AI-chatbots tonen potentie als onderwijshulpmiddel in endodontie
Twee AI-chatbots scoren vergelijkbaar met geavanceerde assistenten bij simulatie van endodontische examenvragen. Potentie als studiehulpmiddel voor studenten en assistenten.
AI-chatbots presteren goed bij endodontische vraagstukken
Twee AI-chatbots, GPT-4o en Gemini 2.5 Pro, zijn getest in een gesimuleerde mondeling examen van de American Board of Endodontics (ABE) met drie endodontische casussen. Beide systemen moesten antwoord geven op 20 open vragen per casus op basis van gedetailleerde patiëntprofielen. De antwoorden werden onafhankelijk beoordeeld op klinische geldigheid, nauwkeurigheid en relevantie van ondersteunende referenties.
Prestaties vergelijkbaar met geavanceerde assistenten
Gemini 2.5 Pro behaalde een gemiddelde score van 2,83 op een schaal van 0 tot 3, terwijl GPT-4o 2,73 scoorde. De meeste antwoorden werden als aanvaardbaar tot uitstekend beoordeeld. Statististische analyse toonde geen significant verschil tussen beide modellen in klinische geldigheid of algehele prestatie. Gemini 2.5 Pro presteerde consistenter over de drie casussen heen, terwijl GPT-4o meer variatie tussen casustypen vertoonde.
Beperkingen en educatief gebruik
De onderzoekers benadrukken dat deze resultaten niet moeten worden overschat. De chatbots kunnen geen echte ABE-examens betrouwbaar halen, aangezien dit live interactie met examinatoren en onafhankelijke radiologische interpretatie vereist. In deze studie werkten de systemen met schriftelijke vragen en beschrijvingen van radiologische bevindingen. Dr. Poorya Jalali, leidend onderzoeker en directeur van de afdeling endodontie aan Texas A&M College of Dentistry, benadrukt dat AI-chatbots diagnostiek of behandelplanning niet zelfstandig kunnen uitvoeren. Ze kunnen geen klinische testen uitvoeren, patiënten onderzoeken of radiografieën in echte klinische omstandigheden interpreteren. De systemen kunnen echter wel helpen bij het oefenen van antwoorden op klinische vragen, kennistesten en het vergelijken van redeneringen met modelantwoorden. Op deze manier bieden zij een interactieve leeromgeving die traditioneel onderwijs aanvult, vooral bij voorbereiding op examen-stijl vragen. Het onderzoek, gepubliceerd op 26 februari 2026 in het Journal of Endodontics, maakt deel uit van een bredere onderzoeksreeks.
Veelgestelde vragen
Kunnen AI-chatbots het American Board of Endodontics examen halen?
Nee. Hoewel GPT-4o en Gemini 2.5 Pro goed scoren op gesimuleerde vragen, kunnen zij geen echte ABE-examens betrouwbaar halen. De echte examinering vereist live interactie met examinatoren en zelfstandige radiologische interpretatie, wat AI-chatbots niet kunnen doen.
Hoe goed zijn ChatGPT en Gemini bij endodontische diagnose en behandelplanning?
Beide systemen kunnen clinisch relevante redeneringen demonstreren en scoren vergelijkbaar met geavanceerde assistenten. Gemini 2.5 Pro presteerde consistent (2,83 op schaal 0-3), GPT-4o meer variabel (2,73). Echter, zij kunnen geen echte diagnose of behandelplanning zelfstandig uitvoeren zonder menselijke expertise.
Kunnen AI-chatbots tandartsstudenten helpen bij examenvoorbereiding?
Ja, als onderwijshulpmiddel. Ze kunnen studenten helpen oefenen met klinische vragen, hun kennis testen en hun redeneringen vergelijken met modelantwoorden. Dit levert een interactieve leeromgeving op die traditioneel onderwijs aanvult, vooral voor voorbereiding op mondeling-stijl examens.
Wat zijn de belangrijkste beperkingen van AI-chatbots in endodontie?
AI-chatbots kunnen geen patiënten onderzoeken, klinische testen uitvoeren of radiografieën in de praktijk interpreteren. Hun prestatie hangt volledig af van de informatie die hen wordt verstrekt. Ze moeten gezien worden als aanvullend op menselijke expertise, niet als vervanging ervan.
Welke studiegroep en onderzoeksmethode werd gebruikt?
De twee chatbots werden getest met een gesimuleerde ABE mondeling examen met drie endodontische casussen. Per casus moesten ze antwoord geven op 20 open vragen. De antwoorden werden beoordeeld door twee tandartsen met ABE-certificering op klinische geldigheid en nauwkeurigheid van referenties.