• Wir

Validierung eines Data-Mining-Modells im Vergleich zu herkömmlichen Methoden zur Schätzung des Zahnalters bei koreanischen Jugendlichen und jungen Erwachsenen

Vielen Dank für Ihren Besuch auf Nature.com.Die von Ihnen verwendete Browserversion bietet eingeschränkte CSS-Unterstützung.Für optimale Ergebnisse empfehlen wir die Verwendung einer neueren Version Ihres Browsers (oder das Deaktivieren des Kompatibilitätsmodus im Internet Explorer).Um den fortlaufenden Support zu gewährleisten, zeigen wir die Website in der Zwischenzeit ohne Styling oder JavaScript an.
Zähne gelten als der genaueste Indikator für das Alter des menschlichen Körpers und werden häufig zur forensischen Altersbestimmung herangezogen.Unser Ziel war es, Data-Mining-basierte zahnärztliche Altersschätzungen zu validieren, indem wir die Schätzgenauigkeit und Klassifizierungsleistung der 18-Jahres-Grenze mit herkömmlichen Methoden und Data-Mining-basierten Altersschätzungen verglichen.Insgesamt wurden 2657 Panorama-Röntgenaufnahmen von koreanischen und japanischen Bürgern im Alter von 15 bis 23 Jahren gemacht.Sie wurden in einen Trainingssatz mit jeweils 900 koreanischen Röntgenbildern und einen internen Testsatz mit 857 japanischen Röntgenbildern unterteilt.Wir haben die Klassifizierungsgenauigkeit und Effizienz traditioneller Methoden mit Testsätzen von Data-Mining-Modellen verglichen.Die Genauigkeit der herkömmlichen Methode für den internen Testsatz ist etwas höher als die des Data-Mining-Modells und der Unterschied ist gering (mittlerer absoluter Fehler <0,21 Jahre, quadratischer Mittelfehler <0,24 Jahre).Auch die Klassifizierungsleistung für den 18-Jahres-Grenzwert ist bei herkömmlichen Methoden und Data-Mining-Modellen ähnlich.Daher können traditionelle Methoden durch Data-Mining-Modelle ersetzt werden, wenn eine forensische Altersbestimmung anhand der Reife der zweiten und dritten Molaren bei koreanischen Jugendlichen und jungen Erwachsenen durchgeführt wird.
Die Schätzung des Zahnalters wird häufig in der Rechtsmedizin und Kinderzahnheilkunde eingesetzt.Insbesondere aufgrund der hohen Korrelation zwischen chronologischem Alter und Zahnentwicklung ist die Alterseinschätzung anhand der Zahnentwicklungsstadien ein wichtiges Kriterium für die Altersbeurteilung von Kindern und Jugendlichen1,2,3.Bei jungen Menschen hat die Schätzung des Zahnalters anhand der Zahnreife jedoch ihre Grenzen, da das Zahnwachstum mit Ausnahme der dritten Molaren fast abgeschlossen ist.Der rechtliche Zweck der Altersbestimmung von Jugendlichen und Heranwachsenden besteht darin, genaue Schätzungen und wissenschaftliche Nachweise darüber zu liefern, ob sie die Volljährigkeit erreicht haben.In der medizinisch-rechtlichen Praxis von Jugendlichen und jungen Erwachsenen in Korea wurde das Alter mithilfe der Lee-Methode geschätzt und auf der Grundlage der von Oh et al. 5 gemeldeten Daten eine gesetzliche Schwelle von 18 Jahren vorhergesagt.
Maschinelles Lernen ist eine Form der künstlichen Intelligenz (KI), die große Datenmengen wiederholt lernt und klassifiziert, Probleme selbstständig löst und die Datenprogrammierung vorantreibt.Maschinelles Lernen kann nützliche versteckte Muster in großen Datenmengen entdecken6.Im Gegensatz dazu können klassische Methoden, die arbeitsintensiv und zeitaufwändig sind, beim Umgang mit großen Mengen komplexer Daten, die sich nur schwer manuell verarbeiten lassen, an ihre Grenzen stoßen7.Daher wurden in letzter Zeit viele Studien durchgeführt, bei denen die neuesten Computertechnologien zum Einsatz kamen, um menschliche Fehler zu minimieren und mehrdimensionale Daten effizient zu verarbeiten8,9,10,11,12.Insbesondere in der medizinischen Bildanalyse wird Deep Learning häufig eingesetzt, und es wurde berichtet, dass verschiedene Methoden zur Altersschätzung durch automatische Analyse von Röntgenbildern die Genauigkeit und Effizienz der Altersschätzung verbessern13,14,15,16,17,18,19,20 .Beispielsweise haben Halabi et al. 13 einen Algorithmus für maschinelles Lernen entwickelt, der auf Convolutional Neural Networks (CNN) basiert, um das Skelettalter anhand von Röntgenaufnahmen von Kinderhänden abzuschätzen.Diese Studie schlägt ein Modell vor, das maschinelles Lernen auf medizinische Bilder anwendet und zeigt, dass diese Methoden die diagnostische Genauigkeit verbessern können.Li et al.14 schätzten das Alter anhand von Röntgenbildern des Beckens mithilfe eines Deep-Learning-CNN und verglichen sie mit Regressionsergebnissen mithilfe der Schätzung des Ossifikationsstadiums.Sie fanden heraus, dass das Deep-Learning-CNN-Modell die gleiche Altersschätzungsleistung zeigte wie das traditionelle Regressionsmodell.In der Studie von Guo et al. [15] wurde die Alterstoleranzklassifizierungsleistung der CNN-Technologie anhand von Zahnorthofotos bewertet. Die Ergebnisse des CNN-Modells bewiesen, dass Menschen seine Altersklassifizierungsleistung übertrafen.
Die meisten Studien zur Altersschätzung mithilfe maschinellen Lernens verwenden Deep-Learning-Methoden13,14,15,16,17,18,19,20.Berichten zufolge ist die auf Deep Learning basierende Altersschätzung genauer als herkömmliche Methoden.Allerdings bietet dieser Ansatz kaum Möglichkeiten, die wissenschaftliche Grundlage für Altersschätzungen darzustellen, beispielsweise die in den Schätzungen verwendeten Altersindikatoren.Es gibt auch einen Rechtsstreit darüber, wer die Kontrollen durchführt.Daher ist es für Verwaltungs- und Justizbehörden schwierig, eine auf Deep Learning basierende Altersschätzung zu akzeptieren.Data Mining (DM) ist eine Technik, die nicht nur erwartete, sondern auch unerwartete Informationen entdecken kann und als Methode zur Entdeckung nützlicher Korrelationen zwischen großen Datenmengen dient6,21,22.Maschinelles Lernen wird häufig beim Data Mining eingesetzt, und sowohl Data Mining als auch maschinelles Lernen verwenden dieselben Schlüsselalgorithmen, um Muster in Daten zu entdecken.Die Altersschätzung anhand der Zahnentwicklung basiert auf der Beurteilung der Reife der Zielzähne durch den Untersucher. Diese Beurteilung wird als Stadium für jeden Zielzahn ausgedrückt.DM kann zur Analyse der Korrelation zwischen dem Stadium der zahnärztlichen Beurteilung und dem tatsächlichen Alter verwendet werden und hat das Potenzial, die herkömmliche statistische Analyse zu ersetzen.Wenn wir also DM-Techniken auf die Altersschätzung anwenden, können wir maschinelles Lernen in der forensischen Altersschätzung implementieren, ohne uns Gedanken über die rechtliche Haftung machen zu müssen.Es wurden mehrere vergleichende Studien zu möglichen Alternativen zu traditionellen manuellen Methoden in der forensischen Praxis und EBM-basierten Methoden zur Bestimmung des Zahnalters veröffentlicht.Shen et al23 zeigten, dass das DM-Modell genauer ist als die traditionelle Camerer-Formel.Galibourg et al24 wandten verschiedene DM-Methoden an, um das Alter nach dem Demirdjian-Kriterium vorherzusagen25 und die Ergebnisse zeigten, dass die DM-Methode die Demirdjian- und Willems-Methoden bei der Schätzung des Alters der französischen Bevölkerung übertraf.
Um das Zahnalter koreanischer Jugendlicher und junger Erwachsener abzuschätzen, wird Lees Methode 4 in der koreanischen forensischen Praxis häufig verwendet.Diese Methode verwendet traditionelle statistische Analysen (z. B. multiple Regression), um den Zusammenhang zwischen koreanischen Probanden und dem chronologischen Alter zu untersuchen.In dieser Studie werden Methoden zur Altersschätzung, die mithilfe traditioneller statistischer Methoden ermittelt wurden, als „traditionelle Methoden“ definiert.Lees Methode ist eine traditionelle Methode und ihre Genauigkeit wurde von Oh et al. bestätigt.5;Allerdings ist die Anwendbarkeit der Altersschätzung auf Basis des DM-Modells in der koreanischen forensischen Praxis immer noch fraglich.Unser Ziel war es, den potenziellen Nutzen der Altersschätzung auf Basis des DM-Modells wissenschaftlich zu validieren.Der Zweck dieser Studie bestand darin, (1) die Genauigkeit von zwei DM-Modellen bei der Schätzung des Zahnalters zu vergleichen und (2) die Klassifizierungsleistung von 7 DM-Modellen im Alter von 18 Jahren mit denen zu vergleichen, die mit herkömmlichen statistischen Methoden zur zweiten Reife ermittelt wurden und dritte Backenzähne in beiden Kiefern.
Mittelwerte und Standardabweichungen des chronologischen Alters nach Stadium und Zahntyp werden online in der Ergänzungstabelle S1 (Trainingssatz), der Ergänzungstabelle S2 (interner Testsatz) und der Ergänzungstabelle S3 (externer Testsatz) angezeigt.Die aus dem Trainingssatz ermittelten Kappa-Werte für die Intra- und Interobserver-Reliabilität betrugen 0,951 bzw. 0,947.P-Werte und 95 %-Konfidenzintervalle für Kappa-Werte sind in der Online-Ergänzungstabelle S4 dargestellt.Der Kappa-Wert wurde im Einklang mit den Kriterien von Landis und Koch26 als „nahezu perfekt“ interpretiert.
Beim Vergleich des mittleren absoluten Fehlers (MAE) übertrifft die traditionelle Methode das DM-Modell bei allen Geschlechtern und im externen Testsatz für Männer leicht, mit Ausnahme von Multilayer Perceptron (MLP).Der Unterschied zwischen dem traditionellen Modell und dem DM-Modell im internen MAE-Testsatz betrug 0,12–0,19 Jahre für Männer und 0,17–0,21 Jahre für Frauen.Bei der externen Testbatterie sind die Unterschiede geringer (0,001–0,05 Jahre bei Männern und 0,05–0,09 Jahre bei Frauen).Darüber hinaus ist der mittlere quadratische Fehler (RMSE) etwas niedriger als bei der herkömmlichen Methode, mit kleineren Unterschieden (0,17–0,24, 0,2–0,24 für den internen Testsatz für Männer und 0,03–0,07, 0,04–0,08 für den externen Testsatz).).MLP zeigt eine etwas bessere Leistung als Single Layer Perceptron (SLP), außer im Fall des weiblichen externen Testsatzes.Bei MAE und RMSE schneidet der externe Testsatz für alle Geschlechter und Modelle besser ab als der interne Testsatz.Alle MAE und RMSE sind in Tabelle 1 und Abbildung 1 aufgeführt.
MAE und RMSE von traditionellen und Data-Mining-Regressionsmodellen.Mittlerer absoluter Fehler MAE, quadratischer Mittelwertfehler RMSE, einschichtiges Perzeptron SLP, mehrschichtiges Perzeptron MLP, traditionelle CM-Methode.
Die Klassifizierungsleistung (mit einem Cutoff von 18 Jahren) des traditionellen und des DM-Modells wurde in Bezug auf Sensitivität, Spezifität, positiver Vorhersagewert (PPV), negativer Vorhersagewert (NPV) und Fläche unter der Receiver Operating Characteristic Curve (AUROC) nachgewiesen. 27 (Tabelle 2, Abbildung 2 und ergänzende Abbildung 1 online).Hinsichtlich der Empfindlichkeit der internen Testbatterie schnitten herkömmliche Methoden bei Männern am besten und bei Frauen schlechter ab.Allerdings beträgt der Unterschied in der Klassifizierungsleistung zwischen traditionellen Methoden und SD 9,7 % für Männer (MLP) und nur 2,4 % für Frauen (XGBoost).Unter den DM-Modellen zeigte die logistische Regression (LR) bei beiden Geschlechtern eine bessere Empfindlichkeit.Bezüglich der Spezifität des internen Testsatzes wurde beobachtet, dass die vier SD-Modelle bei Männern eine gute Leistung erbrachten, während das traditionelle Modell bei Frauen eine bessere Leistung erbrachte.Die Unterschiede in der Klassifizierungsleistung für Männer und Frauen betragen 13,3 % (MLP) bzw. 13,1 % (MLP), was darauf hindeutet, dass der Unterschied in der Klassifizierungsleistung zwischen den Modellen die Sensitivität übersteigt.Unter den DM-Modellen schnitten die Modelle „Support Vector Machine“ (SVM), „Decision Tree“ (DT) und „Random Forest“ (RF) bei Männern am besten ab, während das LR-Modell bei Frauen am besten abschnitt.Der AUROC des traditionellen Modells und aller SD-Modelle war größer als 0,925 (k-nächster Nachbar (KNN) bei Männern), was eine hervorragende Klassifizierungsleistung bei der Unterscheidung von 18-jährigen Stichproben zeigt28.Beim externen Testset kam es im Vergleich zum internen Testset zu einem Rückgang der Klassifizierungsleistung hinsichtlich Sensitivität, Spezifität und AUROC.Darüber hinaus lag der Unterschied in Sensitivität und Spezifität zwischen der Klassifizierungsleistung des besten und des schlechtesten Modells zwischen 10 % und 25 % und war größer als der Unterschied im internen Testsatz.
Sensitivität und Spezifität von Data-Mining-Klassifizierungsmodellen im Vergleich zu herkömmlichen Methoden mit einem Cutoff von 18 Jahren.KNN k nächster Nachbar, SVM-Support-Vektor-Maschine, LR logistische Regression, DT-Entscheidungsbaum, RF-Zufallswald, XGB XGBoost, MLP-Mehrschicht-Perzeptron, traditionelle CM-Methode.
Der erste Schritt dieser Studie bestand darin, die Genauigkeit der Schätzungen des Zahnalters aus sieben DM-Modellen mit denen zu vergleichen, die mithilfe der herkömmlichen Regression ermittelt wurden.MAE und RMSE wurden in internen Testreihen für beide Geschlechter ausgewertet, und der Unterschied zwischen der traditionellen Methode und dem DM-Modell lag zwischen 44 und 77 Tagen für MAE und zwischen 62 und 88 Tagen für RMSE.Obwohl die traditionelle Methode in dieser Studie etwas genauer war, lässt sich nur schwer schlussfolgern, ob ein so kleiner Unterschied klinische oder praktische Bedeutung hat.Diese Ergebnisse deuten darauf hin, dass die Genauigkeit der Schätzung des Zahnalters mithilfe des DM-Modells nahezu mit der der herkömmlichen Methode übereinstimmt.Ein direkter Vergleich mit Ergebnissen früherer Studien ist schwierig, da keine Studie die Genauigkeit von DM-Modellen mit herkömmlichen statistischen Methoden verglichen hat, bei denen dieselbe Technik zur Erfassung von Zähnen im gleichen Altersbereich wie in dieser Studie verwendet wurde.Galibourg et al24 verglichen MAE und RMSE zwischen zwei traditionellen Methoden (Demirjian-Methode25 und Willems-Methode29) und 10 DM-Modellen in einer französischen Bevölkerung im Alter von 2 bis 24 Jahren.Sie berichteten, dass alle DM-Modelle genauer waren als herkömmliche Methoden, mit Unterschieden von 0,20 und 0,38 Jahren bei MAE und 0,25 und 0,47 Jahren bei RMSE im Vergleich zur Willems- bzw. Demirdjian-Methode.Die in der Halibourg-Studie gezeigte Diskrepanz zwischen dem SD-Modell und traditionellen Methoden berücksichtigt zahlreiche Berichte30,31,32,33, dass die Demirdjian-Methode das Zahnalter in anderen Populationen als den Frankokanadiern, auf denen die Studie basiert, nicht genau schätzt.in dieser Studie.Tai et al. 34 verwendeten den MLP-Algorithmus, um das Zahnalter aus 1636 chinesischen kieferorthopädischen Fotografien vorherzusagen, und verglichen seine Genauigkeit mit den Ergebnissen der Demirjian- und Willems-Methode.Sie berichteten, dass MLP eine höhere Genauigkeit aufweist als herkömmliche Methoden.Der Unterschied zwischen der Demirdjian-Methode und der traditionellen Methode beträgt <0,32 Jahre und die Willems-Methode beträgt 0,28 Jahre, was den Ergebnissen der vorliegenden Studie ähnelt.Die Ergebnisse dieser früheren Studien24,34 stimmen auch mit den Ergebnissen der vorliegenden Studie überein, und die Genauigkeit der Altersschätzung des DM-Modells und der traditionellen Methode ist ähnlich.Aufgrund der präsentierten Ergebnisse können wir jedoch nur vorsichtig den Schluss ziehen, dass die Verwendung von DM-Modellen zur Altersschätzung bestehende Methoden ersetzen könnte, da es an früheren Vergleichs- und Referenzstudien mangelt.Folgestudien mit größeren Stichproben sind erforderlich, um die in dieser Studie erzielten Ergebnisse zu bestätigen.
Unter den Studien, die die Genauigkeit der SD bei der Schätzung des Zahnalters testeten, zeigten einige eine höhere Genauigkeit als unsere Studie.Stepanovsky et al. 35 wandten 22 SD-Modelle auf Panorama-Röntgenaufnahmen von 976 tschechischen Einwohnern im Alter von 2,7 bis 20,5 Jahren an und testeten die Genauigkeit jedes Modells.Sie beurteilten die Entwicklung von insgesamt 16 oberen und unteren linken bleibenden Zähnen anhand der von Moorrees et al. vorgeschlagenen Klassifizierungskriterien 36 .Der MAE liegt zwischen 0,64 und 0,94 Jahren und der RMSE zwischen 0,85 und 1,27 Jahren, was genauer ist als die beiden in dieser Studie verwendeten DM-Modelle.Shen et al23 verwendeten die Cameriere-Methode, um das Zahnalter von sieben bleibenden Zähnen im linken Unterkiefer bei ostchinesischen Einwohnern im Alter von 5 bis 13 Jahren zu schätzen, und verglichen es mit dem mithilfe der linearen Regression, SVM und RF geschätzten Alter.Sie zeigten, dass alle drei DM-Modelle im Vergleich zur traditionellen Cameriere-Formel eine höhere Genauigkeit aufweisen.MAE und RMSE waren in Shens Studie niedriger als im DM-Modell dieser Studie.Die erhöhte Präzision der Studien von Stepanovsky et al.35 und Shen et al.23 kann auf die Einbeziehung jüngerer Probanden in ihre Studienstichproben zurückzuführen sein.Da die Altersschätzungen für Teilnehmer mit sich entwickelnden Zähnen umso genauer werden, je mehr Zähne während der Zahnentwicklung vorhanden sind, kann die Genauigkeit der resultierenden Methode zur Altersschätzung beeinträchtigt sein, wenn die Studienteilnehmer jünger sind.Darüber hinaus ist der Fehler von MLP bei der Altersschätzung etwas kleiner als der von SLP, was bedeutet, dass MLP genauer ist als SLP.MLP gilt als etwas besser für die Altersschätzung, möglicherweise aufgrund der verborgenen Schichten in MLP38.Eine Ausnahme gibt es jedoch für die äußere Stichprobe der Frauen (SLP 1,45, MLP 1,49).Die Feststellung, dass das MLP bei der Altersbestimmung genauer ist als das SLP, erfordert zusätzliche retrospektive Studien.
Die Klassifizierungsleistung des DM-Modells und der traditionellen Methode bei einem 18-Jahres-Schwellenwert wurde ebenfalls verglichen.Alle getesteten SD-Modelle und traditionellen Methoden des internen Testsatzes zeigten praktisch akzeptable Diskriminierungsgrade für die 18-jährige Stichprobe.Die Sensitivität lag bei Männern und Frauen bei über 87,7 % bzw. 94,9 % und die Spezifität bei über 89,3 % bzw. 84,7 %.Auch der AUROC aller getesteten Modelle liegt über 0,925.Nach unserem besten Wissen hat keine Studie die Leistung des DM-Modells für die 18-Jahres-Klassifizierung basierend auf der Zahnreife getestet.Wir können die Ergebnisse dieser Studie mit der Klassifizierungsleistung von Deep-Learning-Modellen auf Panorama-Röntgenaufnahmen vergleichen.Guo et al.15 berechneten die Klassifizierungsleistung eines CNN-basierten Deep-Learning-Modells und einer manuellen Methode basierend auf der Demirjian-Methode für eine bestimmte Altersschwelle.Die Sensitivität und Spezifität der manuellen Methode betrugen 87,7 % bzw. 95,5 %, und die Sensitivität und Spezifität des CNN-Modells überstiegen 89,2 % bzw. 86,6 %.Sie kamen zu dem Schluss, dass Deep-Learning-Modelle die manuelle Bewertung bei der Klassifizierung von Altersschwellen ersetzen oder übertreffen können.Die Ergebnisse dieser Studie zeigten eine ähnliche Klassifizierungsleistung;Es wird davon ausgegangen, dass die Klassifizierung mithilfe von DM-Modellen herkömmliche statistische Methoden zur Altersschätzung ersetzen kann.Unter den Modellen war DM LR das beste Modell hinsichtlich der Sensitivität für die männliche Probe und der Sensitivität und Spezifität für die weibliche Probe.In Bezug auf die Spezifität für Männer liegt LR an zweiter Stelle.Darüber hinaus gilt LR als eines der benutzerfreundlicheren DM35-Modelle und ist weniger komplex und schwierig zu verarbeiten.Basierend auf diesen Ergebnissen wurde LR als das beste Cutoff-Klassifizierungsmodell für 18-Jährige in der koreanischen Bevölkerung angesehen.
Insgesamt war die Genauigkeit der Altersschätzung oder Klassifizierungsleistung beim externen Testsatz im Vergleich zu den Ergebnissen beim internen Testsatz schlecht oder niedriger.Einige Berichte deuten darauf hin, dass die Klassifizierungsgenauigkeit oder -effizienz abnimmt, wenn auf der koreanischen Bevölkerung basierende Altersschätzungen auf die japanische Bevölkerung angewendet werden5,39, und ein ähnliches Muster wurde in der vorliegenden Studie gefunden.Dieser Verschlechterungstrend wurde auch im DM-Modell beobachtet.Um das Alter genau zu schätzen, sollten daher, selbst wenn DM im Analyseprozess verwendet wird, Methoden bevorzugt werden, die aus einheimischen Bevölkerungsdaten abgeleitet werden, wie z. B. traditionelle Methoden5,39,40,41,42.Da unklar ist, ob Deep-Learning-Modelle ähnliche Trends zeigen können, sind Studien zum Vergleich der Klassifizierungsgenauigkeit und -effizienz mit herkömmlichen Methoden, DM-Modellen und Deep-Learning-Modellen an denselben Stichproben erforderlich, um zu bestätigen, ob künstliche Intelligenz diese Rassenunterschiede in begrenztem Alter überwinden kann.Einschätzungen.
Wir zeigen, dass traditionelle Methoden durch eine Altersschätzung auf der Grundlage des DM-Modells in der forensischen Altersschätzungspraxis in Korea ersetzt werden können.Wir entdeckten auch die Möglichkeit, maschinelles Lernen zur forensischen Altersbestimmung einzusetzen.Allerdings gibt es klare Einschränkungen, wie zum Beispiel die unzureichende Teilnehmerzahl dieser Studie, um die Ergebnisse definitiv zu bestimmen, und das Fehlen früherer Studien, um die Ergebnisse dieser Studie zu vergleichen und zu bestätigen.Zukünftig sollten DM-Studien mit einer größeren Anzahl von Proben und vielfältigeren Populationen durchgeführt werden, um ihre praktische Anwendbarkeit im Vergleich zu herkömmlichen Methoden zu verbessern.Um die Machbarkeit des Einsatzes künstlicher Intelligenz zur Schätzung des Alters in mehreren Populationen zu validieren, sind zukünftige Studien erforderlich, um die Klassifizierungsgenauigkeit und Effizienz von DM- und Deep-Learning-Modellen mit herkömmlichen Methoden in denselben Stichproben zu vergleichen.
Für die Studie wurden 2.657 orthografische Fotografien von koreanischen und japanischen Erwachsenen im Alter von 15 bis 23 Jahren verwendet.Die koreanischen Röntgenbilder wurden in 900 Trainingssätze (19,42 ± 2,65 Jahre) und 900 interne Testsätze (19,52 ± 2,59 Jahre) unterteilt.Der Trainingssatz wurde an einer Einrichtung (Seoul St. Mary's Hospital) gesammelt, und der eigene Testsatz wurde an zwei Institutionen (Seoul National University Dental Hospital und Yonsei University Dental Hospital) gesammelt.Wir haben außerdem 857 Röntgenaufnahmen von anderen bevölkerungsbasierten Daten (Iwate Medical University, Japan) für externe Tests gesammelt.Als externer Testsatz wurden Röntgenaufnahmen japanischer Probanden (19,31 ± 2,60 Jahre) ausgewählt.Die Daten wurden retrospektiv gesammelt, um die Stadien der Zahnentwicklung auf Panorama-Röntgenaufnahmen zu analysieren, die während der Zahnbehandlung aufgenommen wurden.Alle erfassten Daten waren anonym, mit Ausnahme von Geschlecht, Geburtsdatum und Datum der Röntgenaufnahme.Die Einschluss- und Ausschlusskriterien waren dieselben wie in zuvor veröffentlichten Studien 4, 5.Das tatsächliche Alter der Probe wurde berechnet, indem das Geburtsdatum vom Datum der Röntgenaufnahme abgezogen wurde.Die Stichprobengruppe wurde in neun Altersgruppen eingeteilt.Die Alters- und Geschlechtsverteilungen sind in Tabelle 3 aufgeführt. Diese Studie wurde in Übereinstimmung mit der Deklaration von Helsinki durchgeführt und vom Institutional Review Board (IRB) des Seoul St. Mary's Hospital der Katholischen Universität Korea (KC22WISI0328) genehmigt.Aufgrund des retrospektiven Designs dieser Studie konnte nicht von allen Patienten, die sich zu therapeutischen Zwecken einer Röntgenuntersuchung unterzogen, eine Einverständniserklärung eingeholt werden.Das St. Mary's Hospital (IRB) der Seoul Korea University verzichtete auf die Anforderung einer Einwilligung nach Aufklärung.
Die Entwicklungsstadien der bimaxillären zweiten und dritten Molaren wurden nach Demircan-Kriterien beurteilt25.Es wurde nur ein Zahn ausgewählt, wenn auf der linken und rechten Seite jedes Kiefers der gleiche Zahntyp gefunden wurde.Wenn sich homologe Zähne auf beiden Seiten in unterschiedlichen Entwicklungsstadien befanden, wurde der Zahn mit dem niedrigeren Entwicklungsstadium ausgewählt, um der Unsicherheit beim geschätzten Alter Rechnung zu tragen.Einhundert zufällig ausgewählte Röntgenbilder aus dem Trainingssatz wurden von zwei erfahrenen Beobachtern ausgewertet, um die Zuverlässigkeit zwischen Beobachtern nach der Vorkalibrierung zur Bestimmung des Zahnreifegrads zu testen.Die Intraobserver-Zuverlässigkeit wurde vom Hauptbeobachter zweimal im Abstand von drei Monaten bewertet.
Das Geschlecht und das Entwicklungsstadium der zweiten und dritten Molaren jedes Kiefers im Trainingssatz wurden von einem primären Beobachter geschätzt, der mit verschiedenen DM-Modellen trainiert wurde, und das tatsächliche Alter wurde als Zielwert festgelegt.SLP- und MLP-Modelle, die beim maschinellen Lernen weit verbreitet sind, wurden anhand von Regressionsalgorithmen getestet.Das DM-Modell kombiniert lineare Funktionen anhand der Entwicklungsstadien der vier Zähne und kombiniert diese Daten zur Altersschätzung.SLP ist das einfachste neuronale Netzwerk und enthält keine versteckten Schichten.SLP basiert auf der Schwellenwertübertragung zwischen Knoten.Das SLP-Modell in der Regression ähnelt mathematisch der multiplen linearen Regression.Im Gegensatz zum SLP-Modell verfügt das MLP-Modell über mehrere verborgene Schichten mit nichtlinearen Aktivierungsfunktionen.Unsere Experimente verwendeten eine verborgene Schicht mit nur 20 verborgenen Knoten mit nichtlinearen Aktivierungsfunktionen.Verwenden Sie den Gradientenabstieg als Optimierungsmethode und MAE und RMSE als Verlustfunktion, um unser Modell für maschinelles Lernen zu trainieren.Das am besten erhaltene Regressionsmodell wurde auf die internen und externen Testsätze angewendet und das Alter der Zähne geschätzt.
Es wurde ein Klassifizierungsalgorithmus entwickelt, der anhand der Reife von vier Zähnen im Trainingssatz vorhersagt, ob eine Stichprobe 18 Jahre alt ist oder nicht.Um das Modell zu erstellen, haben wir sieben Darstellungsalgorithmen für maschinelles Lernen abgeleitet6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost und (7) MLP .LR ist einer der am weitesten verbreiteten Klassifizierungsalgorithmen44.Es handelt sich um einen überwachten Lernalgorithmus, der mithilfe von Regression die Wahrscheinlichkeit vorhersagt, dass Daten zu einer bestimmten Kategorie von 0 bis 1 gehören, und die Daten basierend auf dieser Wahrscheinlichkeit als zu einer wahrscheinlicheren Kategorie gehörend klassifiziert.Wird hauptsächlich zur binären Klassifizierung verwendet.KNN ist einer der einfachsten Algorithmen für maschinelles Lernen45.Wenn neue Eingabedaten eingegeben werden, werden k Daten in der Nähe des vorhandenen Satzes gefunden und diese dann in die Klasse mit der höchsten Häufigkeit eingeteilt.Für die Anzahl der betrachteten Nachbarn (k) setzen wir 3.SVM ist ein Algorithmus, der den Abstand zwischen zwei Klassen maximiert, indem er eine Kernelfunktion verwendet, um den linearen Raum in einen nichtlinearen Raum namens Fields46 zu erweitern.Für dieses Modell verwenden wir Bias = 1, Potenz = 1 und Gamma = 1 als Hyperparameter für den Polynomkern.DT wurde in verschiedenen Bereichen als Algorithmus zur Aufteilung eines gesamten Datensatzes in mehrere Untergruppen durch Darstellung von Entscheidungsregeln in einer Baumstruktur angewendet47.Das Modell ist mit einer Mindestanzahl von 2 Datensätzen pro Knoten konfiguriert und verwendet den Gini-Index als Qualitätsmaßstab.RF ist eine Ensemble-Methode, die mehrere DTs kombiniert, um die Leistung mithilfe einer Bootstrap-Aggregationsmethode zu verbessern, die für jede Stichprobe einen schwachen Klassifikator generiert, indem sie mehrmals zufällig Stichproben derselben Größe aus dem Originaldatensatz zieht48.Als Kriterien für die Knotentrennung verwendeten wir 100 Bäume, 10 Baumtiefen, 1 Mindestknotengröße und den Gini-Beimischungsindex.Die Einstufung neuer Daten erfolgt durch Mehrheitsbeschluss.XGBoost ist ein Algorithmus, der Boosting-Techniken mit einer Methode kombiniert, die als Trainingsdaten den Fehler zwischen den tatsächlichen und den vorhergesagten Werten des vorherigen Modells verwendet und den Fehler mithilfe von Gradienten vergrößert49.Aufgrund seiner guten Leistung und Ressourceneffizienz sowie seiner hohen Zuverlässigkeit als Überanpassungskorrekturfunktion handelt es sich um einen weit verbreiteten Algorithmus.Das Modell ist mit 400 Stützrädern ausgestattet.MLP ist ein neuronales Netzwerk, in dem ein oder mehrere Perzeptrone mehrere Schichten mit einer oder mehreren verborgenen Schichten zwischen der Eingabe- und Ausgabeschicht bilden38.Auf diese Weise können Sie eine nichtlineare Klassifizierung durchführen. Wenn Sie eine Eingabeebene hinzufügen und einen Ergebniswert erhalten, wird der vorhergesagte Ergebniswert mit dem tatsächlichen Ergebniswert verglichen und der Fehler wird zurück propagiert.Wir haben eine verborgene Schicht mit 20 verborgenen Neuronen in jeder Schicht erstellt.Jedes von uns entwickelte Modell wurde auf interne und externe Sätze angewendet, um die Klassifizierungsleistung durch Berechnung von Sensitivität, Spezifität, PPV, NPV und AUROC zu testen.Die Sensitivität ist definiert als das Verhältnis einer Stichprobe, deren Alter auf 18 Jahre oder älter geschätzt wird, zu einer Stichprobe, deren Alter auf 18 Jahre oder älter geschätzt wird.Spezifität ist der Anteil der Proben unter 18 Jahren und der geschätzten Proben unter 18 Jahren.
Die im Trainingssatz bewerteten Zahnstufen wurden zur statistischen Analyse in numerische Stufen umgewandelt.Es wurden multivariate lineare und logistische Regressionen durchgeführt, um Vorhersagemodelle für jedes Geschlecht zu entwickeln und Regressionsformeln abzuleiten, die zur Schätzung des Alters verwendet werden können.Wir haben diese Formeln verwendet, um das Zahnalter sowohl für interne als auch für externe Testsätze abzuschätzen.Tabelle 4 zeigt die in dieser Studie verwendeten Regressions- und Klassifizierungsmodelle.
Die Intra- und Interobserver-Reliabilität wurde mithilfe der Kappa-Statistik von Cohen berechnet.Um die Genauigkeit von DM- und traditionellen Regressionsmodellen zu testen, haben wir MAE und RMSE anhand des geschätzten und tatsächlichen Alters der internen und externen Testsätze berechnet.Diese Fehler werden häufig zur Bewertung der Genauigkeit von Modellvorhersagen verwendet.Je kleiner der Fehler, desto höher ist die Genauigkeit der Prognose24.Vergleichen Sie MAE und RMSE interner und externer Testsätze, die mithilfe von DM und traditioneller Regression berechnet wurden.Die Klassifizierungsleistung des 18-Jahres-Grenzwerts in der traditionellen Statistik wurde anhand einer 2 × 2-Kontingenztabelle bewertet.Die berechnete Sensitivität, Spezifität, PPV, NPV und AUROC des Testsatzes wurden mit den gemessenen Werten des DM-Klassifizierungsmodells verglichen.Die Daten werden abhängig von den Dateneigenschaften als Mittelwert ± Standardabweichung oder Zahl (%) ausgedrückt.Zweiseitige P-Werte <0,05 wurden als statistisch signifikant angesehen.Alle routinemäßigen statistischen Analysen wurden mit SAS Version 9.4 (SAS Institute, Cary, NC) durchgeführt.Das DM-Regressionsmodell wurde in Python mithilfe des Keras50 2.2.4-Backends und Tensorflow51 1.8.0 speziell für mathematische Operationen implementiert.Das DM-Klassifizierungsmodell wurde in der Waikato Knowledge Analysis Environment und der Analyseplattform Konstanz Information Miner (KNIME) 4.6.152 implementiert.
Die Autoren erkennen an, dass Daten, die die Schlussfolgerungen der Studie stützen, im Artikel und in ergänzenden Materialien zu finden sind.Die während der Studie generierten und/oder analysierten Datensätze sind auf begründete Anfrage beim entsprechenden Autor erhältlich.
Ritz-Timme, S. et al.Altersbestimmung: auf dem neuesten Stand der Technik, um den spezifischen Anforderungen der forensischen Praxis gerecht zu werden.Internationalität.J. Rechtsmedizin.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. und Olze, A. Aktueller Stand der forensischen Altersbestimmung lebender Personen zur Strafverfolgung.Forensik.Medizin.Pathologie.1, 239–246 (2005).
Pan, J. et al.Eine modifizierte Methode zur Beurteilung des Zahnalters von Kindern im Alter von 5 bis 16 Jahren in Ostchina.klinisch.Mündliche Befragung.25, 3463–3474 (2021).
Lee, SS etc. Chronologie der Entwicklung der zweiten und dritten Molaren bei Koreanern und ihre Anwendung für die forensische Altersbestimmung.Internationalität.J. Rechtsmedizin.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY und Lee, SS Genauigkeit der Altersschätzung und Schätzung der 18-Jahres-Grenze basierend auf der Reife der zweiten und dritten Molaren bei Koreanern und Japanern.PLoS ONE 17, e0271247 (2022).
Kim, JY, et al.Eine auf maschinellem Lernen basierende präoperative Datenanalyse kann das Behandlungsergebnis einer Schlafoperation bei Patienten mit OSA vorhersagen.die Wissenschaft.Bericht 11, 14911 (2021).
Han, M. et al.Genaue Altersschätzung durch maschinelles Lernen mit oder ohne menschliches Eingreifen?Internationalität.J. Rechtsmedizin.136, 821–831 (2022).
Khan, S. und Shaheen, M. Vom Data Mining zum Data Mining.J.Informationen.die Wissenschaft.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. und Shaheen, M. WisRule: Der erste kognitive Algorithmus für das Assoziationsregel-Mining.J.Informationen.die Wissenschaft.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. und Abdullah U. Karm: Traditionelles Data Mining basierend auf kontextbasierten Assoziationsregeln.Berechnung.Matt.weitermachen.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. und Habib M. Deep-Learning-basierte semantische Ähnlichkeitserkennung anhand von Textdaten.informieren.Technologien.Kontrolle.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. und Shahin, M. Ein System zur Erkennung von Aktivitäten in Sportvideos.Multimedia.Tools-Anwendungen https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al.RSNA-Herausforderung für maschinelles Lernen im pädiatrischen Knochenalter.Radiologie 290, 498–503 (2019).
Li, Y. et al.Forensische Altersschätzung anhand von Beckenröntgenaufnahmen mithilfe von Deep Learning.EURO.Strahlung.29, 2322–2329 (2019).
Guo, YC, et al.Genaue Altersklassifizierung mit manuellen Methoden und tiefen Faltungs-Neuronalen Netzen aus orthografischen Projektionsbildern.Internationalität.J. Rechtsmedizin.135, 1589–1597 (2021).
Alabama Dalora et al.Schätzung des Knochenalters mithilfe verschiedener Methoden des maschinellen Lernens: eine systematische Literaturrecherche und Metaanalyse.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. und Yang, J. Bevölkerungsspezifische Altersschätzung von Afroamerikanern und Chinesen basierend auf dem Pulpakammervolumen der ersten Molaren mittels Kegelstrahl-Computertomographie.Internationalität.J. Rechtsmedizin.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK und Oh KS Bestimmung der Altersgruppen lebender Menschen anhand von auf künstlicher Intelligenz basierenden Bildern der ersten Molaren.die Wissenschaft.Bericht 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. und Urschler, M. Automatische Altersschätzung und Mehrheitsaltersklassifizierung aus multivariaten MRT-Daten.IEEE J. Biomed.Gesundheitswarnungen.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. und Li, G. Altersschätzung basierend auf der 3D-Pulpekammersegmentierung der ersten Molaren aus der Kegelstrahl-Computertomographie durch Integration von Deep Learning und Level-Sets.Internationalität.J. Rechtsmedizin.135, 365–373 (2021).
Wu, WT, et al.Data Mining in klinischen Big Data: Gemeinsame Datenbanken, Schritte und Methodenmodelle.Welt.Medizin.Ressource.8, 44 (2021).
Yang, J. et al.Einführung in medizinische Datenbanken und Data-Mining-Technologien im Big-Data-Zeitalter.J. Avid.Grundlegende Medizin.13, 57–69 (2020).
Shen, S. et al.Camerers Methode zur Schätzung des Zahnalters mithilfe von maschinellem Lernen.BMC Oral Health 21, 641 (2021).
Galliburg A. et al.Vergleich verschiedener Methoden des maschinellen Lernens zur Vorhersage des Zahnalters mithilfe der Demirdjian-Staging-Methode.Internationalität.J. Rechtsmedizin.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. und Tanner, JM Ein neues System zur Beurteilung des Zahnalters.Schnauben.Biologie.45, 211–227 (1973).
Landis, JR und Koch, GG Maße der Beobachterübereinstimmung bei kategorialen Daten.Biometrie 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK und Choi HK.Texturale, morphologische und statistische Analyse der zweidimensionalen Magnetresonanztomographie unter Verwendung von Techniken der künstlichen Intelligenz zur Differenzierung primärer Hirntumoren.Gesundheitsinformationen.Ressource.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Zeitpunkt der Veröffentlichung: 04.01.2024