Vielen Dank für Ihren Besuch bei Nature.com. Die von Ihnen verwendete Version des Browsers hat eine begrenzte CSS -Unterstützung. Für die besten Ergebnisse empfehlen wir eine neuere Version Ihres Browsers (oder die Ausschaltung des Kompatibilitätsmodus im Internet Explorer). In der Zwischenzeit zeigen wir die Website ohne Styling oder JavaScript, um eine kontinuierliche Unterstützung zu gewährleisten.
Die Zähne gelten als der genaueste Indikator für das Alter des menschlichen Körpers und werden häufig bei der Bewertung des forensischen Alters verwendet. Wir wollten die Schätzungen des datenminingbasierten zahnärztlichen Alters validieren, indem wir die Schätzgenauigkeit und Klassifizierungsleistung des 18-jährigen Schwellenwerts mit herkömmlichen Methoden und auf Data Mining basierenden Altersschätzungen vergleichen. Insgesamt 2657 Panoramabläufe wurden von koreanischen und japanischen Bürgern im Alter von 15 bis 23 Jahren gesammelt. Sie wurden in ein Trainingssatz unterteilt, das jeweils 900 koreanische Röntgenaufnahmen enthielt, und einen internen Testsatz mit 857 japanischen Röntgenaufnahmen. Wir haben die Klassifizierungsgenauigkeit und Effizienz herkömmlicher Methoden mit Testsätzen von Data Mining -Modellen verglichen. Die Genauigkeit der herkömmlichen Methode im internen Testsatz ist geringfügig höher als die des Data -Mining -Modells, und die Differenz ist gering (mittlerer absoluter Fehler <0,21 Jahre, Mittelwertquadratfehler <0,24 Jahre). Die Klassifizierungsleistung für den 18-jährigen Grenzwert ist auch zwischen herkömmlichen Methoden und Data Mining-Modellen ähnlich. Daher können traditionelle Methoden durch Data Mining -Modelle ersetzt werden, wenn die forensische Altersbewertung unter Verwendung der Reife der zweiten und dritten Molaren bei koreanischen Jugendlichen und jungen Erwachsenen durchführt.
Die Schätzung des Zahnalters wird in der forensischen Medizin und der pädiatrischen Zahnmedizin häufig eingesetzt. Insbesondere aufgrund der hohen Korrelation zwischen chronologischem Alter und zahnärztlicher Entwicklung ist die Bewertung der Altersbewertung durch zahnärztliche Entwicklungsstadien ein wichtiges Kriterium für die Beurteilung des Alters von Kindern und Jugendlichen1,2,3. Für junge Menschen hat die Schätzung des Zahnarztes auf der Grundlage der Zahnreife jedoch seine Einschränkungen, da das Zahnwachstum nahezu vollständig ist, mit Ausnahme der dritten Molaren. Der gesetzliche Zweck der Bestimmung des Alters junger Menschen und Jugendlicher besteht darin, genaue Schätzungen und wissenschaftliche Beweise dafür zu liefern, ob sie das Alter der Mehrheit erreicht haben. In der medizinisch-legalen Praxis von Jugendlichen und jungen Erwachsenen in Korea wurde das Alter unter Verwendung der Lee-Methode geschätzt, und eine rechtliche Schwelle von 18 Jahren wurde auf der Grundlage der von OH et al. 5 gemeldeten Daten vorhergesagt.
Maschinelles Lernen ist eine Art künstliche Intelligenz (KI), die wiederholt große Datenmengen lernt und klassifiziert, Probleme selbst löst und die Datenprogrammierung vorantreibt. Maschinelles Lernen kann nützliche versteckte Muster in großen Datenvolumina ermitteln. Im Gegensatz dazu können klassische Methoden, die arbeitsintensiv und zeitaufwändig sind, Einschränkungen bei großen Mengen komplexer Daten aufweisen, die schwer manuell zu verarbeiten sind 7. Daher wurden kürzlich viele Studien mit den neuesten Computertechnologien durchgeführt, um menschliche Fehler zu minimieren und mehrdimensionale Daten zu verarbeiten8, 9,10, 11,12. Insbesondere wurde in der medizinischen Bildanalyse häufig ein tiefes Lernen verwendet, und es wurde berichtet . Beispielsweise entwickelten Halabi et al. 13 einen Algorithmus für maschinelles Lernen, der auf Faltungsnetzwerken (CNN) basiert, um das Skelettalter unter Verwendung von Radiogrammen der Hände von Kindern abzuschätzen. Diese Studie schlägt ein Modell vor, das maschinelles Lernen auf medizinische Bilder angewendet und zeigt, dass diese Methoden die diagnostische Genauigkeit verbessern können. Li et al .14 schätzte das Alter aus Becken-Röntgenbildern unter Verwendung eines Deep-Learning-CNN und verglichen sie mit Regressionsergebnissen unter Verwendung der Schätzung des Ossifikationstadiums. Sie fanden heraus, dass das Deep Learning CNN -Modell die gleiche Altersschätzungsleistung wie das traditionelle Regressionsmodell zeigte. Die Studie [15] von Guo et al.
Die meisten Studien zur Altersschätzung mit maschinellem Lernen verwenden Deep -Learning -Methoden13,14,15,16,17,18,19,20. Die Altersschätzung, die auf tiefem Lernen basiert, ist genauer als herkömmliche Methoden. Dieser Ansatz bietet jedoch kaum die Möglichkeit, die wissenschaftliche Grundlage für Altersschätzungen zu präsentieren, wie beispielsweise die in den Schätzungen verwendeten Altersindikatoren. Es gibt auch einen Rechtsstreit darüber, wer die Inspektionen durchführt. Daher ist eine Altersschätzung, die auf tiefem Lernen beruht, durch Verwaltungs- und Justizbehörden schwer zu akzeptieren. Data Mining (DM) ist eine Technik, die nicht nur erwartet, sondern auch unerwartete Informationen als Methode zum Erkennen nützlicher Korrelationen zwischen großen Datenmengen 6,21,22 ermitteln kann. Maschinelles Lernen wird häufig im Data Mining verwendet, und sowohl Data Mining als auch maschinelles Lernen verwenden dieselben wichtigen Algorithmen, um Muster in Daten zu ermitteln. Die Altersschätzung unter Verwendung der Zahnentwicklung basiert auf der Bewertung der Reife der Zielzähne durch den Prüfer, und diese Bewertung wird für jeden Zielzahn als Stadium ausgedrückt. DM kann verwendet werden, um die Korrelation zwischen der Dental -Bewertungsphase und dem tatsächlichen Alter zu analysieren und kann die traditionelle statistische Analyse ersetzen. Wenn wir DM -Techniken auf die Altersschätzung anwenden, können wir daher maschinelles Lernen in der forensischen Altersschätzung implementieren, ohne sich über die rechtliche Haftung zu sorgen. Mehrere vergleichende Studien wurden zu möglichen Alternativen zu herkömmlichen manuellen Methoden veröffentlicht, die in der forensischen Praxis und in EBM-basierten Methoden zur Bestimmung des zahnärztlichen Alters verwendet werden. Shen et al23 zeigten, dass das DM -Modell genauer ist als die herkömmliche Camerer -Formel. Galibourg et al24 wendeten verschiedene DM -Methoden an, um das Alter gemäß dem Demirdjian -Kriterium25 vorherzusagen, und die Ergebnisse zeigten, dass die DM -Methode die Methoden des Demirdjian- und Willems bei der Schätzung des Alters der französischen Bevölkerung übertraf.
Um das zahnärztliche Zeitalter koreanischer Jugendlicher und junger Erwachsener abzuschätzen, wird Lees Methode 4 in der koreanischen forensischen Praxis häufig eingesetzt. Diese Methode verwendet die traditionelle statistische Analyse (z. B. multiple Regression), um die Beziehung zwischen koreanischen Probanden und chronologischem Alter zu untersuchen. In dieser Studie werden Altersschätzungsmethoden mit traditionellen statistischen Methoden als „traditionelle Methoden“ definiert. Lees Methode ist eine traditionelle Methode, und seine Genauigkeit wurde von Oh et al. 5; Die Anwendbarkeit der Altersschätzung auf der Grundlage des DM -Modells in der koreanischen forensischen Praxis ist jedoch immer noch fraglich. Unser Ziel war es, die potenzielle Nützlichkeit der Altersschätzung wissenschaftlich auf der Grundlage des DM -Modells wissenschaftlich zu validieren. Der Zweck dieser Studie bestand darin, (1) die Genauigkeit von zwei DM -Modellen bei der Abschätzung des Zahnalters zu vergleichen, und (2), um die Klassifizierungsleistung von 7 DM -Modellen im Alter von 18 Jahren mit denen zu vergleichen und dritte Molaren in beiden Kiefern.
Mittelwerte und Standardabweichungen des chronologischen Alters nach Bühnen- und Zahntyp werden online in der Ergänzungstabelle S1 (Trainingset), der Ergänzungstabelle S2 (interner Testsatz) und der Ergänzungstabelle S3 (externer Testsatz) angezeigt. Die Kappa-Werte für die aus dem Trainingssatz erhaltene Intra- und Interobserver-Zuverlässigkeit betrugen 0,951 bzw. 0,947. P -Werte und 95% -Konfidenzintervalle für Kappa -Werte sind in der Online -Ergänzungstabelle S4 gezeigt. Der Kappa -Wert wurde als „fast perfekt“ interpretiert, was mit den Kriterien von Landis und Koch26 übereinstimmt.
Beim Vergleich des mittleren Absolute -Fehlers (MAE) übertrifft die herkömmliche Methode das DM -Modell für alle Geschlechter und im externen männlichen Testsatz mit Ausnahme der Mehrschicht -Perzeptron (MLP) geringfügig. Der Unterschied zwischen dem traditionellen Modell und dem DM -Modell im internen MAE -Testsatz betrug für Männer 0,12–0,19 Jahre und 0,17–0,21 Jahre für Frauen. Für die externe Testbatterie sind die Unterschiede kleiner (0,001–0,05 Jahre für Männer und 0,05–0,09 Jahre für Frauen). Zusätzlich ist der Quadratfehler (RMSE) der Wurzel mit kleineren Unterschieden geringfügig niedriger als die herkömmliche Methode (0,17–0,24, 0,2–0,24 für den männlichen internen Testsatz und 0,03–0,07, 0,04–0,08 für einen externen Testsatz). ). MLP zeigt eine etwas bessere Leistung als eine einzelne Perzeptron (SLP), außer im Fall des weiblichen externen Testsatzes. Für MAE und RMSE bewertet der externe Testsatz höher als der interne Testsatz für alle Geschlechter und Modelle. Alle MAE und RMSE sind in Tabelle 1 und Abbildung 1 dargestellt.
MAE und RMSE von traditionellen Regressionsmodellen für Data Mining. Mittlerer absoluter Fehler MAE, Stammwertquadratfehler RMSE, Einzelschicht -Perzeptron -SLP, Mehrschicht -Perzeptron -MLP, herkömmliche CM -Methode.
Die Klassifizierungsleistung (mit einem Grenzwert von 18 Jahren) der traditionellen und DM -Modelle wurde hinsichtlich Sensitivität, Spezifität, positivem Vorhersagewert (PPV), negativem Vorhersagewert (NPV) und Fläche unter der OROC (Receiver Operating "-Kurve (AUROC) demonstriert. 27 (Tabelle 2, Abbildung 2 und ergänzende Abbildung 1 online). In Bezug auf die Empfindlichkeit der internen Testbatterie kamen herkömmliche Methoden bei Männern am besten und schlechter bei Frauen. Der Unterschied in der Klassifizierungsleistung zwischen herkömmlichen Methoden und SD beträgt jedoch 9,7% für Männer (MLP) und nur 2,4% für Frauen (XGBOOST). Unter DM -Modellen zeigte die logistische Regression (LR) bei beiden Geschlechtern eine bessere Empfindlichkeit. In Bezug auf die Spezifität des internen Testsatzes wurde beobachtet, dass die vier SD -Modelle bei Männern gut abschnitten, während das traditionelle Modell bei Frauen besser abschnitten. Die Unterschiede in der Klassifizierungsleistung bei Männern und Frauen betragen 13,3% (MLP) bzw. 13,1% (MLP), was darauf hinweist, dass der Unterschied in der Klassifizierungsleistung zwischen den Modellen die Empfindlichkeit übersteigt. Unter den DM -Modellen zeigten die Modelle der Support Vector Machine (SVM), Decision Tree (DT) und Random Forest (RF) unter Männern am besten, während das LR -Modell bei Frauen am besten abschneidete. Die AUROC des traditionellen Modells und aller SD-Modelle war größer als 0,925 (K-Nearest-Nachbar (KNN) bei Männern) und zeigte eine hervorragende Klassifizierungsleistung bei der diskriminierten 18-jährigen Proben28. Für den externen Testsatz war die Klassifizierungsleistung in Bezug auf Sensitivität, Spezifität und AUROC im Vergleich zum internen Testsatz zugenommen. Darüber hinaus lag der Unterschied in der Empfindlichkeit und Spezifität zwischen der Klassifizierungsleistung der besten und schlechtesten Modelle zwischen 10% und 25% und war größer als der Unterschied im internen Testsatz.
Sensitivität und Spezifität von Data Mining -Klassifizierungsmodellen im Vergleich zu herkömmlichen Methoden mit einem Grenzwert von 18 Jahren. KNN K Nächster Nachbar, SVM -Unterstützungsvektormaschine, LR -logistische Regression, DT -Entscheidungsbaum, RF -Zufallswald, XGB XGBOOST, MLP Multilayer Perceptron, herkömmliche CM -Methode.
Der erste Schritt in dieser Studie bestand darin, die Genauigkeit der Schätzungen des Zahnalters aus sieben DM -Modellen mit denen zu vergleichen, die unter Verwendung der traditionellen Regression erhalten wurden. MAE und RMSE wurden in internen Testsätzen für beide Geschlechter bewertet, und der Unterschied zwischen der herkömmlichen Methode und dem DM -Modell lag für MAE zwischen 44 und 77 Tagen und zwischen 62 und 88 Tagen für RMSE. Obwohl die traditionelle Methode in dieser Studie etwas genauer war, ist es schwierig zu schließen, ob ein so kleiner Unterschied eine klinische oder praktische Bedeutung hat. Diese Ergebnisse deuten darauf hin, dass die Genauigkeit der zahnärztlichen Altersschätzung unter Verwendung des DM -Modells nahezu die der traditionellen Methode ist. Der direkte Vergleich mit den Ergebnissen früherer Studien ist schwierig, da keine Studie die Genauigkeit von DM -Modellen mit herkömmlichen statistischen Methoden verglichen hat, die dieselbe Technik zur Aufzeichnung von Zähnen im gleichen Altersbereich wie in dieser Studie anhand der gleichen Technik verglichen haben wie in dieser Studie. Galibourg et al24 verglichen MAE und RMSE zwischen zwei traditionellen Methoden (Demirjian Method25 und Willems Method29) und 10 DM -Modellen in einer französischen Bevölkerung im Alter von 2 bis 24 Jahren. Sie berichteten, dass alle DM -Modelle genauer waren als herkömmliche Methoden mit Unterschieden von 0,20 und 0,38 Jahren bei MAE und 0,25 und 0,47 Jahren in RMSE im Vergleich zu den Willems- und Demirdjian -Methoden. Die Diskrepanz zwischen dem SD -Modell und den traditionellen Methoden, die in der Halibourg -Studie gezeigt werden, berücksichtigt zahlreiche Berichte 30,31,32,33, dass die Demirdjian -Methode das zahnärztliche Zeitalter in anderen Populationen als die französischen Kanadier, auf denen die Studie beruht, nicht genau schätzt. In dieser Studie. Tai et al. 34 verwendeten den MLP -Algorithmus, um das Zahnalter von 1636 chinesischen kieferorthopädischen Fotografien vorherzusagen, und verglichen seine Genauigkeit mit den Ergebnissen der Demirjian- und Willems -Methode. Sie berichteten, dass MLP eine höhere Genauigkeit als herkömmliche Methoden aufweist. Der Unterschied zwischen der Demirdjian -Methode und der traditionellen Methode beträgt <0,32 Jahre, und die Willems -Methode beträgt 0,28 Jahre, was den Ergebnissen der vorliegenden Studie ähnlich ist. Die Ergebnisse dieser früheren Studien24,34 stimmen auch mit den Ergebnissen der vorliegenden Studie überein, und die Altersschätzungsgenauigkeit des DM -Modells und die traditionelle Methode sind ähnlich. Basierend auf den vorgestellten Ergebnissen können wir jedoch nur vorsichtig zu dem Schluss kommen, dass die Verwendung von DM -Modellen zur Schätzung des Alters bestehende Methoden aufgrund des Mangels an vergleichenden und früheren Studien ersetzen kann. Follow-up-Studien mit größeren Proben sind erforderlich, um die in dieser Studie erhaltenen Ergebnisse zu bestätigen.
Unter den Studien, die die Genauigkeit von SD bei der Abschätzung des Zahnalters testen, zeigten einige eine höhere Genauigkeit als unsere Studie. Stepanovsky et al. Sie untersuchten die Entwicklung von insgesamt 16 oberen und unteren linken permanenten Zähnen anhand der von Moorrees et al. 36 vorgeschlagenen Klassifizierungskriterien. Der MAE liegt zwischen 0,64 und 0,94 Jahren und der RMSE -Bereich zwischen 0,85 und 1,27 Jahren, die genauer sind als die beiden in dieser Studie verwendeten DM -Modelle. Shen et al23 verwendeten die Cameriere -Methode, um das zahnärztliche Alter von sieben dauerhaften Zähnen im linken Unterkiefer in Ostchinienbewohnern im Alter von 5 bis 13 Jahren abzuschätzen, und verglichen es mit Altersalter, die unter Verwendung der linearen Regression, SVM und RF geschätzt wurden. Sie zeigten, dass alle drei DM -Modelle im Vergleich zur traditionellen Cameriere -Formel eine höhere Genauigkeit aufweisen. Die MAE und die RMSE in Shens Studie waren in dieser Studie niedriger als die im DM -Modell. Die erhöhte Präzision der Studien von Stepanovsky et al. 35 und Shen et al. 23 kann auf die Einbeziehung jüngerer Probanden in ihre Studienproben zurückzuführen sein. Da Altersschätzungen für Teilnehmer mit sich entwickelnden Zähnen genauer werden, wenn die Anzahl der Zähne während der Zahnentwicklung zunimmt, kann die Genauigkeit der resultierenden Altersschätzungsmethode beeinträchtigt werden, wenn die Studienteilnehmer jünger sind. Zusätzlich ist der Fehler von MLP bei der Altersschätzung etwas kleiner als die von SLP, was bedeutet, dass MLP genauer ist als SLP. MLP wird für die Altersschätzung als etwas besser angesehen, möglicherweise aufgrund der versteckten Schichten in MLP38. Es gibt jedoch eine Ausnahme für die äußere Stichprobe von Frauen (SLP 1.45, MLP 1.49). Die Feststellung, dass die MLP bei der Bewertung des Alters genauer ist als der SLP, erfordert zusätzliche retrospektive Studien.
Die Klassifizierungsleistung des DM-Modells und die traditionelle Methode bei einer 18-jährigen Schwelle wurde ebenfalls verglichen. Alle getesteten SD-Modelle und traditionellen Methoden im internen Testsatz zeigten praktisch akzeptable Diskriminierungsgrads für die 18-jährige Stichprobe. Die Sensibilität für Männer und Frauen betrug größer als 87,7% bzw. 94,9% und die Spezifität mehr als 89,3% bzw. 84,7%. Die AUROC aller getesteten Modelle übersteigt ebenfalls 0,925. Nach unserem Kenntnisstand hat keine Studie die Leistung des DM-Modells für die 18-jährige Klassifizierung auf der Grundlage der Zahnreife getestet. Wir können die Ergebnisse dieser Studie mit der Klassifizierungsleistung von Deep -Learning -Modellen zu Panorama -Röntgenaufnahmen vergleichen. Guo et al.15 berechnete die Klassifizierungsleistung eines CNN-basierten Deep-Learning-Modells und einer manuellen Methode, die auf der Demirjian-Methode für eine bestimmte Altersschwelle basiert. Die Empfindlichkeit und Spezifität der manuellen Methode betrug 87,7% bzw. 95,5%, und die Empfindlichkeit und Spezifität des CNN -Modells überstieg 89,2% bzw. 86,6%. Sie kamen zu dem Schluss, dass Deep -Learning -Modelle manuelle Bewertung bei der Klassifizierung von Altersschwellen ersetzen oder übertreffen können oder übertreffen können oder übertreffen können oder übertreffen können. Die Ergebnisse dieser Studie zeigten eine ähnliche Klassifizierungsleistung; Es wird angenommen, dass die Klassifizierung mit DM -Modellen herkömmliche statistische Methoden für die Altersschätzung ersetzen kann. Unter den Modellen war DM LR das beste Modell in Bezug auf die Empfindlichkeit für die männliche Stichprobe sowie die Empfindlichkeit und Spezifität für die weibliche Probe. LR belegt für Männer den zweiten Platz. Darüber hinaus gilt LR als eines der benutzerfreundlicheren DM35-Modelle und ist weniger komplex und schwer zu verarbeiten. Basierend auf diesen Ergebnissen wurde LR als das beste Cutoff-Klassifizierungsmodell für 18-Jährige in der koreanischen Bevölkerung angesehen.
Insgesamt war die Genauigkeit der Altersschätzung oder der Klassifizierungsleistung im externen Testsatz im Vergleich zu den Ergebnissen des internen Testsatzes schlecht oder niedriger. Einige Berichte zeigen, dass die Klassifizierungsgenauigkeit oder Effizienz abnimmt, wenn Altersschätzungen auf der Grundlage der koreanischen Bevölkerung auf die japanische Bevölkerung angewendet werden5,39 und in der vorliegenden Studie ein ähnliches Muster gefunden wurde. Dieser Verschlechterungstrend wurde auch im DM -Modell beobachtet. Um das Alter genau bei der Verwendung von DM im Analyseprozess genau abzuschätzen, sollten Methoden aus nativen Bevölkerungsdaten wie herkömmlichen Methoden bevorzugt werden5,39,40,41,42. Da unklar ist, ob Deep -Learning -Modelle ähnliche Trends zeigen können, sind Studien zur Vergleich der Klassifizierungsgenauigkeit und -Effizienz mithilfe herkömmlicher Methoden, DM -Modelle und Deep -Learning -Modellen mit denselben Stichproben erforderlich, um zu bestätigen, ob künstliche Intelligenz diese Rassenunterschiede im begrenzten Alter überwinden kann. Bewertungen.
Wir zeigen, dass traditionelle Methoden durch Altersschätzung ersetzt werden können, basierend auf dem DM -Modell in der Praxis der forensischen Altersschätzung in Korea. Wir haben auch die Möglichkeit entdeckt, maschinelles Lernen für die Bewertung des forensischen Alters zu implementieren. Es gibt jedoch eindeutige Einschränkungen, wie die unzureichende Anzahl von Teilnehmern dieser Studie, um die Ergebnisse definitiv zu bestimmen, und das Fehlen früherer Studien zum Vergleichen und Bestätigen der Ergebnisse dieser Studie. In Zukunft sollten DM -Studien mit einer größeren Anzahl von Proben und vielfältigeren Populationen durchgeführt werden, um die praktische Anwendbarkeit im Vergleich zu herkömmlichen Methoden zu verbessern. Um die Machbarkeit der Verwendung künstlicher Intelligenz zur Abschätzung des Alters in mehreren Populationen zu validieren, sind zukünftige Studien erforderlich, um die Klassifizierungsgenauigkeit und Effizienz von DM- und Deep -Learning -Modellen mit traditionellen Methoden in denselben Stichproben zu vergleichen.
In der Studie wurden 2.657 orthografische Fotografien verwendet, die von koreanischen und japanischen Erwachsenen im Alter von 15 bis 23 Jahren gesammelt wurden. Die koreanischen Röntgenaufnahmen wurden in 900 Trainingssätze (19,42 ± 2,65 Jahre) und 900 interne Testsets (19,52 ± 2,59 Jahre) unterteilt. Das Ausbildungssatz wurde an einer Institution (Seoul St. Mary's Hospital) gesammelt, und das eigene Testsatz wurde an zwei Institutionen (Seoul National University Dental Hospital und Yonsei University Dental Hospital) gesammelt. Wir haben auch 857 Röntgenaufnahmen aus anderen bevölkerungsbasierten Daten (Iwate Medical University, Japan) für externe Tests gesammelt. Röntgenaufnahmen japanischer Probanden (19,31 ± 2,60 Jahre) wurden als externer Testsatz ausgewählt. Die Daten wurden retrospektiv erfasst, um die Stadien der Zahnentwicklung auf Panorama -Röntgenaufnahmen zu analysieren, die während der Zahnbehandlung aufgenommen wurden. Alle gesammelten Daten waren anonym, bis auf das Geschlecht, das Geburtsdatum und das Datum der Röntgenaufnahme. Die Einschluss- und Ausschlusskriterien waren die gleichen wie zuvor veröffentlichte Studien 4, 5. Das tatsächliche Alter der Stichprobe wurde berechnet, indem das Geburtsdatum ab dem Datum der Röntgenaufnahme abgebaut wurde. Die Stichprobengruppe wurde in neun Altersgruppen unterteilt. Die Alters- und Geschlechtsverteilung sind in Tabelle 3 gezeigt. Diese Studie wurde gemäß der Erklärung von Helsinki durchgeführt und vom Institutional Review Board (IRB) des Seoul St. Mary's Hospital der katholischen Universität Korea (KC22WISI0328) genehmigt. Aufgrund des retrospektiven Designs dieser Studie konnte nicht alle Patienten, die sich für therapeutische Zwecke radiologischen Untersuchungen unterzogen, eine Einverständniserklärung eingeholt werden. Die Seoul Korea University St. Mary's Hospital (IRB) verzichtete auf eine Einverständniserklärung.
Die Entwicklungsstadien der bimaxillären zweiten und dritten Molaren wurden gemäß Demircan -Kriterien25 bewertet. Es wurde nur ein Zahn ausgewählt, wenn der gleiche Zahntyp auf der linken und rechten Seite jedes Kiefers gefunden wurde. Wenn homologe Zähne auf beiden Seiten in verschiedenen Entwicklungsstadien lagen, wurde der Zahn mit der niedrigeren Entwicklungsstufe ausgewählt, um die Unsicherheit im geschätzten Alter zu berücksichtigen. Einhundert zufällig ausgewählte Röntgenaufnahmen aus dem Trainingssatz wurden von zwei erfahrenen Beobachtern bewertet, um die Interobserver -Zuverlässigkeit nach der Vorkalibrierung zu testen, um die Zahnreife -Stadium zu bestimmen. Die Zuverlässigkeit der Intraobserver wurde in Intervallen von drei Monaten vom primären Beobachter zweimal bewertet.
Die Geschlechts- und Entwicklungsstufe der zweiten und dritten Molaren jedes Kiefers im Trainingssatz wurde durch einen primären Beobachter geschätzt, der mit verschiedenen DM -Modellen trainiert wurde, und das tatsächliche Alter wurde als Zielwert festgelegt. SLP- und MLP -Modelle, die im maschinellen Lernen häufig verwendet werden, wurden gegen Regressionsalgorithmen getestet. Das DM -Modell kombiniert lineare Funktionen unter Verwendung der Entwicklungsstadien der vier Zähne und kombiniert diese Daten, um das Alter abzuschätzen. SLP ist das einfachste neuronale Netzwerk und enthält keine versteckten Schichten. SLP arbeitet basierend auf der Schwellenwertübertragung zwischen Knoten. Das SLP -Modell in der Regression ähnelt mathematisch der multiplen linearen Regression. Im Gegensatz zum SLP -Modell verfügt das MLP -Modell über mehrere versteckte Schichten mit nichtlinearen Aktivierungsfunktionen. Unsere Experimente verwendeten eine versteckte Schicht mit nur 20 versteckten Knoten mit nichtlinearen Aktivierungsfunktionen. Verwenden Sie Gradientenabstieg als Optimierungsmethode und MAE und RMSE als Verlustfunktion, um unser maschinelles Lernmodell zu trainieren. Das am besten erhaltene Regressionsmodell wurde auf die internen und externen Testsätze angewendet, und das Alter der Zähne wurde geschätzt.
Es wurde ein Klassifizierungsalgorithmus entwickelt, der die Reife von vier Zähnen im Training verwendet, um vorherzusagen, ob eine Stichprobe 18 Jahre alt ist oder nicht. Um das Modell zu erstellen, haben wir sieben Darstellungsalgorithmen maschinelles Lernen 6,43: (1) LR, (2) Knn, (3) SVM, (4) dt, (5) rf, (6) xgboost und (7) mlp abgeleitet . LR ist eines der am häufigsten verwendeten Klassifizierungsalgorithmen44. Es handelt sich um einen überwachten Lernalgorithmus, der die Regression verwendet, um die Wahrscheinlichkeit von Daten zu einer bestimmten Kategorie von 0 bis 1 vorherzusagen, und klassifiziert die Daten als zu einer wahrscheinlicheren Kategorie anhand dieser Wahrscheinlichkeit. hauptsächlich zur binären Klassifizierung verwendet. KNN ist einer der einfachsten Algorithmen für maschinelles Lernen45. Wenn neue Eingabedaten angegeben werden, findet es K -Daten in der Nähe des vorhandenen Satzes und klassifiziert sie dann mit der höchsten Frequenz in die Klasse. Wir setzen 3 für die Anzahl der in Betracht gezogenen Nachbarn (k). SVM ist ein Algorithmus, der den Abstand zwischen zwei Klassen maximiert, indem eine Kernelfunktion verwendet wird, um den linearen Raum in einen nichtlinearen Raum namens Fields46 zu erweitern. Für dieses Modell verwenden wir Bias = 1, Power = 1 und Gamma = 1 als Hyperparameter für den Polynomkern. DT wurde in verschiedenen Bereichen als Algorithmus zur Aufteilung eines gesamten Datensatzes in mehrere Untergruppen angewendet, indem Entscheidungsregeln in einer Baumstruktur47 dargestellt werden. Das Modell ist mit einer Mindestanzahl von Datensätzen pro 2 -Knoten konfiguriert und verwendet den Gini -Index als Qualitätsmaß. RF ist eine Ensemble -Methode, die mehrere DTs kombiniert, um die Leistung mithilfe einer Bootstrap -Aggregationsmethode zu verbessern, die für jedes Beispiel einen schwachen Klassifizierer erzeugt, indem Sie aus dem ursprünglichen Datensatz 48 profital die gleiche Größe derselben Größe zeichnen. Wir verwendeten 100 Bäume, 10 Baumtiefen, 1 minimale Knotengröße und Gini -Beimischungsindex als Knoten -Trennungskriterien. Die Klassifizierung neuer Daten wird durch eine Mehrheitsabstimmung bestimmt. XGBOOST ist ein Algorithmus, der Boosting -Techniken mithilfe einer Methode kombiniert, die den Fehler zwischen den tatsächlichen und vorhergesagten Werten des Vorgängermodells als Trainingsdaten annimmt und den Fehler unter Verwendung von Gradients49 erhöht. Es ist ein weit verbreiteter Algorithmus aufgrund seiner guten Leistung und Ressourceneffizienz sowie einer hohen Zuverlässigkeit als Überanpassungskorrekturfunktion. Das Modell ist mit 400 Unterstützungsrädern ausgestattet. MLP ist ein neuronales Netzwerk, in dem eine oder mehrere Perzeptrons mehrere Schichten mit einer oder mehreren versteckten Schichten zwischen Eingangs- und Ausgangsschichten38 bilden. Mit diesem Fall können Sie eine nichtlineare Klassifizierung durchführen, bei der beim Hinzufügen einer Eingangsschicht und beim Erhalten eines Ergebniswerts der vorhergesagte Ergebniswert mit dem tatsächlichen Ergebniswert verglichen und der Fehler zurückgegeben wird. Wir haben eine versteckte Schicht mit 20 versteckten Neuronen in jeder Schicht erstellt. Jedes von uns entwickelte Modell wurde auf interne und externe Sets angewendet, um die Klassifizierungsleistung durch Berechnung der Empfindlichkeit, Spezifität, PPV, NPV und AUROC zu testen. Die Empfindlichkeit ist definiert als das Verhältnis einer auf 18 Jahre oder älteren Stichprobe geschätzten Stichprobe zu einer Stichprobe, die auf 18 Jahre oder älter geschätzt wird. Die Spezifität ist der Anteil der Proben unter 18 Jahren und diejenigen, die auf unter 18 Jahre geschätzt werden.
Die im Trainingssatz bewerteten zahnärztlichen Stadien wurden für die statistische Analyse in numerische Stadien umgewandelt. Eine multivariate lineare und logistische Regression wurde durchgeführt, um Vorhersagemodelle für jedes Geschlecht zu entwickeln und Regressionsformeln abzuleiten, die zur Abschätzung des Alters verwendet werden können. Wir haben diese Formeln verwendet, um das Zahnalter sowohl für interne als auch für externe Testsätze abzuschätzen. Tabelle 4 zeigt die in dieser Studie verwendeten Regressions- und Klassifizierungsmodelle.
Die Intra- und Interobserver-Zuverlässigkeit wurde unter Verwendung von Cohens Kappa-Statistik berechnet. Um die Genauigkeit von DM- und traditionellen Regressionsmodellen zu testen, berechneten wir MAE und RMSE unter Verwendung des geschätzten und tatsächlichen Alters der internen und externen Testsätze. Diese Fehler werden üblicherweise verwendet, um die Genauigkeit von Modellvorhersagen zu bewerten. Je kleiner der Fehler ist, desto höher ist die Genauigkeit der Prognose24. Vergleichen Sie die MAE und RMSE von internen und externen Testsätzen, die unter Verwendung von DM und herkömmlicher Regression berechnet wurden. Die Klassifizierungsleistung des 18-jährigen Grenzwerts in herkömmlichen Statistiken wurde anhand einer 2 × 2-Kontingenztabelle bewertet. Die berechnete Empfindlichkeit, Spezifität, PPV, NPV und AUROC des Testsatzes wurden mit den gemessenen Werten des DM -Klassifizierungsmodells verglichen. Die Daten werden je nach Dateneigenschaften als Mittelwert ± Standardabweichung oder Zahl (%) ausgedrückt. Zweiseitige P-Werte <0,05 wurden als statistisch signifikant angesehen. Alle routinemäßigen statistischen Analysen wurden mit SAS Version 9.4 (SAS Institute, Cary, NC) durchgeführt. Das DM -Regressionsmodell wurde in Python unter Verwendung von Keras50 2.2.4 Backend und TensorFlow51 1.8.0 speziell für mathematische Operationen implementiert. Das DM -Klassifizierungsmodell wurde in der Waikato -Wissensanalyseumgebung und der Konstanz Information Miner (Knime) 4.6.152 Analyse -Plattform implementiert.
Die Autoren erkennen an, dass Daten, die die Schlussfolgerungen der Studie unterstützen, im Artikel und in den ergänzenden Materialien gefunden werden können. Die während der Studie generierten und/oder analysierten Datensätze sind beim entsprechenden Autor auf angemessene Anfrage verfügbar.
Ritz-Timme, S. et al. Altersbewertung: Stand der Technik, um die spezifischen Anforderungen der forensischen Praxis zu erfüllen. Internationalität. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. und Olze, A. Aktueller Status der forensischen Altersbewertung lebender Probanden für Strafverfolgung. Forensik. Medizin. Pathologie. 1, 239–246 (2005).
Pan, J. et al. Eine modifizierte Methode zur Bewertung des zahnärztlichen Alters von Kindern im Alter von 5 bis 16 Jahren in Ostchina. klinisch. Mündliche Umfrage. 25, 3463–3474 (2021).
Lee, SS usw. Chronologie der Entwicklung der zweiten und dritten Molaren bei Koreanern und ihrer Anwendung für die Bewertung des forensischen Alters. Internationalität. J. Legal Medicine. 124, 659–665 (2010).
OH, S., Kumagai, A., Kim, Sy und Lee, SS-Genauigkeit der Altersschätzung und Schätzung der 18-jährigen Schwelle auf der Grundlage der Reife der zweiten und dritten Molaren bei Koreanern und Japanisch. PLoS ONE 17, E0271247 (2022).
Kim, JY, et al. Durch präoperative Datenanalyse auf der basierten Datenanalyse für maschinelles Lernen kann die Behandlungsergebnis der Schlafchirurgie bei Patienten mit OSA vorhersagen. Die Wissenschaft. Bericht 11, 14911 (2021).
Han, M. et al. Genaue Altersschätzung durch maschinelles Lernen mit oder ohne menschliche Intervention? Internationalität. J. Legal Medicine. 136, 821–831 (2022).
Khan, S. und Shaheen, M. vom Data Mining bis zum Data Mining. J.Information. Die Wissenschaft. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. und Shaheen, M. Wisrule: Der erste kognitive Algorithmus für die Assoziationsregel -Mining. J.Information. Die Wissenschaft. https://doi.org/10.1177/0165551521108695 (2022).
Shaheen M. und Abdullah U. Karm: Traditionelles Data Mining basierend auf kontextbasierten Verbandsregeln. berechnen. Matt. weitermachen. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. und Habib M. Deep Learning -basierte semantische Ähnlichkeitserkennung unter Verwendung von Textdaten. informieren. Technologien. Kontrolle. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. und Shahin, M. Ein System zur Erkennung von Aktivitäten in Sportvideos. Multimedia. Tools-Anwendungen https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge im pädiatrischen Knochenalter. Radiologie 290, 498–503 (2019).
Li, Y. et al. Forensische Altersschätzung aus Beckenröntgenstrahlen unter Verwendung von Deep Learning. EURO. Strahlung. 29, 2322–2329 (2019).
Guo, YC, et al. Genaue Altersklassifizierung mit manuellen Methoden und tiefen nerven Netzwerken mit faltbaren Falten aus orthografischen Projektionsbildern. Internationalität. J. Legal Medicine. 135, 1589–1597 (2021).
Alabama Dalora et al. Schätzung der Knochenalter unter Verwendung verschiedener Methoden für maschinelles Lernen: eine systematische Literaturübersicht und Metaanalyse. PLoS ONE 14, E0220242 (2019).
Du, H. Du, G. Li, K. Cheng und J. Yang, J. Bevölkerungsspezifische Altersschätzung von Afroamerikanern und Chinesen, basierend auf der Bühne der Erstmolaren mit Zellstoffkammer unter Verwendung von CONE-Beam-Computertomographie. Internationalität. J. Legal Medicine. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK und OH KS, die Altersgruppen lebender Menschen bestimmen, die künstliche Intelligenzbilder von ersten Molaren verwenden. Die Wissenschaft. Bericht 11, 1073 (2021).
Stern, D., Zahler, C., Giuliani, N. und Urschler, M. Automatische Altersschätzung und Mehrheit der Altersalterung aus multivariaten MRT -Daten. IEEE J. Biomed. Gesundheitswarnungen. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. und Li, G. Altersschätzung basierend auf der 3D -Segmentierung von Zellstoffkammer von ersten Molaren aus der Cone Beam Computed Tomographie durch Integration von Deep -Lern- und Ebenensätzen. Internationalität. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT, et al. Data Mining in klinischen Big Data: Häufige Datenbanken, Schritte und Methodenmodelle. Welt. Medizin. Ressource. 8, 44 (2021).
Yang, J. et al. Einführung in medizinische Datenbanken und Data Mining -Technologien in der Big Data -Ära. J. Avid. Grundmedizin. 13, 57–69 (2020).
Shen, S. et al. Camerer -Methode zur Schätzung des Zahnalters mithilfe von maschinellem Lernen. BMC Mundgesundheit 21, 641 (2021).
Galliburg A. et al. Vergleich verschiedener Methoden für maschinelles Lernen zur Vorhersage des Zahnalters mit der Demirdjian Staging -Methode. Internationalität. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. und Tanner, JM, ein neues System zur Bewertung des zahnärztlichen Zeitalters. Schnauben. Biologie. 45, 211–227 (1973).
Landis, JR und Koch, GG -Maßnahmen zur Übereinstimmung der Beobachter über kategoriale Daten. Biometrie 33, 159–174 (1977).
Bhattacharjee S., Prakash D., Kim C., Kim HK und Choi HK. Texturale, morphologische und statistische Analyse der zweidimensionalen Magnetresonanztomographie unter Verwendung künstlicher Intelligenztechniken zur Differenzierung primärer Hirntumoren. Gesundheitsinformationen. Ressource. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Postzeit: Jan.-04-2024