Bedankt voor het bezoeken van Nature.com. De versie van de browser die u gebruikt, heeft beperkte CSS -ondersteuning. Voor de beste resultaten raden we aan om een nieuwere versie van uw browser te gebruiken (of de compatibiliteitsmodus uit te schakelen in Internet Explorer). In de tussentijd laten we de site zien zonder styling of javascript.
Tanden worden beschouwd als de meest nauwkeurige indicator van de leeftijd van het menselijk lichaam en worden vaak gebruikt in forensische leeftijdsbeoordeling. We wilden dat op data mining gebaseerde gebaseerde schattingen van tandheelkundige leeftijd valideren door de schattingsnauwkeurigheid en classificatieprestaties van de 18-jarige drempel te vergelijken met traditionele methoden en op data mining gebaseerde leeftijdsschattingen. In totaal werden 2657 panoramische röntgenfoto's verzameld van Koreaanse en Japanse burgers van 15 tot 23 jaar. Ze werden verdeeld in een trainingsset, elk met 900 Koreaanse röntgenfoto's en een interne testset met 857 Japanse röntgenfoto's. We vergeleken de classificatienauwkeurigheid en efficiëntie van traditionele methoden met testsets van dataminingmodellen. De nauwkeurigheid van de traditionele methode op de interne testset is iets hoger dan die van het dataminingmodel, en het verschil is klein (gemiddelde absolute fout <0,21 jaar, rootgemiddelde vierkante fout <0,24 jaar). De classificatieprestaties voor de 18-jarige cutoff zijn ook vergelijkbaar tussen traditionele methoden en dataminingmodellen. Traditionele methoden kunnen dus worden vervangen door dataminingmodellen bij het uitvoeren van forensische leeftijdsbeoordeling met behulp van de looptijd van tweede en derde kiezen bij Koreaanse adolescenten en jonge volwassenen.
De schatting van de tandheelkundige leeftijd wordt veel gebruikt in forensische geneeskunde en pediatrische tandheelkunde. Met name vanwege de hoge correlatie tussen chronologische leeftijd en tandheelkundige ontwikkeling, is leeftijdsbeoordeling door tandheelkundige ontwikkelingsstadia een belangrijk criterium voor het beoordelen van de leeftijd van kinderen en adolescenten1,2,3. Voor jongeren heeft het schatten van de tandheelkundige leeftijd op basis van tandheelkundige volwassenheid echter beperkingen omdat tandheelkundige groei bijna compleet is, met uitzondering van de derde kiezen. Het wettelijke doel van het bepalen van de leeftijd van jongeren en adolescenten is om nauwkeurige schattingen en wetenschappelijk bewijs te geven van of ze de leeftijd van meerderheid hebben bereikt. In de medisch-juridische praktijk van adolescenten en jonge volwassenen in Korea werd leeftijd geschat met behulp van Lee's methode, en een wettelijke drempel van 18 jaar werd voorspeld op basis van de gegevens gerapporteerd door Oh et al 5.
Machine Learning is een type kunstmatige intelligentie (AI) dat herhaaldelijk grote hoeveelheden gegevens leert en classificeert, problemen op zichzelf oplost en gegevensprogrammering stimuleert. Machine learning kan nuttige verborgen patronen ontdekken in grote hoeveelheden data6. Klassieke methoden, die arbeidsintensief en tijdrovend zijn, kunnen daarentegen beperkingen hebben bij het omgaan met grote hoeveelheden complexe gegevens die moeilijk handmatig te verwerken zijn7. Daarom zijn er recent veel studies uitgevoerd met behulp van de nieuwste computertechnologieën om menselijke fouten te minimaliseren en multidimensionale data8,9,10,11,12 efficiënt te verwerken. In het bijzonder is diep leren op grote schaal gebruikt bij medische beeldanalyse, en verschillende methoden voor leeftijdsschatting door het automatisch analyseren van röntgenfoto's is gerapporteerd om de nauwkeurigheid en efficiëntie van leeftijdsschatting te verbeteren13,14,15,16,17,18,19,20 . Halabi et al 13 ontwikkelden bijvoorbeeld een machine learning -algoritme op basis van convolutionele neurale netwerken (CNN) om de skelettijd te schatten met behulp van röntgenfoto's van de handen van kinderen. Deze studie stelt een model voor dat machine learning toepast op medische afbeeldingen en laat zien dat deze methoden de diagnostische nauwkeurigheid kunnen verbeteren. Li et al14 geschatte leeftijd van röntgenfoto's van bekken met behulp van een diep leren CNN en vergeleken ze met regressieresultaten met behulp van de schatting van de ossificatiefase. Ze ontdekten dat het CNN -model van deep learning dezelfde leeftijdsramingprestaties vertoonde als het traditionele regressiemodel. De studie van Guo et al. [15] evalueerden de leeftijdstolerantieclassificatieprestaties van CNN -technologie op basis van tandheelkundige orthofoto's, en de resultaten van het CNN -model bewezen dat mensen beter presteerden dan de prestaties van de leeftijdsclassificatie.
De meeste studies naar leeftijdsschatting met behulp van machine learning gebruiken diepgaande leermethoden13,14,15,16,17,18,19,20. De leeftijdsraming op basis van diep leren is gerapporteerd om nauwkeuriger te zijn dan traditionele methoden. Deze aanpak biedt echter weinig gelegenheid om de wetenschappelijke basis te presenteren voor leeftijdsschattingen, zoals de leeftijdsindicatoren die in de schattingen worden gebruikt. Er is ook een juridisch geschil over wie de inspecties uitvoert. Daarom is leeftijdsschatting op basis van diep leren moeilijk te accepteren door administratieve en gerechtelijke autoriteiten. Data Mining (DM) is een techniek die niet alleen kan worden verwacht, maar ook onverwachte informatie als een methode voor het ontdekken van nuttige correlaties tussen grote hoeveelheden data6,21,22. Machine learning wordt vaak gebruikt in datamining en zowel datamining als machine learning gebruiken dezelfde sleutelalgoritmen om patronen in gegevens te ontdekken. Leeftijdsschatting met behulp van tandheelkundige ontwikkeling is gebaseerd op de beoordeling door de examinator van de looptijd van de doeltanden, en deze beoordeling wordt uitgedrukt als een stadium voor elke doeltand. DM kan worden gebruikt om de correlatie tussen tandheelkundige beoordelingsfase en werkelijke leeftijd te analyseren en heeft het potentieel om traditionele statistische analyse te vervangen. Daarom, als we DM -technieken toepassen op leeftijdsraming, kunnen we machine learning implementeren in forensische leeftijdsschatting zonder ons zorgen te maken over wettelijke aansprakelijkheid. Verschillende vergelijkende studies zijn gepubliceerd over mogelijke alternatieven voor traditionele handmatige methoden die worden gebruikt in forensische praktijk en EBM-gebaseerde methoden voor het bepalen van de tandheelkundige leeftijd. Shen et al23 toonden aan dat het DM -model nauwkeuriger is dan de traditionele camererformule. Galibourg et al24 paste verschillende DM -methoden toe om de leeftijd te voorspellen volgens het Demirdjian Criterion25 en de resultaten toonden aan dat de DM -methode de Demirdjian- en Willems -methoden overtrof bij het schatten van de leeftijd van de Franse bevolking.
Om de tandheelkundige leeftijd van Koreaanse adolescenten en jonge volwassenen te schatten, wordt Lee's methode 4 veel gebruikt in de Koreaanse forensische praktijk. Deze methode maakt gebruik van traditionele statistische analyse (zoals meervoudige regressie) om de relatie tussen Koreaanse proefpersonen en chronologische leeftijd te onderzoeken. In deze studie worden leeftijdsschattingsmethoden verkregen met behulp van traditionele statistische methoden gedefinieerd als 'traditionele methoden'. Lee's methode is een traditionele methode en de nauwkeurigheid ervan is bevestigd door Oh et al. 5; De toepasbaarheid van leeftijdsschatting op basis van het DM -model in de Koreaanse forensische praktijk is echter nog steeds twijfelachtig. Ons doel was om wetenschappelijk het potentiële nut van leeftijdsschatting te valideren op basis van het DM -model. Het doel van deze studie was (1) om de nauwkeurigheid van twee DM -modellen te vergelijken bij het schatten van de tandheelkundige leeftijd en (2) om de classificatieprestaties van 7 dm -modellen op de leeftijd van 18 jaar te vergelijken met die verkregen met behulp van traditionele statistische methoden volwassenheid van de tweede en derde kiezen in beide kaken.
Middelen en standaardafwijkingen van chronologische leeftijd per stadium- en tandtype worden online weergegeven in aanvullende tabel S1 (trainingsset), aanvullende tabel S2 (interne testset) en aanvullende tabel S3 (externe testset). De kappa-waarden voor betrouwbaarheid intra- en interobserver verkregen uit de trainingsset waren respectievelijk 0,951 en 0,947. P -waarden en 95% betrouwbaarheidsintervallen voor kappa -waarden worden weergegeven in online aanvullende tabel S4. De Kappa -waarde werd geïnterpreteerd als "bijna perfect", consistent met de criteria van Landis en Koch26.
Bij het vergelijken van de gemiddelde absolute fout (MAE) presteert de traditionele methode enigszins beter dan het DM -model voor alle geslachten en in de externe mannelijke testset, met uitzondering van meerlagige perceptron (MLP). Het verschil tussen het traditionele model en het DM -model op de interne MAE -testset was 0,12-0,19 jaar voor mannen en 0,17-0,21 jaar voor vrouwen. Voor de externe testbatterij zijn de verschillen kleiner (0,001-0,05 jaar voor mannen en 0,05-0,09 jaar voor vrouwen). Bovendien is de rootgemiddelde vierkante fout (RMSE) iets lager dan de traditionele methode, met kleinere verschillen (0,17-0,24, 0,2-0,24 voor de mannelijke interne testset en 0,03-0,07, 0,04-0,08 voor externe testset). ). MLP toont iets betere prestaties dan perceptron met één laag (SLP), behalve in het geval van de vrouwelijke externe testset. Voor MAE en RMSE set de externe testset scores hoger dan de interne testset voor alle geslachten en modellen. Alle MAE en RMSE worden weergegeven in tabel 1 en figuur 1.
MAE en RMSE van traditionele en datamining regressiemodellen. Gemiddelde absolute fout MAE, rootgemiddelde vierkante fout RMSE, enkele laag perceptron SLP, meerlagige perceptron MLP, traditionele CM -methode.
Classificatieprestaties (met een cutoff van 18 jaar) van de traditionele en DM -modellen werden aangetoond in termen van gevoeligheid, specificiteit, positieve voorspellende waarde (PPV), negatieve voorspellende waarde (NPV) en gebied onder de ontvanger operationele karakteristieke curve (AUROC) 27 (Tabel 2, figuur 2 en aanvullend figuur 1 online). In termen van de gevoeligheid van de interne testbatterij presteerden traditionele methoden het beste bij mannen en slechter bij vrouwen. Het verschil in classificatieprestaties tussen traditionele methoden en SD is echter 9,7% voor mannen (MLP) en slechts 2,4% voor vrouwen (XGBOOST). Onder DM -modellen vertoonde logistieke regressie (LR) een betere gevoeligheid bij beide geslachten. Wat betreft de specificiteit van de interne testset, werd waargenomen dat de vier SD -modellen goed presteerden bij mannen, terwijl het traditionele model beter presteerde bij vrouwen. De verschillen in classificatieprestaties voor mannen en vrouwen zijn respectievelijk 13,3% (MLP) en 13,1% (MLP), wat aangeeft dat het verschil in classificatieprestaties tussen modellen de gevoeligheid overschrijdt. Onder de DM -modellen presteerden de Support Vector Machine (SVM), Decision Tree (DT) en Random Forest (RF) -modellen het beste bij mannen, terwijl het LR -model het beste presteerde bij vrouwen. De auroc van het traditionele model en alle SD-modellen was groter dan 0,925 (K-CTE-buur (KNN) bij mannen), wat uitstekende classificatieprestaties aantoonde bij het onderscheiden van 18-jarige monsters28. Voor de externe testset was er een afname van de classificatieprestaties in termen van gevoeligheid, specificiteit en Auroc in vergelijking met de interne testset. Bovendien varieerde het verschil in gevoeligheid en specificiteit tussen de classificatieprestaties van de beste en slechtste modellen van 10% tot 25% en was hij groter dan het verschil in de interne testset.
Gevoeligheid en specificiteit van data -mining classificatiemodellen in vergelijking met traditionele methoden met een afsluiting van 18 jaar. Knn K dichtstbijzijnde buur, SVM Support Vector Machine, LR Logistische regressie, DT -beslissingsboom, RF Random Forest, XGB XGBOOST, MLP Meerlagige perceptron, traditionele CM -methode.
De eerste stap in deze studie was het vergelijken van de nauwkeurigheid van de schattingen van de tandheelkundige leeftijd verkregen uit zeven DM -modellen met die verkregen met traditionele regressie. MAE en RMSE werden geëvalueerd in interne testsets voor beide geslachten, en het verschil tussen de traditionele methode en het DM -model varieerde van 44 tot 77 dagen voor MAE en van 62 tot 88 dagen voor RMSE. Hoewel de traditionele methode in deze studie iets nauwkeuriger was, is het moeilijk te concluderen of een dergelijk klein verschil klinisch of praktisch is. Deze resultaten geven aan dat de nauwkeurigheid van de schatting van de tandheelkundige leeftijd met behulp van het DM -model bijna hetzelfde is als die van de traditionele methode. Directe vergelijking met resultaten van eerdere studies is moeilijk omdat geen enkele studie de nauwkeurigheid van DM -modellen heeft vergeleken met traditionele statistische methoden met dezelfde techniek voor het opnemen van tanden in dezelfde leeftijdscategorie als in deze studie. Galibourg et al24 vergeleken MAE en RMSE tussen twee traditionele methoden (Demirjian Method25 en Willems Method29) en 10 DM -modellen in een Franse bevolking van 2 tot 24 jaar. Ze rapporteerden dat alle DM -modellen nauwkeuriger waren dan traditionele methoden, met verschillen van 0,20 en 0,38 jaar in MAE en 0,25 en 0,47 jaar in RMSE in vergelijking met respectievelijk de Willems en Demirdjian -methoden. De discrepantie tussen het SD -model en traditionele methoden die in het Halibourg -onderzoek worden getoond, houdt rekening met tal van rapporten30,31,32,33 dat de Demirdjian -methode niet nauwkeurig de tandheelkundige leeftijd in populaties schat in populaties dan de Franse Canadezen dan de studie waarop de studie was gebaseerd. In deze studie. Tai et al 34 gebruikten het MLP -algoritme om de tandtijd uit 1636 Chinese orthodontische foto's te voorspellen en vergeleken de nauwkeurigheid ervan met de resultaten van de Demirjian en Willems -methode. Ze meldden dat MLP een hogere nauwkeurigheid heeft dan traditionele methoden. Het verschil tussen de Demirdjian -methode en de traditionele methode is <0,32 jaar, en de Willems -methode is 0,28 jaar, wat vergelijkbaar is met de resultaten van de huidige studie. De resultaten van deze eerdere studies24,34 zijn ook consistent met de resultaten van de huidige studie, en de leeftijdsramingsnauwkeurigheid van het DM -model en de traditionele methode zijn vergelijkbaar. Op basis van de gepresenteerde resultaten kunnen we echter alleen voorzichtig concluderen dat het gebruik van DM -modellen om de leeftijd te schatten bestaande methoden kan vervangen vanwege het ontbreken van vergelijkende en referentie eerdere studies. Vervolgstudies met behulp van grotere monsters zijn nodig om de resultaten te bevestigen die in deze studie zijn verkregen.
Onder de studies die de nauwkeurigheid van SD testen bij het schatten van de tandheelkundige leeftijd, vertoonden sommigen een hogere nauwkeurigheid dan onze studie. Stepanovsky et al 35 Pas 22 SD -modellen toe op panoramische röntgenfoto's van 976 Tsjechische inwoners van 2,7 tot 20,5 jaar en testten de nauwkeurigheid van elk model. Ze beoordeelden de ontwikkeling van een totaal van 16 bovenste en links linker permanente tanden met behulp van de classificatiecriteria voorgesteld door Moorrees et al 36. De MAE varieert van 0,64 tot 0,94 jaar en de RMSE varieert van 0,85 tot 1,27 jaar, die nauwkeuriger zijn dan de twee DM -modellen die in deze studie worden gebruikt. Shen et al23 gebruikten de camerieringsmethode om de tandheelkundige leeftijd van zeven permanente tanden in de linker onderkaak te schatten in oostelijke Chinese inwoners van 5 tot 13 jaar en vergeleken met AGE's geschat met behulp van lineaire regressie, SVM en RF. Ze toonden aan dat alle drie DM -modellen een hogere nauwkeurigheid hebben in vergelijking met de traditionele camerierformule. De MAE en RMSE in Shen's studie waren lager dan die in het DM -model in deze studie. De verhoogde precisie van de studies door Stepanovsky et al. 35 en Shen et al. 23 kan te wijten zijn aan de opname van jongere proefpersonen in hun studiemonsters. Omdat leeftijdsschattingen voor deelnemers met zich ontwikkelende tanden nauwkeuriger worden naarmate het aantal tanden toeneemt tijdens de tandheelkundige ontwikkeling, kan de nauwkeurigheid van de resulterende leeftijdsschattingsmethode worden aangetast wanneer deelnemers aan de studie jonger zijn. Bovendien is de fout van MLP in leeftijdsschatting iets kleiner dan die van SLP, wat betekent dat MLP nauwkeuriger is dan SLP. MLP wordt als iets beter beschouwd voor leeftijdsschatting, mogelijk vanwege de verborgen lagen in MLP38. Er is echter een uitzondering voor het buitenste monster van vrouwen (SLP 1,45, MLP 1,49). De bevinding dat de MLP nauwkeuriger is dan de SLP bij het beoordelen van leeftijd, vereist aanvullende retrospectieve studies.
De classificatieprestaties van het DM-model en de traditionele methode bij een 18-jarige drempel werden ook vergeleken. Alle geteste SD-modellen en traditionele methoden op de interne testset vertoonden praktisch acceptabele niveaus van discriminatie voor het 18-jarige monster. Gevoeligheid voor mannen en vrouwen was respectievelijk groter dan 87,7% en 94,9%, en de specificiteit was groter dan 89,3% en 84,7%. De Auroc van alle geteste modellen is ook meer dan 0,925. Voor zover wij weten, heeft geen enkele studie de prestaties van het DM-model getest op 18-jarige classificatie op basis van tandheelkundige volwassenheid. We kunnen de resultaten van deze studie vergelijken met de classificatieprestaties van diepe leermodellen op panoramische röntgenfoto's. Guo et al.15 berekenden de classificatieprestaties van een op CNN gebaseerd diep leermodel en een handmatige methode gebaseerd op de methode van Demirjian voor een bepaalde leeftijdsdrempel. De gevoeligheid en specificiteit van de handmatige methode waren respectievelijk 87,7% en 95,5%, en de gevoeligheid en specificiteit van het CNN -model overschreed respectievelijk 89,2% en 86,6%. Ze concludeerden dat diepe leermodellen de handmatige beoordeling kunnen vervangen of beter kunnen presteren bij het classificeren van leeftijdsdrempels. De resultaten van deze studie toonden vergelijkbare classificatieprestaties; Er wordt aangenomen dat classificatie met DM -modellen traditionele statistische methoden voor leeftijdsschatting kan vervangen. Onder de modellen was DM LR het beste model in termen van gevoeligheid voor het mannelijke monster en de gevoeligheid en specificiteit voor het vrouwelijke monster. LR staat op de tweede plaats in specificiteit voor mannen. Bovendien wordt LR beschouwd als een van de meer gebruiksvriendelijke DM35-modellen en is hij minder complex en moeilijk te verwerken. Op basis van deze resultaten werd LR beschouwd als het beste cutoff-classificatiemodel voor 18-jarigen in de Koreaanse bevolking.
Over het algemeen was de nauwkeurigheid van leeftijdsschatting of classificatieprestaties op de externe testset slecht of lager in vergelijking met de resultaten op de interne testset. Sommige rapporten geven aan dat de nauwkeurigheid of efficiëntie van de classificatie afneemt wanneer leeftijdsschattingen op basis van de Koreaanse bevolking worden toegepast op de Japanse bevolking5,39, en een soortgelijk patroon werd gevonden in de huidige studie. Deze verslechteringstrend werd ook waargenomen in het DM -model. Daarom, om de leeftijd nauwkeurig te schatten, zelfs bij het gebruik van DM in het analyseproces, moeten methoden afgeleid van native populatiegegevens, zoals traditionele methoden, de voorkeur hebben 5,39,40,41,42. Omdat het onduidelijk is of diepgaande leermodellen vergelijkbare trends kunnen vertonen, zijn studies die de nauwkeurigheid en efficiëntie van classificatie vergeleken met behulp van traditionele methoden, DM -modellen en diepe leermodellen op dezelfde monsters nodig om te bevestigen of kunstmatige intelligentie deze raciale verschillen in beperkte leeftijd kan overwinnen. beoordelingen.
We tonen aan dat traditionele methoden kunnen worden vervangen door leeftijdsschatting op basis van het DM -model in forensische leeftijdsschatting in Korea. We hebben ook de mogelijkheid ontdekt om machine learning te implementeren voor forensische leeftijdsbeoordeling. Er zijn echter duidelijke beperkingen, zoals het onvoldoende aantal deelnemers in dit onderzoek om de resultaten definitief te bepalen, en het ontbreken van eerdere studies om de resultaten van deze studie te vergelijken en te bevestigen. In de toekomst moeten DM -onderzoeken worden uitgevoerd met een groter aantal monsters en meer diverse populaties om de praktische toepasbaarheid ervan te verbeteren in vergelijking met traditionele methoden. Om de haalbaarheid te valideren van het gebruik van kunstmatige intelligentie om de leeftijd in meerdere populaties te schatten, zijn toekomstige studies nodig om de classificatienauwkeurigheid en efficiëntie van DM en diepe leermodellen te vergelijken met traditionele methoden in dezelfde monsters.
De studie gebruikte 2.657 orthografische foto's verzameld van Koreaanse en Japanse volwassenen van 15 tot 23 jaar. De Koreaanse röntgenfoto's werden verdeeld in 900 trainingssets (19,42 ± 2,65 jaar) en 900 interne testsets (19,52 ± 2,59 jaar). De trainingsset werd verzameld in één instelling (Seoul St. Mary's Hospital) en de eigen testset werd verzameld bij twee instellingen (Seoul National University Dental Hospital en Yonsei University Dental Hospital). We hebben ook 857 röntgenfoto's verzameld van een andere populatiegebaseerde gegevens (Iwate Medical University, Japan) voor externe testen. Röntgenfoto's van Japanse onderwerpen (19,31 ± 2,60 jaar) werden geselecteerd als de externe testset. Gegevens werden achteraf verzameld om de stadia van de tandheelkundige ontwikkeling op panoramische röntgenfoto's te analyseren die tijdens tandheelkundige behandeling zijn genomen. Alle verzamelde gegevens waren anoniem, behalve voor geslacht, geboortedatum en datum van röntgenfoto. Inclusie- en uitsluitingscriteria waren hetzelfde als eerder gepubliceerde studies 4, 5. De werkelijke leeftijd van het monster werd berekend door de geboortedatum af te trekken van de datum waarop de röntgenfoto werd genomen. De monstergroep werd verdeeld in negen leeftijdsgroepen. De leeftijds- en geslachtsverdelingen worden getoond in tabel 3 Deze studie werd uitgevoerd in overeenstemming met de verklaring van Helsinki en goedgekeurd door de Institutional Review Board (IRB) van Seoul St. Mary's Hospital van de Katholieke Universiteit van Korea (KC22WISI0328). Vanwege het retrospectieve ontwerp van deze studie, kon geïnformeerde toestemming niet worden verkregen van alle patiënten die radiografisch onderzoek voor therapeutische doeleinden ondergaan. Seoul Korea University St. Mary's Hospital (IRB) zag af van de vereiste voor geïnformeerde toestemming.
Ontwikkelingsfasen van Bimaxillaire tweede en derde kiezen werden beoordeeld volgens Demircan Criteria25. Er werd slechts één tand geselecteerd als hetzelfde type tand aan de linker- en rechterkant van elke kaak werd gevonden. Als homologe tanden aan beide zijden in verschillende ontwikkelingsstadia waren, werd de tand met de lagere ontwikkelingsfase gekozen om rekening te houden met onzekerheid in de geschatte leeftijd. Honderd willekeurig geselecteerde röntgenfoto's van de trainingsset werden gescoord door twee ervaren waarnemers om de betrouwbaarheid van de interobserver te testen na precalibratie om de tandheelkundige volwassenheidsfase te bepalen. Intraobserver betrouwbaarheid werd tweemaal beoordeeld met intervallen van drie maanden door de primaire waarnemer.
De seksuele en ontwikkelingsfase van de tweede en derde kiezen van elke kaak in de trainingsset werden geschat door een primaire waarnemer die was getraind met verschillende DM -modellen, en de werkelijke leeftijd werd vastgesteld als de doelwaarde. SLP- en MLP -modellen, die veel worden gebruikt in machine learning, werden getest tegen regressie -algoritmen. Het DM -model combineert lineaire functies met behulp van de ontwikkelingsfasen van de vier tanden en combineert deze gegevens om de leeftijd te schatten. SLP is het eenvoudigste neurale netwerk en bevat geen verborgen lagen. SLP werkt op basis van drempeloverdracht tussen knooppunten. Het SLP -model in regressie is wiskundig vergelijkbaar met meerdere lineaire regressie. In tegenstelling tot het SLP -model heeft het MLP -model meerdere verborgen lagen met niet -lineaire activeringsfuncties. Onze experimenten gebruikten een verborgen laag met slechts 20 verborgen knooppunten met niet -lineaire activeringsfuncties. Gebruik gradiëntafkomst als de optimalisatiemethode en MAE en RMSE als de verliesfunctie om ons machine learning -model te trainen. Het best verkregen regressiemodel werd toegepast op de interne en externe testsets en de leeftijd van de tanden werd geschat.
Er is een classificatie -algoritme ontwikkeld dat de volwassenheid van vier tanden gebruikt op de training om te voorspellen of een monster 18 jaar oud is of niet. Om het model te bouwen, hebben we zeven representatiemachine learning -algoritmen 6,43 afgeleid: (1) Lr, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST en (7) MLP . LR is een van de meest gebruikte classificatie -algoritmen44. Het is een begeleid leeralgoritme dat regressie gebruikt om de waarschijnlijkheid van gegevens te voorspellen die behoren tot een bepaalde categorie van 0 tot 1 en de gegevens classificeert als behorend tot een meer waarschijnlijke categorie op basis van deze waarschijnlijkheid; voornamelijk gebruikt voor binaire classificatie. KNN is een van de eenvoudigste machine learning -algoritmen45. Wanneer nieuwe invoergegevens worden gegeven, vindt het k -gegevens dicht bij de bestaande set en classificeert deze vervolgens in de klasse met de hoogste frequentie. We stellen 3 in voor het aantal beschouwde buren (k). SVM is een algoritme dat de afstand tussen twee klassen maximaliseert met behulp van een kernelfunctie om de lineaire ruimte uit te breiden naar een niet-lineaire ruimte genaamd Fields46. Voor dit model gebruiken we bias = 1, vermogen = 1 en gamma = 1 als hyperparameters voor de polynoom kernel. DT is op verschillende gebieden toegepast als een algoritme voor het delen van een volledige gegevensset in verschillende subgroepen door beslissingsregels in een boomstructuur te vertegenwoordigen47. Het model is geconfigureerd met een minimum aantal records per knooppunt van 2 en gebruikt de Gini -index als kwaliteitsmaat. RF is een ensemble -methode die meerdere DT's combineert om de prestaties te verbeteren met behulp van een bootstrap -aggregatiemethode die een zwakke classificator voor elk monster genereert door willekeurig meerdere keren monsters van dezelfde grootte te trekken uit de oorspronkelijke dataset48. We gebruikten 100 bomen, 10 boomdiepten, 1 minimale knooppuntgrootte en Gini -bijmengde -index als knooppuntscheidingscriteria. De classificatie van nieuwe gegevens wordt bepaald door een meerderheid van stemmen. XGBOOST is een algoritme dat boostingtechnieken combineert met behulp van een methode die als trainingsgegevens de fout tussen de werkelijke en voorspelde waarden van het vorige model neemt en de fout vergroot met behulp van gradiënten49. Het is een veel gebruikt algoritme vanwege de goede prestaties en de efficiëntie van hulpbronnen, evenals een hoge betrouwbaarheid als een overfittingscorrectiefunctie. Het model is uitgerust met 400 ondersteuningswielen. MLP is een neuraal netwerk waarin een of meer perceptrons meerdere lagen vormen met een of meer verborgen lagen tussen de invoer- en uitvoerlagen38. Met dit kunt u niet-lineaire classificatie uitvoeren, waarbij wanneer u een invoerlaag toevoegt en een resultaatwaarde krijgt, de voorspelde resultaatwaarde wordt vergeleken met de werkelijke resultaatwaarde en de fout wordt teruggebracht. We hebben een verborgen laag gemaakt met 20 verborgen neuronen in elke laag. Elk model dat we ontwikkelden werd toegepast op interne en externe sets om de classificatieprestaties te testen door gevoeligheid, specificiteit, PPV, NPV en Auroc te berekenen. Gevoeligheid wordt gedefinieerd als de verhouding van een monster geschat op 18 jaar of ouder tot een monster geschat op 18 jaar of ouder. Specificiteit is het aandeel van monsters jonger dan 18 jaar en die geschat op de leeftijd van 18 jaar.
De in de trainingsset beoordeelde tandfasen werden omgezet in numerieke fasen voor statistische analyse. Multivariate lineaire en logistieke regressie werden uitgevoerd om voorspellende modellen voor elk geslacht te ontwikkelen en regressieformules af te leiden die kunnen worden gebruikt om de leeftijd te schatten. We hebben deze formules gebruikt om de tandtijd te schatten voor zowel interne als externe testsets. Tabel 4 toont de regressie- en classificatiemodellen die in deze studie worden gebruikt.
Intra- en interobserver betrouwbaarheid werd berekend met behulp van Cohen's Kappa-statistiek. Om de nauwkeurigheid van DM en traditionele regressiemodellen te testen, hebben we MAE en RMSE berekend met behulp van de geschatte en werkelijke leeftijden van de interne en externe testsets. Deze fouten worden vaak gebruikt om de nauwkeurigheid van modelvoorspellingen te evalueren. Hoe kleiner de fout, hoe hoger de nauwkeurigheid van de voorspelling24. Vergelijk de MAE en RMSE van interne en externe testsets berekend met behulp van DM en traditionele regressie. Classificatieprestaties van de 18-jarige cutoff in traditionele statistieken werden beoordeeld met behulp van een 2 × 2 contingentietabel. De berekende gevoeligheid, specificiteit, PPV, NPV en auroc van de testset werden vergeleken met de gemeten waarden van het DM -classificatiemodel. Gegevens worden uitgedrukt als gemiddelde ± standaardafwijking of aantal (%), afhankelijk van gegevenskenmerken. Tweezijdige P-waarden <0,05 werden als statistisch significant beschouwd. Alle routinematige statistische analyses werden uitgevoerd met behulp van SAS -versie 9.4 (SAS Institute, Cary, NC). Het DM -regressiemodel werd geïmplementeerd in Python met behulp van Keras50 2.2.4 backend en tensorflow51 1.8.0 specifiek voor wiskundige bewerkingen. Het DM -classificatiemodel werd geïmplementeerd in de Waikato Knowledge Analysis -omgeving en de Konstanz Information Miner (Knime) 4.6.152 Analyseplatform.
De auteurs erkennen dat gegevens ter ondersteuning van de conclusies van de studie kunnen worden gevonden in het artikel en aanvullende materialen. De datasets gegenereerd en/of geanalyseerd tijdens het onderzoek zijn verkrijgbaar bij de overeenkomstige auteur op redelijk verzoek.
Ritz-Timme, S. et al. Leeftijdsbeoordeling: Staat van de kunst om te voldoen aan de specifieke vereisten van de forensische praktijk. Internationaliteit. J. Juridische geneeskunde. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. en Olze, A. De huidige status van forensische leeftijdsbeoordeling van levende proefpersonen voor strafrechtelijke vervolging. Forensisch onderzoek. geneesmiddel. Pathologie. 1, 239–246 (2005).
Pan, J. et al. Een aangepaste methode voor het beoordelen van de tandheelkundige leeftijd van kinderen van 5 tot 16 jaar in Oost -China. Klinisch. Mondelinge enquête. 25, 3463–3474 (2021).
Lee, SS enz. Chronologie van de ontwikkeling van tweede en derde kiezen in Koreanen en de toepassing ervan voor forensische leeftijdsbeoordeling. Internationaliteit. J. Juridische geneeskunde. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy en Lee, SS Nauwkeurigheid van leeftijdsschatting en schatting van de 18-jarige drempel op basis van de volwassenheid van tweede en derde kiezen in Koreanen en Japans. PLOS ONE 17, E0271247 (2022).
Kim, JY, et al. Preoperatieve op machine learning gebaseerde data-analyse kan de uitkomst van de behandeling van slaapchirurgie voorspellen bij patiënten met OSA. de wetenschap. Rapport 11, 14911 (2021).
Han, M. et al. Nauwkeurige leeftijdsschatting van machine learning met of zonder menselijke tussenkomst? Internationaliteit. J. Juridische geneeskunde. 136, 821–831 (2022).
Khan, S. en Shaheen, M. Van datamining tot datamining. J. Informatie. de wetenschap. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. en Shaheen, M. Wisrule: het eerste cognitieve algoritme voor associatieregels. J. Informatie. de wetenschap. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. en Abdullah U. Karm: traditionele datamining op basis van contextgebaseerde associatieregels. berekenen. Mat. doorgaan. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. en Habib M. Deep Learning -gebaseerde semantische gelijkenisdetectie met behulp van tekstgegevens. informeren. Technologieën. controle. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. en Shahin, M. Een systeem voor het herkennen van activiteit in sportvideo's. multimedia. Tools Toepassingen https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge in Pediatric Bone Age. Radiology 290, 498–503 (2019).
Li, Y. et al. Forensische leeftijdsschatting van röntgenfoto's van bekken met behulp van diep leren. EURO. Straling. 29, 2322–2329 (2019).
Guo, YC, et al. Nauwkeurige leeftijdsclassificatie met behulp van handmatige methoden en diepe convolutionele neurale netwerken van orthografische projectiebeelden. Internationaliteit. J. Juridische geneeskunde. 135, 1589–1597 (2021).
Alabama Dalora et al. Botleeftijdschatting met behulp van verschillende methoden voor machine learning: een systematisch literatuuronderzoek en meta-analyse. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. en Yang, J. Populatiespecifieke leeftijdsschatting van Afro-Amerikanen en Chinezen op basis van pulpkamervolumes van eerste kiezen met behulp van kegelbundel computertomografie. Internationaliteit. J. Juridische geneeskunde. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK en OH KS bepalen leeftijdsgroepen van levende mensen met behulp van kunstmatige intelligentie-gebaseerde beelden van eerste kiezen. de wetenschap. Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. en Urschler, M. Automatische leeftijdsschatting en meerderheid van leeftijdsclassificatie van multivariate MRI -gegevens. IEEE J. Biomed. Gezondheidswaarschuwingen. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. en Li, G. Leeftijdsschatting op basis van 3D -pulpkamersegmentatie van eerste kiezen uit kegelbundelcomputtomografie door diepleren en niveausets te integreren. Internationaliteit. J. Juridische geneeskunde. 135, 365–373 (2021).
Wu, WT, et al. Datamining in klinische big data: gemeenschappelijke databases, stappen en methodenmodellen. Wereld. geneesmiddel. bron. 8, 44 (2021).
Yang, J. et al. Inleiding tot medische databases en dataminingtechnologieën in het Big Data -tijdperk. J. Avid. Basisgeneeskunde. 13, 57–69 (2020).
Shen, S. et al. Camerer's methode voor het schatten van de tandleeftijd met behulp van machine learning. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Vergelijking van verschillende methoden voor machine learning voor het voorspellen van de tandheelkundige leeftijd met behulp van de Demirdjian -staging -methode. Internationaliteit. J. Juridische geneeskunde. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. en Tanner, JM Een nieuw systeem voor het beoordelen van de tandheelkundige leeftijd. snuiven. biologie. 45, 211–227 (1973).
Landis, JR en Koch, GG -maatregelen van waarnemerovereenkomst over categorische gegevens. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK en Choi HK. Textuur, morfologische en statistische analyse van tweedimensionale magnetische resonantiebeeldvorming met behulp van kunstmatige intelligentietechnieken voor differentiatie van primaire hersentumoren. Gezondheidsinformatie. bron. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Posttijd: Jan-04-2024