Validation of a data mining model against traditional dental age estimation methods among Korean adolescents and young adults

Vă mulțumim că ați vizitat Nature.com. Versiunea browserului pe care o utilizați are suport CSS limitat. Pentru cele mai bune rezultate, vă recomandăm să utilizați o versiune mai nouă a browserului dvs. (sau să dezactivați modul de compatibilitate în Internet Explorer). Între timp, pentru a asigura un sprijin continuu, arătăm site -ul fără styling sau JavaScript.
Dintii sunt considerați cel mai exact indicator al vârstei corpului uman și sunt adesea folosiți în evaluarea vârstei criminalistice. Ne-am propus să validăm estimările de vârstă dentară bazată pe minerit, comparând precizia estimării și performanța de clasificare a pragului de 18 ani cu metodele tradiționale și estimările de vârstă bazate pe minerit. Un număr de 2657 de radiografii panoramice au fost colectate de la cetățenii coreeni și japonezi cu vârste cuprinse între 15 și 23 de ani. Acestea au fost împărțite într -un set de antrenament, fiecare conținând 900 de radiografii coreene și un set de test intern care conține 857 de radiografii japoneze. Am comparat exactitatea clasificării și eficiența metodelor tradiționale cu seturi de teste ale modelelor de exploatare a datelor. Precizia metodei tradiționale pe setul de teste interne este puțin mai mare decât cea a modelului de extragere a datelor, iar diferența este mică (eroare absolută medie <0,21 ani, eroare pătrată medie pătrată <0,24 ani). Performanța de clasificare pentru întreruperea de 18 ani este de asemenea similară între metodele tradiționale și modelele de exploatare a datelor. Astfel, metodele tradiționale pot fi înlocuite cu modelele de exploatare a datelor atunci când efectuează evaluarea criminalistică a vârstei folosind maturitatea molarilor secundari și a treia la adolescenții coreeni și adulții tineri.
Estimarea vârstei dentare este utilizată pe scară largă în medicina criminalistică și stomatologia pediatrică. În special, din cauza corelației ridicate între vârsta cronologică și dezvoltarea stomatologică, evaluarea vârstei de către etapele de dezvoltare dentară este un criteriu important pentru evaluarea vârstei copiilor și adolescenților1,2,3. Cu toate acestea, pentru tineri, estimarea vârstei dentare pe baza maturității dentare are limitările sale, deoarece creșterea dentară este aproape completă, cu excepția celui de -al treilea molar. Scopul legal de a determina vârsta tinerilor și adolescenților este de a oferi estimări exacte și dovezi științifice dacă au atins vârsta majorității. În practica medico-legală a adolescenților și a adulților tineri din Coreea, vârsta a fost estimată folosind metoda lui Lee și a fost prevăzut un prag legal de 18 ani pe baza datelor raportate de OH și colab.
Învățarea automată este un tip de inteligență artificială (AI) care învață în mod repetat și clasifică cantități mari de date, rezolvă problemele de la sine și conduce programarea datelor. Învățarea automată poate descoperi modele utile ascunse în volume mari de date6. În schimb, metodele clasice, care sunt consumatoare de muncă și consumatoare de timp, pot avea limitări atunci când se ocupă de volume mari de date complexe care sunt dificil de procesat manual7. Prin urmare, multe studii au fost efectuate recent folosind cele mai noi tehnologii computerizate pentru a minimiza erorile umane și pentru a prelucra eficient datele multidimensionale 8,9,10,11,12. În special, învățarea profundă a fost utilizată pe scară largă în analiza imaginilor medicale și au fost raportate diverse metode de estimare a vârstei prin analizarea automată a radiografiilor pentru a îmbunătăți precizia și eficiența estimării vârstei13,14,15,16,17,18,19,20 . De exemplu, Halabi și colab. 13 au dezvoltat un algoritm de învățare automată bazat pe rețele neuronale convoluționale (CNN) pentru a estima vârsta scheletică folosind radiografii ale mâinilor copiilor. Acest studiu propune un model care aplică învățarea automată la imaginile medicale și arată că aceste metode pot îmbunătăți precizia diagnosticării. Li și colab. Vârsta estimată din imaginile cu raze X pelvine folosind un CNN de învățare profundă și le-a comparat cu rezultatele regresiei folosind estimarea stadiului de osificare. Ei au descoperit că modelul CNN de învățare profundă a arătat aceeași performanță de estimare a vârstei ca și modelul de regresie tradițională. Studiul lui Guo și colab. [15] a evaluat performanța de clasificare a toleranței la vârstă a tehnologiei CNN bazate pe ortofoto dentară, iar rezultatele modelului CNN au dovedit că oamenii au depășit performanța de clasificare a vârstei.
Majoritatea studiilor privind estimarea vârstei folosind învățarea automată utilizează metode de învățare profundă13,14,15,16,17,18,19,20. Estimarea vârstei bazată pe învățarea profundă este raportată a fi mai exactă decât metodele tradiționale. Cu toate acestea, această abordare oferă puține oportunități de a prezenta baza științifică pentru estimările vârstei, cum ar fi indicatorii de vârstă folosiți în estimări. Există, de asemenea, o dispută legală cu privire la cine efectuează inspecțiile. Prin urmare, estimarea vârstei bazată pe învățarea profundă este dificil de acceptat de către autoritățile administrative și judiciare. Minerirea datelor (DM) este o tehnică care poate descoperi nu numai informațiile așteptate, ci și neașteptate ca metodă pentru descoperirea corelațiilor utile între cantități mari de date6,21,22. Învățarea automată este adesea utilizată în extragerea datelor, atât minierea datelor, cât și învățarea automată folosesc aceiași algoritmi cheie pentru a descoperi tipare în date. Estimarea vârstei folosind dezvoltarea stomatologică se bazează pe evaluarea examinatorului privind maturitatea dinților țintă, iar această evaluare este exprimată ca o etapă pentru fiecare dinte țintă. DM poate fi utilizat pentru a analiza corelația dintre stadiul de evaluare dentară și vârsta reală și are potențialul de a înlocui analiza statistică tradițională. Prin urmare, dacă aplicăm tehnici DM la estimarea vârstei, putem implementa învățarea automată în estimarea vârstei criminalistice, fără a ne face griji cu privire la răspunderea legală. Mai multe studii comparative au fost publicate pe posibile alternative la metodele manuale tradiționale utilizate în practica criminalistică și metodele bazate pe EBM pentru determinarea vârstei dentare. Shen și colab. Au arătat că modelul DM este mai precis decât formula tradițională a camererului. Galibourg și colab. A aplicat diferite metode DM pentru a prezice vârsta în funcție de criteriul demirdjian25, iar rezultatele au arătat că metoda DM a depășit metodele Demirdjian și Willems în estimarea vârstei populației franceze.
Pentru a estima epoca dentară a adolescenților coreeni și a adulților tineri, metoda lui Lee 4 este utilizată pe scară largă în practica criminalistică coreeană. Această metodă folosește analiza statistică tradițională (cum ar fi regresia multiplă) pentru a examina relația dintre subiecții coreeni și vârsta cronologică. În acest studiu, metodele de estimare a vârstei obținute folosind metode statistice tradiționale sunt definite drept „metode tradiționale”. Metoda lui Lee este o metodă tradițională, iar exactitatea acesteia a fost confirmată de Oh și colab. 5; Cu toate acestea, aplicabilitatea estimării vârstei pe baza modelului DM în practica criminalistică coreeană este încă discutabilă. Scopul nostru a fost să valideze științific utilitatea potențială a estimării vârstei pe baza modelului DM. Scopul acestui studiu a fost (1) să compare exactitatea a două modele DM în estimarea vârstei dentare și (2) pentru a compara performanța de clasificare a 7 modele DM la vârsta de 18 ani cu cele obținute folosind metode statistice tradiționale maturitatea a doua și al treilea molar în ambele fălci.
Mijloacele și abaterile standard ale vârstei cronologice după stadiu și tipul dinților sunt prezentate online în tabelul suplimentar S1 (set de antrenament), tabelul suplimentar S2 (set de test intern) și tabelul suplimentar S3 (set de teste externe). Valorile kappa pentru fiabilitatea intra și interobserver obținută din setul de antrenament au fost de 0,951 și, respectiv, 0,947. Valorile P și 95% intervale de încredere pentru valorile Kappa sunt prezentate în tabelul suplimentar online S4. Valoarea kappa a fost interpretată ca „aproape perfectă”, în concordanță cu criteriile lui Landis și Koch26.
Atunci când comparați o eroare absolută medie (MAE), metoda tradițională depășește ușor modelul DM pentru toate genurile și în setul de teste masculine externe, cu excepția perceptronului multistrat (MLP). Diferența dintre modelul tradițional și modelul DM pe setul de teste MAE intern a fost de 0,12-0,19 ani pentru bărbați și 0,17–0,21 ani pentru femei. Pentru bateria de testare externă, diferențele sunt mai mici (0,001–0,05 ani pentru bărbați și 0,05–0,09 ani pentru femei). În plus, eroarea pătrată medie a rădăcinii (RMSE) este puțin mai mică decât metoda tradițională, cu diferențe mai mici (0,17–0,24, 0,2–0,24 pentru setul de test intern masculin și 0,03–0,07, 0,04–0,08 pentru setul de test extern). ). MLP prezintă o performanță ușor mai bună decât perceptul de un singur strat (SLP), cu excepția setului de testare externă feminină. Pentru MAE și RMSE, setul de teste extern este mai mare decât setul de test intern pentru toate genurile și modelele. Toate Mae și RMSE sunt prezentate în tabelul 1 și figura 1.
MAE și RMSE de modele de regresie tradițională și minieră de date. Eroare medie absolută MAE, eroare pătrată medie RMSE, SLP -ul cu un singur strat SLP, MLP -ul perceptron multistrat, metoda tradițională CM.
Performanța de clasificare (cu o întrerupere de 18 ani) a modelelor tradiționale și DM a fost demonstrată în termeni de sensibilitate, specificitate, valoare predictivă pozitivă (PPV), valoare predictivă negativă (VNV) și zonă sub curba caracteristică de funcționare a receptorului (Auroc) 27 (Tabelul 2, Figura 2 și Figura suplimentară 1 online). În ceea ce privește sensibilitatea bateriei de testare internă, metodele tradiționale s -au comportat cel mai bine în rândul bărbaților și mai rău în rândul femeilor. Cu toate acestea, diferența de performanță de clasificare între metodele tradiționale și SD este de 9,7% pentru bărbați (MLP) și doar 2,4% pentru femei (XGBOOST). Printre modelele DM, regresia logistică (LR) a arătat o sensibilitate mai bună la ambele sexe. În ceea ce privește specificitatea setului de teste interne, s -a observat că cele patru modele SD au avut performanțe bune la bărbați, în timp ce modelul tradițional s -a comportat mai bine la femei. Diferențele de performanță de clasificare pentru bărbați și femei sunt de 13,3% (MLP) și, respectiv, 13,1% (MLP), ceea ce indică faptul că diferența de performanță de clasificare între modele depășește sensibilitatea. Printre modelele DM, modelele de asistență vectorială (SVM), arborele de decizie (DT) și modelele aleatorii de pădure (RF) au avut performanțe cele mai bune în rândul bărbaților, în timp ce modelul LR a fost cel mai bine în rândul femelelor. AUROC al modelului tradițional și toate modelele SD a fost mai mare de 0,925 (vecinul cel mai mare K (KNN) la bărbați), demonstrând performanțe excelente de clasificare în discriminarea probelor de 18 ani. Pentru setul de teste externe, a existat o scădere a performanței de clasificare în ceea ce privește sensibilitatea, specificitatea și Auroc în comparație cu setul de teste interne. Mai mult, diferența de sensibilitate și specificitate între performanța de clasificare a celor mai bune și mai rele modele a variat de la 10% la 25% și a fost mai mare decât diferența în setul de test intern.
Sensibilitatea și specificitatea modelelor de clasificare a minierelor de date în comparație cu metodele tradiționale cu o întrerupere de 18 ani. KNN K cel mai apropiat vecin, vector de suport SVM, regresie logistică LR, arbore de decizie DT, RF Random Forest, XGB XGBOOST, MLP multistrat perceptron, metodă tradițională CM.
Primul pas în acest studiu a fost compararea exactității estimărilor de vârstă dentară obținută de la șapte modele DM cu cele obținute folosind regresia tradițională. MAE și RMSE au fost evaluate în seturile de teste interne pentru ambele sexe, iar diferența dintre metoda tradițională și modelul DM a variat de la 44 la 77 de zile pentru MAE și de la 62 la 88 de zile pentru RMSE. Deși metoda tradițională a fost puțin mai precisă în acest studiu, este dificil să concluzionăm dacă o diferență atât de mică are o semnificație clinică sau practică. Aceste rezultate indică faptul că precizia estimării vârstei dentare folosind modelul DM este aproape aceeași cu cea a metodei tradiționale. Comparația directă cu rezultatele studiilor anterioare este dificilă, deoarece niciun studiu nu a comparat exactitatea modelelor DM cu metodele statistice tradiționale folosind aceeași tehnică de înregistrare a dinților în aceeași gamă de vârstă ca în acest studiu. Galibourg și colab. Au comparat MAE și RMSE între două metode tradiționale (Metoda Demirjian25 și Metoda Willems29) și 10 modele DM într -o populație franceză cu vârste cuprinse între 2 și 24 de ani. Ei au raportat că toate modelele DM au fost mai precise decât metodele tradiționale, cu diferențe de 0,20 și 0,38 ani în MAE și 0,25 și 0,47 ani în RMSE, comparativ cu metodele Willems și, respectiv, demirdjian. Discrepanța dintre modelul SD și metodele tradiționale prezentate în studiul Halibourg ține cont de numeroase rapoarte 30,31,32,33 că metoda demirdjian nu estimează cu exactitate vârsta dentară în alte populații decât canadienii francezi pe care s -a bazat studiul. În acest studiu. Tai și colab. 34 au folosit algoritmul MLP pentru a prezice vârsta dinților din 1636 de fotografii ortodontice chinezești și a comparat exactitatea acestuia cu rezultatele metodei Demirjian și Willems. Ei au raportat că MLP are o precizie mai mare decât metodele tradiționale. Diferența dintre metoda demirdjian și metoda tradițională este <0,32 ani, iar metoda Willems este de 0,28 ani, ceea ce este similar cu rezultatele prezentului studiu. Rezultatele acestor studii anterioare24,34 sunt, de asemenea, în concordanță cu rezultatele studiului de față, iar precizia estimării vârstei a modelului DM și metoda tradițională sunt similare. Cu toate acestea, pe baza rezultatelor prezentate, putem concluziona cu precauție doar că utilizarea modelelor DM pentru a estima vârsta poate înlocui metodele existente din cauza lipsei de studii anterioare comparative și de referință. Studiile de urmărire folosind probe mai mari sunt necesare pentru a confirma rezultatele obținute în acest studiu.
Printre studiile care testează precizia SD în estimarea vârstei dentare, unele au arătat o precizie mai mare decât studiul nostru. Stepanovsky și colab. 35 au aplicat 22 de modele SD la radiografii panoramice ale 976 rezidenți cehe cu vârste cuprinse între 2,7 și 20,5 ani și au testat exactitatea fiecărui model. Ei au evaluat dezvoltarea unui total de 16 dinți permanenți din stânga superioară și inferioară folosind criteriile de clasificare propuse de Moorrees și colab. 36. MAE variază de la 0,64 la 0,94 ani, iar RMSE variază de la 0,85 la 1,27 ani, care sunt mai precise decât cele două modele DM utilizate în acest studiu. Shen și al23 au folosit metoda camererelor pentru a estima vârsta dentară a șapte dinți permanenți în mandibula stângă la rezidenții chinezi de est cu vârste cuprinse între 5 și 13 ani și au comparat -o cu vârste estimate folosind regresie liniară, SVM și RF. Ei au arătat că toate cele trei modele DM au o precizie mai mare în comparație cu formula tradițională de camerere. Mae și RMSE în studiul lui Shen au fost mai mici decât cele din modelul DM din acest studiu. Precizia crescută a studiilor realizate de Stepanovsky și colab. 35 și Shen și colab. 23 se poate datora includerii subiecților mai tineri în eșantioanele lor de studiu. Deoarece estimările de vârstă pentru participanții cu dinți în curs de dezvoltare devin mai exacte pe măsură ce numărul de dinți crește în timpul dezvoltării stomatologice, precizia metodei de estimare a vârstei rezultate poate fi compromisă atunci când participanții la studiu sunt mai tineri. În plus, eroarea MLP în estimarea vârstei este puțin mai mică decât SLP -ul, ceea ce înseamnă că MLP este mai precis decât SLP. MLP este considerat puțin mai bun pentru estimarea vârstei, posibil datorită straturilor ascunse din MLP38. Cu toate acestea, există o excepție pentru eșantionul exterior de femei (SLP 1.45, MLP 1.49). Constatarea că MLP este mai precisă decât SLP în evaluarea vârstei necesită studii retrospective suplimentare.
De asemenea, a fost comparată performanța de clasificare a modelului DM și metoda tradițională la un prag de 18 ani. Toate modelele SD testate și metodele tradiționale de pe setul de teste interne au arătat niveluri de discriminare practic acceptabile pentru eșantionul de 18 ani. Sensibilitatea pentru bărbați și femei a fost mai mare de 87,7% și, respectiv, 94,9%, iar specificitatea a fost mai mare de 89,3% și 84,7%. AUROC a tuturor modelelor testate depășește, de asemenea, 0,925. În conformitate cu cunoștințele noastre, niciun studiu nu a testat performanța modelului DM pentru clasificarea de 18 ani pe baza maturității dentare. Putem compara rezultatele acestui studiu cu performanța de clasificare a modelelor de învățare profundă pe radiografii panoramice. Guo și colab.15 au calculat performanța de clasificare a unui model de învățare profundă bazat pe CNN și o metodă manuală bazată pe metoda lui Demirjian pentru un anumit prag de vârstă. Sensibilitatea și specificitatea metodei manuale au fost de 87,7% și, respectiv, 95,5%, iar sensibilitatea și specificitatea modelului CNN au depășit 89,2% și, respectiv, 86,6%. Ei au ajuns la concluzia că modelele de învățare profundă pot înlocui sau depăși evaluarea manuală în clasificarea pragurilor de vârstă. Rezultatele acestui studiu au arătat o performanță similară de clasificare; Se crede că clasificarea folosind modele DM poate înlocui metodele statistice tradiționale pentru estimarea vârstei. Printre modele, DM LR a fost cel mai bun model din punct de vedere al sensibilității pentru eșantionul masculin și sensibilitatea și specificitatea pentru eșantionul feminin. LR se află pe locul doi în specificitate pentru bărbați. Mai mult, LR este considerat unul dintre modelele DM35 mai ușor de utilizat și este mai puțin complexă și dificil de procesat. Pe baza acestor rezultate, LR a fost considerat cel mai bun model de clasificare a întreruperilor pentru copiii de 18 ani din populația coreeană.
În general, precizia estimării vârstei sau a performanței clasificării pe setul de teste externe a fost slabă sau mai mică în comparație cu rezultatele din setul de teste interne. Unele rapoarte indică faptul că precizia clasificării sau eficiența scade atunci când estimările de vârstă pe baza populației coreene sunt aplicate populației japoneze 5,39 și un model similar a fost găsit în studiul de față. Această tendință de deteriorare a fost observată și în modelul DM. Prin urmare, pentru a estima cu exactitate vârsta, chiar și atunci când utilizați DM în procesul de analiză, metodele derivate din datele populației autohtone, cum ar fi metodele tradiționale, ar trebui să fie preferate 5,39,40,41,42. Întrucât nu este clar dacă modelele de învățare profundă pot arăta tendințe similare, studii care compară precizia și eficiența clasificării folosind metode tradiționale, modele DM și modele de învățare profundă pe aceleași probe sunt necesare pentru a confirma dacă inteligența artificială poate depăși aceste disparități rasiale la vârsta limitată. evaluări.
Demonstrăm că metodele tradiționale pot fi înlocuite cu estimarea vârstei pe baza modelului DM în practica de estimare a vârstei criminalistice în Coreea. De asemenea, am descoperit posibilitatea implementării învățării automate pentru evaluarea criminalistică a vârstei. Cu toate acestea, există limitări clare, cum ar fi numărul insuficient de participanți la acest studiu pentru a determina definitiv rezultatele și lipsa studiilor anterioare pentru a compara și confirma rezultatele acestui studiu. În viitor, studiile DM ar trebui efectuate cu un număr mai mare de eșantioane și populații mai diverse pentru a -și îmbunătăți aplicabilitatea practică în comparație cu metodele tradiționale. Pentru a valida fezabilitatea utilizării inteligenței artificiale pentru a estima vârsta în mai multe populații, sunt necesare studii viitoare pentru a compara precizia și eficiența clasificării modelelor DM și de învățare profundă cu metode tradiționale în aceleași probe.
Studiul a folosit 2.657 de fotografii ortografice colectate de la adulții coreeni și japonezi cu vârste cuprinse între 15 și 23 de ani. Radiografiile coreene au fost împărțite în 900 de seturi de instruire (19,42 ± 2,65 ani) și 900 de seturi de teste interne (19,52 ± 2,59 ani). Setul de instruire a fost colectat la o instituție (Spitalul Seul St. Mary's), iar propriul set de teste a fost colectat la două instituții (Spitalul stomatologic al Universității Naționale din Seul și Spitalul Dental al Universității Yonsei). De asemenea, am colectat 857 de radiografii din alte date bazate pe populație (IWATE Medical University, Japonia) pentru testarea externă. Radiografiile subiecților japonezi (19,31 ± 2,60 ani) au fost selectate ca set de teste externe. Datele au fost colectate retrospectiv pentru a analiza etapele dezvoltării stomatologice pe radiografiile panoramice luate în timpul tratamentului stomatologic. Toate datele colectate au fost anonime, cu excepția genului, a datei nașterii și a datei radiografiei. Criteriile de incluziune și excludere au fost aceleași cu studiile publicate anterior 4, 5. Vârsta efectivă a eșantionului a fost calculată scăzând data nașterii de la data la care a fost luată radiografia. Grupul de probe a fost împărțit în nouă grupe de vârstă. Distribuțiile de vârstă și sex sunt prezentate în tabelul 3 Acest studiu a fost realizat în conformitate cu Declarația de la Helsinki și aprobată de Consiliul de revizuire instituțională (IRB) din Spitalul St. Mary din Seul St. al Universității Catolice din Coreea (KC22WISI0328). Datorită proiectării retrospective a acestui studiu, consimțământul informat nu a putut fi obținut de la toți pacienții care au suferit examen radiografic în scop terapeutic. Spitalul St. Mary's al Universității din Seul Coreea (IRB) a renunțat la cerința de consimțământ informat.
Etapele de dezvoltare ale molarilor din al doilea și al treilea bimaxilar au fost evaluate conform criteriilor demircan25. Un singur dinte a fost selectat dacă s -a găsit același tip de dinte pe partea stângă și dreapta a fiecărei maxilare. Dacă dinții omologi de pe ambele părți erau în etape de dezvoltare diferite, dintele cu stadiul de dezvoltare inferior a fost selectat pentru a ține cont de incertitudinea vârstei estimate. O sută de radiografii selectate aleatoriu din setul de antrenament au fost notate de doi observatori cu experiență pentru a testa fiabilitatea interobserverului după precalibrare pentru a determina stadiul de maturitate dentară. Fiabilitatea intraobserver a fost evaluată de două ori la intervale de trei luni de către observatorul primar.
Etapa de sex și dezvoltare a celui de -al doilea și al treilea molar al fiecărui maxilar din setul de antrenament au fost estimate de un observator primar instruit cu diferite modele DM, iar vârsta reală a fost stabilită ca valoare țintă. Modelele SLP și MLP, care sunt utilizate pe scară largă în învățarea automată, au fost testate împotriva algoritmilor de regresie. Modelul DM combină funcțiile liniare folosind etapele de dezvoltare ale celor patru dinți și combină aceste date pentru a estima vârsta. SLP este cea mai simplă rețea neuronală și nu conține straturi ascunse. SLP funcționează pe baza transmisiei pragului între noduri. Modelul SLP în regresie este similar matematic cu regresia liniară multiplă. Spre deosebire de modelul SLP, modelul MLP are mai multe straturi ascunse cu funcții de activare neliniară. Experimentele noastre au folosit un strat ascuns cu doar 20 de noduri ascunse cu funcții de activare neliniară. Utilizați coborârea gradientului ca metodă de optimizare și MAE și RMSE ca funcție de pierdere pentru a ne antrena modelul de învățare automată. Cel mai bun model de regresie obținut a fost aplicat pe seturile de teste interne și externe și a fost estimată vârsta dinților.
A fost dezvoltat un algoritm de clasificare care folosește maturitatea a patru dinți pe setul de antrenament pentru a prezice dacă un eșantion are 18 ani sau nu. Pentru a construi modelul, am derivat șapte algoritmi de învățare automată 6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST și (7) MLP . LR este unul dintre cei mai utilizați algoritmi de clasificare 444. Este un algoritm de învățare supravegheat care folosește regresia pentru a prezice probabilitatea datelor aparținând unei anumite categorii de la 0 la 1 și clasifică datele ca aparținând unei categorii mai probabile bazate pe această probabilitate; utilizat în principal pentru clasificarea binară. KNN este unul dintre cei mai simpli algoritmi de învățare automată45. Atunci când li se oferă date noi de intrare, găsește date K apropiate de setul existent și apoi le clasifică în clasă cu cea mai mare frecvență. Am stabilit 3 pentru numărul de vecini luați în considerare (k). SVM este un algoritm care maximizează distanța dintre două clase folosind o funcție de kernel pentru a extinde spațiul liniar într-un spațiu neliniar numit Fields46. Pentru acest model, folosim prejudecăți = 1, putere = 1 și gamma = 1 ca hiperparametre pentru nucleul polinomial. DT a fost aplicat în diferite domenii ca algoritm pentru împărțirea unui întreg date stabilite în mai multe subgrupuri, reprezentând reguli de decizie într -o structură a arborelui47. Modelul este configurat cu un număr minim de înregistrări pe nod de 2 și folosește indicele Gini ca măsură a calității. RF este o metodă de ansamblu care combină mai multe DT -uri pentru a îmbunătăți performanța folosind o metodă de agregare a bootstrap -ului care generează un clasificator slab pentru fiecare eșantion prin trasarea aleatorie a eșantioanelor de aceeași dimensiune de mai multe ori de la DataSet48 original. Am folosit 100 de copaci, 10 adâncimi de copac, 1 dimensiune minimă a nodului și indice de amestec Gini ca criterii de separare a nodului. Clasificarea noilor date este determinată de un vot majoritar. XGBOOST este un algoritm care combină tehnicile de impulsare folosind o metodă care ia ca date de instruire eroarea dintre valorile reale și cele prezise ale modelului anterior și crește eroarea folosind Gradients49. Este un algoritm utilizat pe scară largă datorită performanței sale bune și eficienței resurselor, precum și fiabilității ridicate ca funcție de corecție excesivă. Modelul este echipat cu 400 de roți de sprijin. MLP este o rețea neuronală în care unul sau mai multe percepte formează mai multe straturi cu unul sau mai multe straturi ascunse între straturile de intrare și ieșire38. Folosind acest lucru, puteți efectua o clasificare neliniară în cazul în care adăugați un strat de intrare și obțineți o valoare a rezultatului, valoarea rezultatului prevăzut este comparată cu valoarea rezultatelor reale și eroarea este propagată înapoi. Am creat un strat ascuns cu 20 de neuroni ascunși în fiecare strat. Fiecare model pe care l -am dezvoltat a fost aplicat la seturi interne și externe pentru a testa performanța clasificării prin calcularea sensibilității, specificității, PPV, NPV și AuroC. Sensibilitatea este definită ca raportul dintre un eșantion estimat la vârsta de 18 ani sau mai mare la un eșantion estimat la vârsta de 18 ani sau mai mult. Specificitatea este proporția de eșantioane sub 18 ani, iar cele estimate a fi sub 18 ani.
Etapele dentare evaluate în setul de instruire au fost transformate în etape numerice pentru analiza statistică. Regresia liniară și logistică multivariată au fost efectuate pentru a dezvolta modele predictive pentru fiecare sex și derivă formule de regresie care pot fi utilizate pentru a estima vârsta. Am folosit aceste formule pentru a estima vârsta dinților atât pentru seturi de teste interne, cât și externe. Tabelul 4 prezintă modelele de regresie și clasificare utilizate în acest studiu.
Fiabilitatea intra și interobserver a fost calculată folosind statistica Kappa a lui Cohen. Pentru a testa precizia DM și a modelelor de regresie tradițională, am calculat MAE și RMSE folosind vârstele estimate și reale ale seturilor de teste interne și externe. Aceste erori sunt utilizate în mod obișnuit pentru a evalua exactitatea predicțiilor modelului. Cu cât eroarea este mai mică, cu atât este mai mare precizia prognozei24. Comparați Mae și RMSE de seturi de teste interne și externe calculate folosind DM și regresie tradițională. Performanța de clasificare a întreruperului de 18 ani în statisticile tradiționale a fost evaluată folosind un tabel de urgență 2 × 2. Sensibilitatea calculată, specificitatea, PPV, NPV și AuroC a setului de testare au fost comparate cu valorile măsurate ale modelului de clasificare DM. Datele sunt exprimate ca medie ± abatere sau număr standard (%) în funcție de caracteristicile datelor. Valorile P pe două fețe <0,05 au fost considerate semnificative statistic. Toate analizele statistice de rutină au fost efectuate folosind versiunea SAS 9.4 (SAS Institute, Cary, NC). Modelul de regresie DM a fost implementat în Python folosind Keras50 2.2.4 backend și TensorFlow51 1.8.0 special pentru operațiuni matematice. Modelul de clasificare DM a fost implementat în mediul de analiză a cunoștințelor Waikato și în Platforma de analiză Konstanz Information (KNIME) 4.6.152.
Autorii recunosc că datele care susțin concluziile studiului pot fi găsite în articol și materiale suplimentare. Seturile de date generate și/sau analizate în timpul studiului sunt disponibile de la autorul corespunzător la o cerere rezonabilă.
Ritz-Timme, S. și colab. Evaluarea vârstei: de ultimă generație pentru a îndeplini cerințele specifice ale practicii criminalistice. Internaționalitate. J. Medicină legală. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. și Olze, A. Starea actuală a evaluării vârstei criminalistice a subiecților vii în scopuri de urmărire penală. Criminalistică. medicament. Patologie. 1, 239–246 (2005).
Pan, J. și colab. O metodă modificată pentru evaluarea vârstei dentare a copiilor cu vârste cuprinse între 5 și 16 ani în estul Chinei. clinic. Sondaj oral. 25, 3463–3474 (2021).
Lee, SS etc. Cronologia dezvoltării a doua și a treia molare în coreeni și cererea sa pentru evaluarea criminalistică a vârstei. Internaționalitate. J. Medicină legală. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy și Lee, SS Precizia estimării vârstei și estimarea pragului de 18 ani pe baza maturității molarilor secundari și a treia la coreeni și japonezi. PLOS ONE 17, E0271247 (2022).
Kim, JY și colab. Analiza preoperatorie a datelor bazate pe învățarea automată poate prezice rezultatul tratamentului chirurgiei somnului la pacienții cu OSA. Știința. Raport 11, 14911 (2021).
Han, M. și colab. Estimarea exactă a vârstei de la învățarea automată cu sau fără intervenția umană? Internaționalitate. J. Medicină legală. 136, 821–831 (2022).
Khan, S. și Shaheen, M. De la extragerea datelor până la extragerea datelor. J.information. Știința. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. și Shaheen, M. Wisrule: Primul algoritm cognitiv pentru exploatarea regulilor de asociere. J.information. Știința. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. și Abdullah U. Karm: extragerea tradițională a datelor bazate pe reguli de asociere bazate pe context. calcula. Matt. continua. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. și Habib M. Detectarea de similaritate semantică bazată pe învățare profundă folosind date de text. informa. tehnologii. controla. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. și Shahin, M. Un sistem de recunoaștere a activității în videoclipuri sportive. multimedia. Instrumente aplicații https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS și colab. RSNA Machine Learning Challenge în epoca oaselor pediatrice. Radiologie 290, 498–503 (2019).
Li, Y. și colab. Estimarea vârstei criminalistice de la radiografiile pelvine folosind învățarea profundă. EURO. radiații. 29, 2322–2329 (2019).
Guo, YC și colab. Clasificarea exactă a vârstei folosind metode manuale și rețele neuronale convoluționale profunde din imagini de proiecție ortografică. Internaționalitate. J. Medicină legală. 135, 1589–1597 (2021).
Alabama Dalora și colab. Estimarea vârstei osoase folosind diferite metode de învățare automată: o revizuire sistematică a literaturii și meta-analiză. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. și Yang, J. Estimarea vârstei specifice populației afro-americanilor și chinezilor, pe baza volumelor camerei de pulpă a primilor molari care folosesc tomografie computerizată cu fascicul cu con. Internaționalitate. J. Medicină legală. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK și OH KS care determină grupuri de vârstă ale persoanelor vii care folosesc imagini bazate pe inteligență artificială ale primilor molari. Știința. Raport 11, 1073 (2021).
Stern, D., plătitor, C., Giuliani, N. și Urschler, M. Estimarea automată a vârstei și clasificarea majorității vârstei din datele RMN multivariate. IEEE J. Biomed. Alerte de sănătate. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. și Li, G. Estimarea vârstei pe baza segmentării camerei de pulpă 3D a primilor molari din tomografia calculată cu fascicul de con, integrând seturi de învățare profundă și nivel. Internaționalitate. J. Medicină legală. 135, 365–373 (2021).
Wu, WT și colab. Minerea de date în datele mari clinice: baze de date comune, pași și metode. Lume. medicament. resursă. 8, 44 (2021).
Yang, J. și colab. Introducere în bazele de date medicale și tehnologiile de extragere a datelor din epoca Big Data. J. Avid. Medicină de bază. 13, 57–69 (2020).
Shen, S. și colab. Metoda Camerer pentru estimarea vârstei dinților folosind învățarea automată. BMC Oral Health 21, 641 (2021).
Galliburg A. și colab. Comparația diferitelor metode de învățare automată pentru prezicerea epocii dentare folosind metoda de stadializare Demirdjian. Internaționalitate. J. Medicină legală. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. și Tanner, JM Un nou sistem pentru evaluarea vârstei dentare. sforăie. biologie. 45, 211–227 (1973).
Landis, Jr și Koch, GG Măsuri ale Acordului de observator privind datele categorice. Biometrie 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK și Choi HK. Analiza texturală, morfologică și statistică a imaginii prin rezonanță magnetică bidimensională folosind tehnici de inteligență artificială pentru diferențierea tumorilor cerebrale primare. Informații despre sănătate. resursă. https://doi.org/10.4258/hir.2022.28.1.46 (2022).

Ora post: 04-2024 ianuarie

Validarea unui model de extragere a datelor împotriva metodelor tradiționale de estimare a vârstei dentare în rândul adolescenților coreeni și al adulților tineri