• noi

Validarea unui model de extragere a datelor față de metodele tradiționale de estimare a vârstei dentare în rândul adolescenților și adulților tineri coreeni

Vă mulțumim că ați vizitat Nature.com.Versiunea de browser pe care o utilizați are suport limitat pentru CSS.Pentru cele mai bune rezultate, vă recomandăm să utilizați o versiune mai nouă a browserului dvs. (sau să dezactivați modul de compatibilitate în Internet Explorer).Între timp, pentru a asigura suport continuu, arătăm site-ul fără stil sau JavaScript.
Dinții sunt considerați cel mai precis indicator al vârstei corpului uman și sunt adesea utilizați în evaluarea vârstei medico-legale.Ne-am propus să validăm estimările vârstei dentare bazate pe data mining, comparând acuratețea estimării și performanța de clasificare a pragului de 18 ani cu metodele tradiționale și estimările de vârstă bazate pe data mining.Un total de 2657 de radiografii panoramice au fost colectate de la cetățeni coreeni și japonezi cu vârsta cuprinsă între 15 și 23 de ani.Au fost împărțiți într-un set de antrenament, fiecare conținând 900 de radiografii coreene și un set de testare intern care conține 857 de radiografii japoneze.Am comparat acuratețea clasificării și eficiența metodelor tradiționale cu seturile de testare ale modelelor de data mining.Precizia metodei tradiționale pe setul de testare intern este puțin mai mare decât cea a modelului de data mining, iar diferența este mică (eroare absolută medie <0,21 ani, eroare pătrată medie <0,24 ani).Performanța de clasificare pentru limita de 18 ani este, de asemenea, similară între metodele tradiționale și modelele de data mining.Astfel, metodele tradiționale pot fi înlocuite cu modele de extragere a datelor atunci când se efectuează evaluarea vârstei criminalistice folosind maturitatea molarilor doi și trei la adolescenții și adulții tineri coreeni.
Estimarea vârstei dentare este utilizată pe scară largă în medicina legală și stomatologia pediatrică.În special, din cauza corelației mari dintre vârsta cronologică și dezvoltarea dentară, evaluarea vârstei pe stadii de dezvoltare dentară este un criteriu important pentru aprecierea vârstei copiilor și adolescenților1,2,3.Totuși, pentru tineri, estimarea vârstei dentare pe baza maturității dentare are limitările sale, deoarece creșterea dentară este aproape completă, cu excepția molarilor trei.Scopul legal al determinării vârstei tinerilor și adolescenților este de a oferi estimări precise și dovezi științifice privind dacă aceștia au împlinit vârsta majoratului.În practica medico-legală a adolescenților și adulților tineri din Coreea, vârsta a fost estimată folosind metoda lui Lee, iar un prag legal de 18 ani a fost prezis pe baza datelor raportate de Oh et al 5 .
Învățarea automată este un tip de inteligență artificială (AI) care învață și clasifică în mod repetat cantități mari de date, rezolvă problemele pe cont propriu și conduce programarea datelor.Învățarea automată poate descoperi modele ascunse utile în volume mari de date6.În schimb, metodele clasice, care necesită multă muncă și consumă mult timp, pot avea limitări atunci când se ocupă cu volume mari de date complexe care sunt dificil de procesat manual7.Prin urmare, multe studii au fost efectuate recent folosind cele mai recente tehnologii informatice pentru a minimiza erorile umane și a procesa eficient datele multidimensionale8,9,10,11,12.În special, învățarea profundă a fost utilizată pe scară largă în analiza imaginilor medicale și s-au raportat că diferite metode de estimare a vârstei prin analiza automată a radiografiilor îmbunătățesc acuratețea și eficiența estimării vârstei13,14,15,16,17,18,19,20. .De exemplu, Halabi et al 13 au dezvoltat un algoritm de învățare automată bazat pe rețele neuronale convoluționale (CNN) pentru a estima vârsta scheletică folosind radiografii ale mâinilor copiilor.Acest studiu propune un model care aplică învățarea automată imaginilor medicale și arată că aceste metode pot îmbunătăți acuratețea diagnosticului.Li și colab.14 au estimat vârsta din imaginile cu raze X pelvine utilizând un CNN de învățare profundă și le-au comparat cu rezultatele regresiei utilizând estimarea stadiului de osificare.Ei au descoperit că modelul CNN de învățare profundă a arătat aceeași performanță de estimare a vârstei ca modelul tradițional de regresie.Studiul lui Guo et al. [15] a evaluat performanța de clasificare a toleranței de vârstă a tehnologiei CNN bazată pe ortofotografii dentare, iar rezultatele modelului CNN au demonstrat că oamenii au depășit performanța de clasificare a vârstei.
Majoritatea studiilor privind estimarea vârstei folosind învățarea automată folosesc metode de învățare profundă13,14,15,16,17,18,19,20.Estimarea vârstei bazată pe învățarea profundă este raportată a fi mai precisă decât metodele tradiționale.Cu toate acestea, această abordare oferă puține oportunități de a prezenta baza științifică pentru estimările de vârstă, cum ar fi indicatorii de vârstă utilizați în estimări.Există, de asemenea, o dispută juridică cu privire la cine efectuează inspecțiile.Prin urmare, estimarea vârstei bazată pe învățarea profundă este greu de acceptat de autoritățile administrative și judiciare.Data mining (DM) este o tehnică care poate descoperi nu numai informații așteptate, ci și neașteptate, ca metodă de descoperire a corelațiilor utile între cantități mari de date6,21,22.Învățarea automată este adesea folosită în extragerea datelor, iar atât extragerea datelor, cât și învățarea automată folosesc aceiași algoritmi cheie pentru a descoperi modele în date.Estimarea vârstei folosind dezvoltarea dentară se bazează pe evaluarea de către examinator a maturității dinților țintă, iar această evaluare este exprimată ca o etapă pentru fiecare dinte țintă.DM poate fi folosit pentru a analiza corelația dintre etapa de evaluare dentară și vârsta reală și are potențialul de a înlocui analiza statistică tradițională.Prin urmare, dacă aplicăm tehnici DM la estimarea vârstei, putem implementa învățarea automată în estimarea vârstei criminalistice fără a ne face griji cu privire la răspunderea legală.Au fost publicate mai multe studii comparative privind posibilele alternative la metodele manuale tradiționale utilizate în practica criminalistică și metodele bazate pe EBM pentru determinarea vârstei dentare.Shen et al23 au arătat că modelul DM este mai precis decât formula tradițională Camerer.Galibourg et al24 au aplicat diferite metode DM pentru a prezice vârsta conform criteriului Demirdjian25 iar rezultatele au arătat că metoda DM a depășit metodele Demirdjian și Willems în estimarea vârstei populației franceze.
Pentru a estima vârsta dentară a adolescenților și adulților tineri coreeni, metoda 4 a lui Lee este utilizată pe scară largă în practica criminalistică coreeană.Această metodă utilizează analiza statistică tradițională (cum ar fi regresia multiplă) pentru a examina relația dintre subiecții coreeni și vârsta cronologică.În acest studiu, metodele de estimare a vârstei obținute cu ajutorul metodelor statistice tradiționale sunt definite ca „metode tradiționale”.Metoda lui Lee este o metodă tradițională, iar acuratețea ei a fost confirmată de Oh și colab.5;cu toate acestea, aplicabilitatea estimării vârstei bazate pe modelul DM în practica criminalistică coreeană este încă discutabilă.Scopul nostru a fost să validăm științific utilitatea potențială a estimării vârstei pe baza modelului DM.Scopul acestui studiu a fost (1) să compare acuratețea a două modele DM în estimarea vârstei dentare și (2) să compare performanțele de clasificare a 7 modele DM la vârsta de 18 ani cu cele obținute prin metode statistice tradiționale. și al treilea molari la ambele maxilare.
Mediile și abaterile standard ale vârstei cronologice în funcție de stadiu și tip de dinte sunt afișate online în Tabelul suplimentar S1 (set de antrenament), Tabelul suplimentar S2 (set de testare intern) și Tabelul suplimentar S3 (set de testare extern).Valorile kappa pentru fiabilitatea intra și interobservator obținute din setul de antrenament au fost 0,951 și, respectiv, 0,947.Valorile P și intervalele de încredere de 95% pentru valorile kappa sunt afișate în tabelul suplimentar online S4.Valoarea kappa a fost interpretată ca „aproape perfectă”, în concordanță cu criteriile lui Landis și Koch26.
Când se compară eroarea medie absolută (MAE), metoda tradițională depășește ușor modelul DM pentru toate genurile și în setul de test extern masculin, cu excepția perceptronului multistrat (MLP).Diferența dintre modelul tradițional și modelul DM pe setul de test intern MAE a fost de 0,12–0,19 ani pentru bărbați și 0,17–0,21 ani pentru femei.Pentru bateria de testare externă, diferențele sunt mai mici (0,001–0,05 ani pentru bărbați și 0,05–0,09 ani pentru femei).În plus, eroarea pătratică medie (RMSE) este puțin mai mică decât metoda tradițională, cu diferențe mai mici (0,17–0,24, 0,2–0,24 pentru setul de test intern masculin și 0,03–0,07, 0,04–0,08 pentru setul de test extern).).MLP arată performanțe puțin mai bune decât Perceptronul cu un singur strat (SLP), cu excepția cazului setului de testare extern feminin.Pentru MAE și RMSE, setul de teste externe are scoruri mai mari decât setul de teste interne pentru toate genurile și modelele.Toate MAE și RMSE sunt prezentate în Tabelul 1 și Figura 1.
MAE și RMSE ale modelelor de regresie tradiționale și data mining.Eroare absolută medie MAE, eroare pătratică medie RMSE, perceptron monostrat SLP, perceptron multistrat MLP, metoda tradițională CM.
Performanța de clasificare (cu o limită de 18 ani) a modelelor tradiționale și DM a fost demonstrată în termeni de sensibilitate, specificitate, valoare predictivă pozitivă (PPV), valoare predictivă negativă (NPV) și aria sub curba caracteristică de funcționare a receptorului (AUROC) 27 (Tabelul 2, Figura 2 și Figura suplimentară 1 online).În ceea ce privește sensibilitatea bateriei interne de testare, metodele tradiționale au avut rezultate mai bune în rândul bărbaților și mai proaste în rândul femeilor.Cu toate acestea, diferența de performanță de clasificare între metodele tradiționale și SD este de 9,7% pentru bărbați (MLP) și doar 2,4% pentru femei (XGBoost).Printre modelele DM, regresia logistică (LR) a arătat o sensibilitate mai bună la ambele sexe.În ceea ce privește specificul setului de test intern, s-a observat că cele patru modele SD au avut rezultate bune la bărbați, în timp ce modelul tradițional a avut rezultate mai bune la femele.Diferențele de performanță de clasificare pentru bărbați și femei sunt de 13,3% (MLP) și, respectiv, 13,1% (MLP), indicând faptul că diferența de performanță de clasificare între modele depășește sensibilitatea.Dintre modelele DM, modelele de mașină vectorială de sprijin (SVM), arborele de decizie (DT) și modelele de pădure aleatoare (RF) au avut cele mai bune rezultate în rândul bărbaților, în timp ce modelul LR a avut cele mai bune rezultate în rândul femelelor.AUROC al modelului tradițional și al tuturor modelelor SD a fost mai mare de 0,925 (k-cel mai apropiat vecin (KNN) la bărbați), demonstrând o performanță excelentă de clasificare în eșantioane discriminante de 18 ani28.Pentru setul de teste externe, a existat o scădere a performanței de clasificare în ceea ce privește sensibilitatea, specificitatea și AUROC față de setul de testare intern.Mai mult, diferența de sensibilitate și specificitate între performanța de clasificare a celor mai bune și cele mai proaste modele a variat de la 10% la 25% și a fost mai mare decât diferența din setul de test intern.
Sensibilitatea și specificitatea modelelor de clasificare de data mining în comparație cu metodele tradiționale cu o limită de 18 ani.KNN k cel mai apropiat vecin, mașină vector suport SVM, regresie logistică LR, arbore de decizie DT, pădure aleatoare RF, XGB XGBoost, perceptron multistrat MLP, metoda tradițională CM.
Primul pas în acest studiu a fost de a compara acuratețea estimărilor vârstei dentare obținute din șapte modele DM cu cele obținute folosind regresia tradițională.MAE și RMSE au fost evaluate în seturi de teste interne pentru ambele sexe, iar diferența dintre metoda tradițională și modelul DM a variat de la 44 la 77 de zile pentru MAE și de la 62 la 88 de zile pentru RMSE.Deși metoda tradițională a fost puțin mai precisă în acest studiu, este dificil de concluzionat dacă o diferență atât de mică are semnificație clinică sau practică.Aceste rezultate indică faptul că acuratețea estimării vârstei dentare folosind modelul DM este aproape aceeași cu cea a metodei tradiționale.Compararea directă cu rezultatele din studiile anterioare este dificilă, deoarece niciun studiu nu a comparat acuratețea modelelor DM cu metodele statistice tradiționale folosind aceeași tehnică de înregistrare a dinților în același interval de vârstă ca în acest studiu.Galibourg et al24 au comparat MAE și RMSE între două metode tradiționale (metoda Demirjian25 și metoda Willems29) și 10 modele DM într-o populație franceză cu vârsta cuprinsă între 2 și 24 de ani.Ei au raportat că toate modelele DM au fost mai precise decât metodele tradiționale, cu diferențe de 0,20 și 0,38 ani în MAE și 0,25 și 0,47 ani în RMSE, comparativ cu metodele Willems și, respectiv, Demirdjian.Discrepanța dintre modelul SD și metodele tradiționale prezentate în studiul Halibourg ia în considerare numeroase rapoarte30,31,32,33 conform cărora metoda Demirdjian nu estimează cu exactitate vârsta dentară în alte populații decât canadienii francezi pe care sa bazat studiul.in acest studiu.Tai et al 34 au folosit algoritmul MLP pentru a prezice vârsta dentară din 1636 de fotografii ortodontice chinezești și au comparat acuratețea acestuia cu rezultatele metodei Demirjian și Willems.Ei au raportat că MLP are o acuratețe mai mare decât metodele tradiționale.Diferența dintre metoda Demirdjian și metoda tradițională este <0,32 ani, iar metoda Willems este de 0,28 ani, ceea ce este similar cu rezultatele studiului de față.Rezultatele acestor studii anterioare24,34 sunt, de asemenea, în concordanță cu rezultatele studiului de față, iar acuratețea estimării vârstei a modelului DM și a metodei tradiționale sunt similare.Cu toate acestea, pe baza rezultatelor prezentate, putem doar concluziona cu prudență că utilizarea modelelor DM pentru estimarea vârstei poate înlocui metodele existente din cauza lipsei de studii anterioare comparative și de referință.Sunt necesare studii ulterioare care utilizează eșantioane mai mari pentru a confirma rezultatele obținute în acest studiu.
Printre studiile care testează acuratețea SD în estimarea vârstei dentare, unele au arătat o acuratețe mai mare decât studiul nostru.Stepanovsky et al 35 au aplicat 22 de modele SD la radiografiile panoramice ale a 976 de rezidenți cehi cu vârsta cuprinsă între 2,7 și 20,5 ani și au testat acuratețea fiecărui model.Ei au evaluat dezvoltarea unui total de 16 dinți permanenți superiori și inferiori stângi folosind criteriile de clasificare propuse de Moorrees et al 36 .MAE variază de la 0,64 la 0,94 ani și RMSE variază de la 0,85 la 1,27 ani, care sunt mai precise decât cele două modele DM utilizate în acest studiu.Shen et al23 au folosit metoda Cameriere pentru a estima vârsta dentară a șapte dinți permanenți în mandibula stângă la rezidenții din estul Chinei cu vârsta cuprinsă între 5 și 13 ani și au comparat-o cu vârstele estimate folosind regresia liniară, SVM și RF.Ei au arătat că toate cele trei modele DM au o precizie mai mare în comparație cu formula tradițională Cameriere.MAE și RMSE din studiul lui Shen au fost mai mici decât cele din modelul DM din acest studiu.Precizia crescută a studiilor lui Stepanovsky et al.35 şi Shen şi colab.23 se poate datora includerii subiecților mai tineri în eșantioanele lor de studiu.Deoarece estimările de vârstă pentru participanții cu dinți în curs de dezvoltare devin mai precise pe măsură ce numărul de dinți crește în timpul dezvoltării dentare, acuratețea metodei de estimare a vârstei rezultată poate fi compromisă atunci când participanții la studiu sunt mai tineri.În plus, eroarea MLP în estimarea vârstei este puțin mai mică decât SLP, ceea ce înseamnă că MLP este mai precisă decât SLP.MLP este considerat puțin mai bun pentru estimarea vârstei, posibil din cauza straturilor ascunse din MLP38.Cu toate acestea, există o excepție pentru eșantionul exterior de femei (SLP 1,45, MLP 1,49).Constatarea că MLP este mai precisă decât SLP în evaluarea vârstei necesită studii retrospective suplimentare.
Au fost comparate și performanța de clasificare a modelului DM și a metodei tradiționale la un prag de 18 ani.Toate modelele SD testate și metodele tradiționale de pe setul de testare intern au arătat niveluri practic acceptabile de discriminare pentru eșantionul de 18 ani.Sensibilitatea pentru bărbați și femei a fost mai mare de 87,7%, respectiv 94,9%, iar specificitatea a fost mai mare de 89,3% și 84,7%.AUROC al tuturor modelelor testate depășește și 0,925.Din câte cunoștințele noastre, niciun studiu nu a testat performanța modelului DM pentru clasificarea pe 18 ani pe baza maturității dentare.Putem compara rezultatele acestui studiu cu performanța de clasificare a modelelor de învățare profundă pe radiografii panoramice.Guo et al.15 au calculat performanța de clasificare a unui model de deep learning bazat pe CNN și a unei metode manuale bazate pe metoda lui Demirjian pentru un anumit prag de vârstă.Sensibilitatea și specificitatea metodei manuale au fost de 87,7%, respectiv 95,5%, iar sensibilitatea și specificitatea modelului CNN au depășit 89,2% și, respectiv, 86,6%.Ei au ajuns la concluzia că modelele de învățare profundă pot înlocui sau depăși evaluarea manuală în clasificarea pragurilor de vârstă.Rezultatele acestui studiu au arătat performanțe similare de clasificare;Se crede că clasificarea folosind modele DM poate înlocui metodele statistice tradiționale pentru estimarea vârstei.Dintre modele, DM LR a fost cel mai bun model în ceea ce privește sensibilitatea pentru eșantionul masculin și sensibilitatea și specificitatea pentru eșantionul feminin.LR ocupă locul al doilea ca specificitate pentru bărbați.Mai mult, LR este considerat a fi unul dintre modelele DM35 mai ușor de utilizat și este mai puțin complex și dificil de procesat.Pe baza acestor rezultate, LR a fost considerat cel mai bun model de clasificare pentru tinerii de 18 ani din populația coreeană.
În general, acuratețea estimării vârstei sau a performanței de clasificare pe setul de teste externe a fost slabă sau mai mică în comparație cu rezultatele pe setul de teste interne.Unele rapoarte indică faptul că acuratețea sau eficiența clasificării scade atunci când estimările de vârstă bazate pe populația coreeană sunt aplicate populației japoneze5,39 și un model similar a fost găsit în studiul de față.Această tendință de deteriorare a fost observată și în modelul DM.Prin urmare, pentru a estima cu exactitate vârsta, chiar și atunci când se utilizează DM în procesul de analiză, ar trebui să fie preferate metodele derivate din datele populației native, cum ar fi metodele tradiționale5,39,40,41,42.Deoarece nu este clar dacă modelele de învățare profundă pot prezenta tendințe similare, sunt necesare studii care compară acuratețea și eficiența clasificării folosind metode tradiționale, modele DM și modele de învățare profundă pe aceleași eșantioane pentru a confirma dacă inteligența artificială poate depăși aceste disparități rasiale la o vârstă limitată.evaluări.
Demonstrăm că metodele tradiționale pot fi înlocuite cu estimarea vârstei bazată pe modelul DM în practica criminalistică de estimare a vârstei din Coreea.De asemenea, am descoperit posibilitatea implementării învățării automate pentru evaluarea vârstei criminalistice.Cu toate acestea, există limitări clare, cum ar fi numărul insuficient de participanți la acest studiu pentru a determina definitiv rezultatele și lipsa unor studii anterioare care să compare și să confirme rezultatele acestui studiu.În viitor, studiile DM ar trebui să fie efectuate cu un număr mai mare de eșantioane și populații mai diverse pentru a-și îmbunătăți aplicabilitatea practică în comparație cu metodele tradiționale.Pentru a valida fezabilitatea utilizării inteligenței artificiale pentru a estima vârsta în mai multe populații, sunt necesare studii viitoare pentru a compara acuratețea și eficiența clasificării modelelor de DM și de învățare profundă cu metodele tradiționale din aceleași eșantioane.
Studiul a folosit 2.657 de fotografii ortografice colectate de la adulți coreeni și japonezi cu vârsta cuprinsă între 15 și 23 de ani.Radiografiile coreene au fost împărțite în 900 de seturi de antrenament (19,42 ± 2,65 ani) și 900 de seturi de teste interne (19,52 ± 2,59 ani).Setul de instruire a fost colectat la o instituție (Spitalul Sf. Maria din Seul), iar setul de testare propriu a fost colectat la două instituții (Spitalul stomatologic Universitar Național din Seul și Spitalul stomatologic Universitar Yonsei).De asemenea, am colectat 857 de radiografii de la alte date bazate pe populație (Universitatea Medicală Iwate, Japonia) pentru testare externă.Radiografiile subiecților japonezi (19,31 ± 2,60 ani) au fost selectate ca set de test extern.Datele au fost colectate retrospectiv pentru a analiza etapele dezvoltării dentare pe radiografii panoramice realizate în timpul tratamentului stomatologic.Toate datele colectate au fost anonime, cu excepția sexului, datei nașterii și datei radiografiei.Criteriile de includere și excludere au fost aceleași ca și studiile publicate anterior 4 , 5 .Vârsta reală a probei a fost calculată scăzând data nașterii din data la care a fost efectuată radiografie.Grupul de eșantion a fost împărțit în nouă grupe de vârstă.Distribuțiile de vârstă și sex sunt prezentate în Tabelul 3. Acest studiu a fost realizat în conformitate cu Declarația de la Helsinki și aprobat de Consiliul de revizuire instituțional (IRB) al Spitalului Seoul St. Mary's al Universității Catolice din Coreea (KC22WISI0328).Datorită designului retrospectiv al acestui studiu, consimțământul informat nu a putut fi obținut de la toți pacienții supuși examenului radiografic în scop terapeutic.Spitalul St. Mary's (IRB) de la Universitatea din Seul din Coreea a renunțat la cerința de consimțământ informat.
Stadiile de dezvoltare ale molarilor doi și trei bimaxilari au fost evaluate conform criteriilor Demircan25.Doar un dinte a fost selectat dacă același tip de dinte a fost găsit pe partea stângă și dreaptă a fiecărui maxilar.Dacă dinții omologi de pe ambele părți se aflau în stadii de dezvoltare diferite, dintele cu stadiul de dezvoltare inferior a fost selectat pentru a ține seama de incertitudinea privind vârsta estimată.O sută de radiografii selectate aleatoriu din setul de antrenament au fost punctate de doi observatori experimentați pentru a testa fiabilitatea interobservatori după precalibrare pentru a determina stadiul de maturitate dentară.Fiabilitatea intraobservator a fost evaluată de două ori la intervale de trei luni de către observatorul primar.
Sexul și stadiul de dezvoltare al celui de-al doilea și al treilea molar al fiecărui maxilar din setul de antrenament au fost estimate de un observator primar antrenat cu diferite modele DM, iar vârsta reală a fost stabilită ca valoare țintă.Modelele SLP și MLP, care sunt utilizate pe scară largă în învățarea automată, au fost testate împotriva algoritmilor de regresie.Modelul DM combină funcții liniare folosind etapele de dezvoltare ale celor patru dinți și combină aceste date pentru a estima vârsta.SLP este cea mai simplă rețea neuronală și nu conține straturi ascunse.SLP funcționează pe baza transmisiei de prag între noduri.Modelul SLP în regresie este matematic similar cu regresia liniară multiplă.Spre deosebire de modelul SLP, modelul MLP are mai multe straturi ascunse cu funcții de activare neliniară.Experimentele noastre au folosit un strat ascuns cu doar 20 de noduri ascunse cu funcții de activare neliniară.Utilizați coborârea gradientului ca metodă de optimizare și MAE și RMSE ca funcție de pierdere pentru a antrena modelul nostru de învățare automată.Cel mai bun model de regresie obținut a fost aplicat la seturile de teste interne și externe și a fost estimată vârsta dinților.
A fost dezvoltat un algoritm de clasificare care folosește maturitatea a patru dinți pe setul de antrenament pentru a prezice dacă un eșantion are 18 ani sau nu.Pentru a construi modelul, am derivat șapte algoritmi de învățare automată de reprezentare6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost și (7) MLP .LR este unul dintre cei mai folosiți algoritmi de clasificare44.Este un algoritm de învățare supravegheată care utilizează regresia pentru a prezice probabilitatea ca datele aparținând unei anumite categorii de la 0 la 1 și clasifică datele ca aparținând unei categorii mai probabile pe baza acestei probabilități;folosit în principal pentru clasificarea binară.KNN este unul dintre cei mai simpli algoritmi de învățare automată45.Când i se oferă date de intrare noi, găsește k date aproape de setul existent și apoi le clasifică în clasa cu cea mai mare frecvență.Setăm 3 pentru numărul de vecini considerați (k).SVM este un algoritm care maximizează distanța dintre două clase folosind o funcție de nucleu pentru a extinde spațiul liniar într-un spațiu neliniar numit câmpuri46.Pentru acest model, folosim bias = 1, putere = 1 și gamma = 1 ca hiperparametri pentru nucleul polinom.DT a fost aplicat în diverse domenii ca algoritm pentru împărțirea unui întreg set de date în mai multe subgrupe prin reprezentarea regulilor de decizie într-o structură arborescentă47.Modelul este configurat cu un număr minim de înregistrări pe nod de 2 și folosește indicele Gini ca măsură a calității.RF este o metodă de ansamblu care combină mai multe DT-uri pentru a îmbunătăți performanța folosind o metodă de agregare bootstrap care generează un clasificator slab pentru fiecare probă prin extragerea aleatorie de eșantioane de aceeași dimensiune de mai multe ori din setul de date original48.Am folosit 100 de arbori, 10 adâncimi de copac, 1 dimensiune minimă de nod și indicele de amestec Gini ca criterii de separare a nodurilor.Clasificarea datelor noi este determinată de votul majorității.XGBoost este un algoritm care combină tehnici de amplificare folosind o metodă care ia ca date de antrenament eroarea dintre valorile reale și cele prezise ale modelului anterior și mărește eroarea folosind gradienți49.Este un algoritm utilizat pe scară largă datorită performanței sale bune și eficienței resurselor, precum și a fiabilității ridicate ca funcție de corecție a supraajustării.Modelul este echipat cu 400 de roți suport.MLP este o rețea neuronală în care unul sau mai mulți perceptroni formează mai multe straturi cu unul sau mai multe straturi ascunse între straturile de intrare și de ieșire38.Folosind aceasta, puteți efectua o clasificare neliniară în care, atunci când adăugați un strat de intrare și obțineți o valoare a rezultatului, valoarea rezultatului prezis este comparată cu valoarea rezultatului real și eroarea este propagată înapoi.Am creat un strat ascuns cu 20 de neuroni ascunși în fiecare strat.Fiecare model pe care l-am dezvoltat a fost aplicat la seturi interne și externe pentru a testa performanța clasificării prin calcularea sensibilității, specificității, PPV, NPV și AUROC.Sensibilitatea este definită ca raportul dintre un eșantion estimat la vârsta de 18 ani sau mai mult și un eșantion estimat la vârsta de 18 ani sau mai mult.Specificitatea este proporția de eșantioane sub 18 ani și a celor estimate a fi sub 18 ani.
Etapele dentare evaluate în setul de antrenament au fost convertite în etape numerice pentru analiza statistică.Regresia liniară și logistică multivariată au fost efectuate pentru a dezvolta modele predictive pentru fiecare sex și pentru a deriva formule de regresie care pot fi utilizate pentru a estima vârsta.Am folosit aceste formule pentru a estima vârsta dentară atât pentru seturile de teste interne, cât și pentru cele externe.Tabelul 4 prezintă modelele de regresie și clasificare utilizate în acest studiu.
Fiabilitatea intra și interobservator a fost calculată utilizând statistica kappa a lui Cohen.Pentru a testa acuratețea modelelor de regresie DM și tradiționale, am calculat MAE și RMSE utilizând vârstele estimate și reale ale setului de teste interne și externe.Aceste erori sunt utilizate în mod obișnuit pentru a evalua acuratețea predicțiilor modelului.Cu cât eroarea este mai mică, cu atât precizia prognozei este mai mare24.Comparați MAE și RMSE ale seturilor de teste interne și externe calculate folosind DM și regresia tradițională.Performanța de clasificare a limitei de 18 ani în statisticile tradiționale a fost evaluată folosind un tabel de contingență 2 × 2.Sensibilitatea, specificitatea, PPV, NPV și AUROC calculate ale setului de testare au fost comparate cu valorile măsurate ale modelului de clasificare DM.Datele sunt exprimate ca medie ± abatere standard sau număr (%), în funcție de caracteristicile datelor.Valorile P pe două fețe <0,05 au fost considerate semnificative statistic.Toate analizele statistice de rutină au fost efectuate folosind SAS versiunea 9.4 (SAS Institute, Cary, NC).Modelul de regresie DM a fost implementat în Python folosind Keras50 2.2.4 backend și Tensorflow51 1.8.0 special pentru operații matematice.Modelul de clasificare DM a fost implementat în Waikato Knowledge Analysis Environment și în platforma de analiză Konstanz Information Miner (KNIME) 4.6.152.
Autorii recunosc că datele care susțin concluziile studiului pot fi găsite în articol și materiale suplimentare.Seturile de date generate și/sau analizate în timpul studiului sunt disponibile de la autorul corespunzător, la cerere rezonabilă.
Ritz-Timme, S. şi colab.Evaluarea vârstei: stadiul tehnicii pentru a îndeplini cerințele specifice practicii criminalistice.internaţionalitate.J. Medicină juridică.113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. și Olze, A. Starea actuală a evaluării vârstei criminalistice a subiecților vii în scopuri de urmărire penală.Criminalistica.medicament.Patologie.1, 239–246 (2005).
Pan, J. şi colab.O metodă modificată pentru evaluarea vârstei dentare a copiilor cu vârsta cuprinsă între 5 și 16 ani din estul Chinei.clinic.Sondaj oral.25, 3463–3474 (2021).
Lee, SS etc. Cronologia dezvoltării molarilor doi și trei la coreeni și aplicarea acesteia pentru evaluarea vârstei criminalistice.internaţionalitate.J. Medicină juridică.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY și Lee, SS Precizia estimării vârstei și estimarea pragului de 18 ani pe baza maturității molarilor doi și trei la coreeni și japonezi.PLoS ONE 17, e0271247 (2022).
Kim, JY, și colab.Analiza datelor bazată pe învățarea automată preoperatorie poate prezice rezultatul tratamentului chirurgical al somnului la pacienții cu OSA.știința.Raport 11, 14911 (2021).
Han, M. şi colab.Estimarea exactă a vârstei din învățarea automată cu sau fără intervenție umană?internaţionalitate.J. Medicină juridică.136, 821–831 (2022).
Khan, S. și Shaheen, M. De la data mining la data mining.J.Informaţii.știința.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. și Shaheen, M. WisRule: Primul algoritm cognitiv pentru minerit de reguli de asociere.J.Informaţii.știința.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. și Abdullah U. Karm: Exploatarea tradițională a datelor bazată pe reguli de asociere bazate pe context.calculati.Matt.continua.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. și Habib M. Detectarea similarității semantice bazată pe învățarea profundă folosind date text.informa.tehnologiilor.Control.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. și Shahin, M. Un sistem de recunoaștere a activității în videoclipurile sportive.multimedia.Instrumente Aplicații https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS și colab.RSNA Machine Learning Challenge în Pediatric Bone Age.Radiologie 290, 498–503 (2019).
Li, Y. şi colab.Estimarea vârstei criminalistice din raze X pelvine folosind învățarea profundă.EURO.radiatii.29, 2322–2329 (2019).
Guo, YC, şi colab.Clasificare precisă a vârstei folosind metode manuale și rețele neuronale convoluționale profunde din imagini de proiecție ortografică.internaţionalitate.J. Medicină juridică.135, 1589–1597 (2021).
Alabama Dalora și colab.Estimarea vârstei osoase folosind diferite metode de învățare automată: o revizuire sistematică a literaturii și meta-analiză.PLoS ONE 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. și Yang, J. Estimarea vârstei specifice populației pentru afro-americani și chinezi pe baza volumelor camerei pulpare ale primilor molari folosind tomografia computerizată cu fascicul conic.internaţionalitate.J. Medicină juridică.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK și Oh KS Determinarea grupelor de vârstă ale oamenilor vii folosind imagini bazate pe inteligența artificială ale primilor molari.știința.Raportul 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. și Urschler, M. Estimarea automată a vârstei și clasificarea vârstei majoritare din datele RMN multivariate.IEEE J. Biomed.Alerte de sănătate.23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. și Li, G. Estimarea vârstei bazată pe segmentarea 3D a camerei pulpare a primilor molari din tomografia computerizată cu fascicul conic prin integrarea învățării profunde și seturi de nivel.internaţionalitate.J. Medicină juridică.135, 365–373 (2021).
Wu, WT, şi colab.Exploatarea datelor în big data clinice: baze de date comune, pași și modele de metode.Lume.medicament.resursă.8, 44 (2021).
Yang, J. şi colab.Introducere în bazele de date medicale și tehnologiile de extragere a datelor în era Big Data.J. Avid.Medicina de baza.13, 57–69 (2020).
Shen, S. şi colab.Metoda lui Camerer pentru estimarea vârstei dentare folosind învățarea automată.BMC Oral Health 21, 641 (2021).
Galliburg A. şi colab.Compararea diferitelor metode de învățare automată pentru prezicerea vârstei dentare folosind metoda de stadializare Demirdjian.internaţionalitate.J. Medicină juridică.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. și Tanner, JM Un nou sistem de evaluare a vârstei dentare.pufni.biologie.45, 211–227 (1973).
Landis, JR, și Koch, GG Măsuri ale acordului observatorilor asupra datelor categorice.Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK și Choi HK.Analiza texturală, morfologică și statistică a imagisticii prin rezonanță magnetică bidimensională folosind tehnici de inteligență artificială pentru diferențierea tumorilor cerebrale primare.Informație despre sănătate.resursă.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Ora postării: 04-ian-2024