Validación de modelos de minería de datos comparándolos con métodos convencionales para la estimación de la edad dental en jóvenes y adultos jóvenes coreanos.
Scientific Reports volumen 13, número de artículo: 726 (2023) Citar este artículo
942 Accesos
3 altmétrico
Detalles de métricas
Se sabe que los dientes son los indicadores de edad más precisos del cuerpo humano y se aplican con frecuencia en la estimación forense de la edad. Nuestro objetivo era validar la estimación de la edad dental basada en la minería de datos, comparando la precisión de la estimación y el rendimiento de la clasificación de umbrales de 18 años con métodos convencionales y con la estimación de la edad basada en la minería de datos. Se recogieron un total de 2657 radiografías panorámicas de poblaciones coreanas y japonesas de entre 15 y 23 años. Se subdividieron en un conjunto de entrenamiento y pruebas internas de 900 radiografías cada uno de coreanos, y un conjunto de pruebas externas de 857 radiografías de japoneses. Comparamos la precisión y el rendimiento de clasificación de los conjuntos de prueba de los métodos convencionales con los de los modelos de minería de datos. La precisión del método convencional con el conjunto de pruebas internas fue ligeramente mayor que la de los modelos de minería de datos, con una ligera diferencia (error absoluto medio <0,21 años, error cuadrático medio <0,24 años). El rendimiento de clasificación del umbral de 18 años también fue similar entre el método convencional y los modelos de minería de datos. Por lo tanto, los métodos convencionales pueden ser reemplazados por modelos de extracción de datos en la estimación forense de la edad utilizando la madurez del segundo y tercer molar de jóvenes y adultos jóvenes coreanos.
La estimación de la edad dental se utiliza ampliamente en la ciencia forense y la odontología pediátrica. En particular, la estimación de la edad utilizando las etapas de desarrollo de los dientes es un criterio importante para estimar la edad de niños y adolescentes, debido a la alta correlación entre la edad cronológica y el desarrollo de los dientes1,2,3. Sin embargo, en el caso de adultos jóvenes, la estimación de la edad dental con madurez dentaria tiene limitaciones debido a que el crecimiento de los dientes es en gran medida completo, excepto los terceros molares. El objetivo legal de la estimación de la edad de los adultos jóvenes y adolescentes es proporcionar una estimación precisa y evidencia científica sobre si han alcanzado la mayoría de edad. En la práctica forense coreana para menores y adultos jóvenes, la edad se estimó con el método de Lee4, y el umbral legal de 18 años se predijo con los datos sugeridos por Oh et al.5.
El aprendizaje automático, un tipo de inteligencia artificial (IA), aprende y clasifica repetidamente grandes cantidades de datos, resuelve problemas por sí solo e induce la programación de datos. El aprendizaje automático puede descubrir patrones ocultos útiles dentro de una gran cantidad de datos6. Por el contrario, los métodos clásicos que requieren mucho tiempo y mano de obra pueden tener limitaciones a la hora de tratar con grandes cantidades de datos complejos que son difíciles de procesar manualmente7. Por ello, recientemente se han realizado muchos estudios utilizando la última tecnología informática para minimizar el error humano y procesar de manera eficiente datos multidimensionales8,9,10,11,12. En particular, el aprendizaje profundo se utiliza ampliamente para el análisis de imágenes médicas y se han informado varios métodos para estimar la edad mediante el análisis automático de radiografías para mejorar la precisión y eficiencia de la estimación de la edad13,14,15,16,17,18,19,20. Por ejemplo, Halabi et al.13 desarrollaron algoritmos de aprendizaje automático basados en redes neuronales convolucionales (CNN) utilizando radiografías de manos pediátricas para estimar la edad de los huesos. Este estudio presentó un modelo que aplicó el aprendizaje automático a imágenes médicas y demostró que estas técnicas pueden ayudar a la precisión del diagnóstico. Li et al.14 estimaron la edad a partir de imágenes de rayos X de huesos pélvicos aplicando el aprendizaje profundo CNN y la compararon con los resultados del análisis de regresión utilizando la evaluación de las etapas de osificación. Descubrieron que el modelo CNN de aprendizaje profundo mostraba el mismo rendimiento de estimación de edad que el modelo de regresión convencional. Un estudio de Guo et al.15 evaluó el rendimiento de clasificación de los umbrales de edad legales aplicando la tecnología CNN basada en ortopantomogramas dentales, y el resultado del modelo CNN demostró que los humanos superaron su rendimiento de clasificación por edad.
La mayoría de los estudios de estimación de edad realizados con aprendizaje automático utilizan métodos de aprendizaje profundo13,14,15,16,17,18,19,20. Se ha informado que la estimación de la edad basada en el aprendizaje profundo es más precisa que los métodos convencionales. Sin embargo, este método hace que sea casi imposible presentar la base científica de la estimación de la edad, como los indicadores de edad utilizados en la estimación. Además, hubo una controversia legal sobre quién realizó el examen. Por lo tanto, la estimación de la edad basada en el aprendizaje profundo es difícil de aceptar por parte de las agencias administrativas y judiciales. La minería de datos (DM) es una técnica que puede encontrar no solo información esperada sino también información inesperada como método para descubrir correlaciones útiles entre una gran cantidad de datos6,21,22. Al realizar DM, generalmente se utiliza el aprendizaje automático y tanto el DM como el aprendizaje automático emplean los mismos algoritmos críticos para descubrir patrones de datos. La estimación de la edad utilizando el desarrollo dental se basa en la evaluación de madurez de los dientes objetivo realizada por el examinador, y esta evaluación se expresa como la etapa de cada diente objetivo. DM se puede utilizar para analizar la correlación entre las etapas evaluadas de los dientes y su edad cronológica y tiene el potencial de reemplazar el análisis estadístico convencional. Por lo tanto, si aplicamos enfoques DM a la estimación de la edad, podemos introducir el aprendizaje automático a la estimación forense de la edad sin preocupaciones de responsabilidad legal. Se han publicado algunos estudios comparativos sobre la posible sustitución de los métodos manuales convencionales utilizados en la práctica forense por los métodos basados en DM en la estimación de la edad dental. Shen et al.23 demostraron que los modelos DM eran más precisos que la fórmula tradicional de Cameriere. Galibourg et al.24, que predijeron la edad aplicando varios métodos DM basados en los criterios de Demirjian25, demostraron que los métodos DM eran superiores a los métodos de Demirjian y Willems en la estimación de la edad para la población francesa.
Para la estimación de la edad dental de jóvenes y adultos jóvenes coreanos, el método de Lee4 ha sido ampliamente utilizado en la práctica forense coreana. Este método utiliza análisis estadístico convencional, como la regresión múltiple, para examinar la relación entre los sujetos coreanos y las edades cronológicas. En este estudio, el método de estimación de la edad derivado de técnicas estadísticas convencionales se definió como "método convencional". La precisión del método de Lee, que es un método convencional, ya ha sido validada por Oh et al.5; sin embargo, la aplicabilidad de la estimación de la edad basada en modelos DM en la práctica forense coreana sigue siendo cuestionable. Nuestro objetivo era validar científicamente la utilidad potencial de la estimación de la edad basada en modelos de DM. Los objetivos de este estudio fueron (1) comparar la precisión de dos modelos de DM en la estimación de la edad dental y (2) comparar el rendimiento de clasificación del umbral de 18 años de siete modelos de DM y los métodos derivados de enfoques estadísticos convencionales utilizando el criterio de madurez. de los segundos y terceros molares en ambos maxilares.
Las medias y las desviaciones estándar de las edades cronológicas según las etapas y tipos de dientes se presentan en la Tabla complementaria S1 (conjunto de entrenamiento), la Tabla complementaria S2 (conjunto de pruebas internas) y la Tabla complementaria S3 (conjunto de pruebas externas) en línea. Los valores kappa de la confiabilidad intra e interobservador obtenidos en el conjunto de entrenamiento fueron 0,951 y 0,947, respectivamente. Los valores p y los intervalos de confianza del 95% de los valores kappa se presentan en la Tabla complementaria S4 en línea. Los valores kappa fueron interpretados como “casi perfectos”, consistentes con los estándares de Landis y Koch26.
Al comparar el error absoluto medio (MAE), los métodos convencionales fueron marginalmente mejores que los modelos DM en todos los sexos y conjuntos de prueba distintos del perceptrón multicapa (MLP) en el conjunto de prueba externo masculino. Las diferencias entre los modelos convencional y DM para los conjuntos de prueba internos en MAE fueron de 0,12 a 0,19 años en hombres y de 0,17 a 0,21 años en mujeres. Para los conjuntos de pruebas externos, las diferencias fueron menores (0,001 – 0,05 años en hombres, 0,05 –0,09 años en mujeres). Además, el error cuadrático medio (RMSE) tuvo valores ligeramente más bajos con el método convencional con pequeñas diferencias (0,17–0,24, 0,2–0,24 para los conjuntos de prueba internos, 0,03 ~ 0,07, 0,04 ~ 0,08 para los conjuntos de prueba externos en hombres y mujeres, respectivamente). Aparte del caso del conjunto de prueba externo femenino, el MLP mostró un rendimiento ligeramente mejor que el perceptrón de capa única (SLP). Tanto con MAE como con RMSE, los resultados de los conjuntos de pruebas externos fueron superiores a los de los conjuntos de pruebas internos en todos los sexos y modelos. Todos los MAE y RMSE se muestran en la Tabla 1 y la Fig. 1.
MAE y RMSE de modelos de regresión convencionales y de minería de datos. Error absoluto medio MAE, error cuadrático medio RMSE, perceptrón de capa única SLP, perceptrón multicapa MLP, método convencional CM.
El rendimiento de clasificación de los modelos convencional y DM, con el umbral de 18 años, se demostró como sensibilidad, especificidad, valor predictivo positivo (VPP), valor predictivo negativo (VPN) y área bajo la curva característica operativa del receptor (AUROC). 27 (Tabla 2, Fig. 2 y Fig. 1 complementaria en línea). Para la sensibilidad del conjunto de pruebas internas, el método convencional demostró el mejor desempeño en los hombres y el peor desempeño en las mujeres. Sin embargo, la diferencia en el rendimiento de clasificación entre el método convencional y DM fue del 9,7% (MLP) en los hombres, mientras que en las mujeres fue solo del 2,4% (XGBoost). Entre los modelos DM, la regresión logística (LR) mostró el mejor desempeño de sensibilidad en ambos sexos. En cuanto a la especificidad del conjunto de pruebas internas, se observó que cuatro modelos de DM eran superiores en los hombres, mientras que los modelos convencionales demostraron el mejor rendimiento en las mujeres. Las diferencias en el rendimiento de la clasificación fueron del 13,3% (MLP) y del 13,1% (MLP) en hombres y mujeres, respectivamente, lo que indica que la diferencia en el rendimiento de la clasificación entre los modelos fue mayor que la sensibilidad. Entre los modelos DM, el rendimiento de los modelos de máquina de vectores de soporte (SVM), árbol de decisión (DT) y bosque aleatorio (RF) fue mejor en los hombres, y LR fue mejor en las mujeres. El AUROC de los modelos convencional y de todos los modelos DM fue superior a 0,925 (k-vecino más cercano (KNN) en hombres), lo que demuestra un excelente rendimiento de clasificación al discriminar muestras de 18 años28. En el caso del conjunto de pruebas externo, se observó una disminución en el rendimiento de clasificación en sensibilidad, especificidad y AUROC en comparación con los del conjunto de pruebas interno. Además, la diferencia entre el rendimiento de clasificación de los mejores y peores modelos, tanto en sensibilidad como en especificidad, fue del 10 al 25 %, y mayor que en el conjunto de pruebas internas.
Sensibilidad y especificidad de los modelos de clasificación de minería de datos y del método convencional, con umbral de 18 años. KNN k-vecino más cercano, máquina de vectores de soporte SVM, regresión logística LR, árbol de decisión DT, bosque aleatorio RF, XGB XGBoost, perceptrón multicapa MLP, método convencional CM.
El primer paso de este estudio fue comparar la precisión de la estimación de la edad dental mediante siete modelos DM con la derivada de la regresión convencional. Tanto MAE como RMSE se evaluaron en conjuntos de pruebas internas para ambos sexos, y las diferencias entre los métodos convencionales y los modelos DM fueron de 44 a 77 días con MAE y de 62 a 88 días con RMSE. Aunque los métodos convencionales fueron ligeramente más precisos en este estudio, es difícil concluir si una diferencia tan pequeña es clínica o prácticamente significativa. Estos resultados implican que la estimación de la edad dental mediante modelos DM se puede realizar con casi la misma precisión que el método convencional. La comparación directa con los resultados de estudios anteriores es difícil porque no existen estudios que comparen la precisión de los modelos DM con enfoques estadísticos convencionales que utilicen la misma técnica de registro dental para el mismo grupo de edades, como se hizo en este estudio. Galibourg et al.24 compararon el MAE y el RMSE entre dos métodos convencionales (método de Demirjian25 y método de Willems29) y diez modelos de DM en una población francesa de 2 a 24 años. Informaron que todos los modelos DM resultaron más precisos que los métodos convencionales, con diferencias de 0,20 y 0,38 años en MAE, y de 0,25 y 0,47 años en RMSE, con los métodos de Willems y Demirjian, respectivamente. Teniendo en cuenta los numerosos informes30,31,32,33 de que el método de Demirjian estima de forma inexacta la edad dental en poblaciones distintas de la francocanadiense, en las que se basó el estudio, la diferencia entre los modelos DM y los métodos convencionales mostrados en el estudio de Galibourg es bastante similar a la observada. en este estudio. Tao et al.34 utilizaron el algoritmo MLP para predecir la edad dental de 1.636 ortopantomogramas chinos y también compararon la precisión con los resultados obtenidos utilizando los métodos de Demirjian y Willems. Informaron de una mayor precisión con MLP que con los métodos convencionales. Las diferencias entre DM y los métodos convencionales fueron <0,32 años para el método de Demirjian y 0,28 años para el método de Willems, con resultados similares a los de este estudio. Los resultados de estos estudios previos24,34 también son consistentes con los resultados de este estudio, en el sentido de que la precisión de la estimación de la edad con los modelos DM y los métodos convencionales es similar. Sin embargo, con base en los resultados actuales, solo podemos concluir cautelosamente que la estimación de la edad utilizando el modelo DM puede reemplazar el método existente, ya que actualmente faltan estudios previos comparativos y referenciables. Se justifican estudios posteriores que utilicen más muestras para confirmar los resultados observados en este estudio.
Entre los estudios que prueban la precisión de la estimación de la edad dental con DM, algunos estudios demostraron una mayor precisión que nuestro estudio. Štepanovský et al.35 aplicaron 22 modelos de DM a radiografías panorámicas de 976 miembros de una población checa con edades comprendidas entre 2,7 y 20,5 años y verificaron la precisión entre cada modelo. Evaluaron el desarrollo de un total de 16 dientes permanentes superiores e inferiores izquierdos utilizando los criterios de clasificación propuestos por Moorrees et al36. El MAE fue de 0,64 a 0,94 años y el RMSE fue de 0,85 a 1,27 años, lo que es más preciso que los dos modelos DM utilizados en este estudio. Shen et al.23 estimaron la edad dental de siete dientes permanentes en la mandíbula izquierda de chinos orientales de entre 5 y 13 años utilizando el método Cameriere, que se comparó con la edad estimada mediante regresión lineal, SVM y RF. Demostraron que los tres modelos DM tenían mayor precisión en comparación con la fórmula tradicional de Cameriere. El MAE y el RMSE en el estudio de Shen fueron más bajos que los de los modelos DM de este estudio. La razón de esta mayor precisión en los estudios de Štepanovský et al.35 y Shen et al.23 puede ser la inclusión de sujetos más jóvenes en sus muestras de estudio. Dado que la estimación de la edad de un participante con dientes en desarrollo se vuelve más precisa a medida que aumenta el número de dientes durante el desarrollo, cuando los participantes del estudio son más jóvenes, la precisión del método de estimación de la edad derivado del mismo podría ser mayor37. Además, el error en la edad estimada con MLP fue ligeramente menor que con SLP, lo que significa una mayor precisión con MLP que con SLP. MLP se consideró un poco más adecuado para la estimación de la edad, y esto puede deberse a la capa oculta en MLP38. Sin embargo, hay una excepción en el caso del conjunto de prueba externo femenino (1,45 para SLP, 1,49 para MLP). Concluir que MLP es más preciso que SLP en la estimación de la edad requiere más estudios retrospectivos.
También se comparó el rendimiento de clasificación del umbral de 18 años entre los modelos DM y los métodos convencionales. Todos los modelos DM probados y los métodos convencionales para los conjuntos de prueba internos mostraron un nivel de discriminación prácticamente aceptable para las muestras de 18 años. La sensibilidad fue superior al 87,7% y 94,9%, y la especificidad fue superior al 89,3% y 84,7% en hombres y mujeres, respectivamente. El AUROC también fue superior a 0,925 en todos los modelos probados. Hasta donde sabemos, no existe ningún estudio que haya probado el desempeño de un modelo DM para la clasificación de 18 años según la madurez de los dientes. Podemos comparar los resultados de este estudio con el rendimiento de clasificación de modelos de aprendizaje profundo con radiografías panorámicas. Guo et al.15 calcularon el rendimiento de clasificación para un umbral de edad determinado de un modelo de aprendizaje profundo basado en CNN en comparación con un método manual basado en el método Demirjian. La sensibilidad y especificidad del método manual fueron del 87,7% y 95,5%, y las del modelo CNN fueron superiores al 89,2% y 86,6%, respectivamente. Concluyeron que un modelo de aprendizaje profundo podría sustituir o ser superior a la estimación manual en la clasificación del umbral de edad legal. Los resultados de este estudio muestran un rendimiento de clasificación similar; Se cree que la clasificación utilizando los modelos DM puede sustituir la estimación de la edad con enfoques estadísticos convencionales. Entre los modelos DM, LR fue el mejor modelo en términos de sensibilidad para el conjunto de pruebas internas masculinas y con respecto a sensibilidad y especificidad para el conjunto femenino. LR fue el segundo más preciso en especificidad para los machos. Además, LR se consideraba uno de los modelos DM más fáciles de usar35 y era menos complejo y sofisticado en el tratamiento de datos. Con base en estos resultados, LR se considera el modelo óptimo para el desempeño de clasificación con el umbral de 18 años en la población coreana.
En general, la precisión de la estimación de la edad o el rendimiento de clasificación del conjunto de pruebas externo fue menos precisa o menor en comparación con los resultados del conjunto de pruebas interno. Varios informes indican que la precisión o el rendimiento de la clasificación se deteriora cuando la estimación de edad basada en datos de la población coreana se aplica a la población japonesa5,39, y en este estudio se encontró un patrón similar. Esta tendencia al deterioro también se observó en los modelos DM. Por lo tanto, para una estimación precisa de la edad, incluso cuando se aplica DM en el proceso de análisis, se debe utilizar como primera opción el método derivado de los datos de la propia población, al igual que los enfoques convencionales5,39,40,41,42. Dado que todavía no está claro si se pueden mostrar tendencias similares con los modelos de aprendizaje profundo, es necesario un estudio que compare la precisión y el rendimiento de la clasificación aplicando el método convencional, los modelos DM y los modelos de aprendizaje profundo a las mismas muestras para confirmar si la IA puede superar los límites. de las diferencias étnicas en la estimación de la edad.
Confirmamos que el método convencional podría reemplazarse por una estimación de la edad basada en el modelo DM en la práctica forense para la estimación de la edad de los coreanos. También encontramos la posibilidad de introducir ML para la estimación forense de la edad. Sin embargo, también hubo limitaciones claras, como un número insuficiente de participantes en este estudio para finalizar los hallazgos y la falta de estudios previos para comparar y verificar los resultados de este estudio. En el futuro, será necesario realizar estudios de DM con más muestras y en poblaciones más diversas para mejorar su aplicabilidad práctica en comparación con los métodos convencionales. Para confirmar la posibilidad de un uso multipoblacional de la IA en la estimación de la edad, también se necesitan estudios futuros que comparen la precisión y el rendimiento de clasificación de DM y modelos de aprendizaje profundo con métodos convencionales con la misma muestra.
Este estudio se realizó con 2657 ortopantomogramas, que se obtuvieron de poblaciones coreana y japonesa, de edades comprendidas entre 15 y 23 años. Las radiografías de los coreanos se subdividieron en un conjunto de entrenamiento de 900 (19,42 ± 2,65 años) y un conjunto de prueba interno de 900 (19,52 ± 2,59 años). El conjunto de capacitación se recopiló de una sola institución (Hospital St. Mary's de Seúl) y el conjunto de pruebas internas se recopiló de dos instituciones (Hospital Dental de la Universidad Nacional de Seúl y Hospital Dental de la Universidad de Yonsei). También recopilamos 857 radiografías de otros datos de población (Universidad Médica de Iwate, Japón) para pruebas externas. Las radiografías de los japoneses se establecieron como un equipo de prueba externo (19,31 ± 2,60 años). Los datos se recopilaron retrospectivamente para analizar las etapas de desarrollo de los dientes a partir de radiografías panorámicas tomadas durante el tratamiento dental. Todos los datos recopilados fueron anonimizados, excepto el sexo, la fecha de nacimiento y la fecha en que se tomaron las radiografías. Los criterios de inclusión y exclusión fueron los mismos que en estudios publicados previamente4,5. La edad cronológica de las muestras se calculó restando la fecha de nacimiento a la fecha de toma de las radiografías. El grupo de muestra se clasificó en nueve grupos de edad. La distribución por edad y sexo se muestra en la Tabla 3. Este estudio se realizó de conformidad con la Declaración de Helsinki y fue aprobado por la Junta de Revisión Institucional (IRB) del Hospital St. Mary's de Seúl, la Universidad Católica de Corea (KC22WISI0328). Dado que este estudio tiene un diseño retrospectivo, es imposible obtener el consentimiento informado de todos los pacientes a los que se les realizaron radiografías con fines de tratamiento. El IRB del Hospital St. Mary's de Seúl, de la Universidad Católica de Corea, renunció al requisito de consentimiento informado.
Las etapas de desarrollo de los segundos y terceros molares de ambos maxilares fueron evaluadas según los criterios de Demirjian25. Si se encontraba el mismo tipo de dientes en los lados derecho e izquierdo de cada mandíbula, solo se seleccionaba un diente. Si los dientes homólogos de cada lado estaban en diferentes etapas de desarrollo, se seleccionó el diente con la etapa de desarrollo más baja para considerar la incertidumbre de la edad estimada4. Dos observadores experimentados evaluaron cien radiografías seleccionadas al azar del conjunto de entrenamiento para probar la confiabilidad entre observadores después de la precalibración para la estadificación de la madurez dental. La confiabilidad intraobservador se probó con dos evaluaciones realizadas por el observador principal en un intervalo de tres meses.
El sexo y las etapas de desarrollo de los segundos y terceros molares de cada mandíbula del conjunto de entrenamiento, que fueron evaluados por los observadores principales, fueron entrenados mediante varios modelos DM y las edades cronológicas se establecieron como valores objetivo. Se probaron los modelos SLP y MLP, ampliamente utilizados para el aprendizaje automático, para los algoritmos de regresión. Los modelos DM utilizaron las etapas de desarrollo de cuatro dientes para la combinación de funciones lineales y hicieron converger estos datos para estimar la edad. Un SLP es la red neuronal más simple y no contiene ninguna capa oculta. El SLP de trabajo se basa en la transferencia de umbral entre los nodos. El modelo SLP en regresión es matemáticamente igual que la regresión lineal multivariable. El modelo MLP tiene más de una capa oculta con funciones de activación no lineales, a diferencia del modelo SLP. Usamos una capa oculta para nuestro experimento, que solo tenía 20 nodos ocultos con funciones de activación no lineales. Se utilizó el descenso de gradiente como método de optimización y MAE y RMSE como funciones de pérdida para entrenar nuestros modelos de aprendizaje automático. El mejor modelo de regresión obtenido se aplicó a los conjuntos de prueba internos y externos y se estimaron las edades dentales.
Se desarrollaron algoritmos de clasificación para predecir si la edad de la muestra alcanzó los 18 años utilizando la madurez de cuatro dientes en el conjunto de entrenamiento. Para construir los modelos, derivamos siete algoritmos de aprendizaje automático de representación6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost y (7) MLP. . LR es uno de los algoritmos de clasificación más utilizados44. Es un algoritmo de aprendizaje supervisado que utiliza regresión para predecir la probabilidad de que los datos caigan en una categoría de 0 a 1 y clasificar los datos como pertenecientes a una categoría más probable según esa probabilidad; se utiliza principalmente para la clasificación binaria. KNN es uno de los algoritmos de aprendizaje automático más simples45 que, cuando se le dan nuevos datos de entrada, encuentra k datos cercanos al conjunto existente y luego los clasifica como la clase con la mayor frecuencia de aparición. Fijamos tres como número de vecinos a considerar (k). SVM es un algoritmo que maximiza la distancia entre dos clases extendiendo un espacio lineal a un espacio no lineal utilizando una función del núcleo, y la distancia se denomina margen46. Para este modelo utilizamos sesgo = 1, potencia = 1 y gamma = 1 como hiperparámetros de los núcleos polinomiales. El DT se utiliza en varios campos como un algoritmo que clasifica todo el conjunto de datos en varios subgrupos representando reglas de decisión en una estructura de árbol47. El modelo se estableció en dos como número mínimo de registros por nodo y se utilizó el índice de Gini como medida de calidad. RF es una técnica de conjunto que combina múltiples DT para mejorar el rendimiento utilizando una técnica de agregación de arranque, que genera un clasificador débil para cada muestra extrayendo aleatoriamente muestras del mismo tamaño varias veces del conjunto de datos original48. Utilizamos 100 árboles, 10 profundidades de árbol, 1 tamaño mínimo de nodo y el índice de impureza de Gini como criterio de división de nodos. La clasificación de los nuevos datos se determinó por mayoría de votos. XGBoost es un algoritmo de la técnica de impulso del conjunto y utiliza un método para ingresar errores entre los valores reales y predichos de modelos anteriores como datos de entrenamiento y complementar los errores usando gradientes49. Es un algoritmo ampliamente utilizado debido a su buen rendimiento y eficiencia de recursos y se caracteriza por su gran durabilidad como función reguladora de sobreajuste. El modelo estaba configurado para 400 rondas de refuerzo. MLP es una red neuronal en la que uno o más perceptrones forman múltiples capas, con una o más capas ocultas entre las capas de entrada y salida38. Con esto, es posible una clasificación no lineal, y cuando se coloca una capa de entrada y sale un valor de resultado, el valor de resultado de la predicción y el valor de resultado real se comparan y el error se propaga hacia atrás. Configuramos una capa oculta y 20 neuronas ocultas por capa. Cada modelo que desarrollamos se aplicó a los conjuntos internos y externos para probar el rendimiento de la clasificación calculando la sensibilidad, especificidad, VPP, VPN y AUROC. La sensibilidad se definió como la proporción de muestras que alcanzaron la edad de 18 años y se estimaron como iguales o mayores de 18 años. La especificidad fue la proporción de muestras que tenían menos de 18 años y se estimaron como menores de 18 años.
Las etapas de los dientes evaluadas en el conjunto de entrenamiento se convirtieron en etapas numéricas para el análisis estadístico. Se realizaron regresiones lineales y logísticas multivariables para desarrollar un modelo predecible para cada sexo y se derivaron las fórmulas de regresión que pueden usarse en la estimación de la edad. Estimamos las edades dentales de los conjuntos de pruebas internos y externos con estas fórmulas. La Tabla 4 muestra los modelos de regresión y clasificación utilizados en este estudio.
La confiabilidad intra e interobservador se calculó utilizando la estadística kappa de Cohen. Para probar la precisión de los modelos DM y de regresión convencional, calculamos el MAE y el RMSE con las edades estimadas y cronológicas de los conjuntos de prueba internos y externos. Estos errores se utilizan a menudo para evaluar la precisión de las predicciones del modelo, y cuanto menor sea el error, mayor será la precisión de la predicción24. Se compararon el MAE y el RMSE de los conjuntos de prueba internos y externos, calculados tanto con DM como con regresión convencional. El desempeño de clasificación del umbral de 18 años en la estadística convencional se evaluó con una tabla de contingencia de dos por dos. La sensibilidad, especificidad, VPP, VPN y AUROC calculados para los conjuntos de prueba se compararon con las medidas de los modelos de clasificación de DM. Los datos se expresan como medias ± desviaciones estándar, o número (%), según las características de los datos. Un valor de P de dos colas <0,05 se consideró estadísticamente significativo. Todos los análisis estadísticos convencionales se realizaron utilizando SAS versión 9.4 (SAS Institute, Cary, NC). Los modelos de regresión DM se implementaron en un Python con Keras50 2.2.4 con backend Tensorflow51 1.8.0 dedicado a la operación matemática. Se implementaron modelos de clasificación de DM en el entorno Waikato para el análisis del conocimiento y en la plataforma de análisis Konstanz Information Miner (KNIME) 4.6.152.
Los autores confirman que los datos que respaldan los hallazgos de este estudio están disponibles en el artículo y en su material complementario. Los conjuntos de datos generados y/o analizados durante el estudio pueden estar disponibles del autor correspondiente previa solicitud razonable.
Ritz-Timme, S. et al. Estimación de edad: El estado del arte en relación con las demandas específicas de la práctica forense. En t. J. Medicina Legal. 113, 129-136 (2000).
Artículo CAS Google Scholar
Schmeling, A., Reisinger, W., Geserick, G. y Olze, A. El estado actual de la estimación forense de la edad de sujetos vivos con fines de procesamiento penal. Ciencia forense. Medicina. Patol. 1, 239–246 (2005).
Artículo de Google Scholar
Pan, J. y col. Un método de evaluación de la edad dental modificado para niños de 5 a 16 años del este de China. Clínico. Investigación oral. 25, 3463–3474 (2021).
Artículo de Google Scholar
Lee, SS y cols. La cronología del desarrollo del segundo y tercer molar en coreanos y su aplicación a la estimación forense de la edad. En t. J. Medicina Legal. 124, 659–665 (2010).
Artículo de Google Scholar
Oh, S., Kumagai, A., Kim, SY & Lee, SS Precisión de la estimación de la edad y evaluación del umbral de 18 años basado en la madurez del segundo y tercer molar en coreanos y japoneses. MÁS UNO 17, e0271247 (2022).
Artículo CAS Google Scholar
Kim, JY y cols. La minería de datos preoperatoria basada en aprendizaje automático puede predecir el resultado terapéutico de la cirugía del sueño en sujetos con AOS. Ciencia. Rep. 11, 14911 (2021).
Artículo ADS CAS Google Scholar
Han, M. y col. ¿Con o sin interferencia humana para una estimación precisa de la edad basada en el aprendizaje automático? En t. J. Medicina Legal. 136, 821–831 (2022).
Artículo de Google Scholar
Khan, S. y Shaheen, M. De la minería de datos a la minería de sabiduría. J.Inf. Ciencia. https://doi.org/10.1177/01655515211030872 (2021).
Artículo de Google Scholar
Khan, S. & Shaheen, M. WisRule: Primer algoritmo cognitivo de minería de reglas de asociación inteligente. J.Inf. Ciencia. https://doi.org/10.1177/01655515221108695 (2022).
Artículo de Google Scholar
Shaheen, M. y Abdullah, U. Carm: Minería de reglas de asociación basada en el contexto para datos convencionales. Computadora. Madre. Continúe. 68, 3305–3322 (2021).
Google Académico
Muhammad, M., Rehman, Z., Shaheen, M., Khan, M. y Habib, M. Detección de similitud semántica basada en aprendizaje profundo utilizando datos de texto. Informar. Tecnología. Control. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Artículo de Google Scholar
Tabish, M., Tanooli, Z. y Shaheen, M. Marco de reconocimiento de actividades en vídeos deportivos. Multimed. Herramientas Aplica. https://doi.org/10.1007/s11042-021-10519-6 (2021).
Artículo de Google Scholar
Halabi, SS y cols. El desafío de aprendizaje automático de la edad ósea pediátrica RSNA. Radiología 290, 498–503 (2019).
Artículo de Google Scholar
Li, Y. et al. Estimación forense de la edad de imágenes de rayos X pélvicos mediante aprendizaje profundo. EUR. Radiol. 29, 2322–2329 (2019).
Artículo de Google Scholar
Guo, YC y cols. Clasificación de edad precisa mediante método manual y red neuronal convolucional profunda basada en imágenes de ortopantomograma. En t. J. Medicina Legal. 135, 1589-1597 (2021).
Artículo de Google Scholar
Dallora, AL y cols. Evaluación de la edad ósea con diversas técnicas de aprendizaje automático: una revisión sistemática de la literatura y un metanálisis. MÁS UNO 14, e0220242 (2019).
Artículo CAS Google Scholar
Du, H., Li, G., Zheng, Q. y Yang, J. Estimación de la edad específica de la población en afroamericanos y chinos basada en el volumen de la cámara pulpar de los primeros molares de la tomografía computarizada de haz cónico. En t. J. Medicina Legal. 136, 811–819 (2022).
Artículo de Google Scholar
Kim, S., Lee, YH, Noh, YK, Park, FC y Auh, QS Determinación del grupo de edad de individuos vivos utilizando imágenes de los primeros molares basadas en inteligencia artificial. Ciencia. Rep. 11, 1073 (2021).
Artículo ADS CAS Google Scholar
Stern, D., Payer, C., Giuliani, N. y Urschler, M. Estimación automática de la edad y clasificación de la mayoría de edad a partir de datos de resonancia magnética multifactoriales. IEEE J. Biomed. Informe de salud. 23, 1392-1403 (2019).
Artículo de Google Scholar
Zheng, Q., Ge, Z., Du, H. & Li, G. Estimación de la edad basada en la segmentación 3D de la cámara pulpar de los primeros molares a partir de tomografía computarizada de haz cónico mediante aprendizaje profundo integrado y conjunto de niveles. En t. J. Medicina Legal. 135, 365–373 (2021).
Artículo de Google Scholar
Wu, WT y cols. Minería de datos en big data clínico: bases de datos, pasos y modelos metodológicos de uso frecuente. Mil. Medicina. Res. 8, 44 (2021).
Google Académico
Yang, J. y col. Breve introducción a las bases de datos médicas y la tecnología de minería de datos en la era del big data. J. Evid. Basado en Med. 13, 57–69 (2020).
Artículo de Google Scholar
Shen, S. y col. Método Cameriere asistido por aprendizaje automático para la estimación de la edad dental. BMC Salud bucal 21, 641 (2021).
Artículo de Google Scholar
Galibourg, A. et al. Comparación de diferentes enfoques de aprendizaje automático para predecir la edad dental utilizando el enfoque de estadificación de Demirjian. En t. J. Medicina Legal. 135, 665–675 (2021).
Artículo de Google Scholar
Demirjian, A., Goldstein, H. & Tanner, JM Un nuevo sistema de evaluación de la edad dental. Tararear. Biol. 45, 211–227 (1973).
CAS Google Académico
Landis, JR y Koch, GG La medición del acuerdo del observador para datos categóricos. Biometría 33, 159-174 (1977).
Artículo CAS MATH Google Scholar
Bhattacharjee, S., Prakash, D., Kim, CH, Kim, HC y Choi, HK Textura, morfología y análisis estadístico para diferenciar tumores cerebrales primarios en exploraciones por resonancia magnética bidimensional utilizando técnicas de inteligencia artificial. Informe Sanitario. Res. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Artículo de Google Scholar
Šimundić, AM Medidas de precisión diagnóstica: definiciones básicas. EJIFCC 19, 203–211 (2009).
Google Académico
Willems, G., Van Olmen, A., Spiessens, B. & Carels, C. Estimación de la edad dental en niños belgas: revisión de la técnica de Demirjian. J. Ciencias Forenses. 46, 893–895 (2001).
Artículo CAS Google Scholar
Ambarkova, V., Galić, I., Vodanović, M., Biočina-Lukenda, D. & Brkić, H. Estimación de la edad dental utilizando los métodos de Demirjian y Willems: estudio transversal en niños de la ex República Yugoslava de Macedonia. Ciencia forense. En t. 234(187), e1-187.e7 (2014).
Google Académico
Tunc, ES & Koyuturk, AE Evaluación de la edad dental mediante el método de Demirjian en niños del norte de Turquía. Ciencia forense. En t. 175, 23-26 (2008).
Artículo de Google Scholar
Moze, K. & Roberts, G. Evaluación de la edad dental (DAA) de niños y adolescentes afrotrinitarios. Desarrollo de un conjunto de datos de referencia (RDS) y comparación con caucásicos residentes en Londres, Reino Unido. J. Pierna Forense. Medicina. 19, 272–279 (2012).
Artículo de Google Scholar
Jayaraman, J., Roberts, GJ, Wong, HM y King, NM Estimación de la edad dental en la población del sur de China mediante radiografías panorámicas: validación de tres conjuntos de datos de referencia específicos de la población. BMC Med. Imágenes 18, 5 (2018).
Artículo de Google Scholar
Tao, J. y col. Estimación de la edad dental: una perspectiva del aprendizaje automático. En Advances in Intelligent Systems and Computing (ed. Hassanien, AE, Azar, AT, Gaber, T., Bhatnagar, R. & Tolba, F.), editores, 722–733 (2020).
Štepanovský, M., Ibrová, A., Buk, Z. & Velemínská, J. Nuevo modelo de estimación de edad basado en el desarrollo de dientes permanentes en comparación con el enfoque clásico y otros métodos modernos de extracción de datos. Ciencia forense. En t. 279, 72–82 (2017).
Artículo de Google Scholar
Moorrees, CF, Fanning, EA y Hunt, EE Jr. Variación de edad en las etapas de formación de diez dientes permanentes. J. Dent. Res. 42, 1490-1502 (1963).
Artículo CAS Google Scholar
Lee, SS y cols. Validez de los métodos de Demirjian y de Demirjian modificado en la estimación de la edad de jóvenes y adolescentes coreanos. Ciencia forense. En t. 211, 41–46 (2011).
Artículo de Google Scholar
Montaño Moreno, JJM, Palmer Pol, A. & Muñoz Gracia, P. Redes neuronales artificiales aplicadas a la predicción de series temporales. Psicotema 23, 322–329 (2011).
Google Académico
Lee, SS & Kumagai, A. La aplicabilidad de los métodos de estimación de la edad dental de Willems y Lee para niños japoneses y la comparación con la población coreana. Pierna. Medicina. Tokio 58, 102094 (2022).
Artículo de Google Scholar
Chaillet, N., Nyström, M. & Demirjian, A. Comparación de la madurez dental en niños de diferentes orígenes étnicos: curvas de madurez internacionales para médicos. J. Ciencias Forenses. 50, 1164-1174 (2005).
Artículo de Google Scholar
Olze, A. y col. Estudios sobre la cronología de la mineralización del tercer molar en una población japonesa. Pierna. Medicina. (Tokio) 6, 73–79 (2004).
Artículo de Google Scholar
Olze, A. y col. Estimación forense de la edad en sujetos vivos: el factor étnico en la mineralización de las muelas del juicio. En t. J. Medicina Legal. 118, 170-173 (2004).
Artículo de Google Scholar
Jiang, F. y col. Inteligencia artificial en la atención sanitaria: pasado, presente y futuro. Accidente cerebrovascular Vasc. Neurol. 2, 230–243 (2017).
Artículo de Google Scholar
Hosmer, DW Jr., Lemeshow, S. y Sturdivant, RX Regresión logística aplicada 3ª ed. (Wiley, 2013).
Libro MATEMÁTICAS Google Scholar
Zhang, Z. Introducción al aprendizaje automático: k vecinos más cercanos. Ana. Traducción Medicina. 4, 218 (2016).
Artículo de Google Scholar
Sweilam, NH, Tharwat, AA y AbdelMoniem, NK Máquina de vectores de soporte para el diagnóstico de enfermedades del cáncer: un estudio comparativo. Egipto. Informar. J. 11, 81–92 (2010).
Artículo de Google Scholar
Gavankar, SS y Sawarkar, SD Árbol de decisión ansioso. En 2da Conferencia Internacional para la Convergencia Tecnológica (I2CT). 837–840 (2017).
Breiman, L. Bosques aleatorios. Mach. Aprender. 45, 5–32 (2001).
Artículo MATEMÁTICAS Google Scholar
Tianqi, C. y Guestrin, C. XGBoost: un sistema de impulso de árboles escalable. En Actas de la 22ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (ed. Krishnapuram, B.) 785–794 (Asociación de Maquinaria de Computación, 2016).
Chollet, F. y col. Keras. https://github.com/fchollet/keras (2015).
Abadi, M. et al. Tensorflow: aprendizaje automático a gran escala en sistemas distribuidos heterogéneos. arXiv:1603.04467 (2016).
Plataforma de análisis KNIME [Internet]. Zúrich, Suiza: KNIME AG; c2020. https://www.knime.com/knime-analyticsplatform.
Descargar referencias
Este trabajo fue apoyado por la subvención de la Fundación Nacional de Investigación de Corea (NRF) financiada por el Ministerio de Ciencia y TIC (MSIT) (No. 2022R1F1A1063719).
División de Odontología Forense y Medicina Oral en Desastres, Departamento de Ciencias Forenses, Universidad Médica de Iwate, Iwate, 028-3694, Japón
Akiko Kumagai
Programa Interdisciplinario en Bioingeniería, Escuela de Graduados, Universidad Nacional de Seúl, Seúl, 03080, República de Corea
Seoi Jeong
Kakao Corp., Jeju, 63309, República de Corea
Daeyoun Kim
Departamento Transdisciplinario de Medicina y Tecnología Avanzada, Hospital Universitario Nacional de Seúl, Seúl, 03080, República de Corea
Hyun Joong Kong
Centro de Investigación de Big Data Médico, Facultad de Medicina de la Universidad Nacional de Seúl, Seúl, 03080, República de Corea
Hyun Joong Kong
Departamento de Ingeniería Biomédica, Facultad de Medicina de la Universidad Nacional de Seúl, Seúl, 03080, República de Corea
Hyun Joong Kong
Departamento de Anatomía, Instituto Católico de Anatomía Aplicada, Facultad de Medicina, Universidad Católica de Corea, Seúl, 06591, República de Corea
Sehyun Oh y Sang-Seob Lee
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
AK: adquisición y análisis de datos (segundo observador en evaluación de radiografías), redacción del manuscrito. SJ: análisis de datos (minería de datos; clasificación, perceptrón de regresión multicapa). DK: análisis de datos (minería de datos; regresión-perceptrón de capa única). HJK: diseño del estudio, supervisión del estudio. SO: adquisición y curación de datos. SSL: concepto y diseño del estudio, análisis de datos (observador principal en la evaluación de radiografías), supervisión del estudio, redacción del manuscrito y adquisición de financiación.
Correspondencia a Sang-Seob Lee.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Kumagai, A., Jeong, S., Kim, D. et al. Validación de modelos de minería de datos comparándolos con métodos convencionales para la estimación de la edad dental en jóvenes y adultos jóvenes coreanos. Representante científico 13, 726 (2023). https://doi.org/10.1038/s41598-023-28086-1
Descargar cita
Recibido: 10 de octubre de 2022
Aceptado: 12 de enero de 2023
Publicado: 13 de enero de 2023
DOI: https://doi.org/10.1038/s41598-023-28086-1
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.