Una técnica de máquina de aprendizaje activo basada en la predicción de enfermedades cardiovasculares de la UCI
Scientific Reports volumen 13, número de artículo: 13588 (2023) Citar este artículo
412 Accesos
5 altmétrico
Detalles de métricas
La enfermedad cardíaca es una importante causa mundial de mortalidad y predecirla mediante el análisis de datos clínicos plantea desafíos. El aprendizaje automático (ML) se ha convertido en una herramienta valiosa para diagnosticar y predecir enfermedades cardíacas mediante el análisis de datos sanitarios. Estudios anteriores han empleado ampliamente técnicas de aprendizaje automático en la investigación médica para la predicción de enfermedades cardíacas. En este estudio, se utilizaron ocho clasificadores de ML para identificar características cruciales que mejoran la precisión de la predicción de enfermedades cardíacas. Se emplearon varias combinaciones de características y algoritmos de clasificación conocidos para desarrollar el modelo de predicción. Se implementaron modelos de redes neuronales, como Naïve Bayes y funciones de base radial, logrando precisiones del 94,78 % y 90,78 % respectivamente en la predicción de enfermedades cardíacas. Entre los métodos de última generación para la predicción de problemas cardiovasculares, la cuantificación de vectores de aprendizaje exhibió la tasa de precisión más alta del 98,7%. La motivación detrás de la predicción de la enfermedad cardíaca cardiovascular radica en su potencial para salvar vidas, mejorar los resultados de salud y asignar recursos sanitarios de manera eficiente. Las contribuciones clave abarcan la intervención temprana, la medicina personalizada, los avances tecnológicos, el impacto en la salud pública y la investigación en curso, todos los cuales trabajan colectivamente para reducir la carga de la enfermedad coronaria tanto en los pacientes individuales como en la sociedad en su conjunto.
La industria de la salud genera una gran cantidad de datos sobre pacientes, enfermedades y diagnósticos, pero no se utilizan correctamente para producir los resultados deseados. Las enfermedades cardíacas y los accidentes cerebrovasculares son dos de las principales causas de muerte. Según un informe de la OMS, las enfermedades cardiovasculares matan directamente a más de 17,8 millones de personas cada año. Debido a que no hay suficientes análisis, las enormes cantidades de datos de pacientes, enfermedades y diagnósticos de la industria de la salud no tienen el efecto que se esperaba en la salud del paciente1. Las enfermedades del corazón y los vasos sanguíneos, o ECV, incluyen la enfermedad de las arterias coronarias, la miocarditis, las enfermedades vasculares y otras afecciones. Los accidentes cerebrovasculares y las enfermedades cardíacas matan al 80% de todas las personas que mueren por enfermedades cardiovasculares. Tres cuartas partes de todas las personas que mueren tienen menos de 70 años. Los principales factores que lo ponen en riesgo de sufrir una enfermedad cardiovascular son el sexo, el tabaquismo, la edad, los antecedentes familiares, la mala alimentación, los lípidos, la falta de actividad física y la presión arterial alta. , aumento de peso y consumo de alcohol2. La presión arterial alta y la diabetes son dos ejemplos de cosas que pueden transmitirse y aumentar la probabilidad de sufrir enfermedades cardiovasculares. Algunas de las otras cosas que aumentan el riesgo son estar inactivo, tener sobrepeso, no comer bien, tener dolor de espalda, cuello y hombros, estar muy cansado y tener latidos cardíacos rápidos. La mayoría de las personas tienen dolor en el pecho, dolor en el hombro, dolor en el brazo, dificultad para respirar y una sensación general de debilidad. Como ha sido durante mucho tiempo, el dolor en el pecho es el signo más común de que el corazón no recibe suficiente sangre3. Este tipo de dolor en el pecho se llama angina en medicina. Algunas pruebas, como las radiografías, la resonancia magnética (MRI) y la angiografía, pueden ayudar a determinar qué está mal. Por otro lado, a veces no es fácil acceder a equipos médicos importantes, lo que limita lo que se puede hacer en caso de emergencia. Cuando se trata de descubrir qué le pasa a su corazón y tratarlo, cada segundo cuenta4. Los diagnósticos de enfermedades cardíacas no son tan buenos como podrían ser y existe una gran necesidad de mejores análisis de big data en el rediseño del sistema cardiovascular y los resultados de los pacientes. Pero el ruido, el carácter incompleto y las irregularidades de los datos dificultan sacar de ellos conclusiones claras, precisas y bien fundamentadas. Debido a las recientes mejoras en tecnologías como big data, almacenamiento y recuperación de información, la inteligencia computarizada juega un papel importante en cardiología. Para sacar conclusiones de los datos extraídos con diferentes modelos de ML, los investigadores utilizaron técnicas de preprocesamiento5. Utilizando un conjunto común de algoritmos y sus variaciones, que se utilizan para realizar un seguimiento de los trastornos cardíacos hereditarios y los controles sanos, es posible predecir cuándo comenzará la primera etapa de la insuficiencia cardíaca. La técnica de clasificación, las máquinas DT, SVC, LR y RF son todos tipos de algoritmos que se pueden utilizar para predecir un paro cardíaco. Cuando se trata de aprendizaje automático, hay tres formas principales de pensar: los tres tipos principales de aprendizaje automático son el aprendizaje automático supervisado basado en tareas (clasificación/regresión), el aprendizaje automático no supervisado basado en datos (agrupación) y el aprendizaje por refuerzo basado en errores ( RL). La enfermedad de las arterias coronarias es una enfermedad muy común de los principales vasos sanguíneos que llevan sangre al músculo cardíaco. Las placas, que están formadas por lipoproteínas, pueden acumularse en las arterias del corazón, lo que puede provocar enfermedad de las arterias coronarias. Aterosclerosis es el nombre que se le da a la acumulación de estas placas6. La aterosclerosis ralentiza el flujo de sangre a través de las venas hacia el pecho y otros órganos. Aumenta si usted tiene una enfermedad cardíaca, angina o un derrame cerebral. Los hombres y las mujeres pueden tener diferentes signos y síntomas de advertencia de enfermedad de las arterias coronarias. Por ejemplo, los hombres tienen más probabilidades que las mujeres de tener dolor en el pecho. Además del dolor en el pecho, las mujeres tienen más probabilidades de experimentar dificultad para respirar, náuseas y agotamiento repentino. La insuficiencia cardíaca, la opresión en el pecho, la presión en el pecho y el dolor en el pecho pueden ser signos de enfermedad de las arterias coronarias7. El sistema de predicción de enfermedades cardíacas incorpora la técnica de clasificación bayesiana ingenua para ayudar en la toma de decisiones. Al analizar una amplia base de datos de casos pasados de enfermedades cardíacas, el sistema descubre información valiosa. Este modelo es muy eficiente para identificar pacientes con riesgo de enfermedad cardíaca. Posee la capacidad de responder a consultas complejas, mostrando sus puntos fuertes en términos de interpretabilidad, acceso a información completa y precisión8. Tomar decisiones precisas y oportunas es crucial en el campo médico, especialmente cuando se trata a pacientes. Las técnicas de aprendizaje automático (ML) desempeñan un papel importante en la predicción de enfermedades al aprovechar la gran cantidad de datos generados por la industria de la salud. En la India, las enfermedades cardíacas son una de las principales causas de mortalidad y la Organización Mundial de la Salud (OMS) enfatiza la importancia de una intervención oportuna para predecir y prevenir los accidentes cerebrovasculares. Este artículo se centra en predecir enfermedades cardiovasculares con mayor precisión mediante el empleo de técnicas de aprendizaje automático como Decision Tree y Naïve Bayes, junto con factores de riesgo. El conjunto de datos utilizado en este estudio es el Conjunto de datos sobre insuficiencia cardíaca, que comprende 13 atributos9. El autor investigó qué tan bien funcionaban dos algoritmos, Support Vector Machine (SVM) y Naive Bayes, para predecir la aparición de enfermedades cardíacas y el estado de supervivencia de los pacientes. Los algoritmos se aplicaron a un conjunto de datos que incluía dieciséis atributos del Centro de Aprendizaje Automático y Sistemas Inteligentes de la Universidad de California en Irvine. Para evaluar el rendimiento de los modelos, se utilizó una matriz de confusión para visualizar métricas como exactitud, recuperación, precisión y error. Además, se llevó a cabo un análisis estadístico utilizando la curva de característica operativa del receptor (ROC) y calculando el área bajo la curva para demostrar la precisión de los modelos10. En este artículo de investigación, se presenta un sistema que emplea una red neuronal con función de base radial para predecir con precisión ocho tipos diferentes de arritmias cardíacas. El enfoque principal del estudio es el análisis de datos de series temporales de frecuencia cardíaca, y el algoritmo propuesto está diseñado específicamente para predecir arritmias específicas, a saber, bloqueo de rama izquierda, fibrilación auricular, ritmo sinusal normal, bloqueo de rama derecha, bradicardia sinusal, aleteo, contracción ventricular prematura y bloqueo de segundo grado. Los datos de series temporales de frecuencia cardíaca utilizados en el estudio provienen de la base de datos de arritmias del MIT-BIH. Tanto las características lineales como las no lineales se extraen de las series temporales de frecuencia cardíaca de cada arritmia individual. El entrenamiento de la red neuronal de función de base radial (RBFN) se lleva a cabo utilizando el 70 % de los conjuntos de datos de características, mientras que el 30 % restante se dedica a predecir la aparición de las ocho enfermedades cardíacas. El enfoque propuesto demuestra una impresionante precisión de predicción general del 96,33 %, superando el rendimiento de los métodos existentes documentados en la literatura11. Se introduce un método novedoso conocido como clasificación de base radial para la clasificación de enfermedades cardíacas utilizando bases de datos clínicas. Los clasificadores convencionales que involucran múltiples atributos tienden a tener una gran cantidad de parámetros, lo que dificulta determinar los atributos ideales. Para abordar esto, se propone el concepto de Ideas de clasificador de funciones multivariadas, con el objetivo de fomentar una tendencia estocástica más cohesiva y minimizar la probabilidad de errores o resultados imprevistos. Esta fórmula resulta beneficiosa para organizar datos multidimensionales y mejorar la precisión de la agrupación en la fase de análisis. Los resultados del estudio indican que el método de cálculo sugerido ofrece una mayor precisión en comparación con enfoques anteriores12. La red neuronal de retropropagación ha demostrado un rendimiento satisfactorio en la precisión de la predicción. Sin embargo, para mejorar aún más la precisión y determinar el tipo específico de enfermedad cardíaca, el artículo integra la técnica CBR con la ANN. Al aprovechar los registros históricos de los pacientes, se logra un nivel de precisión que alcanza el 97 %. Esta investigación no sólo utiliza CBR para mejorar la precisión sino también para predecir el tipo de enfermedad cardíaca. El resultado del CBR abarca tanto el tipo identificado de enfermedad cardíaca como la medicación recomendada. Esto permite una comparación entre la medicación original y la medicación sugerida por la RBF (Función de Base Radial). La medicación prescrita mediante este método muestra una precisión comparativa del 98%13. Los síntomas incluyen dificultad para respirar, dolor en la parte superior de la espalda, cuello, mandíbula o garganta, y dolor, entumecimiento, debilidad o escalofrío en las extremidades. Debido al estrechamiento de los vasos sanguíneos en ciertas partes del cuerpo, es posible tener una enfermedad de las arterias coronarias y no saberlo hasta que sufre un ataque cardíaco, angina, derrame cerebral o insuficiencia cardíaca. Esté atento a los signos de problemas cardíacos y, si está preocupado, hable con su médico. Si lo examinan con frecuencia, es posible que se detecten antes enfermedades cardíacas (cardiovasculares)14. Este método propuesto utiliza clasificadores de ML supervisados para mostrar cómo diferentes modelos pueden predecir la presencia de enfermedades cardiovasculares y evaluar el rendimiento de estos clasificadores, como el bosque aleatorio, el árbol de decisión, la máquina de vectores de soporte, XGBoost, la función de base radial y el k-vecino más cercano. , bayes ingenuos y aprendizaje de la cuantificación de vectores.
El objetivo de predecir la enfermedad cardíaca cardiovascular es desarrollar modelos precisos y confiables que puedan evaluar el riesgo de un individuo de desarrollar diversas afecciones cardiovasculares, permitiendo una intervención temprana, un tratamiento personalizado y, en última instancia, reduciendo la carga de la enfermedad cardíaca en la salud pública.
Las secciones restantes del documento están estructuradas de la siguiente manera: La sección "Resumen de la literatura" proporciona una revisión exhaustiva de la literatura relevante. La sección "Metodología propuesta" presenta en detalle la metodología propuesta. Los resultados experimentales se analizan y discuten en la Sección "Resultados experimentales y discusión". La sección "Conclusión" presenta la conclusión del estudio, mientras que la sección "Trabajo futuro" describe el trabajo futuro y las posibles direcciones de investigación.
La variabilidad de la frecuencia cardíaca (VFC) se ha convertido en un predictor fiable de insuficiencia cardíaca congestiva (ICC). Sin embargo, persisten desafíos para extraer de manera efectiva características temporales y clasificar eficientemente representaciones HRV de alta dimensión. Para abordar estos desafíos, este estudio propone un método conjunto que utiliza datos de VFC a corto plazo y redes neuronales profundas para la detección de ICC. La investigación incorpora cinco bases de datos disponibles públicamente: base de datos BIDMC CHF (BIDMC-CHF), base de datos de intervalo CHF RR (CHF-RR), base de datos de ritmo sinusal normal (NSR) MIT-BIH, base de datos de fantasía (FD) y base de datos de intervalo RR NSR ( NSR-RR). Se emplean tres longitudes diferentes de segmentos RR (N = 500, 1000 y 2000) para evaluar el método propuesto. Inicialmente, las características expertas se extraen de los intervalos RR (RRI). Posteriormente, se construye una red basada en redes neuronales convolucionales de memoria a corto plazo para extraer automáticamente características de aprendizaje profundo (DL). Finalmente, se utiliza un clasificador de conjunto para detectar CHF utilizando las características antes mencionadas. La validación con los ojos vendados se lleva a cabo en tres sujetos con ICC y tres sujetos normales, lo que da como resultado precisiones del 99,85 %, 99,41 % y 99,17 % para N = 500, 1000 y 2000 RRI de longitud, respectivamente, utilizando BIDMC-CHF, NSR y FD. bases de datos15. En esta publicación hay un resumen de estudios anteriores y un análisis de qué tan bien funciona el algoritmo. Antes de entrenar y probar diferentes algoritmos, la arquitectura sugerida procesa los datos que llegan primero. El autor sugiere usar Adaboost porque hace que cada método de ML se vea mejor. Además, el autor estuvo de acuerdo en que la configuración podría ajustarse para mejorar la precisión. Los investigadores idearon una estrategia de aprendizaje profundo para analizar y detectar enfermedades cardíacas utilizando el conjunto de datos de la UCI. Continuaron diciendo que las redes neuronales profundas podrían ayudar a mejorar el análisis y el diagnóstico de las enfermedades cardiovasculares en su conjunto. En comparación con otras formas de mejorar el rendimiento del modelo, descubrieron que el proceso Talos Hyper funcionó mejor16. Los algoritmos KNN, RF, SVM y DT se estudiaron como modelos de ML para predecir enfermedades cardíacas con alta exactitud, alta recuperación y alta precisión. Como se muestra en su método de estimación para trastornos cardíacos, que se encuentra alojado en la biblioteca UCI ML, la categorización basada en SVM fue la más precisa. Analizamos los resultados de cuatro técnicas de aprendizaje automático y una red neuronal (NN) para detectar enfermedades cardíacas. Este estudio comparó algoritmos para predecir la dosis cardíaca basándose en aspectos como confiabilidad, recuperación, precisión y F1. El algoritmo Deep NN pudo detectar problemas cardíacos el 98% de las veces. Para demostrar que el algoritmo es útil para predecir enfermedades, se centraron en cómo podría utilizarse con un conjunto de datos médicos. Los investigadores llegaron a la conclusión de que el refuerzo y el embolsado son buenas formas de mejorar el rendimiento de los clasificadores que no son muy buenos para predecir el riesgo de enfermedad cardíaca. Los resultados mostraron que la precisión de las predicciones aumentó mucho después de utilizar la selección de características, lo que mejoró el procedimiento17. Se utilizaron enfoques conjuntos para mejorar la precisión de los malos clasificadores en no más del 7%. En los últimos años, los algoritmos de ML han recibido muchos elogios por lo precisos y útiles que se han vuelto para hacer predicciones. Es fundamental poder crear y recomendar modelos con la mayor precisión y eficiencia posibles18. Dado que los modelos híbridos utilizan muchas técnicas de aprendizaje automático y sistemas de datos, es posible que puedan predecir con precisión problemas de salud. Los clasificadores de malezas funcionaron mejor cuando utilizaron embolsado y refuerzo, y su capacidad para predecir el riesgo de enfermedad cardiovascular se calificó bien cuando trabajaron juntos. Hicieron el modelo híbrido utilizando votación mayoritaria con los clasificadores Bayes Net, NB, C4.5, MLP y RF19. Con el 85,48 por ciento de las veces, el modelo que se realizó es el correcto. Además de los modelos de aprendizaje, el conjunto de datos de enfermedades cardiovasculares de la UCI se ha utilizado recientemente con métodos de aprendizaje automático como RF y SVM. La precisión aumentó cuando se agregaron muchos clasificadores al modelo basado en votación20. Según los datos, el uso de clasificadores débiles condujo a un aumento del 2,1 % en la precisión. Utilizamos métodos de clasificación de ML para determinar cómo les iría a las personas con enfermedades a largo plazo. Descubrieron que el clasificador de Hoeffding puede predecir la enfermedad coronaria con una precisión del 88,56 por ciento. En general, descubrieron que cuando se utilizó el modelo híbrido con las características deseadas, tenía una precisión del 87,41%. Utilizamos un modelo SVM y el método de puntuación de Fisher para elegir características en función de la media21.
Utilizamos muchos métodos de clasificación y conjuntos de características diferentes para crear este modelo de predicción único en su tipo. El HRFLM propuesto utilizó una ANN con una red profunda y 13 características clínicas como entradas. También se analizaron técnicas de minería de datos como DT, SVM, NN y KNN. Los investigadores han descubierto que es útil utilizar SVM para predecir quién se enfermará. Hubo un nuevo método llamado "voto" y se habló de un método híbrido que combina LR y NB. La estrategia HRFLM resultó tener una efectividad del 88,7%22. Pudimos crear un modelo para predecir la muerte por insuficiencia cardíaca que tiene en cuenta una gama más amplia de factores de riesgo mejorando el bosque de supervivencia aleatorio23. El IRSF utilizó un criterio de división y un criterio de detención que eran nuevos en el campo para diferenciar entre los sobrevivientes y las personas que no lograron sobrevivir. La minería de datos también se ha utilizado para saber si alguien padece una enfermedad cardiovascular24. Las enfermedades cardíacas todavía se diagnostican mediante algoritmos bayesianos, clasificadores DT, NN, ley de asociación, KNN, SVM y ML. SVM tenía razón el 99,3% de las veces. Se han elaborado varios clasificadores basados en aprendizaje automático para predecir cuánto vivirá un paciente25. Se calificaron las características relacionadas con los factores de riesgo más importantes y los resultados se compararon con las pruebas bioestadísticas tradicionales. Los investigadores llegaron a la conclusión de que los niveles de creatinina sérica y la fracción de eyección son los dos elementos más importantes a tener en cuenta al intentar hacer predicciones precisas26. El algoritmo ML se utilizó para crear un modelo para encontrar ECV. En este estudio, limpiamos y analizamos los datos de cuatro maneras diferentes. Los métodos DT y RF obtuvieron una tasa de precisión del 99,83%, mientras que los métodos SVM y KNN solo obtuvieron tasas de precisión del 85,32% y 84,49%, respectivamente. Utilizando el método conjunto, otro estudio predijo la ICC observando la VFC y utilizando redes neuronales profundas para llenar vacíos de conocimiento en áreas no relacionadas. En general, el método sugerido fue correcto en un 99,85%. En una publicación reciente27, se utilizaron diferentes tipos de datos para crear un marco de inteligencia. Estos fueron análisis de componentes principales y MLA basado en RF. Se aplicó la FAMD a la RF para valorar las propiedades relevantes y predecir enfermedades. El método sugerido es correcto el 93,44% de las veces, sensible el 89,28% de las veces y específico el 96,74% de las veces. Para probar su teoría, los autores utilizaron un conjunto de 303 casos que se crearon agregándolos al conjunto de datos de Cleveland. En las pruebas, el algoritmo DT sugerido funcionó un 75,5% mejor que el algoritmo de referencia. Las enfermedades cardíacas a menudo se denominan "enfermedades cardiovasculares"28. Varios investigadores están tratando de hacer que sea más fácil saber si alguien tiene una enfermedad cardíaca. Su investigación sobre enfermedades cardíacas cubre mucho terreno. El autor utilizó datos de los conjuntos húngaro y Statlog para clasificar CVD utilizando el árbol de poda de error reducido (árbol REP), el árbol R, el árbol M5P, la regresión logística (LR), J48, bayes ingenuos (NB) y JRIP. La gente usa bosque aleatorio (RF), árbol de decisión (DT) y regresión lineal (LR). Se utilizan máquina de vectores de soporte (SVM), CART, análisis discriminante lineal (LDA), aumento de gradiente (XGB) y bosque aleatorio (RF)29. El objetivo de este estudio es encontrar una manera de determinar la probabilidad de que alguien padezca una enfermedad cardíaca. Los resultados muestran que SVM funciona mejor que LR porque obtiene un 96% de precisión, mientras que LR solo obtiene un 92% de precisión. El autor dice que el modelo DT siempre funciona mejor que el modelo NB y el modelo SVM. Se ha demostrado que SVM tiene una precisión del 87 %, DT tiene una precisión del 90 % y LR es el más preciso para predecir cuándo ocurrirá una enfermedad cardíaca, en comparación con DT, SVM, NB y k-vecino más cercano (KNN). La Tabla 1 representa la comparación de métricas de rendimiento general de los métodos más recientes.
El método basado en RF tiene una precisión del 97% en la predicción de enfermedades cardíacas congénitas, con una especificidad del 88% y una sensibilidad del 85%. Pudieron encontrar ECV con una precisión del 94 %, una especificidad del 95 % y una sensibilidad del 93 % mediante el uso de LR, MARS, EVF y CART-ML. La RF se utilizó para predecir objetivos farmacológicos en las interacciones huésped-hospedador y huésped-patógeno relacionadas con la ECV causada por microorganismos. Se han propuesto varios conjuntos y representaciones híbridas para resolver el problema de predecir enfermedades cardíacas. Según el método sugerido30, los CVD del Instituto Mendeley, los conjuntos de datos de Cleveland y el puerto IEEE se procesan con un alto nivel de precisión (96 %, 88,24 % y 93 %, respectivamente). El autor combinó los algoritmos LR y RF para predecir enfermedades cardíacas y obtuvo una precisión del 88,7%. En este estudio, los investigadores quieren saber más sobre cómo se relacionan el calcio en las arterias coronarias y la placa en las arterias carótidas. Ambos están relacionados con un mayor riesgo de enfermedad cardíaca, pero es posible que aún no causen ningún síntoma. El aprendizaje automático y el Internet de las cosas se utilizan a menudo para predecir y diagnosticar enfermedades en este momento. El autor pudo predecir problemas cardíacos el 94% de las veces con la ayuda de dispositivos móviles y el método de aprendizaje profundo. El autor emplea clasificadores de aprendizaje automático e Internet de las cosas para predecir infecciones cardíacas antes de que ocurran31. Al final del día, queremos demostrar que el aprendizaje automático podría ser una buena forma de resolver el problema que nos ocupa. Podemos usar ML para analizar casos relacionados con enfermedades y problemas de salud analizando cientos de conjuntos de datos de atención médica. Los investigadores han trabajado en la percepción informática sofisticada para una atención médica confiable para descubrir cómo las prácticas de visión artificial ayudan a las necesidades humanas, como la salud psicosocial, el movimiento específico, la fatiga inducida por la exposición, tener que mirar con frecuencia acciones en vivo, el análisis de imágenes, el aprendizaje profundo, la clasificación de patrones, y cómo la comprensión del lenguaje y la animación por ordenador funcionan con la robótica32. Los autores notaron y escribieron sobre cómo los usuarios aprenden sobre interfaces nítidas y herramientas de realidad virtual, lo que conduce al desarrollo de sistemas restaurativos complejos que pueden realizar actividades humanas y reconocerlas. El trabajo respalda el método directo de visión artificial en el sector sanitario. Esto incluye la tecnología detrás de las sillas de ruedas inteligentes, la posible ayuda para las personas con discapacidad visual y otras soluciones de seguimiento de objetos que se han utilizado recientemente para monitorear la salud y la seguridad33. Los científicos utilizaron máquinas de vectores de soporte, máquinas de impulso generalizadas, regresión logística, máquinas de impulso de luz y bosques aleatorios para ver la probabilidad de que alguien contrajera una enfermedad cardiovascular. La RF era la mejor manera de predecir quién sufriría una enfermedad cardíaca. Acertó el 88% de las veces. Nuestro método se compara con el estudio actual. Este es el primer y único estudio que compara la precisión de siete clasificadores ML diferentes para predecir enfermedades cardiovasculares. Estos métodos incluyen los más avanzados, como el aprendizaje de la cuantificación de vectores, las redes neuronales RBF y la regresión logística. Por tanto, ahora es posible utilizar un sistema que sea preciso y útil para predecir problemas cardíacos. Además, sugerimos utilizar el mejor clasificador de aprendizaje automático al crear sistemas inteligentes para predecir CHD34. Las características clave de las enfermedades cardiovasculares incluyen una alta morbilidad, discapacidad y muerte, y la etiología de las enfermedades cardíacas sigue siendo un problema mundial sin resolver. Por lo tanto, es necesaria una predicción temprana precisa de los resultados previstos en personas afectadas por enfermedades cardíacas. En este trabajo, empleamos modelos ML para predecir enfermedades cardíacas. Este estudio se centra en predecir enfermedades cardíacas utilizando clasificadores ML. Los autores primero abordan el problema del conjunto de datos y posteriormente lo mejoran y estandarizan para la tokenización y la conversión a minúsculas. Luego, los conjuntos de datos se utilizaron para entrenar y probar los clasificadores, evaluando su desempeño para lograr el más alto nivel de precisión. Estos algoritmos deben cumplir estrictos criterios de admisión, entre ellos modernidad, representatividad y alta madurez. Anteriormente, empleamos funciones de base radial y Naive Bayes examinando los trabajos de investigadores anteriores. Investigamos si investigadores anteriores habían utilizado estos enfoques en el conjunto de datos cardíacos de la UCI.
Las aportaciones de trabajo propuestas:
Los autores comienzan analizando conjuntos de datos, que posteriormente se estandarizan y mejoran. Luego, estos conjuntos de datos se emplean para entrenar y probar varios clasificadores para determinar cuál tiene la mayor precisión.
Posteriormente, los autores utilizan la matriz de correlación para clasificar los valores o características óptimos.
El tercer paso consiste en aplicar los clasificadores ML al conjunto de datos preprocesado, con el objetivo de lograr la mayor precisión posible mediante modificaciones de parámetros.
En el cuarto y último paso, se evalúa la exactitud, precisión (especificidad), recuerdo (sensibilidad) y medida F de los clasificadores sugeridos.
En última instancia, los clasificadores sugeridos superan a los clasificadores de última generación presentados en la Tabla 1 en términos de precisión.
Con la utilización del conjunto de datos cardíacos, empleamos clasificadores de ML para predecir la presencia de enfermedad coronaria. El conjunto de datos se obtuvo del repositorio de la UCI y se aplicó ingeniería de funciones para el preprocesamiento de los datos antes de seleccionar las funciones. Posteriormente, lo dividimos en conjuntos de datos de entrenamiento y prueba, utilizando alrededor del 70% de los datos totales para entrenamiento y la parte restante para pruebas. El conjunto de datos de entrenamiento se utiliza para crear un modelo que predice enfermedades cardíacas, mientras que el conjunto de datos de prueba se utiliza para evaluar los clasificadores. Antes de transformar variables categóricas en valores numéricos para su clasificación, se realizó un análisis exhaustivo del conjunto de datos. El conjunto de datos se etiquetó como "normal" y "enfermo" en el Paso 1. La etiqueta "enfermo" indica la presencia de enfermedad cardíaca, mientras que la etiqueta "normal" indica la ausencia de enfermedad cardíaca. En el Paso 2, se realizó la limpieza de datos durante la fase de entrenamiento. El preprocesamiento de datos implicó el manejo de valores faltantes mediante el cálculo de la media debido a la presencia de valores parciales y faltantes. El paso 3 implicó la visualización de datos utilizando el Análisis de datos exploratorios (EDA) para examinar las relaciones entre varios atributos. En particular, identificamos que la correlación para FBS es relativamente baja. Pasando al Paso 4, se aplicaron clasificadores ML al conjunto de datos preprocesado y se evaluó el rendimiento de los clasificadores utilizando una variedad de parámetros. Como se mencionó anteriormente, el conjunto de datos se dividió en conjuntos de prueba y entrenamiento para evaluar los clasificadores y desarrollar el modelo, respectivamente. Los clasificadores empleados demostraron distintos niveles de precisión en la detección de la presencia de enfermedades cardíacas. La Figura 1 ilustra las etapas de nuestro enfoque de trabajo propuesto.
Descripción general del funcionamiento del sistema propuesto.
Utilizamos los conjuntos de datos de enfermedades cardiovasculares disponibles públicamente de la base de datos de la UCI. Hay 503 casos en total, con características multivariadas representadas por 10 atributos y un rango de valores enteros, de categoría y reales. El conjunto de datos se describe en la Tabla 2. Base de datos: https://archive.ics.uci.edu/ml/datasets/heart+disease.
Utilizando el conjunto de datos cardíacos y los clasificadores ML, pudimos hacer predicciones precisas sobre la presencia de enfermedad coronaria. El conjunto de datos se obtuvo del repositorio de la UCI, y el material que se realizó previamente se realizó antes de utilizar la ingeniería de características para seleccionar las características. Luego lo dividimos en dos partes, una para entrenamiento y otra para pruebas; la primera contiene normalmente el 75% de los datos totales y la segunda el resto. El conjunto de datos de entrenamiento se utiliza para hacer predicciones sobre enfermedades cardiovasculares, mientras que la información de la prueba se utiliza para evaluar clasificadores. Antes de transformar variables categóricas en datos cuantitativos para su clasificación, primero analizamos el conjunto de datos.
Fase 1: el conjunto de datos se anotó con etiquetas "normal" y "anormal". Tanto la etiqueta "sano" como la "enferma" indican que las respectivas personas están libres de problemas relacionados con el corazón. Fase 2: Hicimos una cierta ordenación de los datos. Debido a los datos parciales y faltantes en el conjunto de datos, promediamos los valores restantes para completar la fase. Fase 3: Utilizamos análisis de datos exploratorios para visualizar los datos y buscar patrones en las relaciones entre variables. Nuestra investigación mostró que la asociación entre FBS y cualquier otra cosa era bastante modesta. Fase 4: A continuación, examinamos el rendimiento de los clasificadores de ML en el conjunto de datos preprocesados utilizando una variedad de métricas. Como se dijo anteriormente, el conjunto de datos a menudo se divide en conjuntos de prueba y entrenamiento, el primero de los cuales se utiliza para evaluar la eficacia de los clasificadores y el segundo para educar al modelo. Los clasificadores utilizados para hacer predicciones sobre la salud cardíaca tienen distintos grados de éxito. La Figura 1 muestra las etapas de nuestro método de trabajo sugerido.
La cuantificación de vectores de aprendizaje es una red que se basa en la competencia y utiliza el aprendizaje supervisado. Podríamos decir que es un método de organización de patrones en grupos, en el que cada función de transferencia es un grupo. Dado que utiliza un algoritmo de aprendizaje, el sistema recibirá una colección de patrones de aprendizaje con clasificaciones reconocidas y una asignación preliminar de la variable de salida. Una vez finalizado el entrenamiento, LVQ categorizaría un vector de entrada colocándolo en la misma clase que el canal de salida. La arquitectura de LVQ se muestra en la siguiente figura 2. Como podemos ver, hay "n" unidades que sirven como entrada y "m" unidades que sirven como salida. Las capas están completamente unidas entre sí y se les colocan pesos. Se han utilizado los siguientes parámetros respectivos para las operaciones de entrenamiento LVQ para la clasificación cardiovascular:
Aprendizaje de la arquitectura de cuantificación de vectores para clasificación cardiovascular.
Paso 1: comenzar.
Paso 2: Inicialización del vector de referencia basada en los vectores de entrenamiento y denota que 'm' son los números del grupo y se puede usar como un vector de peso. El resto de vectores se asignarán para el modo de entrenamiento.
Paso 3: Asignar aleatoriamente la clasificación inicial y sus pesos correspondientes.
Paso 4: Inicializar la técnica de agrupación de K-medias.
Paso 5: Se asigna el vector de referencia β.
Paso 6: Calcular el cuadrado de la distancia euclidiana para i y j (1 a my 1 a n) respectivamente.
Paso 7: Calcular y lograr la unidad de elevación J donde ED es localmente mínima.
Paso 8: Calcule el peso inicial de la unidad de elevación utilizando las condiciones relativas,
Paso 9: Reducir la tasa de aprendizaje β.
Paso 10: Iniciar la condición de parada de la prueba.
Paso 11: Detente.
El contorno de la arteria coronaria muestra arterias coronarias claras, arterias coronarias con lesiones ateromatosas y arterias coronarias con flujo sanguíneo reducido debido a una obstrucción. El grado y la dirección de una conexión lineal entre dos variables cuantitativas se pueden describir examinando su correlación. La Tabla 3 muestra las relaciones entre las distintas columnas. La mayoría de las columnas tienen alguna correlación con la variable "número", pero "BS-F" tiene muy poca.
De la ecuación. (1) Los coeficientes de correlación α entre una variable explicativa (y) y otra (x) están representados por una cadena de caracteres en esta fórmula (x). El valor de α1 indica la fuerza de la relación entre la variable (y) y las variables independientes (x), y así sucesivamente. La Figura 3 muestra un mapa de calor integrado dentro de una matriz de correlación. Un mapa de calor es una representación visual de la relación entre características independientes y valores dependientes. Además, está claro qué características tienen el vínculo más fuerte con la variable de la característica complementaria. El producto final se muestra en la Fig. 2. Para comprender mejor los datos, ahora trazaremos la característica del conjunto de datos de enfermedades cardiovasculares frente al número. Los gráficos estadísticos y otras formas de visualización de datos son herramientas comunes en el análisis de datos exploratorio, que se utiliza para examinar conjuntos de datos con el fin de identificar y describir sus características más destacadas.
Matriz de correlación de mapas de calor.
Ecuación (5), la correlación general entre dos variables en una población de muestra viene dada por esta ecuación. Esta sería la conexión entre la variable independiente y la variable dependiente en la regresión lineal básica. La tabla 4 ilustra los distintos análisis cardiovasculares por grupos de edad.
De un máximo de 503 casos de enfermedad, determinamos que 305 personas tenían algún tipo de problema de enfermedad cardíaca. Maligno se representa con 1, benigno con 0 y 198 del total de pacientes se consideran sanos. Teniendo en cuenta estos resultados, podemos inferir que el 53,36 por ciento de los pacientes tienen problemas cardíacos y el 46,64 por ciento no. También analizamos otras características del conjunto de datos, incluido el sexo, el grupo de edad, el estado cardíaco, el control de la presión arterial, la grasa y el tabaquismo. En diabéticos promedio, el electrocardiograma obtuvo el valor pico de la frecuencia del pulso para angina de pecho y el pico obsoleto. Como se puede observar en la Fig. 4, la propiedad sexual acepta dos valores: 0 para mujeres y 1 para hombres. Según los resultados, las mujeres tienen un mayor riesgo de desarrollar enfermedades cardiovasculares que los hombres. La Figura 5 muestra la distribución por edades del conjunto de datos, lo que demuestra que el riesgo de enfermedad cardíaca es independiente del grupo de edad. Tanto la edad como el porcentaje deseado se muestran en los ejes x e y, respectivamente. El malestar en el pecho es común entre quienes padecen enfermedades cardíacas. Los pacientes cardiovasculares pueden experimentar dolor en el pecho. Sin embargo, el dolor en el pecho se puede dividir en diferentes categorías, como angina no anginosa, asintomática, atípica y angina típica. La Figura 6 muestra las diferentes categorías de dolor en el pecho que pueden ocurrir. Según la Fig. 6, los pacientes con angina atípica pueden tener el mayor riesgo de paro cardíaco. El nivel de azúcar en sangre durante el ayuno (BS-F) no puede tener un impacto significativo en el desarrollo de enfermedades cardíacas.
Casos generales de pacientes con enfermedades cardíacas.
Posibilidades cardiovasculares basadas en la categorización del sexo.
Estadísticas por grupos de edad cardiovasculares.
Realizamos un análisis de la información en el que se asigna el valor 1 (verdadero) al caso en que el nivel de azúcar en sangre en ayunas del paciente es superior a 120 mg/dL, lo que indica que está en riesgo de padecer la afección; en caso contrario, se asigna al caso el número 0 (falso), como se muestra en la figura 7. Según los resultados, este método para predecir la existencia de enfermedades cardíacas no tiene nada de destacable. Las lecturas del electrocardiograma son 0, 1 y 2. Los resultados demuestran que aquellos cuyos valores de ECG son "1" o "0" tienen un mayor riesgo de desarrollar enfermedades cardíacas en comparación con las personas cuyos valores de ECG son "20", como se ve en la figura. 8. La Figura 9 muestra el análisis del ECG de posibilidad cardiovascular. La Tabla 5 representa las diversas categorías de aparición cardiovascular. La Tabla 6 ilustra las posibilidades de enfermedad cardiovascular encontradas en el escrutinio del ECG.
Diferentes tipos cardiovasculares.
Posibilidad de enfermedad durante el ayuno.
Análisis de ECG de posibilidad cardiovascular.
Como se muestra en la Fig. 10, quienes sufren angina tienen un riesgo mucho menor de desarrollar problemas cardíacos. Si la puntuación de la angina de ejercicio es 1, indica que el paciente en realidad tiene un problema cardíaco; en cambio, si es 0, indica que el paciente no tiene ningún problema cardíaco y por tanto es menos probable que desarrolle problemas cardíacos.
No impacto e impacto de la ocurrencia basado en el ejercicio.
En este capítulo, se abordan los resultados de los clasificadores de ML en diversos requisitos de evaluación, como precisión, recuperación y medida F. Ejemplos de estas limitaciones de evaluación incluyen: Además de esto, el rendimiento de los modelos de clasificación de aprendizaje automático se evalúa utilizando el conjunto de datos, que incluye información sobre enfermedades cardíacas. A k-NN no le fue muy bien, aunque a RBF, NB y LVQ les fue mejor que a los otros clasificadores en comparación con su desempeño general. Como se puede ver en la Tabla 7, los criterios de evaluación más importantes que se tuvieron en cuenta en este estudio para evaluar el desempeño del clasificador ML son las calificaciones de sensibilidad, exactitud, especificidad, recuperación, precisión y medida F. Como consecuencia de esto, la especificidad y sensibilidad de la clase objetivo se calculan para evaluar la precisión con la que se prevé que funcionará el método dado. Las tasas "TP" (verdadero positivo), "TN" (verdadero negativo), "FN" (falso negativo) y "FP" (falso positivo) se utilizan para calcular la exactitud, precisión, recuperación y medida F en ML. . Estas medidas están determinadas por la calidad de los datos. Cada predicción positiva y negativa correcta se subdivide en pronósticos positivos y negativos correctos. Cada modelo predijo correctamente los resultados de TP, TN, FP y FN. Las letras TP significan enfermo, que significa infectado. La FN es una enfermedad que no se cree que esté relacionada con la enfermedad cardiovascular. La enfermedad FP se ha predicho pero nunca se ha visto en humanos. En el mundo actual, la TN no existe como enfermedad y no se prevé que esto cambie en el futuro previsible. El desempeño de los enfoques de ML en términos de precisión se enumera en la Tabla 7. Al asociar el desempeño de estos clasificadores, observamos que las funciones de base radial, las bayes ingenuas y la cuantificación de vectores de aprendizaje, así como su relación con otros clasificadores de ML, llevaron a estos modelos para lograr casi 90,06%, 94,16% y 98,07% de precisión, respectivamente, como se muestra en la Fig. 11.
Ilustración gráfica de la comparación métrica de parámetros de RF y LVQ.
La Tabla 7 y la Fig. 11 ilustran el resultado de la comparación de la métrica de parámetros (precisión, exactitud, sensibilidad, especificidad, recuperación y medida f) del bosque aleatorio (RF) y la cuantificación de vectores de aprendizaje (LVQ). El resultado muestra que el LVQ obtuvo una mejor precisión de resultados del 98,78%. Tabla 8, resultado de la comparación de la métrica de parámetros (precisión, exactitud, sensibilidad, especificidad, recuperación y medida f) del árbol de decisión (DT) y la cuantificación del vector de aprendizaje (LVQ).
El resultado muestra que LVQ obtuvo una mejor precisión de resultado del 98,78%, y la ilustración gráfica se muestra en la Fig. 10. Las Tablas 9 y 10 ilustran que el resultado del sistema propuesto es mejor que los métodos XGBoost y KNN, y se muestra la representación de la vista gráfica. en las Figs. 11 y 12 respectivamente. La Tabla 11 muestra el resultado de la comparación de la métrica de parámetros (precisión, exactitud, sensibilidad, especificidad, recuperación y medida f) de la máquina de vectores de soporte (DT) y la cuantificación de vectores de aprendizaje (LVQ). Luego, la Tabla 12 muestra la comparación de parámetros de métricas de rendimiento de varios clasificadores como DT, KNN, RF, SVM y XGBoost. De la Tabla 12, el sistema propuesto logró (Pre 98,07%, Acc 98,78%, Se 97,91%, Sp 97,1%, Recall 95,31% y Fm 97,89%) mejores resultados en todos los parámetros que las otras técnicas convencionales. La Figura 13 muestra la ilustración gráfica de la comparación de métricas de parámetros de XGBoost y LVQ. La Figura 14 representa la ilustración gráfica de la comparación de métricas de parámetros de KNN y LVQ.
Ilustración gráfica de la comparación de métricas de parámetros de DT y LVQ.
Ilustración gráfica de la comparación de métricas de parámetros de XGBoost y LVQ.
Ilustración gráfica de la comparación de métricas de parámetros de KNN y LVQ.
En comparación con las otras técnicas de clasificación, las dos técnicas correspondientes, función de base radial y nave Bayes, produjeron los mejores resultados. Para lo cual se toman sus respectivos parámetros y se compara con el sistema propuesto que se muestra en la Tabla 13; el resultado muestra que los resultados de los parámetros del sistema propuestos son mejores que esos dos resultados, como se ilustra en la Fig. 15. La Figura 16 muestra la comparación de los parámetros de la métrica de rendimiento del método propuesto para la precisión de la clasificación. La Figura 17 ilustra la comparación de métricas de rendimiento de los clasificadores RBF, NB y LVQ. Las características operativas del receptor de la cuantificación del vector de aprendizaje se ilustran en la Fig. 18.
Ilustración gráfica de la comparación de métricas de parámetros de SVM y LVQ.
Precisión de clasificación: comparación de parámetros de métricas de rendimiento.
Comparación de métricas de rendimiento de los clasificadores RBF, NB y LVQ.
Aprendizaje de la cuantificación vectorial ROC.
En este estudio, se utilizan clasificadores de aprendizaje automático para determinar si un paciente tiene o no problemas cardíacos. El conjunto de datos se tomó del repositorio de la UCI. Después de la recopilación de datos, pasarán por pasos de limpieza y preprocesamiento. Después de este paso, los modelos de aprendizaje automático se utilizan para el análisis predictivo. Investigamos el potencial de estos ocho métodos aplicados de aprendizaje automático para realizar predicciones precisas sobre enfermedades cardíacas. Los criterios de inclusión para estos algoritmos son que sean maduros, representativos y estén a la última en sus respectivos campos. Anteriormente hemos utilizado las redes neuronales Naive Bayes y RBF, pero otros académicos no las han utilizado en el conjunto de datos de enfermedades cardiovasculares de la UCI. Como resultado, hemos logrado un nivel de precisión más alto que ellos, como se muestra en la tabla titulada "estado del arte", que compara nuestros resultados con los de otros investigadores. Los hallazgos finales demuestran que cuando se utilizaron los clasificadores de máquinas de aprendizaje, las redes neuronales Naive Bayes y RBF lograron una precisión del 94,78% al intentar pronosticar la presencia de enfermedad cardiovascular coronaria. Sin embargo, el método de cuantificación del vector de aprendizaje logró la mayor precisión de categorización del 98,78 %, con una especificidad del 97,1 % y una sensibilidad del 97,91 %, una precisión del 98,07 % y 95,31 %, y valores de puntuación F1 y medida F del 97,89 %, respectivamente.
En el futuro, nuestra investigación tiene como objetivo mejorar aún más la confiabilidad de nuestras conclusiones mediante la incorporación de conjuntos de datos adicionales. Exploraremos el uso de técnicas metaheurísticas y algoritmos inspirados en la naturaleza para optimizar los parámetros de los clasificadores de aprendizaje automático y los métodos de aprendizaje profundo. Este proceso de optimización nos permitirá evaluar de manera más efectiva la presencia de enfermedades cardíacas en varios conjuntos de datos relacionados con enfermedades cardíacas. Además, nos centraremos en mejorar la precisión de los algoritmos existentes para mejorar su rendimiento en la detección de enfermedades cardíacas. Aprovechando estos avances, nuestro objetivo es proporcionar métodos más sólidos y precisos para el diagnóstico y evaluación de enfermedades cardíacas.
Se utilizó una base de datos disponible públicamente y no se utilizaron datos/muestras humanas en el estudio” https://archive.ics.uci.edu/ml/datasets/heart+disease.
Gour, S., Panwar, P., Dwivedi, D. y Mali, C. Un enfoque de aprendizaje automático para la predicción de ataques cardíacos. Intel. Sostener. Sistema. 2555(1), 741–747 (2022).
Google Académico
Juhola, M. et al. Análisis de datos para enfermedades cardíacas. Computadora. Biol. Medicina. 142(1), 1–9 (2022).
Google Académico
Alom, Z. y col. Detección temprana de insuficiencia cardíaca mediante técnicas de aprendizaje automático. Proc. En t. Conf. Big Data IoT Mach. Aprender. 95, 75–88 (2021).
Google Académico
Sharma, S. & Parmar, M. Predicción de enfermedades cardíacas utilizando un modelo de red neuronal de aprendizaje profundo. En t. J. Innov. Tecnología. Explorar. Ing. 9(3), 2244–2248 (2020).
Artículo de Google Scholar
Ravindhar, N. y Hariharan Ragavendran, S. Diagnóstico inteligente de predicción de enfermedades cardíacas mediante aprendizaje automático. En t. J. Innov. Tecnología. Explorar. Ing. 9(11), 1417–1421 (2019).
Artículo de Google Scholar
Arunpradeep, N. & Niranjana, G. Diferentes modelos de aprendizaje automático basados en la predicción de enfermedades cardíacas. En t. J. Tecnología reciente. Ing. 8(6), 544–548 (2020).
Google Académico
Ravindhar, N., Anand, H. y Ragavendran, G. Diagnóstico inteligente de predicción de enfermedades cardíacas mediante aprendizaje automático. En t. J. Innov. Tecnología. Explorar. Ing. 8(11), 1417–1421 (2019).
Artículo de Google Scholar
Subulakshmi, G. Apoyo a la toma de decisiones en el sistema de predicción de enfermedades cardíacas utilizando Naive Bayes. Indio J. Computadora. Ciencia. Ing. 2(2), 170–176 (2011).
Google Académico
Sai Krishna Reddy, V., Meghana, P., Subba Reddy, NV y Ashwath Rao, B. Predicción de enfermedades cardiovasculares mediante árboles de decisión y clasificadores ingenuos de Bayes. J. Física. 2161, 1–8 (2022).
Google Académico
Patel, TS, Patel, DP, Sanyal, M. & Shrivastav, PS Predicción de enfermedades cardíacas y capacidad de supervivencia utilizando una máquina de vectores de soporte y el algoritmo Naive Bayes. bioRxiv https://doi.org/10.1101/2023.06.09.543776 (2023).
Artículo PubMed PubMed Central Google Scholar
Kelwade, P. y Salankar. 2016. Red neuronal con función de base radial para la predicción de arritmias cardíacas basada en series temporales de frecuencia cardíaca. Primera Conferencia Internacional IEEE sobre Control, Medición e Instrumentación 454–458. https://doi.org/10.1109/CMI.2016.7413789 (2016).
Kumar, S. Detección de enfermedades cardíacas mediante clasificador de función de base radial. ICTACT J. Ciencia de datos. Mach. Aprender. 1(4), 105–108 (2020).
Google Académico
Jothikumar, R., Sivakumar, N. & Ramesh, PS Sistema de predicción de enfermedades cardíacas utilizando ANN, RBF y CBR. En t. J. Aplicación pura. Matemáticas. 117(21), 199–217 (2017).
Google Académico
Saravanan, S. & Thirumurugan, P. Análisis del rendimiento de la segmentación de tumores cerebrales de glioma mediante transformada de Ridgelet y metodología CANFES. J. Med. Informe de Salud por Imágenes. 10(11), 2642–2648 (2020).
Artículo de Google Scholar
Latha, C. & Jeeva, S. Mejora de la precisión de la predicción del riesgo de enfermedad cardíaca basada en técnicas de clasificación conjunta. Informar. Medicina. Desbloquear 16(1), 1–9 (2019).
Google Académico
Abdeldjouad, F., Brahami, M. y Matta, N. Un enfoque híbrido para el diagnóstico y predicción de enfermedades cardíacas mediante técnicas de aprendizaje automático. En Conferencia internacional sobre hogares inteligentes y telemática sanitaria 299–306 (Springer, 2020).
Google Académico
Tarawneh, M. & Embarak, O. Enfoque híbrido para la predicción de enfermedades cardíacas mediante técnicas de minería de datos. Acta de ciencia. Nutrición. Salud 3(7), 147–151 (2019).
Google Académico
Javid, I., Alsaedi, A. y Ghazali, R. Precisión mejorada en la predicción de enfermedades cardíacas mediante el aprendizaje automático y el método de votación mayoritaria por conjunto de redes neuronales recurrentes. En t. J. Adv. Computadora. Ciencia. Aplica. 11(3), 540–551 (2020).
Google Académico
Kumar, N. & Sikamani, K. Predicción de enfermedades crónicas e infecciosas mediante clasificadores de aprendizaje automático: un enfoque sistemático. En t. J. Intel. Ing. Sistema. 13(4), 11-20 (2020).
Google Académico
Saqlain, S. y col. Selección de subconjuntos de características basada en la puntuación de Fisher y el coeficiente de correlación de Matthew para el diagnóstico de enfermedades cardíacas mediante máquinas de vectores de soporte. Conocimiento. inf. Sistema. 58, 139-167 (2019).
Artículo de Google Scholar
Mohan, S., Thirumalai, C. y Srivastava, G. Predicción eficaz de enfermedades cardíacas mediante técnicas híbridas de aprendizaje automático. Acceso IEEE 7, 81542–81554 (2019).
Artículo de Google Scholar
Miao, F., Cai, Y., Zhang, Y. & Li, Y. Modelado predictivo de mortalidad hospitalaria para pacientes con insuficiencia cardíaca mediante el uso de un bosque de supervivencia aleatorio mejorado. Acceso IEEE 6, 7244–7253 (2018).
Artículo de Google Scholar
Chicco, D. & Jurman, G. El aprendizaje automático puede predecir la supervivencia de pacientes con insuficiencia cardíaca únicamente a partir de la creatinina sérica y la fracción de eyección. BMC Med. Informar. Decide. Mak. 20(16), 1–16 (2020).
Google Académico
Ahmad, E., Tiwari, A. y Kumar, A. Detección de enfermedades cardiovasculares (ECV) mediante algoritmos de aprendizaje automático. En t. J.Res. Aplica. Ciencia. Ing. Tecnología. 8(6), 2341–2346 (2020).
Artículo de Google Scholar
Wang, L., Zhou, W., Chang, Q., Chen, J. y Zhou, X. Detección profunda por conjunto de insuficiencia cardíaca congestiva mediante intervalos RR a corto plazo. Acceso IEEE. 7, 69559–69574 (2019).
Artículo de Google Scholar
Gupta, A., Kumar, R., Arora, H. y Raman, B. MIFH: un marco de inteligencia artificial para el diagnóstico de enfermedades cardíacas. Acceso IEEE 8, 14659–14674 (2019).
Artículo de Google Scholar
Rashmi, G. & Kumar, U. Métodos de aprendizaje automático para la predicción de enfermedades cardíacas. Computación SN. Ciencia. 8, 220–223 (2019).
Google Académico
Nadakinamani, R. y cols. Análisis de datos clínicos para la predicción de enfermedades cardiovasculares mediante técnicas de aprendizaje automático. Computadora. Intel. Neurociencias. 2022, 1-13 (2022).
Artículo de Google Scholar
Hossen, M. y col. Análisis y predicción supervisados de enfermedades cardiovasculares basados en aprendizaje automático. Matemáticas. Problema. Ing. 2021, 1–10 (2021).
Artículo de Google Scholar
Saboor, A. y col. Un método para mejorar la predicción de enfermedades cardíacas humanas mediante algoritmos de aprendizaje automático. Inf. Móvil Sistema. 2022, 1–11 (2022).
Artículo de Google Scholar
Arumugam, K. y col. Predicción de múltiples enfermedades mediante algoritmos de aprendizaje automático. Madre. Hoy 2021, 1–10 (2021).
Google Académico
Gupta, C., Saha, A., Reddy, N. y Acharya, U. Predicción de enfermedades cardíacas mediante técnicas de aprendizaje automático supervisado. J. Física: Conf. Ser. 2161, 1-12 (2022).
Google Académico
Truong, V. y col. Aplicación del aprendizaje automático en el cribado de cardiopatías congénitas mediante ecocardiografía fetal. En t. J. Cardiovasc. Imágenes 38, 1007–1015 (2022).
Artículo de Google Scholar
Abdalrada, A., Abawajy, J., Al-Quraishi, T. & Islam, S. Modelos de aprendizaje automático para la predicción de la coexistencia de diabetes y enfermedades cardiovasculares: un estudio de cohorte retrospectivo. J. Diabetes Metab. Desorden. 21, 251–261 (2022).
Artículo CAS PubMed PubMed Central Google Scholar
Descargar referencias
Departamento de Ingeniería y Ciencias de la Computación, Vel Tech Rangarajan Dr. Sagunthala Instituto de Investigación y Desarrollo de Ciencia y Tecnología, Avadi, Chennai, India
Saravanan Srinivasan
Departamento de Ingeniería y Ciencias de la Computación, Instituto Sathyabama de Ciencia y Tecnología, Chennai, India
Subathra Gunasekaran
Escuela de Ingeniería y Ciencias de la Computación, Universidad Galgotias, Greater Noida, 203201, India
Sandeep Kumar Mathivanan
Escuela de Ingeniería Informática y Sistemas de Información, Instituto de Tecnología de Vellore, Vellore, 632014, Tamil Nadu, India
Benjula Anbu Malar M. B y Prabhu Jayagopal
Departamento de Ingeniería de Software, Facultad de Computación e Informática, Universidad Haramaya, POB 138, Dire Dawa, Etiopía
Gemmachis Teshita Dalu
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
Conceptualización, SS y SG; metodología, SKM; validación, BAMMB; recursos, PJ; curación de datos, GTD; redacción: preparación del borrador original, SS y SG; redacción: revisión y edición, SKM, BAMMB, PJ y GTD; visualización, SKM, BAMMB, P..J y GTD; supervisión SKM, BAMMB, PJ y GTD; administración de proyecto.
Correspondencia a Gemmachis Teshite Dalu.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Srinivasan, S., Gunasekaran, S., Mathivanan, SK et al. Una técnica de máquina de aprendizaje activo basada en la predicción de enfermedades cardiovasculares a partir de la base de datos del repositorio de la UCI. Representante científico 13, 13588 (2023). https://doi.org/10.1038/s41598-023-40717-1
Descargar cita
Recibido: 25 de diciembre de 2022
Aceptado: 16 de agosto de 2023
Publicado: 21 de agosto de 2023
DOI: https://doi.org/10.1038/s41598-023-40717-1
Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.