Calabria Sarmiento, Juan CarlosRua Ascar, Juan ManuelGuzmán Díaz, Yecid David2024-09-232024-09-232024https://hdl.handle.net/20.500.12442/15686Esta investigación aborda una de las tantas problemáticas del sector salud en Colombia, que se relaciona con el aumento de los casos de la enfermedad renal crónica y el alto costo para el sistema de salud. Además, destaca la falta de análisis de datos eficaz en el país, con escaso uso de técnicas de Machine learning o algoritmos de aprendizaje automático. Para abordar estas deficiencias en el sistema de salud, primero se obtuvieron los datos de una institución prestadora de Salud (IPS) y se sometieron a un proceso exploratorio de información. Durante la preparación de los datos, se llevaron a cabo procesos de selección, limpieza y transformación para garantizar la calidad de los datos para su posterior análisis mediante técnicas de minería de datos y algoritmos computacionales. Se utilizó la metodología CRISP-DM, que proporciona un enfoque completo y detallado para el proceso de minería de datos, y la distribución Anaconda de Python, una herramienta ampliamente utilizada para algoritmos de Machine learning. El entrenamiento del modelo propuesto y diferentes modelos utilizaron un dataset supervisado dividido en un 70% para entrenamiento y el 30% para pruebas, además se usó un análisis de datos exploratorio para así conocer a detalle las características de las variables entregadas por la ips. La métrica para determinar cuál es el más optimo es la exactitud y la exhaustividad donde vemos que el modelo tiene un mejor rendimiento comparado diferente algoritmos de machine learning, Dicha comparación define que el modelo propio es más exacto al momento de predecir la enfermedad renal crónica. El resultado fue la creación de un modelo apoyado en Machine learning recomendado para predecir la ocurrencia de la enfermedad renal crónica (ERC).This research addresses one of the many problems of the health sector in Colombia, which is related to the increase in cases of chronic kidney disease and the high cost for the health system. Furthermore, the lack of effective data analysis in the country stands out, with little use of Machine learning techniques or machine learning algorithms. To address these deficiencies in the health system, data were first obtained from a health care institution (IPS) and subjected to statistical analysis using exploratory information methods. During data preparation, selection, cleaning and transformation processes were carried out to guarantee the quality of the data for subsequent analysis using data mining techniques and computational algorithms. The CRISP-DM methodology was used, which provides a complete and detailed approach to the data mining process, and the Anaconda distribution of Python, a widely used tool for Machine learning algorithms. The training of the proposed model and different models used a supervised dataset split into 70% for training and 30% for testing. Additionally, exploratory data analysis was employed to thoroughly understand the characteristics of the variables provided by the IPS. The metric used to determine which model is the most optimal is accuracy and recall, where we see that the model performs better compared to different machine learning algorithms. This comparison shows that the custom model is more accurate in predicting chronic kidney disease. The result was the creation of a model supported by Machine learning recommended to predict the occurrence of chronic kidney disease (CKD).pdfspaAttribution-NonCommercial-NoDerivs 3.0 United StatesEnfermedad renal crónicaERCMachine learningSistema de salud colombianoIPSEPSPythonAzure Machine learning studioModelosDiseño de un modelo para determinar la tecnología de predicción adecuada para diagnosticar la enfermedad renal crónicainfo:eu-repo/semantics/embargoedAccessinfo:eu-repo/semantics/masterThesisChronic kidney diseaseCKDHealth system colombianoModels