k-NN, la eficiencia de compararte con tus vecinos

Autores/as

DOI:

https://doi.org/10.20983/cienciavital.2026.02.bas.02

Palabras clave:

Ajuste de datos, Imputación de datos, Series temporales

Resumen

Este artículo explica de manera clara y accesible cómo funciona el método k-NN (k-nearest neighbors o “k vecinos cercanos”) para imputar, es decir, rellenar datos faltantes en registros obtenidos a lo largo del tiempo. A través de ejemplos y explicaciones sencillas, se describen los conceptos principales involucrados en su implementación computacional, así como los términos técnicos necesarios para comprender su funcionamiento sin requerir conocimientos especializados. El texto también analiza por qué este método ha ganado relevancia frente a técnicas tradicionales, destacando su capacidad para mejorar la precisión en el manejo de información incompleta. Este tipo de herramientas resulta especialmente útil en áreas donde los datos son fundamentales, como la ciencia, la ingeniería, la medicina o el análisis ambiental. Además de presentar los fundamentos del algoritmo, el artículo busca acercar al lector al mundo del aprendizaje automático (Machine Learning), mostrando cómo la inteligencia artificial puede ayudar a resolver problemas reales de forma práctica y eficiente.

Biografía del autor/a

Dr. Víctor Manuel Vázquez Báez, Benemérita Universidad Autónoma de Puebla

Es licenciado en Física por la Facultad de Ciencias Físico Matemáticas de la Benemérita Universidad Autónoma de Puebla, institución donde también obtuvo los grados de Maestro y Doctor en Ciencias, ambos con beca de excelencia del CONACyT. Cuenta con formación técnica como Programador y es miembro de la Sociedad Mexicana de Física y de la American Physical Society. Actualmente forma parte del Sistema Nacional de Investigadoras e Investigadores de la SECIHTI.

Desde 2010 se desempeña como docente en la Facultad de Ingeniería, donde participa en el Grupo de Ciencias Espaciales como profesor, ponente y asesor académico de investigación. Ha impartido asignaturas de ciencias básicas y áreas aplicadas, entre ellas Física General, Álgebra Lineal, Ecuaciones Diferenciales, Métodos Numéricos, Informática y Programación, además de Matemáticas Aplicadas al Transporte en programas de posgrado.

Entre 2023 y 2025 fungió como Coordinador Académico de Ciudad Universitaria 2, participando en procesos de planeación, evaluación y aseguramiento de la calidad académica. Su trayectoria combina docencia, investigación, gestión académica y divulgación científica, con interés en la formación de recursos humanos y el impacto social de la educación científica.

Estefanía Espinosa Fernández, Benemérita Universidad Autónoma de Puebla

Estefanía Espinosa Fernández es una estudiante de Licenciatura en Ingeniería Geofísica. Durante las últimas etapas de su carrera, se ha enfocado en investigaciones relacionadas con usos del Machine Learning en el área de Ciencias de la Tierra, particularmente con los proyectos Predicción de Datos Faltantes en Conjuntos de Normales Climatológicas con k-NN y Predicción de Crecimiento Urbano Mediante Redes Neuronales, con un enfoque que busca combinar la Inteligencia Artificial y la Ciencia de Datos con la administración y administración de recursos.

Mtra. Gabriela Yáñez Pérez, Benemérita Universidad Autónoma de Puebla

Licenciada en Informática del Instituto Tecnológico de Puebla, Maestra en Educación Superior de la Facultad de Filosofía y Letras de la BUAP, Docente de la Facultad de Ingeniería de la BUAP, Desempeño de diversos cargos: Coordinadora de Evaluación Académica, Responsable del Departamento de Becas y Coordinadora de Planeación, Tutora académica, de Servicio Social y Prácticas Profesionales, Asesora del programa Delfín. Laboró como: Analista de Información en el Instituto Poblano de la Vivienda, Coordinadora de área DESIT en la Dirección General de Educación Superior BUAP. Colaboración en el Cuerpo Académico Ciencias de la Tierra Aplicada a la Gestión de Desastres Naturales.

Dra. Dolores García Toral, Benemérita Universidad Autónoma de Puebla

La Dra. Dolores García Toral es investigadora de la Benemérita Universidad Autónoma de Puebla, con participación interdisciplinaria en la Facultad de Ingeniería Química, la Facultad de Ciencias Físico Matemáticas y el Instituto de Física. Su labor científica se centra en la física teórico-computacional y la química molecular, áreas desde las cuales contribuye al diseño y análisis de materiales a escala atómica.

Sus líneas de investigación abarcan el estudio de la estructura electrónica mediante la Teoría del Funcional de la Densidad, la evaluación computacional de propiedades estructurales, eléctricas y ópticas aplicadas a la nanociencia, así como el análisis molecular del ADN. Su trabajo ha contribuido a la comprensión del comportamiento de sistemas moleculares complejos y al desarrollo de herramientas útiles para la investigación experimental en materiales avanzados.

Cuenta con una destacada producción científica en revistas indexadas internacionales, respaldada por más de 310 citas, un índice h de 12 y un índice i10 de 14. Además de su labor en investigación, mantiene un compromiso constante con la divulgación científica, promoviendo la comprensión de conceptos de física y química entre públicos no especializados.

Citas

F. Imam, P. Musilek y M. Z. Reformat, “Parametric and Nonparametric Machine Learning Techniques for Increasing Power System Reliability: A Review”, Information, vol. 15, no. 1, p. 37, ene. 2024. doi: https://doi.org/10.3390/info15010037

B. W. Silverman y M. C. Jones, “E. Fix and J. L. Hodges (1951): An Important Contribution to Nonparametric Discriminant Analysis and Density Estimation: Commentary on Fix and Hodges (1951)”, International Statistical Review, vol. 57, no. 3, p. 233, dic. 1989. doi: https://doi.org/10.2307/1403796

H. Díaz-Barrios, Y. Alemán-Rivas, L. Cabrera-Hernández, A. Morales-Hernández, M. Chávez-Cárdenas y G. Casas-Cardoso, “Algoritmos de aprendizaje automático para clasificación de Splice Sites en secuencias genómicas”, SciELO, 2015. [En línea]. Disponible en: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2227-18992015000400012

IBM, “What is the k-nearest neighbors algorithm?”, IBM, 2022. [En línea]. Disponible en: https://www.ibm.com/topics/knn

J. Sun, W. Du y N. Shi, “A Survey of kNN Algorithm”, Information Engineering and Applied Computing, 2018. [En línea]. Disponible en: https://www.researchgate.net/publication/348305327_A_Survey_of_kNN_Algorithm

R. Nisbet, J. Elder y G. Miner, “Classification”, en Handbook of Statistical Analysis and Data Mining Applications. Elsevier, 2009, pp. 235–258. doi: https://doi.org/10.1016/B978-0-12-374765-5.00011-5

United States Artificial Intelligence Institute, “Understanding KNN Algorithm and Its Role in Machine Learning”, 2023. [En línea]. Disponible en: https://www.usaii.org/ai-insights/understanding-knn-algorithm-and-its-role-in-machine-learning

T. Davi, “Understanding Different Distance Measures”, LinkedIn, 2023. [En línea]. Disponible en: https://www.linkedin.com/pulse/understanding-different-distance-measures-tiago-davi-1f

Scikit-learn, “API Reference - sklearn.neighbors: Nearest Neighbors”. [En línea]. Disponible en: https://scikit-learn.org/stable/modules/classes.html#module-sklearn.neighbors

F. Pedregosa et al., “Scikit-learn: Machine learning in Python”, Journal of Machine Learning Research, vol. 12, pp. 2825–2830, 2011. [En línea]. Disponible en: https://www.jmlr.org/papers/volume12/pedregosa11a/pedregosa11a.pdf

Descargas

Publicado

12-06-2026

Número

Sección

Ciencias Básicas