Predicción del bajo rendimiento académico en ámbitos rurales de Bolivia mediante modelos de aprendizaje automático
Palabras clave:
analítica de datos, educación rural, F1-score ponderado, modelos predictivos, generación de predicciónResumen
En Bolivia, la desigualdad educativa entre zonas urbanas y rurales continúa siendo un desafío estructural. Este estudio analiza el rendimiento académico en una unidad educativa rural del departamento de Santa Cruz, utilizando registros de calificaciones entre los años 2015 y 2024. El análisis evidenció una concentración significativa de reprobaciones en tres materias clave: Biogeografía/Ciencias Naturales (17.24%), Matemáticas (16.55%) y Comunicación y Lenguajes (13.79%), que en conjunto agrupan el 47.58% de los casos. Estos resultados reflejan debilidades persistentes en competencias científicas y comunicativas.
Con el objetivo de anticipar casos de reprobación, se entrenaron distintos modelos de aprendizaje automático supervisado. Entre ellos, el algoritmo CatBoost alcanzó el mejor desempeño, con un F1-score ponderado de 0.84 y una precisión del 91%, superando a modelos como XGBoost, Random Forest, SVM y redes neuronales. La implementación del modelo permitió generar listas predictivas de estudiantes en riesgo para los siguientes cinco años, lo cual brinda al equipo docente una herramienta operativa para diseñar intervenciones pedagógicas tempranas y focalizadas. Los resultados muestran el potencial del uso de inteligencia artificial en contextos educativos rurales, aportando soluciones basadas en datos para mejorar la equidad y la calidad del aprendizaje.