Reflexión sobre el uso de inteligencias artificiales en actividades evaluativas
Publicado: el 23 diciembre, 2025 por Deisy Lorena Perez Bernal / Konrad Lorenz
En el vertiginoso desarrollo de la inteligencia artificial, es fácil asumir que los modelos más avanzados son infalibles, especialmente en áreas lógicas como las matemáticas. Sin embargo, los datos revelan una realidad más matizada. Este texto explora las limitaciones persistentes de estas herramientas, analizando la naturaleza y el impacto de sus errores, y advierte sobre los riesgos de depender de ellas sin un juicio crítico, particularmente en escenarios donde la exactitud no admite margen de error.
1.Reflexión sobre los riesgos éticos del uso de la IA
El uso de la inteligencia artificial está representando uno de los mayores avances tecnológicos en esta época, donde se han planteado riesgos éticos que no se pueden ignorar. La IA más que todo en matemáticas tiene por un lado unas ventajas y desventajas al implementar su uso una de las desventajas es la confianza ciega de los resultados generados por la IA. Mientras que una parte de estudiantes o profesionales aceptan las respuestas sin entender o comprender la razón que hay detrás de dicha respuesta, donde se pierde la validez del sentido crítico y el verdadero aprendizaje matemático.
Además, algunos modelos de IA no son infalibles: pueden estar cometiendo errores en cálculos, demostraciones o interpretaciones de datos. Estos errores pueden llegar a parecer pequeños, pero en realidad pueden llegar a atraer grandes consecuencias cuando se aplican más que todo en matemáticas, ingenierías, la economía o la investigación científica.
El riesgo ético radica en delegar la responsabilidad humana en el algoritmo. La IA debería usarse como una herramienta de apoyo mas no para la sustitución del pensamiento lógico y del razonamiento matemático.
2. Porcentajes de error de estas herramientas de IA en matemáticas.
Tabla 1
Precisión de GPT-4 en Problemas de Competencia (MATH)

Nota: Rendimiento base del modelo en un conjunto de problemas matemáticos de alta dificultad sin asistencia de herramientas de verificación externa.
Fuente. Datos extraídos y adaptados de Vellum AI (2025). LLM leaderboard & benchmarks. https://www.vellum.ai/llm-leaderboard
Tabla 2
Precisión de GPT-4 con Verificación por Código

Nota: Rendimiento del mismo modelo al utilizar técnicas de verificación automática (p. ej., Code Interpreter), mostrando una mejora significativa en la precisión.
Fuente. Datos extraídos y adaptados de LLM Stats (2025). Math benchmarks. https://llm-stats.com/benchmarks/category/math
Tabla 3
Rendimiento de Gemini 2.5 Pro en Problemas de Nivel Olímpico

Nota: Precisión del modelo de Google en MathArena, un benchmark con problemas de dificultad extrema (“olímpicos”).
Fuente. Datos extraídos y adaptados de Binary Verse AI (2025). LLM math benchmark performance 2025. https://binaryverseai.com/llm-math-benchmark-performance-2025/
Tabla 4
Precisión de Claude 3.5 Sonnet en el Dataset MATH

Nota: Rendimiento del modelo de Anthropic en el conjunto de problemas estándar MATH, mostrando un equilibrio entre capacidad y errores residuales.
Fuente. Datos extraídos y adaptados de Nerds.AI (2025). Evaluación de LLMs: principales benchmarks y cómo entenderlos. https://www.nerds.ai/blog/evaluacion-de-llms-principales-benchmarks-y-como-entenderlos
Las cifras disponibles muestran que incluso los modelos más avanzados no están libres de errores significativos, un problema que se acentúa en tareas de matemáticas complejas o de alta competencia. Cabe señalar que el error estimado, que se calcula como el 100% menos la precisión estimada, no nos da toda la información sobre la gravedad de las fallas; este porcentaje único puede englobar desde pequeños deslices en un cálculo hasta errores conceptuales graves que invalidan por completo un razonamiento. Por tanto, confiar ciegamente en los resultados que arroja la IA en matemáticas puede ser riesgoso, más aún en contextos académicos, científicos o técnicos donde la precisión es crítica y las consecuencias de un fallo son elevadas.
3. Actualización del reglamento académico sobre el uso no autorizado de la IA
Atención compañeros y compañeras:
A partir de la actualización del reglamento académico de la universidad en el artículo 108 que dice “se entiende por fraude académico y como tal una falta disciplinaria, a la conducta en la que el estudiante que quebranta las normas institucionales en desarrollo de una actividad académica.” en donde algunos de los incisos de dicho artículo se puede mostrar como fraude académico el uso no autorizado de inteligencias artificiales por ejemplo en el inciso 2 del artículo dice “la posesión, disposición o utilización de ayudas no autorizadas (material de clase, anotaciones, calculadoras, teléfonos móviles, agendas electrónicas, traductores, entre otros) en situaciones de evaluación.” Y en el inciso 10 del artículo 108 dice “hacer uso de inteligencia artificial sin haber declarado previamente su uso, según los lineamientos institucionales.” Dentro de dichas faltas pueden ser sancionadas según su gravedad de las siguientes sanciones:
1.Amonestación verbal. Será impuesta por el Decano de la Facultad/Escuela con el fin de orientar al estudiante para prevenir la comisión de faltas. De esta sanción, no quedará registro alguno.
2. Amonestación escrita. Será impuesta por el Decano de la Facultad/Escuela y tiene por objeto contrarrestar el mal ejemplo y prevenir la comisión de la misma falta por otros estudiantes.
3. Restauración del daño en virtud de falta de orden disciplinario. El tiempo de sanción será determinado por el Consejo de Facultad/Escuela y la verificación de su cumplimiento se hará por parte del Decano.
4. Matrícula condicional. Será impuesta por el Consejo de Facultad/Escuela. Consiste en condicionar la continuidad de un estudiante a la aprobación de todas las asignaturas del periodo o periodos académicos respectivos con el promedio aritmético que se le fije y a la observancia de buena conducta. En casos en que la falta no haya sido del orden académico sino asociada a ámbitos de la interacción y/o del comportamiento social, el ente regulador podrá exceptuarse del condicionamiento académico y, en su lugar, imponer la adscripción del sancionado a actividades establecidas por el Centro de Consejería Académica. En el acto en el que se imponga la sanción, se señalará el periodo o periodos académicos en que tendrán vigencia tales condiciones. Si durante la vigencia de la sanción no se cumplen sus condicionamientos el estudiante pierde el cupo para el siguiente periodo académico en la Institución.
5. Suspensión de la matrícula. Será impuesta por el Consejo de Facultad/Escuela e implica la pérdida inmediata del cupo en la Institución. Puede tener efecto por el resto del periodo académico que cursa el estudiante y comprender hasta dos periodos académicos adicionales. El estudiante podrá renovar la matrícula en el siguiente periodo académico, una vez cumplida la sanción.
6. Suspensión del derecho a grado. Será impuesta por el Consejo de Facultad/Escuela y es aplicable a quienes, habiendo concluido las actividades académicas, no hayan obtenido el grado de cualquiera de los programas o cursos que ofrece la Institución por razones de orden disciplinario.
7. Expulsión. Será impuesta por el Consejo de Facultad/Escuela e implica el retiro definitivo por razones de orden disciplinario.
A mi juicio, esta actualización es no solo necesaria, sino también oportuna. No se trata de demonizar la tecnología, sino de integrarla con ética y responsabilidad en el ecosistema académico. El análisis sobre la falibilidad de la IA refuerza por qué esta regulación es sensata: confiar ciegamente en una herramienta que puede cometer errores graves y presentar su trabajo como propio es un doble perjuicio: para la formación personal y para la justicia académica. La exigencia de declarar su uso transforma a la IA de un posible instrumento de fraude en una herramienta de aprendizaje cuya aplicación puede y debe ser discutida, evaluada y citada.
La gama de sanciones, que prioriza en sus niveles más leves la orientación y la reparación, me parece acertada, ya que entiende que el objetivo último debe ser educar. En conclusión, este cambio reglamentario es un paso fundamental para preservar el valor del conocimiento, el mérito y la honestidad intelectual en la era digital, recordándonos que la verdadera inteligencia, por ahora, sigue residiendo en la capacidad crítica, ética y creadora del ser humano.
Referencias:
Azmat, S. (2025, 20 de julio). AI Math: Why Gemini 2.5 pro beats Grok 4 on Olympiad-level problems. Binary Verse AI. https://binaryverseai.com/ai-math-olympiad-benchmark/?utm_source=chatgpt.com
Fundación Universitaria Konrad Lorenz (Consejo Superior). (2025, abril). Acuerdo No. 01 de 2025: Reglamento Académico Institucional. https://www.konradlorenz.edu.co/wp-content/uploads/2025/04/Acuerdo-No.-01-de-2025-Reglamento-Academico-Institucional.pdf
Zhang, Y., Liu, X., Chen, J., & Wang, L. (2024). GPT-4 MATH accuracy soars to 84.3%! New CSV method proposed by top universities including CUHK and Tsinghua. AIbase. https://www.aibase.com/news/1068
Yaduvanshi, L. (2025, 20 de julio). Claude 3.5 sonnet benchmark July 2025. Rankllms.com. https://rankllms.com/claude-3-5-sonnet-benchmark-july-2025/?utm_source=chatgpt.com
Por: Daniel Felipe Herrera Reyes




