Más allá de la calificación: hacia una evaluación inteligente, ética y centrada en el aprendizaje.

Durante décadas, se consideró que el propósito principal de la evaluación del aprendizaje era el de medir: aplicar una prueba que comprobaba que el estudiante estaba entendiendo y dominando el tema y, muchas veces, esto definía el destino académico de los estudiantes. 

Sin embargo, hoy en día esta manera de entender la evaluación está en crisis. En pleno siglo XXI, evaluar no significa sólo medir, sino acompañar, comprender y retroalimentar el proceso de aprendizaje. Especialmente con los avances en inteligencia artificial (IA), el aprendizaje adaptativo y la analítica de datos han abierto nuevas oportunidades para diseñar una evaluación más justa, ética y personalizada. Aunque esto es algo positivo, al mismo tiempo, plantea dilemas sobre el papel docente, la privacidad y la autonomía del estudiante. O

De la medición al acompañamiento

En su artículo Desde los tests hasta la investigación evaluativa actual(2003), Tomás Escudero describe cómo ha evolucionado la evaluación educativa a lo largo del siglo XX, mostrando cómo pasó de ser un proceso técnico y cuantitativo a ser más complejo, ético y pedagógico.

El autor identifica cuatro grandes etapas que sintetizan los cambios de paradigma:

  1. La etapa de la medición (inicios del siglo XX):
    Dominada por el paradigma psicométrico, la evaluación se concebía como un proceso de medición objetiva de habilidades y rendimientos. Se inspiraba en el modelo de las ciencias naturales, se priorizaba la precisión estadística y la estandarización. El estudiante era considerado un “objeto de medición” y el fin era comparar, clasificar y predecir el desempeño. Figuras como los psicólogos Thorndike y Termanmarcaron esta etapa, centrada en los tests de inteligencia y las pruebas normativas.
  2. La etapa descriptiva (mediados del siglo XX):
    En su análisis, Escudero identifica que durante esta segunda etapa, con la expansión de la educación masiva y la influencia de Ralph W. Tyler, la evaluación comenzó a describirse en función de objetivos educativos. Tyler diseñó un modelo de desarrollo curricular que introdujo la idea de evaluar para comprobar el grado de logro de metas previamente definidas. Esto dio origen a la planeación por objetivos y a la evaluación curricular. Aun así, el enfoque seguía siendo funcionalista: se evaluaban productos, no procesos.
  3. La etapa del juicio de valor (años sesenta y setenta):
    Durante esta etapa, Escudero señala que, con los aportes de Scriven y Stake, la evaluación experimentó un giro conceptual: dejó de limitarse a medir y comenzó a emitir juicios de valor fundamentados sobre la calidad y pertinencia de los programas. Scriven introdujo la distinción entre evaluación formativa y sumativa, mientras que Stake desarrolló el enfoque responsivo y promovió el uso de estudios de caso. Se reconoció al evaluador como intérprete y no solo como técnico, y se consolidó la idea de que toda evaluación conlleva una dimensión ética y política.
  4. La etapa de la investigación evaluativa (finales del siglo XX):
    Finalmente, Escudero describe la consolidación de una visión holística, interpretativa y participativa. La evaluación se integra a la investigación educativa como una práctica de comprensión y transformación, donde el contexto, las voces de los actores y la retroalimentación cobran protagonismo. Ya no se trata de calificar resultados, sino de acompañar procesos de aprendizaje y mejora institucional.

De este recorrido que hizo Escudero sobre la evaluación se llega a una conclusión clave: la evaluación es un fenómeno social, no meramente técnico. El autor enfatiza que reducirla a sólo el acto de medición empobrece su sentido, porque evaluar implica comprender, dialogar y tomar decisiones informadas para transformar la enseñanza.

Por eso, el autor propone concebir al docente como un “profesional evaluador”, no sólo un ente que aplica pruebas, sino un mediador entre la información, la interpretación y la acción pedagógica. La evaluación, en esta perspectiva, se convierte en una práctica reflexiva, ética y colaborativa que busca la mejora continua. De ahí surgió la necesidad de que el docente fuera no solo un experto disciplinar, sino un profesional evaluador, capaz de observar, retroalimentar y acompañar.

En esta línea, Sánchez Mendiola amplía la propuesta al introducir el modelo de la evaluación delpara y cómo aprendizaje, que traslada las ideas de Escudero al contexto contemporáneo de la educación superior. Delaprendizaje intenta certificar logros y acredita resultados; para el aprendizaje orienta la enseñanza y proporciona retroalimentación y cómoaprendizaje impulsa la autorregulación y la reflexión del estudiante. En conjunto, estos tres enfoques colocan al estudiante en el centro del proceso, promoviendo una cultura de aprendizaje continuo más que de rendición de cuentas.

Además, el autor propone que las estrategias e instrumentos deben alinearse con resultados de aprendizaje observables y medibles, sugiere reemplazar exámenes memorísticos por tareas que simulen contextos reales. Además, considera que la IA y la analítica de aprendizaje pueden fortalecer la retroalimentación si se usan con propósito formativo. 

El poder de la retroalimentación y la interacción

Por otra parte, los autores John Hattie y Helen Timperley realizaron un metaanálisis de más de 500 estudios y 7000 efectos sobre variables que influyen en el aprendizaje. En su síntesis, hallaron que la retroalimentación es uno de los factores más poderosos para mejorar el rendimiento académico, con un tamaño del efecto promedio de 0.79. Esto significa que una retroalimentación bien diseñada puede tener casi el doble de impacto que la enseñanza promedio (0.40). No obstante, advirtieron que no toda retroalimentación genera mejora: su efectividad depende de su naturaleza, su oportunidad y su orientación hacia el aprendizaje.

Los autores proponen un modelo de tres niveles de retroalimentación que orienta su efectividad:

  1. Nivel de tarea: se centra en la corrección de errores específicos o la calidad del producto final.
  2. Nivel de proceso: orienta al estudiante sobre cómo mejorar su comprensión o estrategia.
  3. Nivel de autorregulación: promueve la autonomía, la metacognición y la autoevaluación.

Su investigación muestra que los dos últimos niveles son los más poderosos, porque fomentan la reflexión y transferencia del aprendizaje, en lugar de simples correcciones superficiales.

Además, en su investigación, Hattie y Timperley enfatizan que la retroalimentación responde a tres preguntas clave:

  • ¿Hacia dónde voy? (Feed up): clarifica metas y criterios.
  • ¿Cómo me va? (Feedback): ofrece información sobre el progreso actual.
  • ¿Qué sigue? (Feed forward): orienta los pasos siguientes para mejorar.

Este ciclo habla del pasado (feed up), presente (feedback) y futuro (feed forward) del aprendizaje y convierte la evaluación en un proceso continuo de orientación y crecimiento.

A esta perspectiva cognitiva se suma la mirada sociocultural de Esterhazy y Damşa (2017), quienes replantean el feedback como una práctica de construcción conjunta de significado, no como un mensaje unidireccional. A través de su investigación con estudiantes universitarios, muestran que el valor de la retroalimentación surge en la interacción: cuando el estudiante dialoga con los comentarios, los interpreta con sus pares o docentes y los incorpora en su trabajo futuro.

Desde esta visión, la retroalimentación no es un evento aislado, sino una trayectoria de aprendizaje, lo que ellos llaman meaning-making trajectory,donde se negocian interpretaciones, emociones y expectativas. El aprendizaje ocurre precisamente en ese espacio intersubjetivo, donde el error deja de verse como fracaso y se transforma en oportunidad de desarrollo.

Para Esterhazy y Damşa retroalimentar no es corregir, sino acompañar. El docente actúa como mediador entre la evidencia del desempeño y las posibilidades de mejora, guiando al estudiante a construir su propio conocimiento. La evaluación deja de ser un acto de calificación para convertirse en diálogo, reflexión y coautoría del aprendizaje.

Alfabetización evaluativa

Actualmente, ya no basta con saber aplicar instrumentos o registrar calificaciones; se trata de comprender el sentido pedagógico, ético y formativo de evaluar. Para transformar la evaluación en un proceso de aprendizaje, se requiere que las y los docentes desarrollen una nueva competencia profesional: la alfabetización evaluativa (assessment literacy).

Pastore y Andrade (2019) describen la alfabetización evaluativa como la integración de conocimientos, habilidades y disposiciones éticas que permiten a los docentes usar la evaluación de manera justa, válida y orientada a la mejora.

Su modelo tridimensional plantea aspectos interdependientes: la cognitiva o de conocimiento, la de práctica o de aplicación y la de ética o de valores. La primera implica entender los fundamentos teóricos, metodológicos y psicométricos de la evaluación. Esto incluye diseñar instrumentos alineados con los objetivos de aprendizaje, reconocer los diferentes tipos de evidencias y seleccionar técnicas apropiadas para cada contexto.

La parte de la práctica o de aplicación se refiere a la capacidad de usar la evaluación como herramienta pedagógica, no solo administrativa. Un docente con alfabetización evaluativa interpreta los resultados, adapta su enseñanza y retroalimenta de manera continua. La evaluación se convierte en un proceso de aprendizaje bidireccional, donde el profesor también aprende de sus estudiantes.

Por último, está la dimensión ética o de valores, la cual es la más profunda y frecuentemente la menos visibilizada. Aquí, evaluar con responsabilidad implica reconocer el poder que tiene para afectar trayectorias, emociones y percepciones de competencia. La ética evaluativa se traduce en transparencia, inclusión y sensibilidad al contexto. El docente debe preguntarse: ¿para qué evalúo y a quién beneficia mi evaluación? Esta duda es tan importante como decidir qué instrumento usar.

Estas dimensiones buscan transformar la visión técnica del docente como aplicador de pruebas y lo redefine como agente reflexivo que diseña, interpreta y actúa sobre la información evaluativa. En palabras de Pastore y Andrade (2019), la alfabetización evaluativa es un “saber situado”: cambia según el contexto cultural e institucional, por lo que debe construirse colectivamente dentro de las comunidades académicas.

Evaluar el pensamiento, no solo el resultado

Katherine Gallardo (2009) amplía esta concepción de Pastore y Andrade al vincularla con la Nueva Taxonomía de Marzano y Kendall, una teoría del pensamiento humano que supera la jerarquía estática de Bloom. En lugar de ordenar los procesos por dificultad, Marzano y Kendall distinguen tres sistemas mentales que intervienen en el aprendizaje:

  1. Sistema cognitivo: encargado de procesar información y resolver tareas a través de distintos niveles de procesamiento: recuperación, comprensión, análisis y utilización del conocimiento.
  2. Sistema metacognitivo: establece metas, monitorea el progreso y regula las estrategias cognitivas.
  3. Sistema interno o self: conecta la motivación, las creencias y las emociones que impulsan o inhiben el aprendizaje.

Evaluar desde este marco implica observar cómo el estudiante piensa, se autorregula y se involucra emocionalmente con su aprendizaje. Así, la evaluación no se limita al producto final, sino que analiza los procesos que lo hicieron posible. Por ejemplo, una rúbrica bien diseñada puede valorar no sólo la exactitud de una respuesta, sino también la claridad de la estrategia utilizada o la persistencia ante la dificultad.

Gallardo (2009) propone que los docentes articulen la evaluación con los tres sistemas: cognitivo, para medir comprensión y desempeño, metacognitivo, para fomentar la reflexión sobre el propio aprendizajeinterno o afectivo, para fortalecer la motivación y el sentido de logro. De este modo, la evaluación se convierte en una práctica integral y humanista, que atiende al quécómo y por qué del aprendizaje. 

Cuando un docente domina la alfabetización evaluativa y aplica la Nueva Taxonomía, su retroalimentación deja de centrarse en la corrección del error y se transforma en acompañamiento consciente del desarrollo del pensamiento.

Inteligencia artificial y aprendizaje adaptativo

La inteligencia artificial (IA) aplicada a la educación representa una oportunidad sin precedentes para personalizar la enseñanza y la evaluación. Su potencial radica en la capacidad de analizar grandes volúmenes de datos en tiempo real, ya sean resultados, interacciones, tiempos de respuesta o patrones de error, para ajustar la instrucción al perfil de cada estudiante.

Modelos como el Personalised Adaptive Learning and Assessment System(PALAS), desarrollado por Palanisamy, Thilarajah y Chen, ilustran esta revolución pedagógica. Este modelo integra algoritmos capaces de diagnosticar conocimientos previos y brechas de comprensión, generar secuencias de aprendizaje personalizadas, ofrecer retroalimentación inmediata y contextualizada, y actualizar las rutas de aprendizaje con base en el progreso individual.

En lugar de seguir un currículo lineal y homogéneo, el estudiante transita por “caminos de aprendizaje personalizados”, donde cada actividad, pregunta o evaluación se ajusta dinámicamente a su desempeño. Esto convierte la evaluación en un proceso continuo de medición y retroalimentación automatizada, no en un evento final, permitiendo detectar dificultades antes de que se consoliden y ofrecer intervenciones más tempranas.

Más allá de la eficiencia técnica, el verdadero valor de estos sistemas reside en su potencial de equidad. El PALAS, por ejemplo, fue diseñado en el marco de la estrategia nacional de IA de Singapur para reducir la brecha educativa asociada al origen socioeconómico o a las necesidades especiales.

Al ofrecer apoyos personalizados, los estudiantes que avanzan más lento reciben refuerzo inmediato, mientras que quienes progresan más rápido pueden acceder a desafíos adicionales. Esto transforma el ideal de la “educación inclusiva” en una práctica concreta basada en datos.

Como señala el artículo The Ethics of Learning Analytics in Australian Higher Education, la analítica de aprendizaje requiere principios de gobernanza claros que regulen la recopilación, almacenamiento y uso de la información estudiantil, garantizando transparencia, consentimiento informado y responsabilidad institucional. 

Aunque la inteligencia artificial y la analítica del aprendizaje son herramientas poderosas, el verdadero desafío no está en cómo funcionan los algoritmos, sino en cómo las personas los usan y con qué propósito educativo.

Es cierto que la IA puede fortalecer la evaluación formativa si se usa para retroalimentar, no para vigilar. Puede promover la equidad si los algoritmos se diseñan para detectar y corregir sesgos, no para reproducirlos, además de liberar tiempo docente si las instituciones priorizan el acompañamiento pedagógico sobre la simple generación de métricas.

La educación inteligente no consiste en delegar el juicio al algoritmo, sino en usar los datos para tomar decisiones más justas, sensibles y contextualizadas. En este sentido, la IA no sustituye al docente: amplifica su mirada.

Esto sucede cuando se combina con marcos de alfabetización evaluativa, la analítica del aprendizaje y los sistemas adaptativos se convierten en herramientas poderosas para enseñar, retroalimentar y aprender con empatía, evidencia y propósito.

Ética y humanismo en la era de la analítica del aprendizaje

El informe The Ethics of Learning Analytics in Australian Higher Educationadvierte que, si bien los datos ofrecen información valiosa para personalizar la enseñanza, también pueden generar riesgos de vigilancia, discriminación algorítmica o pérdida de autonomía estudiantil cuando se utilizan sin marcos claros de gobernanza.

La pregunta ética fundamental no es si debemos usar los datos, sino cómo y para qué los usamos. Una analítica orientada al control deteriora la confianza y convierte la educación en un sistema de monitoreo; en cambio, una analítica orientada al acompañamiento potencia la reflexión, la mejora y la inclusión.

Las universidades tienen la responsabilidad de establecer políticas institucionales de gobernanza de datos educativos que incluyan: delimitación clara de responsabilidades entre docentes, diseñadores y analistas; procesos de auditoría periódica de los algoritmos; comités de revisión ética interdisciplinarios y mecanismos de participación estudiantil en la toma de decisiones sobre el uso de su información.

Asimismo, los algoritmos deben ser explicables e interpretables, de modo que los usuarios comprendan cómo se generan las recomendaciones o predicciones. La analítica no puede sustituir el juicio docente, porque la comprensión del contexto, las emociones y las intenciones del aprendizaje siguen siendo insustituiblemente humanas.

La ética de la evaluación digital se resume en una pregunta crucial: ¿al servicio de quién está la tecnología educativa? Si la respuesta es “al servicio del aprendizaje”, entonces la IA puede convertirse en un aliado poderoso para fortalecer la justicia, la inclusión y la personalización.

El desafío consiste en diseñar un ecosistema donde los datos informen, pero no dominen; donde la tecnología asista, pero no controle, y donde cada decisión educativa siga guiada por la empatía, la confianza y el compromiso formativo.

Hacia una evaluación auténtica y transformadora

En su propuesta más reciente, Sánchez Mendiola (2022) define la evaluación auténtica como aquella que reproduce los desafíos del mundo real y exige al estudiante que transfiera sus conocimientos a situaciones complejas, interdisciplinarias y con sentido social. Para el autor, el propósito es que la evaluación deje de ser un filtro para convertirse en una experiencia de aprendizaje en sí misma.

A diferencia de las pruebas estandarizadas, centradas en la memorización o el resultado inmediato, la evaluación auténtica valora el proceso, el razonamiento y la aplicación contextual del conocimiento. Para ello, se recomienda emplear estrategias como proyectos integradores, estudios de caso, simulaciones clínicas o empresariales, portafolios digitales y retos de innovación. Utilizar este tipo de metodologías fomenta habilidades como el pensamiento crítico, colaboración, comunicación, autorregulación y creatividad, que constituyen el núcleo de las competencias del siglo XXI.

La inteligencia artificial puede potenciar esta forma de evaluación si se usa con sentido pedagógico. Por ejemplo, las herramientas adaptativas permiten analizar patrones de desempeño y ofrecer retroalimentación inmediata; las plataformas de learning analytics ayudan a visualizar el progreso individual y colectivo, mientras que los entornos de simulación digital posibilitan experiencias auténticas en contextos seguros.

Sin embargo, el verdadero poder transformador no radica en la tecnología, sino en cómo se diseñan las experiencias y cómo se interpretan los datos. Una evaluación auténtica requiere alineación entre objetivos curriculares, tareas de aprendizaje y criterios de desempeño, así como un compromiso ético del docente para acompañar los procesos con retroalimentación significativa.

Más que medir resultados, busca comprender el aprendizaje como fenómeno integral, que incluye la emoción, la motivación y el sentido de logro. La evaluación del siglo XXI se aleja del paradigma de la medición y se orienta hacia el acompañamiento, la personalización y la reflexión ética.

Su propósito no es clasificar, sino comprender y potenciar el desarrollo humano. Integrar inteligencia artificial, analítica de aprendizaje y marcos cognitivos como la Nueva Taxonomía no implica deshumanizar la educación, sino reafirmar su esencia: enseñar con empatía y evaluar con propósito.

Catálogo de educación

Artículos de interés

Herramientas de IA para educación básica.

El campo de la IA en educación nos brinda herramientas útiles para crear entornos de aprendizaje tecnológicos y dinámicos potenciados por sistemas inteligentes. Descubre cómo se clasifican estas herramientas y algunos ejemplos de estas aquí. Fuente: Instituto Tecnológico Monterrey (México) La integración de la

Leer más »

¿Se aprende mejor participando en clase?

¿Qué hace un “buen estudiante”? Toma apuntes, presta atención y guarda silencio, mientras el docente explica: esta sería una respuesta habitual. Es decir, el profesor o profesora como protagonista, y los estudiantes con una actitud pasiva. A menudo, este se considera el mejor modelo

Leer más »
Resumen de privacidad
Instituto IEFES

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Cookies de terceros

Esta web utiliza cookie para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.