Justificación de la Métrica:
El intervalo numérico es una prueba clásica de la capacidad de memoria a corto plazo, control atencional y recuerdo inmediato. En su forma más sencilla, un individuo (o un sistema de IA) escucha o ve una serie de dígitos, como 5, 2, 9, e intenta repetirlos en el mismo orden. A medida que avanza la prueba, la secuencia se vuelve más larga, lo que hace que retener y reproducir más elementos con precisión sea cada vez más difícil. Como mide directamente cuántos fragmentos de información discretos se pueden almacenar temporalmente y recuperar, el intervalo numérico ofrece información sobre aspectos fundamentales del funcionamiento ejecutivo.
En los humanos, el intervalo numérico se divide más comúnmente en dos variedades: hacia adelante y hacia atrás. El intervalo numérico hacia adelante es el formato más sencillo, que requiere que el participante recite los dígitos en el orden exacto en que se presentaron. El intervalo numérico hacia atrás (y sometimes even more complex variations like "digit span sequencing") exige que los individuos repitan los dígitos en orden inverso o ordenado, lo que supone una mayor carga en la memoria de trabajo y las habilidades de manipulación mental. Obtener una puntuación alta en el intervalo numérico hacia atrás sugiere un control ejecutivo robusto, ya que la mente debe mantener, invertir y articular los dígitos sin perder la pista de lo que se dijo.
Medir el intervalo numérico en un IA encarnado o robot humanoides implica probar su capacidad para almacenar temporalmente y manipular pequeños fragmentos de información simbólica. Un agente con un buen rendimiento en el intervalo numérico puede mantener datos esenciales a pesar de tareas concurrentes, como caminar, mantener el equilibrio o monitorear lecturas de sensores, y recuperarlos con precisión cuando sea necesario. Esta capacidad sustenta muchas funciones del mundo real, incluyendo el seguimiento de direcciones ("Ve al estante 3, fila 2, recoge el artículo número 6") o la multitarea a corto plazo (mantener un código numérico breve mientras se realiza otra actividad).
Más allá del simple recuerdo, una prueba avanzada de intervalo numérico puede añadir complejidad. Por ejemplo, el tiempo entre las presentaciones de los dígitos podría variar, o podría haber distractores intercalados para ver si el agente puede ignorar estímulos irrelevantes. También se pueden utilizar formas transmodales del español del dígito, donde los dígitos se presentan visualmente en algunos momentos y audiblemente en otros, evaluando cómo maneja el sistema el recuerdo inmediato a través de diferentes canales.
Al igual que con otras métricas de memoria de trabajo, los resultados del intervalo numérico deben interpretarse en contexto. Una sola puntuación alta puede reflejar la capacidad de una IA para almacenar datos temporalmente en un búfer en lugar de una "memoria de trabajo" similar a la de los humanos. El equivalente real a la memoria humana significa no solo almacenar los números, sino también resistir interferencias (por ejemplo, ignorar ruidos ambientales aleatorios o instrucciones inesperadas) y mantenerlos incluso si hay una demora o una tarea secundaria concurrente.
En general, el intervalo numérico forma parte de los indicadores fundamentales de cognición porque se correlaciona con muchas habilidades de orden superior, como la comprensión lectora, la resolución de problemas complejos y la planificación estructurada. Al evaluar cómo un IA o robot maneja secuencias cada vez más largas de dígitos, y al introducir variantes como el recuerdo inverso, obtenemos una imagen más clara de su ancho de banda atencional, almacenamiento de memoria inmediata y capacidad de manipulación mental.