En un contexto donde la inteligencia artificial (IA) está transformando múltiples aspectos de la vida cotidiana, un informe reciente pone el foco en un aspecto poco explorado: su capacidad (y necesidad) de adaptarse a lenguas indígenas.
El estudio “El desempeño de la inteligencia artificial en el uso de lenguas indígenas americanas”, elaborado por LLYC en colaboración con BID Lab (el brazo de innovación del Grupo BID) y Microsoft, analiza el desempeño de la IA generativa en siete lenguas originarias y revela importantes hallazgos sobre su calidad, comprensión y adecuación cultural.
En Colombia, 70 lenguas, incluyendo el castellano, 65 son lenguas indígenas, 2 criollas (palenquero de San Basilio y la de las islas de San Andrés y Providencia – creole), la romaní o romaníes del pueblo Room – Gitano y la lengua de señas colombiana. Sin embargo, el 40 % de estas lenguas están en peligro de extinción y silencio digital, lo cual pone en riesgo la pérdida de conocimientos, culturas y formas de ver el mundo.
IA generativa: ¿es aliada o una barrera?
Los hallazgos del informe son tan reveladores como preocupantes: en el 54% de los casos, las preguntas hechas a modelos de IA generativa en lenguas indígenas reciben respuestas que aparentemente son correctas, pero que suelen ser más cortas, menos claras y culturalmente sesgadas. Mientras que una respuesta en español puede ser extensa y rica en matices, en idiomas originarios la calidad baja drásticamente: 2,4 sobre 10 en expresión y 2,3 en comprensión, según el análisis.
Además, muchas de las respuestas replican referencias occidentales, incluso cuando las preguntas están formuladas desde cosmovisiones indígenas. Esto evidencia una desconexión entre la tecnología y las realidades culturales a las que pretende servir.
21 estrategias para una IA más inclusiva
Para revertir esta situación, el informe propone 21 estrategias que abordan tres frentes esenciales: ampliar los datos disponibles en lenguas originarias, desarrollar tecnologías habilitadoras y fortalecer la presencia digital de estas lenguas.
Entre las recomendaciones destacan: fomentar conversaciones digitales en idiomas indígenas, proteger archivos y plataformas culturales, dar visibilidad a influencers nativos y desarrollar tecnologías de traducción y reconocimiento de voz adaptadas a estas lenguas. Todo ello contribuiría a entrenar modelos de IA que realmente comprendan y respeten los contextos culturales en los que operan.
La correlación entre volumen de contenido digital y calidad de las respuestas en IA es clara: hay una relación del 91% entre la cantidad de datos disponibles en una lengua y el rendimiento de los modelos generativos en esa misma lengua.
Una oportunidad clave para Colombia y América Latina
En países como Colombia, donde la diversidad lingüística es amplia pero vulnerable, estas estrategias pueden ser decisivas. “La IA puede reducir el aislamiento digital, preservar tradiciones y cerrar brechas derivadas del monolingüismo en zonas remotas”, precisa el informe.
Adolfo Corujo, CEO de Marketing Solutions en LLYC, afirma que “para que la IA sea verdaderamente inclusiva, debe adaptarse a los distintos contextos lingüísticos y culturales”. Por su parte, Daniel Korn, de Microsoft Américas, añade que, “los productos basados en IA deben ofrecer relevancia cultural y lingüística, y que esto solo es posible con colaboración multilateral”.
Desde el BID Lab, César Buenadicha resalta que el programa fAIr LAC busca precisamente desarrollar soluciones de IA pertinentes para América Latina y el Caribe, y que este estudio es clave para identificar brechas y oportunidades concretas.
Más que una herramienta, una vía de salvaguarda cultural
La IA generativa , cuando se utiliza con enfoque inclusivo, puede ser más que una solución tecnológica: puede convertirse en un canal de visibilización, respeto y revitalización de culturas milenarias. Frente al riesgo de desaparición de decenas de lenguas indígenas, este tipo de iniciativas representan un paso fundamental hacia una tecnología verdaderamente diversa, capaz de dar voz —literalmente— a quienes históricamente han sido silenciados.
Si queremos una inteligencia artificial que represente a todos, debemos empezar por incluir las voces que aún no están en el mundo digital. Comparte este artículo y sé parte del cambio hacia una IA realmente inclusiva.
#IAInclusiva #LenguasIndígenas
_______________________________
Foto de apoyo creada por Despejando Dudas con apoyo de ChatGPT
Botón de CTA creado por Grafixpoint en Freepik