Desarrollan MarIA, el primer sistema de IA experto en español

inteligencia artificial - federadiove
Inteligencia Artificial | Foto: Pixabay

El Centro Nacional de Supercomputación de Barcelona (BSC por sus siglas en ingles) desarrolló MarIA, el primer sistema de inteligencia artificial experto en comprender y escribir castellano.

MarIA es un conjunto de redes neuronales profundas entrenadas para adquirir una comprensión de la lengua y su léxico. Además, entiende sus mecanismos para expresar el significado y escribir a nivel experto. Funciona con interdependencias cortas y largas, siendo capaces de entender conceptos abstractos y el contexto de los mismos.

Para crear el corpus de MarIA, se utilizaron 59 terabytes del archivo web de la Biblioteca Nacional de España. Estos archivos se procesaron para eliminar todo el texto que no estuviesen bien formado. Solo se usaron en el modelo textos que sean un buen ejemplo de la lengua.

Una vez creado el corpus, El BSC utilizó una tecnología de redes neuronales que ha demostrado excelentes resultados en el inglés. Las redes neuronales multicapa son una tecnología de Inteligencia Artificial y los entrenamientos consisten, entre otras técnicas, en presentar a la red textos con palabras ocultas, para que aprenda a adivinar cuál es la palabra ocultada dado su contexto.

«Con este proyecto contribuimos a que el país se incorpore a esta revolución científico-técnica y se posicione como actor de pleno derecho en el tratamiento computacional del español.” expresó Marta Villegas, responsable del proyecto.

MarIA está disponible en abierto, con el objetivo de que pueda ser utilizado por todo quien lo necesite sin costo.

El equipo del BSC está trabajando en ampliar el modelo con textos de diferentes lenguas, incluyendo castellano, catalán, gallego, euskera, portugués y español latino.


Lea también: Apple busca incluir la tecnología Face ID en Mac