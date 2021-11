SHARJAH- La lengua árabe, cuyo alfabeto data desde el año 400, no sólo es un misterio para las personas de occidente, sino también para sus propios hablantes, quienes por primera vez han emprendido la titánica tarea de rastrear los orígenes y evolución de sus palabras a través de los siglos.



Tres mil lingüistas, financiados por Sheikh Dr. Sultan bin Muhammad Al Qasimi, gobernante de Sharjah, el Emirato cultural por excelencia de los Emiratos Árabes Unidos, han estado trabajando desde hace cuatro años y medio en documentar la historia de la lengua árabe, explica Mohamed Al Safi Mosteghanemi, Secretario General de la Academia de la Lengua Árabe de Sharjah.

Hasta ahora, se han analizado tan sólo cinco letras del alfabeto árabe (que cuenta con 28 letras en total): hamza (?), ba (?), ta (?) tha (?) and jeem (?). El resultado de esta "excavación" lingüística se ha traducido en los primeros 17 volúmenes del "Corpus histórico de la Lengua en árabe" ("Historical Corpus of the Arabic Language").



El hacer este Corpus podría compararse con una hazaña arqueológica: el estudio ha creado una base de datos a partir de 20 mil libros en árabe, manuscritos, documentos históricos, antiguas inscripciones e incluso hallazgos arqueológicos que datan del siglo III, antes del Islam.



"La lengua árabe es tan vasta, profunda y rica que no hace que esta sea una tarea fácil de lograr. Este proyecto sería imposible lograrlo si una sola persona lo trabajara, es por eso que es una colaboración con múltiples instituciones, académicos, lingüistas de Sharjah y de todos los Emiratos y la región; todos ellos pueden traer a la vida a este proyecto masivo", explica Mohamed Al Safi Mosteghanemi.

Ayuda de la tecnología

El experto explica que, debido a que la lengua árabe es un campo de estudio muy extenso, se requiere el apoyo de la tecnología en el proceso para poder llevarlo a cabo. En este caso, el uso de Optical Character Recognition (OCR), una herramienta que permite a la computadora identificar los caracteres, la digitalización de documentos, su almacenamiento en una biblioteca digital, son las herramientas tecnológicas que han facilitado el desarrollo del proyecto.



La cuestión es que, debido a la caligrafía, las letras varían su forma dependiendo de su posición en una palabra. Por ejemplo, la letra “a” no se ve igual al inicio de una palabra, que en medio o al final de otras, explica el traductor. La tecnología OCR ayuda a ubicar las letras entre las diferentes formas de las palabras, las cuales están escritas con diferentes estilos de fuente a lo largo de la historia (desde manuscritos hasta panfletos impresos).



De acuerdo al Secretario general de la Academia de la Lengua Árabe de Sharjah, la principal diferencia entre este diccionario y un diccionario ordinario en árabe, es que el Corpus documenta la historia del significado de la palabra y sus usos en su propio contexto.

"La compilación de documentos ha permitido ver a detalle la evolución del lenguaje árabe. Ver cómo se ha ido transformando una palabra y bajo qué contexto. Por ejemplo, la palabra ‘estrategia’, no existió en la antigüedad; documentando los orígenes de esta palabra, aunque sean relativamente nuevos, es de 1800, uno puede trazar cómo adquirió su significado”, explicó el especialista.



El "Corpus histórico de la Lengua en árabe" muestra el desarrollo de frases en árabe, contiene listas de palabras en desuso y explica el por qué se dejaron de usar. También se exponen las influencias del árabe en otras lenguas, como el hebreo. "Este proyecto es algo que la gente ha esperado desde hace como 80 años", destacó,