OURENSE, 23 de abril de 2021.-Ana García Serrano comenzó reflexionando sobre cómo la inteligencia artificial (IA) pone de moda y durante cada ciclo genera muchas expectativas tanto alcanzadas como de ficción. El término inteligencia artificial se aplica cuando una máquina imita las funciones cognitivas que los humanos asocian con otras mentes humanas, como por ejemplo: percibir, razonar, aprender y resolver problemas. “Pero estas funciones humanas las realiza una máquina de forma muy similar a cómo un avión vuela con respecto a como lo hace un ave”, señala la ponente. Como ejemplos del cumplimiento de expectativas generadas por los avances en la investigación y desarrollo en informática y en concreto en la IA, citó aplicaciones bien conocidas socialmente y desarrolladas con nuevas tecnologías sobre la base de las últimas décadas para llevarnos a cuestionar su potencial utilización en las humanidades digitales:
También presentó algunas ideas contrastadas en informes actuales, como por ejemplo sobre la adopción de la IA en las empresas y comentó el interés del reglamento publicado el pasado miércoles, 21 de abril, de la Comisión Europea, que supone el primer marco legal sobre la IA, y que aborda los riesgos de la IA y posiciona a Europa para desempeñar un papel de liderazgo a nivel mundial. En la actualidad existen varios informes sobre la adopción de la IA:
La profesora Ana García Serrano explicó también qué es el procesamiento del lenguaje natural, una sub-área de la IA, que pretende simular el conocimiento y comportamiento humanos en el dominio del lenguaje y la comprensión lingüística. En PLN se desarrollan recursos de información y algoritmos que los gestionan para resolver problemas relacionados con la lingüística y la comprensión del lenguaje, pero también con la comunicación inteligente. En este sentido hay ejemplos bien conocidos: diccionarios digitales, asistentes como Alexa o Cortana, traductores como el de Google (con tecnología de IA que aparece en investigación y se implanta en explotación en menos de tres años), analizadores sintácticos y morfológicos integrados en buscadores como Google, Bing (Microsoft) o Safari (Apple).
De acuerdo con el Informe SEPLN 2020, la simulación de procesos cognitivos humanos en una máquina sigue siendo imposible porque continúa sin resolverse el problema científico de comprender cómo funciona el intelecto humano. La ponente destaca que “el PLN, también conocido como lingüística computacional o las Tecnologías del Lenguaje (TL) están en el corazón del software que actualmente procesa la información no estructurada y explota la gran cantidad de datos contenidos en los textos, también los de la web, de los medios sociales y de las interacciones por voz. Informes de varias consultoras pronostican un gran crecimiento del mercado mundial en TL basándose en la explosión de aplicaciones observada en los últimos años y en un crecimiento exponencial de los datos digitales no estructurados. Desarrollar las TLs para el español es clave: el español es la segunda lengua con más hablantes nativos en el mundo y la tercera por número de hablantes, posición que se mantiene en los rankings de lenguas más usadas en las redes sociales”.
Otro concepto que explicó García Serrano es el de Humanidades Digitales (HD). “Es un área de investigación, enseñanza y creación en la que convergen las humanidades y la informática, e incorporan tanto materiales digitalizados como artefactos originados en el medio digital. Para su ejercicio, combinan las metodologías propias de las disciplinas humanísticas tradicionales (historia, filosofía, filología, lingüística teórica, lingüística aplicada, historia del arte, arqueología, música y estudios culturales) y de las ciencias sociales con el uso de herramientas informáticas. Las HD van más allá del uso de herramientas informáticas en las humanidades”.
¿A qué nos referimos cuando hablamos de humanidades digitales? “El conocimiento humanista y resolución de enigmas históricos puede incrementarse con el uso de metodologías y técnicas que provienen de la informática, así como las técnicas y los desarrollos informáticos se nutren de resultados físicos o matemáticos”, señala la ponente. Precisamente en el ámbito del Patrimonio cultural se ha producido una evolución desde que en:
2011: Aparece la recomendación europea para que en 2025 TODO el patrimonio cultural (institucional) europeo esté digitalizado.
2017: hay un 30% digitalizado.
2018: es un importante año para Europeana, la iniciativa europea de datos en abierto sobre el patrimonio cultural.
2019: se detecta que un 20% del patrimonio digitalizado ya no tiene calidad suficiente para su uso con la tecnología actual. La investigación sí se ha conseguido promover.
2020: se cuenta con 500.000 investigadores de Humanidades en Europa.
2021: es necesario preguntarse: ¿permite el patrimonio cultural (institucional) europeo digital su interoperabilidad (intercambio de datos y servicios software) y está garantizado su acceso? Y veremos que queda mucho por avanzar en la digitalización y preservación del patrimonio, y que en algunos casos no está garantizado el acceso porque pueden ser privados o de pago, no ser interoperables porque no se digitalizó utilizando los estándares necesarios. Buenos ejemplos del patrimonio cultural español ya digitalizado son la Colección de mapas, planos y dibujos del Archivo General de Simancas, la interesante web del Museo del Prado, en la Biblioteca Nacional de España o en la Fundación Pública Galega Centro Tecnolóxico de Supercomputación de Galicia
De esta manera, la profesora terminó su introducción a las Humanidades Digitales y algunos aspectos de interés sobre lo que ha supuesto la evolución de la tecnología y la IA en la sociedad. Pasó a presentar el que llama “el misterio entre novelistas italianos”, un ejemplo muy representativo de los problemas que se pueden resolver con técnicas de procesamiento del lenguaje natural (PLN), análisis de datos y las humanidades digitales. Se refiere a cómo explotar técnicas y herramientas de estilometría para concluir sobre evidencias de autoría de novelas. Para ello se utiliza una lingüística basada en corpus y análisis estadístico terminológico a partir de obras de 40 autores italianos entre los que se destacan 13 mujeres novelistas y autores de una determinada región italiana. Por ejemplo, se emplea un algoritmo para agrupar objetos (palabras, párrafos o novelas), según su similitud. Pues bien, el estudio aporta indicios claros de que la novelista superventas con pseudónimo Elena Ferrante y el novelista italiano Doménico Starnone son autores muy “cercanos” en estilo y vocabulario. Sin embargo, estas pistas obtenidas por las dos investigadoras filólogas no son concluyentes, y eso que además se sabe que los derechos de autor de las novelas de la escritora Ferrante los cobra ¡la pareja de Starnone!, que también es escritora, aunque hace años que no publica nada.
La investigación en PNL y humanidades digitales tiene en estos momentos un foco de gran importancia en el grupo de investigación de la UNED de Procesamiento del Lenguaje Natural (PLN) y Recuperación de Información (IR) en Humanidades Digitales. La ponente fue citando brevemente algunos proyectos en los que investigó para pasar a la tercera parte de su conferencia en la que utiliza el contexto de uno de sus proyectos, DIMH “El dibujante ingeniero al servicio de la monarquía hispánica. Siglos XVI-XVIII (HAR2012-31117) financiado por el ministerio entre 2013 y 2015, en cuyo contexto se sigue investigando para hacer una panorámica de la necesidad de la tecnología en las HD y cómo dar soporte a la investigación de los humanistas.
El PLN en las Humanidades Digitales aporta técnicas, recursos y herramientas software para la representación de datos e información (metadatos y estándares) para
Y así citó aspectos necesarios en el trabajo de los humanistas digitales como es descargar datos o información digitalizada y enriquecerla con nueva información pertinente, indexar toda esa información y facilitar la navegación o búsquedas configurables. Este proyecto tiene varias etapas y es a partir de 2016 cuando se aplican tecnologías emergentes relacionadas con la web semántica, las redes neuronales y el aprendizaje profundo. Desde hace un año, la profesora incorpora los resultados de este proyecto en una asignatura de máster para una práctica evaluable.
La ponente finalizó indicando centros en los que se puede estudiar Humanidades Digitales, cuáles son las asociaciones nacionales e internacionales en las que encontrar variada información sobre las humanidades digitales. Aportó algunas ideas y bastantes enlaces sobre los contenidos necesarios para formar un perfil o curriculum que capacite a los profesionales e investigadores en humanidades digitales.
Puedes ver la conferencia aquí.
UNED Ourense
Comunicación