OURENSE, 23 de abril de 2021.-Ana García Serrano comezou reflexionando sobre como a intelixencia artificial (IA) pon de moda e durante cada ciclo xera moitas expectativas tanto alcanzadas como de ficción. O termo intelixencia artificial aplícase cando unha máquina imita as funcións cognitivas que os humanos asocian con outras mentes humanas, por exemplo: percibir, razoar, aprender e resolver problemas. “Pero estas funcións humanas realízaas unha máquina de forma moi similar a como un avión voa con respecto a como o fai un ave”, sinala a relatora. Como exemplos do cumprimento de expectativas xeradas polos avances na investigación e desenvolvemento en informática e en concreto na IA, citou aplicacións ben coñecidas socialmente e desenvolvidas con novas tecnoloxías sobre a base das últimas décadas para levarnos a cuestionar a súa potencial utilización nas humanidades dixitais:
Tamén presentou algunhas ideas contrastadas en informes actuais, por exemplo sobre a adopción da IA nas empresas e comentou o interese do regulamento publicado o pasado mércores, 21 de abril, da Comisión Europea, que supón o primeiro marco legal sobre a IA, e que aborda os riscos da IA e posiciona a Europa para desempeñar un papel de liderado a nivel mundial. Na actualidade existen varios informes sobre a adopción da IA:
A profesora Ana García Serrano explicou tamén que é o procesamento da linguaxe natural, unha sub-área da IA, que pretende simular o coñecemento e comportamento humanos no dominio da linguaxe e a comprensión lingüística. En PLN desenvólvense recursos de información e algoritmos que os xestionan para resolver problemas relacionados coa lingüística e a comprensión da linguaxe, pero tamén coa comunicación intelixente. Neste sentido hai exemplos ben coñecidos: dicionarios dixitais, asistentes como Alexa ou Cortana, tradutores como o de Google (con tecnoloxía de IA que aparece en investigación e #implantar en explotación en menos de tres anos), analizadores sintácticos e morfolóxicos integrados en buscadores como Google, Bing (Microsoft) ou Safari (Apple).
De acordo co Informe SEPLN 2020, a simulación de procesos cognitivos humanos nunha máquina segue sendo imposible porque continúa sen resolverse o problema científico de comprender como funciona o intelecto humano. A relatora destaca que “o PLN, tamén coñecido como lingüística computacional ou as Tecnoloxías da Linguaxe (TL) están no corazón do software que actualmente procesa a información non estruturada e explota a gran cantidade de datos contidos nos textos, tamén os da web, dos medios sociais e das interaccións por voz. Informes de varias consultoras prognostican un gran crecemento do mercado mundial en TL baseándose na explosión de aplicacións observada nos últimos anos e nun crecemento exponencial dos datos dixitais non estruturados. Desenvolver as TLs para o español é clave: o español é a segunda lingua con máis falantes nativos no mundo e a terceira por número de falantes, posición que se mantén nas clasificacións de linguas máis usadas nas redes sociais”.
Outro concepto que explicou García Serrano é o de Humanidades Dixitais (HD). “É unha área de investigación, ensino e creación na que converxen as humanidades e a informática, e incorporan tanto materiais dixitalizados como artefactos orixinados no medio dixital. Para o seu exercicio, combinan as metodoloxías propias das disciplinas humanísticas tradicionais (historia, filosofía, filoloxía, lingüística teórica, lingüística aplicada, historia da arte, arqueoloxía, música e estudos culturais) e das ciencias sociais co uso de ferramentas informáticas. As HD van máis aló do uso de ferramentas informáticas nas humanidades”.
A que nos referimos cando falamos de humanidades dixitais? “O coñecemento humanista e resolución de enigmas históricos pode incrementarse co uso de metodoloxías e técnicas que proveñen da informática, así como as técnicas e os desenvolvementos informáticos nútrense de resultados físicos ou matemáticos”, sinala a relatora. Precisamente no ámbito do Patrimonio cultural produciuse unha evolución desde que en:
Desta maneira, a profesora terminou a súa introdución ás Humanidades Dixitais e algúns aspectos de interese sobre o que supuxo a evolución da tecnoloxía e a IA na sociedade. Pasou a presentar o que chama “o misterio entre novelistas italianos”, un exemplo moi representativo dos problemas que se poden resolver con técnicas de procesamento da linguaxe natural (PLN), análise de datos e as humanidades dixitais. Refírese a como explotar técnicas e ferramentas de estilometría para concluír sobre evidencias de autoría de novelas. Para iso utilízase unha lingüística baseada en corpus e análise estatístico terminolóxico a partir de obras de 40 autores italianos entre os que se destacan 13 mulleres novelistas e autores dunha determinada rexión italiana. Por exemplo, emprégase un algoritmo para agrupar obxectos (palabras, parágrafos ou novelas), segundo a súa similitude. Pois ben, o estudo achega indicios claros de que a novelista superventas con pseudónimo Elena Ferrante e o novelista italiano Doménico Starnone son autores moi “próximos” en estilo e vocabulario. Con todo, estas pistas obtidas polas dúas investigadoras filólogas non son concluíntes, e iso que ademais sábese que os dereitos de autor das novelas da escritora Ferrante cóbraos a parella de Starnone!, que tamén é escritora, aínda que hai anos que non publica nada.
A investigación en PNL e humanidades dixitais ten nestes momentos un foco de gran importancia no grupo de investigación da UNED de Procesamento da Linguaxe Natural (PLN) e Recuperación de Información (IR) en Humanidades Dixitais. A relatora foi citando brevemente algúns proxectos nos que investigou para pasar á terceira parte da súa conferencia na que utiliza o contexto dun dos seus proxectos, DIMH “O debuxante enxeñeiro ao servizo da monarquía hispánica. Séculos XVI- XVIII (HAR2012-31117) financiado polo ministerio entre 2013 e 2015, en cuxo contexto se segue investigando para facer unha panorámica da necesidade da tecnoloxía nas HD e como dar soporte á investigación dos humanistas. O PLN nas Humanidades Dixitais achega técnicas, recursos e ferramentas software para a representación de datos e información (metadatos e estándares) para
E así citou aspectos necesarios no traballo das humanistas dixitais como é descargar datos ou información dixitalizada e enriquecela con nova información pertinente, indexar toda esa información e facilitar a navegación ou procuras configurables. Este proxecto ten varias etapas e é a partir de 2016 cando se aplican tecnoloxías emerxentes relacionadas coa web semántica, as redes neuronais e a aprendizaxe profunda. Desde hai un ano, a profesora incorpora os resultados deste proxecto nunha materia de máster para unha práctica avaliable. A relatora finalizou indicando centros nos que se pode estudar Humanidades Dixitais, cales son as asociacións nacionais e internacionais nas que atopar variada información sobre as humanidades dixitais. Achegou algunhas ideas e bastantes ligazóns sobre os contidos necesarios para formar un perfil ou curriculum que capacite aos profesionais e investigadores en humanidades dixitais.
Podes ver o relatorio aquí.
UNED Ourense
Comunicación