Ana García Serrano: ” Las HD van más allá del uso de herramientas informáticas en las humanidades”

La profesora doctora de la UNED disertó esta mañana sobre el procesamiento del lenguaje natural en humanidades digitales, desde el Centro de IA de Ourense, en un seminario que cuenta con el apoyo del Vicerrectorado de Investigación, Transferencia del Conocimiento y Divulgación Científica.

Ana García Serrano comenzó reflexionando sobre cómo la inteligencia artificial (IA) pone de moda y durante cada ciclo genera muchas expectativas tanto alcanzadas como de ficción. El término inteligencia artificial se aplica cuando una máquina imita las funciones cognitivas que los humanos asocian con otras mentes humanas, como por ejemplo: percibir, razonar, aprender y resolver problemas. “Pero estas funciones humanas las realiza una máquina de forma muy similar a cómo un avión vuela con respecto a como lo hace un ave”, señala la ponente. Como ejemplos del cumplimiento de expectativas generadas por los avances en la investigación y desarrollo en informática y en concreto en la IA, citó aplicaciones bien conocidas socialmente y desarrolladas con nuevas tecnologías sobre la base de las últimas décadas para llevarnos a cuestionar su potencial utilización en las humanidades digitales:

AVANTAR ACTIVIDADES

Década de los 80: Se generalizan los ordenadores personales y con ellos la ofimática, la aplicación de las bases de datos para compañías, los programas de cálculo de estructuras para arquitectos e ingenieros…

Década de los 90: Se generaliza la información en la web, los recomendadores de películas o productos a partir de nuestros datos y “comportamientos” como usuarios en internet. Se desarrollan  aplicaciones  comerciales  complejas  como  son  los  sistemas  informáticos  de diseño para fabricantes de moda, robotización de las fábricas y almacenes de stock de productos; la recolección de pistachos con robots, la gestión de inversiones…

Primera década del siglo XXI: Se generalizan las redes sociales y el consumo de las noticias cambia, se disparan las compras online mediante Amazon, se habla de “San Google” porque todo lo sabe.

Segunda década del siglo XXI: El traductor de Google acapara parte del mercado, se populariza la televisión de pago (Netflix), el móvil inteligente desbanca a otros dispositivos e incluso a los relojes de muñeca, la criptomoneda aumenta su presencia en los mercados y empresas como Nomics, lanza predicciones basadas en la IA, de precios a siete días.

También presentó algunas ideas contrastadas en informes actuales, como por ejemplo sobre la adopción de la IA en las empresas y comentó el interés del reglamento publicado el pasado miércoles, 21 de abril, de la Comisión Europea, que supone el primer marco legal sobre la IA, y que aborda los riesgos de la IA y posiciona a Europa para desempeñar un papel  de  liderazgo  a  nivel  mundial.  En  la  actualidad  existen  varios  informes  sobre  la adopción de la IA:

Informe El Estado de Inteligencia Artificial 2020, elaborado por McKinsey & Company a partir de una encuesta a 2.395 participantes de distintas regiones, industrias y empresas de todo el mundo, indica que la adopción de Inteligencia Artificial (IA) no aumentó masivamente en 2020, pese a que el 60% de las empresas con un alto rendimiento de su inversión en IA haya aumentado este año la inversión en esta tecnología. Por otra parte, el 22%  de las empresas que han implementado algún tipo de AI observa un impacto positivo sobre su EBIT (beneficio antes de intereses e impuestos).

Informe Microsoft IA en España (2019), a partir de información de 277 empresas, en 7 sectores y15 países de Europa, concluye que el 71% de las empresas europeas considera que la IA es un tema importante para los directivos y un 57% de las compañías espera que la IA tenga un alto o muy alto impacto en las áreas de negocios que son «totalmente desconocidas para las compañías en la actualidad». Solo el 4% de las empresas está utilizando activamente la IA en muchos procesos y para permitir tareas avanzadas. Un 28% de las empresas encuestadas se encuentra en la etapa de «lanzamiento» en la que han comenzado un uso activo de la IA en uno o unos pocos procesos en la empresa.

Informe de Ernst and Young para Microsoft: IA en el sector público: Perspectivas europeas para 2020 y años siguientes (España). El 33% del Sector Público en España ya ha implementado soluciones de Inteligencia Artificial. Su uso en el ámbito público se encuentra en una fase inicial en nuestro país, aunque el 80% reconoce que la implantación de esta tecnología es una prioridad digital.

La profesora Ana García Serrano explicó también qué es el procesamiento del lenguaje natural, una sub-área de la IA, que pretende simular el conocimiento y comportamiento humanos en el dominio del lenguaje y la comprensión lingüística. En PLN se desarrollan recursos de información y algoritmos que los gestionan para resolver problemas relacionados con la lingüística y la comprensión del lenguaje, pero también con la comunicación inteligente. En este sentido hay ejemplos bien conocidos: diccionarios digitales, asistentes como Alexa o Cortana, traductores como el de Google (con tecnología de IA que aparece en investigación y se implanta en explotación en menos de tres años), analizadores sintácticos y morfológicos integrados en buscadores como Google, Bing (Microsoft) o Safari (Apple).

De acuerdo con el Informe SEPLN 2020, la simulación de procesos cognitivos humanos en una máquina sigue siendo imposible porque continúa sin resolverse el problema científico de comprender cómo funciona el intelecto humano. La ponente destaca que “el PLN, también conocido como lingüística computacional o las Tecnologías del Lenguaje (TL) están en el corazón del software que actualmente procesa la información no estructurada y explota la gran cantidad de datos contenidos en los textos, también los de la web, de los medios sociales y de las interacciones por voz. Informes de varias consultoras pronostican un gran crecimiento  del  mercado  mundial  en  TL  basándose  en  la  explosión  de  aplicaciones observada en los últimos años y en un crecimiento exponencial de los datos digitales no estructurados. Desarrollar las TLs para el español es clave: el español es la segunda lengua con más hablantes nativos en el mundo y la tercera por número de hablantes, posición que se mantiene en los rankings de lenguas más usadas en las redes sociales”.

Otro concepto que explicó García Serrano es el de Humanidades Digitales (HD). “Es un área de  investigación,  enseñanza  y  creación  en  la  que  convergen  las  humanidades  y  la informática, e incorporan  tanto materiales digitalizados como artefactos originados en el medio digital. Para su ejercicio, combinan las metodologías propias de las disciplinas humanísticas tradicionales (historia, filosofía, filología, lingüística teórica, lingüística aplicada,  historia  del  arte,  arqueología,  música  y estudios  culturales)  y  de  las  ciencias sociales con el uso de herramientas informáticas. Las HD van más allá del uso de herramientas informáticas en las humanidades”.

¿A  qué  nos  referimos  cuando  hablamos  de  humanidades  digitales?  “El  conocimiento humanista  y  resolución  de  enigmas  históricos  puede  incrementarse  con  el  uso  de metodologías  y  técnicas  que  provienen  de  la  informática,  así  como  las  técnicas  y  los desarrollos informáticos se nutren de resultados físicos o matemáticos”, señala la ponente. Precisamente en el ámbito del Patrimonio cultural se ha producido una evolución desde que en:

2011: Aparece la recomendación europea para que en 2025 TODO el patrimonio cultural (institucional) europeo esté digitalizado.

2017: hay un 30% digitalizado.

2018: es un importante año para Europeana, la iniciativa europea de datos en abierto sobre el patrimonio cultural.

2019: se detecta que un 20% del patrimonio digitalizado ya no tiene calidad suficiente para su uso con la tecnología actual. La investigación sí se ha conseguido promover.

2020: se cuenta con 500.000 investigadores de Humanidades en Europa.

2021:  es  necesario  preguntarse:  ¿permite  el  patrimonio  cultural  (institucional)  europeo digital su interoperabilidad (intercambio de datos y servicios software) y está garantizado su acceso? Y veremos que queda mucho por avanzar en la digitalización y preservación del patrimonio, y que en algunos casos no está garantizado el acceso porque pueden ser privados o de pago, no ser interoperables porque no se digitalizó utilizando los estándares necesarios. Buenos ejemplos del patrimonio cultural español ya digitalizado son la Colección de mapas, planos y dibujos del Archivo General de Simancas, la interesante web del Museo del Prado, en la Biblioteca Nacional de España o en la Fundación Pública Galega Centro Tecnolóxico de Supercomputación de Galicia

De esta manera, la profesora terminó su introducción a las Humanidades Digitales y algunos aspectos de interés sobre lo que ha supuesto la evolución de la tecnología y la IA en la sociedad. Pasó a presentar el que llama “el misterio entre novelistas italianos”, un ejemplo muy representativo de los problemas que se pueden resolver con técnicas de procesamiento del lenguaje natural (PLN), análisis de datos y las humanidades digitales. Se refiere a cómo explotar técnicas y herramientas de estilometría para concluir sobre evidencias de autoría de novelas. Para ello se utiliza una lingüística basada en corpus y análisis estadístico terminológico a partir de obras de 40 autores italianos entre los que se destacan 13 mujeres novelistas y autores de una determinada región italiana. Por ejemplo, se emplea un algoritmo para agrupar objetos (palabras, párrafos o novelas), según su similitud. Pues bien, el estudio aporta indicios claros de que la novelista superventas con pseudónimo Elena Ferrante y el novelista italiano Doménico Starnone son autores muy “cercanos” en estilo y vocabulario. Sin embargo, estas pistas obtenidas por las dos investigadoras filólogas no son concluyentes, y eso que además se sabe que los derechos de autor de las novelas de la escritora Ferrante los cobra ¡la pareja de Starnone!, que también es escritora, aunque hace años que no publica nada.

La investigación en PNL y humanidades digitales tiene en estos momentos un foco de gran importancia  en  el  grupo  de investigación  de la UNED de Procesamiento  del  Lenguaje Natural (PLN) y Recuperación de Información (IR) en Humanidades Digitales. La ponente fue citando brevemente algunos proyectos en los que investigó para pasar a la tercera parte de su conferencia en la que utiliza el contexto de uno de sus proyectos, DIMH “El dibujante ingeniero al servicio de la monarquía hispánica. Siglos XVI-XVIII (HAR2012-31117) financiado por el ministerio entre 2013 y 2015, en cuyo contexto se sigue investigando para hacer una panorámica de la necesidad de la tecnología en las HD y cómo dar soporte a la investigación de los humanistas.

El PLN en las Humanidades Digitales aporta técnicas, recursos y herramientas software para la representación de datos e información (metadatos y estándares) para la accesibilidad de la información, mediante repositorios en la web la gestión de estos datos e información con técnicas complejas su visualización, mediante repositorios en la web

Y así citó aspectos necesarios en el trabajo de los humanistas digitales como es descargar datos o información digitalizada y enriquecerla con nueva información pertinente, indexar toda esa información y facilitar la navegación o búsquedas configurables. Este proyecto tiene varias etapas y es a partir de 2016 cuando se aplican tecnologías emergentes relacionadas con la web semántica, las redes neuronales y el aprendizaje profundo. Desde hace un año, la profesora incorpora los resultados de este proyecto en una asignatura de máster para una práctica evaluable.

La ponente finalizó indicando centros en los que se puede estudiar Humanidades Digitales, cuáles son las asociaciones nacionales e internacionales en las que encontrar variada información sobre las humanidades digitales. Aportó algunas ideas y bastantes enlaces sobre los contenidos necesarios para formar un perfil o curriculum que capacite a los profesionales e investigadores en humanidades digitales.