Investigadores del I3A trabajan para mejorar las búsquedas en Internet

Expertos en sistemas de información se reúnen del 13 al 15 de noviembre en un congreso en el que abordarán la representación de conocimiento, el procesamiento del lenguaje natural y el aprendizaje automático, disciplinas con impacto en la vida cotidiana

10-11-2023

¿Cuántas consultas hacemos cada día en buscadores de Internet? ¿Cuántas responden a lo que queríamos y aciertan con lo que necesitamos? Detrás de esta tarea que repetimos cada día, teclear en un buscador o pedirle a un asistente como Google o Alexa que nos facilite información hay un entramado de sistemas de información, fórmulas matemáticas y aplicaciones tecnológicas que se actualizan constantemente para lograr mejores resultados.

Por eso, del 13 al 15 de noviembre, organizado por el grupo de Sistemas de Información Distribuidos del I3A Unizar, se celebra en Zaragoza el quinto congreso iberoamericano y cuarto indoamericano sobre Grafos de Conocimiento y Web Semántica (KGSWC'23, 5th Iberoamerican and 4th Indo-American Knowledge Graphs and Semantic Web Conference). Será en el Campus Río Ebro, en el Edificio I+D (calle Mariano Esquillor, s/n).

De qué hablamos cuando nos referimos a web semántica

La web actual se basa, principalmente, en la sintáctica, es decir, en cómo se escribe la información, ahora los investigadores dirigen su trabajo hacia la Web Semántica, hacia el significado. Eduardo Mena, investigador del grupo de Sistemas de Información Distribuidos (SID), organizador de este congreso, explica que, en las primeras versiones de Google, “si buscabas ‘Andorra Aragón’, recuperaba páginas donde aparecieran ambas cadenas de texto, ‘Andorra’ y ‘Aragón’, posiblemente refiriéndose al Principado de Andorra. En la web semántica, ante esa misma consulta, se interpretaría que la consulta del usuario se refiere al municipio turolense de Andorra”.

Grafos del conocimiento, estructuras matemáticas

Los grafos de conocimiento son una de las maneras más usadas en la actualidad para representar conocimiento y que lo puedan manejar adecuadamente los ordenadores. Permiten representar "entidades", como el municipio de "Andorra de Teruel" o la comunidad de "Aragón", relacionándolas entre sí. “Por ejemplo – señala el investigador Carlos Bobed desde el Grupo SID- en un grafo de conocimiento, ‘Andorra de Teruel’ se relacionaría con ’Aragón’ a través de la propiedad ‘pertenece a’. Además, Andorra de Teruel y Andorra del Principado se representarían como dos entidades diferenciadas.”

Las versiones modernas de Google usan grafos de conocimiento para mejorar las respuestas a las consultas de los usuarios. Aunque todavía no se ha llegado a tener una Web Semántica, sí que Google es capaz de entender parcialmente el significado de una consulta de un usuario sin limitarse a su sintaxis.

Además de las aplicaciones actuales de los grafos de conocimiento, una posible aplicación futura sería la combinación de sistemas de Inteligencia Artificial, como el sistema conversacional Chat GPT, con grafos de conocimiento, para mejorar la calidad de sus conversaciones.

El congreso que empieza el lunes en Zaragoza se celebra anualmente desde 2019 y se ha consolidado como foro de discusión tanto de los avances científicos como de las innovaciones tecnológicas relacionadas con la Web Semántica y los grafos de conocimiento. Es un punto de encuentro para investigadores y para expertos de la industria dónde compartir y discutir temas que incluyen la representación de conocimiento, el procesamiento del lenguaje natural y el aprendizaje automático, disciplinas que están mostrando unos avances muy significativos con impacto directo en la vida cotidiana de las personas. Los objetivos del congreso son, por un lado, servir de foro para la comunidad de la Inteligencia Artificial dedicada a estos temas, y, por otro, fomentar la adopción de estas tecnologías en estos dominios.

Máquinas que usan metáforas

Sobre el grupo de investigación Sistemas de Información Distribuidos (SID), trabaja en varias líneas de investigación, entre ellas, técnicas que permitan responder consultas "flexibles" usando grafos de conocimiento. Una consulta flexible incorpora algún término impreciso que puede cumplirse con cierto grado. “Podríamos querer recuperar ‘municipios de Aragón de tamaño mediano’, de manera que la Andorra de Teruel estaría sin duda incluida, pero municipios más pequeños, como Daroca, estarían incluidos con menor grado. Para resolver este problema, combinamos grafos de conocimiento con lógica difusa.”, apunta el investigador Fernando Bobillo, también del grupo SID.

Asimismo, desarrollan técnicas para el descubrimiento de nuevas relaciones semánticas para completar y enriquecer grafos de conocimiento ya existentes. En particular, “en el grupo hemos trabajado con sistemas de procesamiento de lenguaje natural, intentando que las máquinas puedan usar metáforas, y sistemas de información lingüística, encontrando traducciones y relaciones lingüísticas entre términos de dos idiomas, por ejemplo, aragonés e inglés, a partir de traducciones existentes en otros idiomas, como traducciones de aragonés a español y de traducciones de español a inglés”, explica Carlos Bobed.

El congreso cuenta con el patrocinio de ShoudGuru, Ultipa, BDTA, Catalink, IET, NTT Data, SWARM, DIIS y el apoyo de la Universidad de Zaragoza.