Miembros

Conoce a los miembros del laboratorio y el trabajo que realizan


Dra. Mireya Tovar Vidal

Responsable técnica de proyecto

Título de tesis: Evaluación automática de ontologías de dominio restringido
Grado: Doctorado en Ciencias de la Computación
Fecha de titulación:Febrero de 2015
Resumen de tesis: Las ontologías son recursos semánticos que capturan el conocimiento de un determinado dominio, por medio de los elementos que la integran. A pesar de la manera en cómo las ontologías son creadas (manualmente, automáticamente o semiautomáticamente), existe el hecho de que el proceso aún no es perfecto y, por lo tanto, un paso adicional se necesita para la validación de la calidad de la ontología. La evaluación de ontologías es la tarea que permite medir la calidad de estos recursos. Entre otros enfoques, la evaluación basada en corpus, intenta validar los componentes de la ontología por medio de una fuente de datos externos, los cuales usualmente son una colección de documentos asociados al mismo dominio de la ontología a evaluar. En este trabajo de investigación, presentamos una metodología de evaluación para ontologías de dominio restringido, formada por tres fases, que toman en cuenta los niveles de representación del procesamiento de lenguaje natural. La primera fase considera el preprocesamiento de los datos junto con un paso de filtrado a través de un tradicional sistema de recuperación de información. La segunda fase consiste de diferentes métodos para identificar relaciones semánticas y conceptos en el corpus de dominio, con el propósito de evaluar las tripletas de la ontología fuente a evaluar. En la última fase, la calidad de la ontología es evaluada al definir una métrica que involucra los resultados de las fases anteriores; en este caso, un puntaje total de evaluación se proporciona. La metodología ha sido aplicada a tres diferentes ontologías de dominio restringido empleando sus correspondientes corpus asociados. Los resultados experimentales muestran un comportamiento apropiado de la metodología cuando está es aplicada a las ontologías evaluadas. Con el propósito de validar los enfoques involucrados en la metodología, conducimos una evaluación manual (por expertoshumanos); adicionalmente, ejecutamos una comparación de los resultados obtenidos contra un baseline diseñado. Los resultados experimentales muestran un desempeño satisfactorio, el cual consideramos interesante para la tarea de medir la calidad de las ontologías de dominio restringido.
Áreas de interés: PLN, aprendizaje ontológico, ingeniería ontologica, RI.

Meliza Contreras González

Título de tesis: Modelo semántico para la comprensión lectora
Grado: Maestría en Ciencias de la Computación
Actualmente estudiante de Doctorado
Fecha de titulación: Pendiente
Resumen de tesis doctoral: El nivel de asimilación de conocimiento por parte de los estudiantes ha ido en deterioro, considerando que se encuentran inmersos en microconversaciones y mensajes cortos, lo que les impide realizar una conexión con los textos y abstraer la información relevante, si a esto se suma que para acreditar licenciaturas y posgrados requieren cumplir certificaciones como TOEFL y B2, se hace evidente que se carecen de estrategias de comprensión lectora efectivas para desarrollar sus habilidades en el razonamiento verbal. Si bien existen recomendaciones de cómo abordar la interpretación de textos, sólo están presentes en lenguaje natural pero no existen mecanismos de inferencia estratégicos que apoyen a los alumnos a deducir sus respuestas, ante esta necesidad se propone un modelo semántico que motive la comprensión lectora de pasajes con información explícita para su evaluación mediante el análisis de la pregunta, su significado y la obtención de la respuesta correcta.
Áreas de interés: FOL, ontologías, relaciones semánticas, cálculo de situaciones.

Cecilia Reyes Peña

Título de tesis: Metodología para el diseño de redes de ontologías en el área médica
Grado: Maestría en Ciencias de la Computación, actualmente estudiante de Doctorado
Fecha de titulación: Probablemente 31 de julio de 2022
Resumen de tesis doctoral: Este trabajo de contiene la propuesta de una metodología de diseño de redes de ontologías a partir del uso de recursos ontológicos y no ontológicos, la cual pueda brindar elementos necesarios para representar información acerca de diferentes dominios, considerando el manejo de la granularidad de los datos y diversidad de representaciones entre ontologías existentes.
Áreas de interés: Representación del conocimiento y Procesamiento de Lenguaje Natural.

Ana Laura Lezama Sánchez

Título de tesis de Licenciatura: Sistema de recuperación de información booleano con expansión semántica de consultas
Grado: Maestra en Ingeniería en Sistemas y Cómputo Inteligente, actualmente estudiante de doctorado
Fecha de titulación de Licenciatura: 15 de abril 2016
Resumen de tesis de Licenciatura: Este trabajo de tesis se enmarca en el campo del Procesamiento del Lenguaje Natural, área de ciencia y tecnología que estudia el lenguaje humano, y de la Recuperación de Información, y su objetivo es recuperar la información que cumpla con la búsqueda de información de un usuario. Se revisó el estado del arte de los Sistemas de Recuperación de Información sin expansión de consultas, sus técnicas, tipos de sistemas de recuperación de información y la evaluación de los resultados obtenidos. También se revisó el estado del arte de los Sistemas de Recuperación de Información con expansión de consultas, sus técnicas, tipos de sistemas de recuperación de información, el tipo de expansión que realizan, y sus resultados obtenidos, donde se observó que, el uso de expansión de las consultas mejora los resultados obtenidos en cualquier sistema de recuperación de información. Se trabaja con 4 ontologías de dominio: Inteligencia Arti cial (IA), Aprendizaje e-Learning (SCORM), ontología del dominio de Petróleo (OIL) y Turismo (Turismo). El objetivo de este trabajo de tesis es, implementar un sistema de recuperación de información booleano con expansión de consultas, sobre documentos en inglés, y dado que existe una gran variedad de recursos lingüisticos para su procesamiento, facilita el desarrollo del sistema propuesto. Se proponen tres aproximaciones diferentes de expansión, obteniendo resultados favorables, en especial para la ontología de Turismo.
Áreas de interés: áreas de interes: Ontologías, aprendizaje profundo, aprendizaje automático, recuperación de información, procesamiento del lenguaje natural.

Irvin Yair Cabrera Moreno

Título de tesis: Extracción automática de relaciones no taxonómicas en corpus de dominio.
Grado: Ingeniero en Ciencias de la Computación.
Fecha de titulación: 13 de enero de 2020
Resumen de tesis: Se desea crear un sistema que extraiga de forma automática relaciones no taxonómicas de fuentes de texto para mejorar y agilizar la creación o evaluación de ontologias, con ayuda de un enfoque de extracción automático.
Áreas de interés: Procesamiento de lenguaje natural, extracción de información, relaciones semánticas, aprendizaje ontológico.

Gerardo Flores Petlacalco

Título de tesis: Validación de conceptos y relaciones semánticas de tipo sinonimia en ontologías de dominio restringido
Grado: Licenciado en Ciencias de la Computación
Fecha de titulación: 13 de diciembre de 2017
Resumen de tesis: Este trabajo de investigación tiene como objetivo buscar técnicas para la validación de conceptos y relaciones semánticas de tipo sinonimia, todo aplicado a las ontologías del dominio de Inteligencia Artificial y el estándar e-Learning SCORM. El objetivo de la investigación es la de mejorar la forma de comprensión del conocimiento disponible. El trabajo consta de dos etapas, la primera es la creación de sistemas para la validación de conceptos, la segunda parte es la creación de sistemas para validación de relaciones semánticas de tipos sinonimia entre conceptos. En la primera etapa, los enfoques abordados inician con el empleo de reglas empíricas para descartar términos candidatos, posteriormente se enriquecen las reglas con patrones morfológicos obtenidos después de un etiquetado Parte-de-la-Oración (Part-of-Speach, PoS) y extracción de acrónimos. Finalmente, complementamos con técnicas de clasificación para mejorar la calidad de los términos candidatos. Los mejores resultados se obtienen con clasificación automática y usando las Máquinas de Soporte Vectorial con una puntuación general del 0.99 de Medida−F1 bajo la ontología SCORM y 0.87 de Medida−F1 para la ontología IA. Para la segunda etapa, se propone un sistema que considera la validación de relaciones por patrones y posteriormente se complementa con una extracción de acrónimos con la intención de demostrar que los acrónimos son una forma de sinonimia. Los resultados arrojados por el sistema completo se compararon con la opinión de tres expertos quienes validaron cada relación de forma manual usando un subcorpus. Las coincidencias entre el sistema y las opiniones de los expertos se calificaron usando la medida Accuracy obteniendo arriba del 0.80 de puntuación para ambas ontologías demostrando que las técnicas propuestas funcionan bien en la tarea de validación de relaciones semanticas.
Áreas de interés: Procesamiento de lenguaje Natural, inteligencia artificial, extracción del conocimiento.

Aimeee Cecilia Hernández García

Título de tesis: Evaluación de conceptos a través de medidas de similitud semántica en taxonomías de dominio restringido
Grado: Ingeniera en Ciencias de la Computación
Fecha de titulación: 28 de febrero de 2019
Resumen de tesis: La similitud semántica, medida que se utiliza para saber el grado de similitud entre dos clases o conceptos en una ontología, es de gran importancia debido a sus extensas aplicaciones en campos como biomedicina, donde se han desarrollado ontologías para comparar genes, proteínas, compuestos químicos, entidades anatómicas y enfermedades, en la geoinformática ha servido para encontrar similitud en características geográficas, en lingüística computacional y procesamiento de lenguaje natural donde se utiliza para el análisis de sentimientos, el entendimiento del lenguaje natural, la traducción automática y la web semántica. En la actualidad existe una extensa variedad de medidas de similitud semántica para ontologías, que se clasifican generalmente en dos grandes grupos: las medidas basadas en conocimiento y las medidas basadas en corpus. En esta investigación se pretende implementar algunas de las medidas de similitud basadas en conocimiento que han sido propuestas en la literatura y que se consideren candidatas para evaluar su comportamiento empleando diferentes juicios de evaluación y al final hacer una comparativa y concluir con ventajas y desventajas de las medidas de similitud.
Áreas de interés: Ontologías, PLN, desarrollo web.

Juan Carlos Flores Molina

Título de tesis: Sistema Basado en Ontologías con Razonamiento para la Búsqueda de Información dentro de la BUAP
Grado: Ingeniero en Ciencias de la Computación
Fecha de titulación: 31 de Mayo del 2019
Resumen de tesis: En la actualidad realizar búsquedas en un lugar donde exista una gran cantidad de información es un reto para los desarrolladores de software. Hoy en día las universidades son un sector que genera gran cantidad de información es por ello que muchas de las veces esta información no es gestionada de forma adecuada, para la realización de consultas dentro de estos sectores se recurre a los motores de búsqueda sin embargo pueden arrojar resultados inesperados o innecesarios. Para dar solución a este problema se recurre a la Web Semántica y a la noción de ontologías del campo de la inteligencia artificial. En este trabajo de investigación se plantea la problemática de buscar información acerca de dos procesos de la Benemérita Universidad Autónoma de Puebla el servicio social y la practica profesional. Para dar solución a esta problemática se crearon dos modelos ontológicos, cada modelo ontológico detalla los conceptos, las relaciones y las instancias de cada proceso. Dichos modelos servirán para dar respuestas a lo que los usuarios requieran conocer sobre estos procesos, mediante el lenguaje de consulta SPARQL. De esta forma se obtendrá información mas clara y precisa de lo que se está buscando.
Áreas de interés: Ontologías, Desarrollo Web, Desarrollo de Aplicaciones de Escritorio, Seguridad Informatica.

Jesús Flores Castillo

Título de tesis: Evaluación de ontologías a través de métricas basadas en contenido
Grado: Estudiante de Ingeniería en Ciencias de la Computación.
Fecha de titulación: Pendiente
Resumen de tesis: Por medio de la web semántica o web 3.0 se planea tener una mejor obtención de datos al momento de buscar información en la red, sin embargo, hoy en día se tiene que buscar por medio de palabras clave. Lo que se piensa para el siguiente paso de búsquedas en la web es tener una búsqueda más humana y tener la información de la red etiquetada conforme a su contenido, no solo obtener información en grandes cantidades. Para obtener estos resultados se necesita que esta web este enlazada por medio de etiquetas, esto es posible gracias a diferentes lenguajes que etiquetan información, la información contenida en un documento. En concreto se hablará de los documentos OWL y RDF los cuales por medio de su contenido es posible obtener información valiosa sobre lo que contiene: Claridad de datos, coherencia de datos, extensibilidad, sesgo de codificación mínimo y mínimo compromiso ontológico. Tomando en cuenta un conocimiento previo de lo que contiene la página web, etc. Esto se lleva a partir de razonamiento de ontologías en las cuales analizan los parámetros de la ontología y lo que contiene. Una ontología es una conceptualización de información que se muestra en un formato con un lenguaje para la extracción de este mismo, estos lenguajes puede ser XML, RDF, OWL, etc. La Conceptualización de conocimiento consiste en que por medio del lenguaje sea posible extraer información de la ontología. Las métricas de evaluación de contenido en ontologías, miden la confiabilidad de una ontología y permiten la extracción de información. Las métricas de evaluación de una ontología pueden ser medidas para la evaluación de esta de forma automática o no; Esto permite verificar la calidad de los datos en una ontología. La evaluación de ontologías se lleva a cabo por medio de dos ontologías una estándar y la otra Gold estándar, la comparación de esta se logra por medio de fórmulas definidas. La calidad del modelo de una ontología se establece por medio de aspectos, atributos, factores y métricas, siendo estas últimas evaluadas en esta tesis para verificar la correctitud y la completitud de la ontología evaluada. En esta tesis se tratarán las métricas que permiten evaluar ontologías desde el aspecto de contenido de la estructura del grafo que las modela..
Áreas de interés: Procesamiento de lenguaje natural, inteligencia artificial, machine learning.


















Emmanuel Santos Rodríguez

Título de tesis: Extracción automática de relaciones taxonómicas en documentos no estructurados a través de un algoritmo de agrupamiento
Grado: Estudiante de Ingeniería en Ciencias de la Computación
Fecha de titulación: Pendiente
Resumen de tesis: En esta tesis se pretende implementar un sistema basado en un algoritmo de agrupamiento que permita la obtención automática de relaciones taxonómicas de un corpus de dominio o documentos no estructurados y permita construir la taxonomía de manera automática o semi-automática utilizando además procesamiento de lenguaje natural.
Áreas de interés: Procesamiento de lenguaje natural, ontologías, desarrollo Web, aprendizaje profundo, aprendizaje automático.



Hugo Raziel Lasserre Chávez

Título de tesis: Extracción automática de relaciones taxonómicas en corpus de dominio
Grado: Maestro en Ciencias de la Computación
Fecha de titulación: 24 de enero de 2018
Resumen de tesis: Hoy en día muchas aplicaciones de procesamiento de lenguaje natural hacen uso de tesauros, listas de palabras o de términos clasificados de manera taxonómica, empleados para representar conceptos, como el sistema WordNet, que sirve como un diccionario de conocimiento léxico para el procesamiento de la semántica de palabras y documentos. Construir dichas taxonomías puede ser una tarea difícil y extremadamente lenta. Por lo que ha surgido un creciente interés en encontrar métodos que puedan aprender relaciones taxonómicas y construir jerarquías semánticas de manera automática. Las jerarquías de conceptos son importantes porque permiten la estructuración de información mediante categorías. Las relaciones de tipo “is-a” (es un) son un problema importante en la construcción de taxonomías, por lo que la adquisición automática de ese tipo de relaciones puede ser utilizado para construir una taxonomía e incluso una ontología. En este trabajo de investigación se proponen modelos para la extracción de relaciones tipo hipónimo e hiperónimo a través de métodos que permitan la identificación de estos tipos de relaciones en corpus de dominio específico, como son los métodos de agrupamiento (Análisis de Conceptos Formales) y/o los métodos por patrones léxico-sintácticos, utilizando técnicas de procesamiento de lenguaje natural.
Áreas de interés: Procesamiento de lenguaje natural, inteligencia artificial, machine learning.