Minería de conceptos

From Wikipedia, the free encyclopedia

La minería de conceptos es una actividad que resulta de la extracción de conceptos procedente de artefactos. Soluciones a esta labor típicamente implican aspectos de la inteligencia artificial y la estadística, tales como la minería de datos y minería de textos.[1] Ya que los artefactos son, típicamente, una secuencia poco estructurada de palabras y otros símbolos (en lugar de conceptos), el problema no es trivial, pero puede proporcionar ideas de gran alcance en el significado, procedencia y similitud de documentos.

Tradicionalmente, la conversión de palabras a conceptos se ha realizado utilizando un tesauro,[2] y para las técnicas computacionales la tendencia ha sido la misma. Los tesauros utilizados son creados especialmente para la tarea, o un modelo de lenguaje preexistente, usualmente relacionado con WordNet de Princeton.

Las asignaciones de las palabras a conceptos[3] ason a menudo ambiguas. Normalmente, cada palabra en un idioma determinado se relacionará con varios posibles conceptos. Los seres humanos utilizan el contexto para eliminar la ambigüedad de los distintos significados de una determinada pieza del texto, a diferencia de los sistemas de traducción automática disponibles, que no pueden inferir fácilmente el contexto.

Para los propósitos de la minería de conceptos, estas ambigüedades tienden a ser menos importantes de lo que son al usar la traducción automática, en documentos de gran tamaño las ambigüedades tienden a ser igualadas de la misma manera que a la minería de textos.

Hay muchas técnicas para la desambiguación lingüística que pueden ser utilizadas. Ejemplos de ello son el análisis lingüístico del texto y el uso de la asociación palabra-concepto que pueden deducirse de grandes cuerpos del texto. Recientemente, las técnicas que se basan en similitud semántica entre los posibles conceptos y el contexto han aparecido y ganado gran interés en la comunidad científica.

Aplicaciones

Véase también

Referencias

Related Articles

Wikiwand AI