Modelo bolsa de palabras
From Wikipedia, the free encyclopedia
El modelo "bolsa de palabras" (del inglés, Bag of Words) es un método que se utiliza en el procesado del lenguaje para representar documentos ignorando el orden de las palabras. En este modelo, cada documento parece una bolsa que contiene algunas palabras. Por lo tanto, este método permite un modelado de las palabras basado en diccionarios, donde cada bolsa contiene unas cuantas palabras del diccionario. En el campo de reconocimiento de objetos, se utiliza una idea similar para las representaciones de imágenes, es decir, una imagen puede ser tratada como un documento y las características extraídas de ciertos puntos de la imagen son consideradas palabras visuales. Las principales ventajas de utilizar este modelo es su facilidad de uso y su eficiencia computacional.
La distribución de contenidos audiovisuales es uno de los servicios más ofrecidos en la red y crece de forma exponencial debido a los avances de las tecnologías informáticas y multimedia. Esto ha supuesto que el proceso de recuperación de estos contenidos sea más complicado y como consecuencia se deben diseñar sistemas de recuperación de imágenes que permitan resolver búsquedas en grandes repositorios multimedia de manera eficaz y eficiente. Por tanto, hay una automatización del proceso de anotación, ya que la anotación manual es demasiado costosa para grandes volúmenes de datos.
La anotación de la imagen es el proceso de asignación automática de palabras clave a las imágenes. Se puede hacer la categorización de una imagen a partir de un conjunto de clases o de características predefinidas. Pero el rendimiento de la anotación de la imagen depende sobre todo de la representación característica de la imagen. El modelo "bolsa de palabras" se aplicó por primera vez en el campo de la imagen y la recuperación de vídeo y se ha mostrado, en general, un gran rendimiento para la anotación de la imagen y las tareas de recuperación.