MODELOS DE RECUPERACION DE INFORMACION

Introducción: Recuperación de la información

Esta pagina es parte de la wikipedia de recuperacion y organizacion de la informacion.La recuperación de la información consiste en dado un conjunto de datos jerarquizados o no, encontrar aquella información relevante para el usuario. Este proceso puede ser comparable a encontrar una aguja en un pajar, ya que, por ejemplo, en Internet la cantidad de información es de unas dimensiones inmanejables. En general cualquier proceso de Recuperación de Información consiste en comparar una query (consulta) del usuario con una gran colección de documentos devolviendo una lista ordenada de acuerdo a un ranking de los documentos que mejor se ajustan a la consulta.

Las primeras aproximaciones a la recuperación de información trabajan sobre la información en bruto, siendo simplemente comparaciones de patrones con todo el texto que se haya obtenido. Pero esta solución es inmanejable, tanto por las cantidades de texto como por la pobreza de los resultados obtenidos. En general todos los documentos que se quieran utilizar para recuperación de la información tendrán que ser categorizados e indexados.

Una vez que los documentos se categorizan e indexan entramos en el verdadero problema: La recuperación de información (Information Retrieval o IR). Necesitamos predecir qué documentos son relevantes para la búsqueda del usuario y necesitamos ordenarlos en función de esa relevancia. Para ello tendremos que describir modelos que relacionen:

Modelos de Recuperación de Información

Un modelo de recuperación de información consiste en:

D: Representación de los documentos
Q: Representación de las queries
F: Un marco (framework) de modelado para D y Q y las relaciones entre ellos.
R(q,di): Un ranking o función de similaridad que ordene los documentos con respecto a una query dada

Modelos de Recuperación de Información clásicos

MODELOS DE RECUPERACIÓN DE INFORMACIÓN

Introducción: Recuperación de la información

Modelos de Recuperación de Información