Introducción: Recuperación de la información
Esta pagina es parte de la wikipedia de recuperacion y organizacion de la informacion.La recuperación de la información consiste en dado un conjunto de datos jerarquizados o no, encontrar aquella información relevante para el usuario. Este proceso puede ser comparable a encontrar una aguja en un pajar, ya que, por ejemplo, en Internet la cantidad de información es de unas dimensiones inmanejables. En general cualquier proceso de Recuperación de Información consiste en comparar una query (consulta) del usuario con una gran colección de documentos devolviendo una lista ordenada de acuerdo a un ranking de los documentos que mejor se ajustan a la consulta.
Las primeras aproximaciones a la recuperación de información trabajan sobre la información en bruto, siendo simplemente comparaciones de patrones con todo el texto que se haya obtenido. Pero esta solución es inmanejable, tanto por las cantidades de texto como por la pobreza de los resultados obtenidos. En general todos los documentos que se quieran utilizar para recuperación de la información tendrán que ser categorizados e indexados.
Una vez que los documentos se categorizan e indexan entramos en el verdadero problema: La recuperación de información (Information Retrieval o IR). Necesitamos predecir qué documentos son relevantes para la búsqueda del usuario y necesitamos ordenarlos en función de esa relevancia. Para ello tendremos que describir modelos que relacionen: