sábado, 27 de febrero de 2016

La web superficial y la web profunda





Hasta hace muy poco tiempo creíamos que nuestras consultas en Internet a través de los motores de búsqueda nos ofrecían toda la información posible al respecto contenida en la red. Pero estamos muy equivocados. Como se puede apreciar en la foto que acompaña este post, hay que diferenciar entre la web superficial y la web profunda. La web superficial o web visible es aquella que puede ser indexada por las herramientas de búsqueda tradicionales (Google, Yahoo...) y recuperada en su totalidad mediante la consulta en los formularios de búsqueda.

Por su parte, la web profunda o invisible es la que no está indexada en estos motores de búsqueda, es decir, que los buscadores convencionales no pueden acceder a esta información. Generalmente es una información almacenada y a la que se puede acceder a través de bases de datos. Se trata de páginas que no tienen una URL fija, son temporales construyéndose en el mismo momento de la consulta y desapareciendo cuando finaliza nuestra búsqueda.

Hay varios tipos de webs invisibles: la web opaca (que contiene archivos que por algún motivo no están incluidos en los buscadores), web privada (páginas que son excluidas deliberadamente por alguna causa), web propietaria (a la que se accede mediante un registro ya sea gratuito o de pago) y web realmente invisible (cuya información no puede ser extraída a menos que exista una petición específica por parte del usuario). En este enlace se explica de manera muy sencilla qué es una web profunda y cómo aprovecharla: http://papelesdeinteligencia.com/internet-profunda/
Asímismo, en este video se muestran las diferencias entre una web y otra y su importancia:

El término web invisible no es del todo adecuado y autores como Luis Codina considera que debería denominarse web no indizable ya que se trata de páginas web que no pueden indizar los motores de búsqueda de uso público.
Algunos de los recursos de búsqueda de la web profunda son los siguientes:
-The WWW Virtual Library http://vlib.org/.
-Academia.edu https://www.academia.edu.
-Reefseek.com http://www.refseek.com/
-Jurn http://www.jurn.org
-Microsoft Academic Search http://academic.research.microsoft.com/
-TechXtra http://techxtra.tradepub.com/
-Ciencia http://ciencia.science.gov/

No hay comentarios:

Publicar un comentario