La imagen que encabeza este artículo es muy reveladora: tan solo una ínfima parte de la información que circula por la Red es accesible por medios convencionales. Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible que comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.
Las características principales de la información de los sitios de la Web visible son:
- no está contenida en bases de datos
- es de libre acceso
- no se requiere la realización de un proceso de registro para su acceso
- mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.
La Web profunda
También conocida como Web invisible. Con este término describimos toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.
Siguiendo la terminología acuñada por Sherman y Price podemos distinguir cuatro tipos de informaciòn invisibles en la Red:
-Web opaca está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están ya sea porque no todas las páginas están indizadas, por la frecuencia de la indización, número máximo de resultados visibles o por no estar referenciadas en otros documentos.
-Web privada consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
* Las páginas están protegidas por contraseñas.
* Contienen un archivo “robots.txt” para evitar ser indizadas.
* Contienen un campo “noindex” . Evita que el buscador pueda indizar la página
-Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.
-Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.
¿Como acceder a los contenidos de la Deep Web (Web profunda)? Entre otros disponemos de los siguientes recursos:
-The WWW Virtual Library (http://vlib.org/) se considera el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web
-Academia.edu (https://www.academia.edu) es una red social 2.0 para investigadores que cuenta con un directorio de más de 12.000 publicaciones científicas de todo el mundo
-Reefseek.com (http://www.refseek.com/) es un motor de búsqueda en Internet para estudiantes e investigadores que tiene como objetivo hacer que la información académica sea de fácil acceso para todos
-Jurn (http://www.jurn.org) es otro motor de búsqueda que permite buscar en millones de artículos libres académicos, capítulos y tesis de múltiples disciplinas
-Microsoft Academic Search (http://academic.research.microsoft.com/) el buscador académico de Microsoft
Las profundidades de la Web Invisible : la Dark Web (Web Oscura)
La llamada Dark Web es en realidad una pequeña porción de la Deep Web, y hace referencia a aquellas páginas que han sido ocultadas intencionalmente. Para navegar por la Dark Web hay que usar recursos no convencionales como la red TOR, la cual básicamente es una red anónima, a la cual sólo se puede tener acceso con el navegador web TOR.
El anonimato que ofrece la red TOR hace que sea asociada a actividades ilícitas. Lo cierto es que TOR permite a los usuarios, evitar el análisis de tráfico o herramientas de monitoreo utilizadas por los sitios comerciales, donde están registrando nuestra información personal y preferencias de forma permanente. También crear sitios web donde puede publicarse material sin preocuparse por la censura.
Conviene señalar que si no se posee conocimientos medios de informática o de redes, el paseo por la web oscura es peligroso: en primer lugar hay materiales de una gran violencia o abiertamente delictivos. Además, desde hace poco tiempo, el FBI “patrulla”estos niveles de la Red (la imagen de la derecha hace referencia a una serie televisiva basada en esta división de delitos informáticos). Y en tercer lugar, están los delincuentes que hacen su gran negocio instalando software malicioso o robando las identidades digitales de los navegantes curiosos..
Para finalizar os dejo un par de enlaces que me han resultado de interés acerca de este tema
http://www.aconcordia.org/articulos-de-interes/darknet-como-funciona-la-red-oscura-donde-se-puede-contratar-asesinos-o-comprar-drogas/
http://www.xataka.com/analisis/una-semana-en-la-deep-web-esto-es-lo-que-me-he-encontrado
Estimado Ignacio:
ResponderEliminarExcelente trabajo!
La información es muy precisa y detallada.
Contiene imágenes ilustrativas muy pertinentes.
Agregaste un par de links de referencia.
Felicitaciones y adelante con el curso!
Saludos.
Gracias por tu valoración. Es de las que animan a seguir adelante.
ResponderEliminarSaludos