miércoles, 27 de enero de 2016

Análisis sobre la Internet Profunda e Invisible

ANALISIS SOBRE LA INTERNET PROFUNDA O INVISIBLE 



El concepto de Internet invisible o Internet profunda, conocida en inglés también como Deepweb, Darkweb o Hidden web, hace referencia, básicamente, a una serie de contenidos que no son visibles para los motores de búsqueda tradicional, esto es, que Google no puede encontrar. 

La Internet Invisible o Profunda, es básicamente el contenido de Internet no indexado por los motores de búsqueda. Aunque ya se habló de la ‘la Web invisible’ en la década de los 90, se considera generalmente aceptado que el término ‘Internet Profunda’ fue introducido por Michael K. Bergman en un white paper titulado “The Deep Web: Surfacing Hidden Value”. Más que de una red oculta creada intencionalmente como nos pueda parecer en la actualidad, el documento hablaba de contenidos no localizables por los motores de búsqueda por distintos motivos, desde páginas protegidas mediante contraseñas a formatos no indexables con páginas sin contenido html. Hay bastante controversia con el tamaño que puede ocupar la Deep Web. 

Algunos autores calculan su tamaño hasta en 500 veces superior a la Internet superficial aunque otros reducen bastante el dato tras la explosión de las redes sociales, de los grandes servicios como Google y de los datos movidos por los dispositivos móviles en la Internet usada por la mayoría de los mortales. En todo caso, las cifras que se manejan para este sub-mundo de Internet son espectaculares y estimaciones basadas en un estudio de la Universidad de Berkeley especulan que en la actualidad el Internet Profundo podría ocupar hasta 91.000 terabytes. 

Algo imposible de confirmar por su propia estructura pero impresionante de igual forma, como el dato de los 300.000 sitios Deep Web existentes en 2004; como todos sabemos la internet es un mar sin fin de información, pero se dice que hay sitios que normalmente no salen en el buscador de gente común. Pero porque se debe esto, como dice en el artículo que se está analizando esto se ya que hay información clasificada de gobiernos que no son accesibles y que resultan difíciles de ver, los cuales incluso si intentas hacerlo puede que tengas serios problemas. 

Pero no solo existe información de gobiernos oculta n la red sino también del narcotráfico y del terrorismo. La internet profunda representa el 95% de la internet que hay en el mundo, lo que podemos saber es que la internet cotidiana almacena 197 Terabytes (un terabytes Equivale a 1024 Gigabytes) contra 91000 de la deep weep casi quinientas veces mayor, por lo tanto aquí podemos encontrar encontrar la puerta a base de datos con directorios gigantescos de información sobre meteorología, astronomía o cualquiera de las principales áreas en las que los gobiernos mantengan investigaciones constantes hasta bibliotecas de millones de tomos, diccionarios, sitios de noticias anónimos, datos financieros, hemerotecas, sitios de personas y empresas, publicaciones digitales de libros, y una fauna de copias de leyes, álbumes de fotografía histórica, directorios con información de personas y sus correos electrónicos o números telefónicos, informes como los de Wikileaks, foros de agrupaciones anónimas, comentarios de redes sociales, marcadores sociales, discusiones en foros, entre tantos otros contenidos que te estés imaginando. 

Pero como todo tiene sus contrastes, luego de leer lo anterior seguramente has quedado pensando en que faltaba lo tal vez más impactante de todo lo que queda afuera de los buscadores, y en este aspecto la ilegalidad y lo prohibido toman un papel mucho más importante en las intenciones del aprovechamiento de la Deep Web. Es así como en la misma podrás llegar a encontrar sitios donde se comercian drogas, armas y hasta servicios delictivos. Asimismo hay lugar para el intercambio de pedofilia y cualquier otro tipo de actividad ilegal de las que tendrás que mantenerte muy atento, pues además de contribuir pasivamente a que estas prácticas horrorosas se sigan nutriendo de público, también estarás expuesto a todo tipo de amenazas cibernéticas. 

Sin descontar la infiltración e investigación constante de organismos de seguridad en estos sitios. Pero no todo es negativo, pues paralelamente a los aspectos más reprobables que puede tener el Hacking en general (como se podrá apreciar en sitios donde se ofrecen servicios para destruir servidores, hackear cuentas, crear virus en comunidad, etc.), también se comparten conocimientos sobre sistemas, seguridad y mucho más que sin dudas es muy interesante y no genera consecuencias para el usuario promedio. Ahora que ya sabemos un poco sobre este tema imaginemos la deep web como un océano donde cada que nademos hacia lo profundo aumentara lo peligroso que puede ser, por lo tanto se divide en 6 niveles: Nivel 0: Web común: la más fácil de todos, llamado asi por un pequeño número de páginas que todos conocemos y que hoy en dia dominan el mundo internauta, tales son Google, Youtube, el mundo Yahoo!, Wikipedia, Redes sociales y similares. 


Nivel 1: 

Web Superficial: Aquí se encuentran web un poco menos conocidas pero de igual fácil acceso. Son en su mayoría foros, páginas pornográficas y pequeñas páginas independientes de interés no tan común como en el nivel anterior.(4chan, Reedit y parecidos) 

Nivel 2: 


Bergie Web: Está compuesto por dominios web aún menos conocidas y por los buscadores independientes tales como lo son Ares y Emule. El material que se puede ver en este nivel es de conducta dudosa y no apto para estómagos débiles. El morbo suele ser por lo que los usuarios lo visitan. Hasta aquí hemos tocado solo la parte superficial del ciber-mundo. Es a partir de aquí donde está lo realmente “interesante”. Es ahora cuando se da el primer paso dentro de Deep Web. Lo interesante de los niveles 3, 4,5 y 6 es lo que pondré a continuación, en su mayoría estos niveles contienen muchas bases de datos inmensas, además de toda la basura informática que hay en Internet. 


Nivel 3: 

Deep Web d’abord: A partir de aquí las todas las cosas cambian radicalmente las páginas que se dominan en este oscuro mundo suelen estar compuestas por letras o signos en su mayoria dejados caer de manera totalmente aleatoria. En ellas no hay publicidad, ni color y lo más significativo es que no se relacionan entre ellas como las paginas superficiales, de hecho, ni siquiera aparecen en buscadores como Google, ni aunque copies el link de la página completa e intentes buscarlo. Los URL no terminan con .com o .org, sino con la terminacion .onion. Aquí hay muchas más cosas raras, muchas cosas perturbadoras, muchas inútiles, tales como las web abandonadas, algunas por más de 25 años, pero también muchas cosas útiles. En este sector quizá encuentres ese libro que tanto buscabas y que no encuentras por que cerraron Megaupload, o esa película de antaño que ya nadie se molesta en subir, e incluso hay algunos foros interesantes. Pero la verdad es que la mayoría de lo que hay aquí tiene fines mucho mas macabros y desagradables, en su mayoría pornografía infantil, pequeños mercados de drogas y armas, instructivos de cómo hacer bombas, o fotos de gente siendo torturada o desmembrada, entre otros. En los foros se hablan temas bastante perturbadores, a veces en broma y otras ni tanto. La verdad llega un punto en el que todo es tan raro que te es difícil saber cuándo es una broma, de un verdadero homicida contando como violó y mató a su víctima. 

Nivel 4: 

Charter Web: Los niveles anteriores eran peligrosos, pero con un programa y un buen antivirus era suficiente, pero aquí no. El cuarto nivel y lo que está por delante están plagados de hackers. Y por hackers no me refiero a chiquillos tontos cuyo único pasatiempo es infectar computadoras, me refiero a verdaderos piratas informáticos, lo mejor de entre lo mejor cuando a robo y malversación de datos se refiere. En este nivel, además de todo lo que hay en los otros niveles, se puede ver Snuff en vivo o grabaciones y, además, se encuentra el “Mercado Negro”. Una página de ventas online como mercadolibre, solo que aquí se venden cosas de los mas macabros, además de drogas, armas, órganos, trata de blancas e incluso puedes contratar sicarios. Todo pagado con una moneda llamada BitCoin. Pero los hackers no están aquí de compras o para ver morbosidades varias, sino para trabajar. En este nivel se encuentran paginas de numeroso gobiernos, donde se puede encontrar información sobre a qué va realmente destinado el dinero de esos países, leyes que piensan ser aprobadas en secreto y secretos de estado tales como expedientes sobre experimentos con humanos que datan de las ultimas 4 décadas. Se dice mucho sobre estos experimentos, y por lo que se menciona, debes tener la fortaleza mental suficiente como para ver un video de ellos.

Nivel 5: 

Marianas Web: Su nombre se debe a la Fosa de las Marianas en el océano Pacifico, el lugar más profundo del mar en si. Hay muy poca información sobre este nivel. Se dice que aquí se exponen los secretos militares y de estado más impactantes e importantes de todos y donde se aprueban estos mismos y donde se controla su progreso. También se cree que la entidad que realmente domina el mundo intercambia información entre sus contra partes por aquí. En este nivel se necesita algoritmos que no se sabe con certeza si existen, además de computadoras que solo posee el gobierno. 

Nivel 6: 

The Fog: No se sabe muy bien que se puede encontrar en este nivel, pero se caracteriza por dos cosas: El nivel de maldad, o ilegalidad es la más alta de la internet, y quienes puedan estar inmerso en este nivel son conocidos como usuarios dioses, por lo extremadamente complicado de tener cosas ya inimaginables ilegales y repugnantes, sin ser vistos ni localizados por absolutamente nadie. Quizás, como referencia, una de las pocas páginas que se sabe que existía en este nivel, traficaba cuerpos muertos y órganos de niños. El creador y mente artificial de este página fue sentenciado a muerte en EE.UU. En la Internet Profunda es de 400 a 500 veces mayor que en lo que comúnmente llamamos Internet, o sea la Internet Superficial. Contiene más de 550 billones de documentos individuales comparado con el billón que hay en la Internet visible (para el año 2000). Lo que reside en los bancos de datos (Databases). Son las requieren membresía y pagar por acceder (America Online, noticias archivadas de periódicos y revistas como Time, Scientific American, Periódicos, y otros). El 95% de la Internet profunda es de acceso gratuito – sin ataduras de pagos ni subscripciones. En febrero de 1999, un estudio de la prestigiosa revista Nature calculaba que entre todos los buscadores no se cubría más que el 42% de la red. Además de textos “invisibles” hay música, videos y arte “invisible”. Para qué puede servir el texto “invisible”? – para comunicarse entre usuarios escogidos, o de un grupo en particular. Se considera “invisible”, o sea, de calidad de Internet Profunda lo siguiente: Las páginas excluidas. No siempre se puede llegar a todas las partes de un Website. El Webmaster puede tener varias razones para hacer que los WebBots no indicen ni consigan ciertas secciones de un Website, lo que hace que esa información aunque esté en la Internet los buscadores no la vean. Las páginas que no son compatibles con HTML. Recordemos que la Internet es esencialmente de formato HTML, pero en la computadoras se bregan cientos de formatos de archivos. Las páginas con gráficas sin texto. Los buscadores no pueden ver nada que no sea texto. Las imágenes que se puedan conseguir es porque están acompañadas de una breve descripción, pero si no la tienen, los buscadores no las ve y es como no si no existieran. Las páginas con música o vídeo pero sin texto. Volvemos a repetir: lo que los indizadores de Internet (los Webots) no pueden leer es como sin existiera. Al igual que con las gráficas, la música no se puede leer, las películas no se pueden leer, etc. Así que Google y los otros buscadores dependen de la descripción adjunta que le haya puesto el Webmaster a sus recursos. Las páginas que son básicamente PDF, Word, WordPerfect, PostScript, PowerPoint, etc. (Google y AltaVista comienzan manejarlas. Esos son parte de los formatos que hablamos anteriormente. En el artículo: Encontrar lo que se busca, sumergiéndose en las profundidades (http://www.redcom.org) se dice: “Técnicamente la mayoría de estos formatos pueden ser indexados, pero los motores eligen no hacerlo por razones de negocio. En primer lugar, hay mucha menos demanda de este tipo de formatos que de textos HTML, y además estos formatos son más difíciles de archivar y organizar, por lo que requieren mayores recursos del servidor”. Las páginas con URL con signos de pregunta (?) imbuidos (esto se hace a propósito). Los URL son las direcciones para que los buscadores consigan una página, pero eso es si el URL está correctamente escrito. El signo de pregunta se usa para que el usuario sepa que esa página va a estar disponible, pero que por ahora no. Otras veces, el signo de pregunta se refiere a que la página corresponde a una búsqueda -usualmente dentro de un banco de datos. Cuando se trata de una búsqueda así, la página no se clasifica como "invisible". Las páginas con contraseñas (Passwords). Se requiere una contraseña para llegar a las bases de datos, para llegar a una membresía, para llegar a una cuenta bancaria, etc. Obviamente, las páginas con contraseña de entrada son el mejor ejemplo de Internet invisible. A veces la contraseña se pide para calificar el usuario como miembro, cliente, participante, o simplemente para establecer una jerarquía de usuario. Las páginas profundas (o sea, las páginas profundas más al interior de un Website que pueden ser muy bien las primeras en haberse entrado) de los Websites grandes. Si un Website contiene demasiadas páginas, los Webots (los indizadores de la Internet) solamente incluyen las primeras de ellas. Esto hace que si lo que buscamos está entre las últimas de las páginas, no lo vamos a ver. En estos casos hay que entrar a los Intranets de esos lugares y utilizar buscadores específicos que se especializan en la información de esa Intranet. Es verdad que el Internet invisible también sirve con propósitos poco asociados a la gestión del conocimiento, pero como todo en la red, queda a discreción de los usuarios saber qué contenidos aprovechar. Aunque su nombre resulte intimidante para algunos, la verdad es que la Internet invisible ya no está tan oculta como antes y gracias a los metabuscadores (buscadores de buscadores) es posible rastrear fuentes de bases de datos, que permiten acceder a la información alojada en la web profunda.

0 comentarios:

Publicar un comentario