domingo, 18 de octubre de 2015

Un iceberg llamado internet

NO LO VEMOS TODO...

Continuando con el MOOC "Encontrando tesoros en la red", esta semana toca tratar una manera de caracterizar a las webs en función de la información que está disponible en los buscadores. He aquí un resumen de los puntos fundamentales.

Entendemos por Web Superficial, a aquel contenido en internet que puede ser indexado por los buscadores y presentado tras ejecutar una búsqueda. Es también conocida como Web visible.

En contraposición, se conoce como Web Profunda a aque contenido en internet que no es recuperado por los buscadores convecionales por diversas razones. También es conocida como Web Invisible.

Veamos ahora las particularidades de cada una:


WEB VISIBLE


La información de estas webs suele tener en común su libre acceso (sin necesidad de registros), no están contenidas en bases de datos y casi en su totalidad son páginas webs estáticas.


Aunque uno pueda pensar que la gran mayoría de la información es visible, ocurre como con un iceberg, objeto que da título a esta entrada. La fracción de hielo que vemos (información) suele ser muy inferior a la parte que está bajo el agua. Es por lo tanto llamativa esta afirmación, pues el usuario general cree poder acceder a todo o casi todo a través de los buscadores.

WEB INVISIBLE

En este caso podemos aglutinar toda aquella informacion contenida en bases de datos, url dinámicas y en general protegidas.


Pero a su vez, la informacion profunda se puede clasificar en 4 subcategorías que os presento a continuación:

-Web opaca: No incluida en los índices por no haber un enlace hacia ellas o por economía y limitaciones de espacio de los buscadores.

-Web privada: Información protegida por contraseñas o por elementos como archivos robots.txt o campos sin índices.

-Web propietaria: Para acceder a su información es necesario un registro

-Web realmente invisible: No indizada por limitaciones de los buscaores o porque son necesarias peticiones para acceder a ella.

Para finalizar, señalar que existen recursos para la búsqueda profunda tales como The WWW Virtual Library y DeepWebTech.

BIBLIOGRAFÍA

Para realizar esta entrada la información ha sido obtenida a partir del vídeo y del pdf adjunto en el capítulo correspondiente del MOOC.

4 comentarios:

  1. Hola Sergio!!!!
    Un gusto visitar tu blog... y descubrir como sigue creciendo semana a semana.
    Espero que el curso esté cumpliendo las expectativas que planteabas en tu primera entrada.
    Saludos y nos seguimos leyendo.
    Cristina
    Equipo Docente

    ResponderEliminar
    Respuestas
    1. ¡Muchas gracias Cristina! La verdad es que disfruto con todo lo aprendido. Un saludo

      Eliminar