NO LO VEMOS TODO...
Continuando con el MOOC "Encontrando tesoros en la red", esta semana toca tratar una manera de caracterizar a las webs en función de la información que está disponible en los buscadores. He aquí un resumen de los puntos fundamentales.
Entendemos por Web Superficial, a aquel contenido en internet que puede ser indexado por los buscadores y presentado tras ejecutar una búsqueda. Es también conocida como Web visible.
En contraposición, se conoce como Web Profunda a aque contenido en internet que no es recuperado por los buscadores convecionales por diversas razones. También es conocida como Web Invisible.
Veamos ahora las particularidades de cada una:
WEB VISIBLE
La información de estas webs suele tener en común su libre acceso (sin necesidad de registros), no están contenidas en bases de datos y casi en su totalidad son páginas webs estáticas.
Aunque uno pueda pensar que la gran mayoría de la información es visible, ocurre como con un iceberg, objeto que da título a esta entrada. La fracción de hielo que vemos (información) suele ser muy inferior a la parte que está bajo el agua. Es por lo tanto llamativa esta afirmación, pues el usuario general cree poder acceder a todo o casi todo a través de los buscadores.
WEB INVISIBLE
En este caso podemos aglutinar toda aquella informacion contenida en bases de datos, url dinámicas y en general protegidas.
Pero a su vez, la informacion profunda se puede clasificar en 4 subcategorías que os presento a continuación:
-Web opaca: No incluida en los índices por no haber un enlace hacia ellas o por economía y limitaciones de espacio de los buscadores.
-Web privada: Información protegida por contraseñas o por elementos como archivos robots.txt o campos sin índices.
-Web propietaria: Para acceder a su información es necesario un registro
-Web realmente invisible: No indizada por limitaciones de los buscaores o porque son necesarias peticiones para acceder a ella.
Para finalizar, señalar que existen recursos para la búsqueda profunda tales como The WWW Virtual Library y DeepWebTech.
BIBLIOGRAFÍA
Para realizar esta entrada la información ha sido obtenida a partir del vídeo y del pdf adjunto en el capítulo correspondiente del MOOC.


Hola. muy bien, sigue así. Saludos.
ResponderEliminarMuchas gracias e igualmente
EliminarHola Sergio!!!!
ResponderEliminarUn gusto visitar tu blog... y descubrir como sigue creciendo semana a semana.
Espero que el curso esté cumpliendo las expectativas que planteabas en tu primera entrada.
Saludos y nos seguimos leyendo.
Cristina
Equipo Docente
¡Muchas gracias Cristina! La verdad es que disfruto con todo lo aprendido. Un saludo
Eliminar