El buscador ha lanzado su nuevo sistema de indexación que ofrece resultados un 70% más actualizados que los del último índice
Google ha anunciado en su blog oficial el lanzamiento de su nuevo sistema de indexación de la web, al que ha bautizado como Caffeine y que proporciona resultados un 70 por ciento más actualizados que los del último índice. Su tamaño es de casi 100 millones de gigabytes en una base de datos y añade información nueva a una velocidad de cientos de miles de gigabytes al día.
Con este nuevo sistema la compañía de Mountain View pretende reaccionar a la mayor cantidad y celeridad de actualización de las páginas webs tras la explosión de los blogs, el auge de las redes sociales o la cada vez mayor presencia de contenidos multimedia en internet. Tanto si se trata de noticias como de entradas de un blog o de un foro, gracias a Caffeine se puede encontrar enlaces a contenido relevante más rápidamente y poco después de su publicación.
La compañía ha explicado que además de la evolución en los contenidos, el otro motivo para crear este método más avanzado es la propia experiencia del usuario. Ahora sus expectativas cuando hace una búsqueda son «más altas y quieren encontrar el contenido relevante más reciente». Asimismo, aquellos que publican ese contenido «esperan que se encuentre justo después de haberlo publicado», según ha apuntado la compañía a través de un comunicado de prensa.
El antiguo índice de Google estaba compuesto por varias secciones algunas de las cuales se actualizaban con más frecuencia que otras. Una gran parte del índice se actualizaba cada dos semanas. Para actualizar una sección del antiguo índice, se tenía que analizar toda la web, lo que significaba un retraso considerable entre el momento en que lo encontraba y el momento en que estaba disponible para los usuarios.
Caffeine analiza internet dividiéndola en segmentos (por ejemplo: vídeos, libros, tweets etc. ) y permite actualizar el índice de búsqueda de forma «continua y global». Así, a medida que se encuentran nuevas páginas o información actualizada en páginas ya existentes, se pueden añadir estos resultados directamente al índice, explicó la compañía.
El resultado es que cuando se hace una búsqueda es posible encontrar la información «más reciente, independientemente de cuándo y dónde se publicara».
Los datos de Caffeine
Caffeine permite indexar páginas web a gran escala. De hecho, cada segundo Caffeine procesa cientos de miles de páginas en paralelo, lo que equivaldría a una columna de papeles de aproximadamente cinco kilómetros de altura (apilado, indexado y vuelto a apilar cada segundo). Además, además añade información nueva a una velocidad de cientos de miles de gigabytes al día. Si se quisiera almacenar esta cantidad de información, se necesitarían 625.000 de los iPods con mayor capacidad y puestos en fila ocuparían más de 64 kilómetros.
Por último, Google matizó que Caffeine «se ha diseñado pensando en el futuro» porque nos permitirá construir un motor de búsqueda más «rápido y completo, capaz de gestionar el aumento de la información online y ofreciendo los resultados más relevantes».
No hay comentarios:
Publicar un comentario