Para que un buscador como Google funcione depende de 5 partes que son indivisibles y muy bien diferenciadas.
1.- Robot, crawler, spider o araña, no es algo fisico como un robot o un autómata, es una mezcla de hardware y software medante los cuales los buscadores rastrean todas las páginas web de internet.:
¿Como la hacen?: los robots son buscadores ciegos, no leen ciertos lenguages, las imágenes no las leen, tampoco flash, ni frames o marcos, una manera de ayudarlos a interpretar las páginas es optmizando los códigos para enfatizar las áreas que el robot considera importantes y dan la relevancia requerida.
Los spider recorren Internet siguiendo los enlaces o links de texto para incluir o indexar las paginas web encontradas en los indices o catálogos, que es donde reside toda infraestructura técnica de hardware del buscador, llamados (2) Datacenters.
3.- Toda esta cuantiosa información hay que ordenarla de alguna manera, para esto están los algoritmos de posicionamiento de cada uno de los buscadores, estos algoritmos son secretos, es mas o menos como la formula de la coca-cola, unas pocas personas conocen la verdad del algoritmo, son formulas matemáticas y razonamientos inmensos, es un ser vivo al que cada día le surgen nuevos componentes y va cambiando a través del tiempo, este algoritmo ordena las páginas web indexadas tras una búsqueda del usuario.
4.- Caja de búsqueda, la interfaz que utilizamos para buscar.
5.- Página de resultado de búsquedas (SERP = Search Engine Results Page), la recuperación de la información es tomar el contenido del indice del buscador y mostrarla en una página de resultados con una cierta lógica que es el ordenamiento que determina el algoritmo.