¿Que és un buscador Web?¿Como actua un buscador Web?

Un buscador web no es más que un programa informático dedicado a rastrear la web página a página. Este programa o programas se les suele denominar coloquialmente como «arañas», lo cual tiene mucho sentido, ya que la traducción al español de la palabra WEB, significa tela de araña.

El buscador utiliza las arañas, para encontrar cada página que navega por la web, pasando de una a otra de un mismo sitio, utilizando los enlaces o vínculos.

De esta primera afirmación, ya hemos sacado un punto muy interesante, que nos puede ofrecer mucha ayuda: Los buscadores se valen de enlaces para rastrear páginas web, por tanto debemos poner especial cuidado en la creación, mantenimiento y saneo de todos nuestros enlaces. Posteriormente diremos que tipos de páginas son adecuadas para que las arañas realicen bien su trabajo y cuales ponen travas a las mismas.

 

¿Cómo actua un Buscador web?.

Un buscador web que emplee este tipo de programas informáticos o arañas, se compone de tres partes principales:

  • El programa informático (Araña). En Google se llama Googlebot y en Bing se llama Bingbot.
  • Un índice donde guarda las copias de cada página visitada.
  • Una interfaz de búsqueda.(Incluida la página que nos muestra)

Este rastreo del buscador, lo hace de varias formas, de primeras es un rastreo superficial, para acabar profundizando más en el contenido del sitio y sus respectivas páginas.

Un buscador no rastrea todos los sitios web, con la misma frecuencia. Esto no depende del tamaño del sitio, sino mas bién de la actividad y frecuencia de cambio de los contenidos de las distintas páginas de esos sitios. Esto quiere decir, que cuanto más actualicemos un sitio, con mayor frecuencia seremos rastreados por el buscador y por tanto mas rápido veremos publicados los nuevos contenidos.

Una buena práctica sería, el disponer de contenido dinámico en las páginas mas revelantes de nuestro sitio, esto contribuiría a llamar la atención de los buscadores con más frecuencia.

Cuando el sitio es nuevo o incorporamos contenido nuevo a la páginas web, el buscador nos encuentra mediante:

  • Otra página que ya esté indexada o figure en su índice.
  • Haciendo nosotros dicha petición directamente a su índice.
  • Mediante la inclusión en el servidor de un mapa del sitio, también llamado SITEMAP.  (Ya diremos en páginas posteriores como se confeciona dicho mapa, que no es otra cosa que un archivo o página xml, donde hacemos constar a modo de índice, todas las páginas que forman nuestro sitio).

Por último deciros, que un buscador no puede abrirse paso por formularios de acceso a páginas web, (ya que no puede rellenarlos.). Que de las imágenes insertadas solo leen el texto del atributo alt=»», ni gif animados, ni algunas aplicaciones Flash, ó páginas dinámicas con demasiados parámetros en sus Url. Y cuidado con los menús hechos con javascript, cuanto mayor código de Javascript tenga más posibilidades hay de entorpecer su tarea.

Por tanto y dicho rotundamente desde esta primera página, lo que mejor funciona con los buscadores, para indexar todas las páginas de un sitio es mostrar los enlaces normales y corrientes de html, sin formar parte de algún tipo de tecnología o elemento de programación .
Tenerlo siempre muy presente a la hora de mostrar contenido, por muy bonita que nos pinte la página o presentación, con Flash, videos, etc, enlazar siempre las páginas con vinculos src o href normales y corrientes, o como último recurso crear rutas alternativas de enlaces.

¿Te ha gustado? Compártelo.