sábado, 28 de mayo de 2016

Rastreo de redireccionamientos 301

De: Adrián Coutin

El uso del redireccionamiento 301 indica a los motores de búsquedas, entre otros,  que hemos cambiado el nombre de las páginas Web, cambio de URL, y su buen uso facilita, entre otras cosas, una buena migración de una Web.

Googlebot


Googlebot es el mejor rastreador actualmente en uso. Destaca su velocidad de acceso que depende, entre otros factores, de la detección de las modificaciones/actualizaciones que se hagan en una página Web o en el conjunto del sitio.

Todas las visitas de Googlebot son, o deben ser bien recibidas. Recibir frecuentes visitas de Googlebot indica que tenemos una Web interesante para Google. Las actualizaciones son rápidamente rastreadas y, con buena suerte, comenzar a competir por resultados de búsquedas importantes.

Un caso interesante que les quería comentar hace un tiempo es los detalles de un proceso de redireccionamiento vía 301 de un grupo de páginas Web y el trabajo de googlebot que, de acuerdo al rastro dejado en los ficheros logs, pude identificar.

Como siempre suelo aclarar en estas cosas los comportamientos de los accesos, procesamientos, y evaluaciones de sitios Web son complejos y están sometidos a múltiples variables. No obstante compartir las informaciones y datos que registramos nos ayudan a comprender y mejorar nuestras acciones como SEO técnicos.

Redireccionamientos 301 


Con vistas a eliminar un conjunto de páginas Web que duplicaban contenidos se procedió a redireccionarlas hacia aquellas páginas que eran consideradas como originales del contenido.

A continuación les muestro la gráfica que recoge los accesos de Googlebot con código de respuesta 200 y 301 en un mes.

código de rspuesta 301 vs. 200
Accesos de Googlebot que recibieron código de respuesta 301 y 200

Como puede apreciarse el primer día de la puesta a punto de los redireccionamientos se produjo una caída en el rastro de las páginas Web que respondían 200 y Googlebot se concentró en el rastreo de las páginas redirecionadas.

Los siguientes días se incrementa los accesos a todas las direcciones que responden 200, como una revisión general de la Web y sus contenidos.

A mediados de mes, 16 de Enero, Googlebot vuelve a concentrarse en los redireccionamientos para, posteriormente, volver a tomar el ritmo normal de rastreo.

Es interesante observar los dos momentos de incrementos de rastreo que ocurren los días 21 y 24 de Enero. En ambas ocasiones el rastreo se concentra en las direcciones que responden 200.

Existe un incremento en los accesos a los redirecionamientos el 20 de Enero pero a partir de ese día se produce una gradual caída de acceso a las páginas redireccionadas.

Googlebot: Deducciones


Al realizar un número considerable de redireccionamientos 301 en nuestra Web Googlebot se va a concentrar en el rastro de las mismas, al menos en este caso durante 24 horas.

Es razonablemente lógico que, una vez detectados cambios que indiquen modificaciones significativas, como un número elevado de redireccionamientos, Googlebot proceda hacer un rastreo masivo de la Web, 2 de Enero, incremento de accesos a los recursos que responden 200.

El 16 de Enero Googlebot vuelve a realizar un acceso masivo a los recursos redireccionados para, posteriormente, volver a comprobar, día 21 y 24 de Enero, el resto de recursos que responden 200 en toda la Web.

Finalmente decrecen los accesos a los recursos redireccionados, Googlebot los da como permanentes, y procede a seguir su normal forma de rastrear la Web.

Conclusiones


  • Googlebot es capaz de procesar y analizar los redirccionamientos 301 en un periodo de un mes, aproximadamente, en Webs de más de 40,000 páginas, y con un número de enlaces externos de calidad aceptables.
  • El proceso de verificación es permanente en un período de tiempo en el cual queda claro, para Google, que las páginas redireccionadas no van a volver a responder 200, proceso de migración concluido.
  • La retirada del redireccionamiento debe tomar más tiempo por el tema de enlazado externo que pueden recibir muchas páginas redireccionadas y que se mantendrán enlazadas desde otras páginas web externas, sobre las cuales no tenemos control.

No hay comentarios:

Publicar un comentario