miércoles, 12 de agosto de 2015

Errores en posicionamiento SEO: CMS y plataformas

De Adrián Coutin

La puesta a punto y lanzamiento de nuevas plataformas Web, gestores de contenido (CMS) y cualquier forma de publicación de sitios Web necesita un buen control de los indicadores que, de una forma u otra, señalan calidad y buen funcionamiento de un sitio Web para los buscadores.

Son definidos como indicadores de funcionamiento de un sitio Web (Web Performance Indicators) aquellos que expresan, de una forma u otra, el estado de funcionamiento de una Web a partir de un conjunto de informaciones técnicas que indican el buen o mal funcionamiento de la plataforma o gestor de contenido

En el presente post trataré los problemas que se concentran en los códigos de respuestas del servidor a las peticiones de los rastreadores, spiders y cómo estos son utilizados, especialmente por Google, para evaluar y puntuar la calidad de la Web que optimizamos.

No trataré otros elementos que no dejan de ser relevantes y que merecen un post aparte. Ejemplo: la velocidad de carga de las páginas Web.

Rastreo - Errores de Rastreo


La presencia o ausencia de los errores de rastreo influye, de manera decisiva, en las veces que un crawler como googlebot visita (y procesa) el contenido que publicamos en al Web.

Google Search Console, anteriormente conocido como Google Herramientas para Webmaster ofrece un resumen de los principales errores encontrados por Googlebot mientras rastreaba la Web.  


Reporte de Estado Actual del panel de control de Google Search Console
Google Search- Console - Estado Actual

La opción de Errores de Rastreo incluye los principales errores que encuentra Googlebot mientras rastrea la Web.

Reporte de Errores de URL - No se encuentran de los Errores de Rastreo de Google Search Console
Google Search Console - Errores de URL


Los principales errores que podemos encontrar aquí son:

Error del Servidor: Informan de los errores conocidos como "500"  y que en dependencia de su persistencia pueden ser considerados graves por Googlebot reduciendo la frecuencia del procesamiento del sitio Web.

En ocasiones suele pasar desapercibido por ocurrir errores, malas configuraciones, etc. en los servicios de webhosting. Google Search Console te brinda esta información, no la ignores.

Error 404 leve: Páginas que responden código de status 200 cuando debe responder 404 o 410. En esta imagen podemos ver, marcado en recuadro rojo, el número de errores 404 y que no son tan leves.


Reporte Error 404 leve de Errores de Rastreo de Google Search Console
Error Leve 404


Tipos de páginas que suelen dar este error:

Las páginas que informan que el contenido ya no está disponible. La página informa que no existe la página sin embargo el código de respuesta es 200.

Las páginas que son resultados del buscador interno. Googlebot no quiere procesar páginas que muestran resultados del buscador interno. No aportan, es contenido duplicado, y deben estar bloqueadas, preferente mente vía robots.txt

No se encuentra: Agrupa los conocidos como errores "400" que técnicamente son conocidos como Errores del Cliente.  Los errores 404 son reportados aquí y que en dependencia de su permanencia o incrementos pueden afectar los indicadores del funcionamiento de calidad de una Web.

Reporte No se Encuentra de Errores de Rastreo en Google Search Console
Error de Rastreo - No se Encuentra


Este ejemplo puede ser un caso de grave, por el elevado número de errores 404.

Los indicadores de calidad se suele afectar más aún si este tipo de error ocurre aleatoriamente, es decir, son páginas que deben dar 200, están disponibles, pero por errores  del CMS, configuración, etc. responden 404 en determinado momento en que se solicitan.

Google Console nos ayuda a detectar este problema pero aquí vemos una muestra de errores. Debes también revisar los ficheros logs o revisarlo con rastreadores como Screamingfrog.

Acceso Denegado:  Las páginas no están accesibles, prohibido el acceso, No es un error que afecte la valoración de calidad de la Web pero si tienes este tipo de error debes bloquear el acceso a estas páginas vía robots.txt y le ahorras tiempo a Googlebot.


Reporte de Acceso Denegado - Errores de Rastreo - Goongle Search Console
Errores de Rastreo - Acceso Denegado


Errores en  CMS y Plataformas


Cuando desarrollamos sitios Web en gestores de contenidos o plataformas con un volumen de medio a alto de contenidos es necesario controlar los errores de los códigos de respuesta incluso antes de lanzar la versión online.

Muestra la representación de conexiones de nodos, páginas, de un sitio Web
Representación vía Grafos de una Web y sus páginas


Al evitar que los rastreadores encuentren errores de este tipo la Web logra pasar correctamente las pruebas y valoraciones que los buscadores suelen hacer con estas informaciones.

Una forma sencilla que podemos usar es el uso de simuladores de rastreos o screaming que pueden detectar muchos de los errores de rastreo antes de subir la Web online.

El simulador de spider Screaming Frog SEO nos ayuda en esta y en muchas tareas de puesta a punto o migraciones de Web por lo que lo considero una herramienta indispensable para el trabajo SEO.

A continuación una imagen un rastreo realizado  con Screaming FrgoSeo a una sitio Web en desarrollo. Marcado en recuadro rojo la zona de Códigos de Respuesta:

Muestra un Reporte de Códigos de Respuesta de Screaming Frogseo
Screaming Frogseo - Reporte de Códigos de Respuesta


Diversos informes pueden ser generados con estos resultados filtrando  por los diferentes códigos de respuesta.

Una vez resueltos estos y otros problemas relacionados con la optimización de la Web esta listo para pasar a la versión online.

Una vez online no dejes de hacer revisiones frecuentes con el Screaming Frogseo y seguir los informes de Errores de Rastreo de Google Console.

No hay comentarios:

Publicar un comentario en la entrada