jueves, 30 de junio de 2011

Google y el temido índice suplementario (SPI)

Obtener que cualquier buscador procesara un buen número de páginas de un sitio era ya de por si un buen logro en el 2000, y que Google te encontrara en esa época era ser un webmaster muy afortunado. Por suerte o por desgracia desde hace ya un tiempo el logro es que no encuentran aquellas zonas de la web que no queremos publicar. Suerte porque si cumples todos los requitos del buscador saldrás rápido de su 'sandbox' inicial, desgracia porque si sólo se trata de algo inacabado es posible que buena parte del contenido vaya a parar al índice suplementario conocido por sus siglas en inglés, SPI. Y salir de este índice puede consumir tiempo y esfuerzos técnicos.

Sin entrar en detalles técnicos complejos podemos decir que Google, para organizar efectivamente los contenidos que les ofrece a sus usuarios posee  dos índices de contenidos, el llamado índice principal ('main index') donde se encuentran los contenidos clasificados correctamente para satisfacer las búsquedas, y el índice mencionado en el párrafo anterior, suplementario, donde va a parar aquello que por alguna razón Google no considera relevante para estar al alcance de los que buscan información. Cuando un sitio web está penalizado más del 50% de sus páginas se encuentran en dicho índice. Y si buscas el nombre de tu dominio y no lo encuentras lo más problable es que el 100% de tu contenido haya ido a parar a dicho índice.

Todos los sitios Web procesados en Google poseen páginas en el índice suplementario pues obviamente existen páginas que por su propia función no son objetivos de búsquedas y 'ensucian' los resultados del buscador. Si somos consciente de este problema utilizaremos los tags diseñados para que el spider no procese dichas páginas ('noindex') o lo haremos a través del robot.txt De cualquier forma todos los spiders agradecen no entrar donde no los llaman, o eso creo yo pues Googlebot es un chico travieso y puede llegar a donde menos lo llaman.

Ahora bien no siempre van a parar al índice suplementario páginas que no nos interesan. Por ejemplo todas aquellas páginas con problemas en su esquema de navegación, mal organizadas, o con títulos repetidos van a parar a dicho índice pues son consideradas, en muchos casos, como contenido duplicado. Es frecuente que un sistema de gestor de contenidos sin una correcta configuración genere un elevado número de páginas con algunos de los problemas mencionados, y por ende iran a parar al índice suplementario.

¿Es posible salir del índice suplementario? Sí aunque puede llevar tiempo. Lo primero es reducir la cantidad de páginas que han sido consideradas como de escaso valor o con contenidos duplicados. Esto lo logramos mejorando el esquema de navegación, incrementando el contenido de calidad en cada una de las páginas, diferenciación de títulos, entre otras acciones que mejoren la calidad del sitio web en general. Si las páginas enviadas al índice suplementario no estaban en el mapa del sitio web se deben colocar allí una vez que estén resueltos los problemas de calidad que tenían las mismas. Otra técnica para acelerar el proceso de subir las páginas al índice principal consiste en buscarle enlaces externos desde páginas bien procesadas por Google. No obstante es un proceso que hay que hacerlo de forma cuidadosa para evitar complicaciones mayores.

En la medida en que logremos sacar la mayor cantidad de páginas del índice suplementario el tráfico irá incrementándose, no sólo por aquellas páginas que estaban allí sino también por aquellas que ya estaban colocadas en el índice principal puesto que Google evalúa de lo particular a lo general, elevando la valoración general del sitio afectado.

2 comentarios:

  1. Muy buen post te doy un mas uno y te dejo mi blog para que le eches un ojo. (Ya te acepté en LinkedIn)

    Un abrazo.

    generación de marketing

    ResponderEliminar
  2. muchas gracias - le echare un vistazo al tuyo. abrazos

    ResponderEliminar