miércoles, 24 de agosto de 2016

Conocer el estado de indexación de las páginas Web en Google

De Adrián Coutin

El posicionamiento Web va más allá de la necesidad de optimización de títulos, descripciones, palabras claves y todo lo relacionado con la optimización del HTML que registran los robots permanentemente.

Una vez completados estos elementos,  en el diseño y construcción de la Web,es necesario conocer cómo Google o cualquier otro buscador, está procesando las páginas del sitio Web, y  Google Search Console.

 Hoy les comentaré cómo usar e interpretar el Estado de Indexación en Google. 
Muetra Estado de Indexación vía Google Search Sonsole
Google Search Console - Estado de Indexación Google (clic para ampliar imágen)

Google nos dice en esta primera opción, (Opción Básica),  el total de páginas que tiene indexada bajo este dominio por lo que ya tenemos un dato importante, el total de las URLs que se han añadido al índice de Google.

Si, por ejemplo, tenemos un sitio Web compuesto por 200 URL que aparecen en el mapa del sitio y detectamos que el Estado de Indexación nos informa que existen más de 600 URL indexadas por Google, algo malo está pasando en nuestro CMS.
  • ¿Se están generando URL dinámicas y están siendo procesadas por Google?
  • ¿Poseen contenido duplicado? 
Señal de peligro, algo extraño está pasando en nuestro sitio Web.

La opción de Avanzada nos da mucha más información detallada. Veamos el gráfico. 

Muestra gráfico con los resultados de estado de indexación en Googl eSearch Console
Opción Avanzada - Estado de Indexación Google Search Console (clic para ampliar imágen)


 La opción Avanzada nos muestra, además del Total Indexadas, las URL Rastreadas alguna vez, Páginas bloqueadas por robots y las Páginas eliminadas.

URL rastreadas alguna vez: El total de páginas a las que Google ha accedido en cualquier momento. Supongamos que al inicio de nuestro Sitio Web tenemos una sección dedicada a noticias y la misma fue eliminada o se decidió cerrarla al procesamiento de los spiders. Estas páginas se contabilizarán en este grupo.

Páginas bloqueadas por robots: Pues lo que dice su nombre, todas aquellas páginas que han sido bloqueadas por el fichero robots.txt ¿Te parecen muchas? Revisalas y ojo con que no tengas bloqueadas páginas que quieres posicionar. Existe una herramienta dentro del propio Google Webmaster donde puedes ver las páginas que están siendo bloqueadas a los buscadores. (Rastreo -> URL Bloqueadas)

 Páginas Eliminadas: Aquellas páginas que han sido eliminadas de los resultados de búsqueda de Google. Y es que Google te permite borrar aquellas páginas que no deseas que estén en los índices de resultados del buscador pero recuerda que antes de bajarla de Google debes bloquearla o eliminarla completa del sitio Web.

Utilizando esta herramienta podrás tener una información más o menos precisa del estado en que se encuentran procesadas las páginas Web de tu sitio.

¿Son fiables estos datos? De acuerdo a mi experiencia si. Quizás es lento en algunas actualizaciones y también el limite en el acceso a la información histórica (que limita el análisis SEO).

Un comentario interesante sobre este tema: Las páginas con contenido duplicado o escaso que Google procesa pero no incorpora a los resultados de búsquedas no aparecen en este informe. Y si estos volúmenes son significativos la Web puede tener problemas en los resultados de búsqueda de Google.

8 comentarios:

  1. Hola, Adrián :)

    Primero que nada gracias por tu entrada.

    ¿Te importa si te hago una pregunta?

    Tengo un blog que recibe continuamente desde febrero visitas desde buscadores de Google de distintos países. Sin embargo, en la gráfica de indexación del dominio (tanto en la versión con www como sin www) aparece a cero.

    ¿Es normal? ¿Es un problema? Y si lo es, ¿puede arreglarse? ¿Cómo?

    Gracias anticipadas por tu ayuda, seguro que muchos nuevos en esto como yo tienen la misma duda...

    ResponderEliminar
  2. Hola !!

    Pues es primera vez que veo esto, puede que sea que tu site es pequeño o que puedes tener algun problema de configuración. No obstante puedes usar el comando que google tiene para conocer todas las páginas que ha subido a su indice.

    site:rebeautys.com

    O sea en la caja de búsqueda de Google.es introduces el comando:
    site:rebeautys.com y verás todas las páginas que Google tiene procesadas de tu blog, en este caso son 60.

    Si tu web es nueva.. google webmaster demora en mostrar los datos en el panel. También revisa la configuración.

    saludos y suerte

    ResponderEliminar
  3. Una pregunta, en webmaster tools me aparece que mi sitio tiene 3 URl bloqueadas, pero al entrar a rastreo: url bloquedas no las veo, veo simplemente todo el contenido de robots.txt donde no tengo ninguna URL específica bloqueada sino carpetas de joomla que por defecto vienen alli. Cómo sé cuáles son las URl bloqueadas? Mil gracias

    ResponderEliminar
  4. Hola Catalina, un placer saludarte..

    Si en el robots.txt sólo tienes la configuración propia de Joomla no debes preocuparte porque sólo te aparezcan 3 páginas bloqueadas. Es normall que esa configuración bloquee un determinado número de páginas que no son necesarias. De hecho deben estar bloqueadas más de esas 3 que te dice Google Webmaster.

    Esta sección, URL bloqueadas, te facilita ver el robots actual, cambiarlo y probar si funcionaria OK y tambien probar si las URL que quieres bloquear en ese robots.txt de prueba, son eficientemente bloqueadas por la configuración de prueba.

    Saludos !!!

    ResponderEliminar
  5. A partir de hoy Google Webmaster Tools pasa a llamarse Search Console. Interesante paso.

    ResponderEliminar
  6. hola ! muchas gracias por el articulo muy interesante. Tenia una pregunta a ver si me la podrias responder. Resulta que venia muy bien con la indexacion de mi pagina, cada semana aparecia que habia mas indexadas, pero desde hace un mes ya que quedo trabado en 106. Y yo sigo publicando articulos. Puede ser algo malo? o deberia seguir esperando? gracias

    ResponderEliminar
  7. hola ! muchas gracias por el articulo muy interesante. Tenia una pregunta a ver si me la podrias responder. Resulta que venia muy bien con la indexacion de mi pagina, cada semana aparecia que habia mas indexadas, pero desde hace un mes ya que quedo trabado en 106. Y yo sigo publicando articulos. Puede ser algo malo? o deberia seguir esperando? gracias

    ResponderEliminar
    Respuestas
    1. Hola romina,

      Puedes tener mucho contenido dupliado y Google te haya dejado de indexar.

      saludos

      Eliminar