Pasos para configurar el archivo Sitemap

 

Antes de explicar cómo y por qué debemos tener configurado en nuestra página el archivo sitemap, pasaremos a definir qué es:

¿Qué es el sitemap?

Es un archivo XML que debemos incluir en nuestra página para indicar cada una de las URL’s internas que forman nuestra web y que queremos que los buscadores indexen.

¿Por qué debemos incluirlo?

La funcionalidad principal del archivo sitemap es la de facilitar el trabajo de indexación a los buscadores. Este archivo funciona como un índice de las páginas que componen nuestra web y por ello los buscadores identificarán más rápidamente cada una de las páginas que queremos que aparezcan en los resultados de búsqueda.

Pasos para una correcta configuración del archivo sitemap

1. Generar el archivo sitemap.xml:

Para generar el archivo sitemap tenemos varias opciones: a través de plugins y generadores automáticos o a mano.

En el caso de que nuestra página esté creada en WordPress o similar, existen diversos plugins que generan automáticamente el archivo a través del rastreo de las páginas que componen la web. Por ejemplo: https://wordpress.org/plugins/google-sitemap-generator/

También existen páginas gratuitas que generan automáticamente el archivo incluyendo la URL de la página que quieres rastrear. Una de las más utilizadas es www.xml-sitemaps.com

C

Para crear el archivo sitemap manualmente debemos seguir la siguiente estructura:

estructura-sitemap

Existen algunas etiquetas obligatorias que debemos incluir y otras que son opcionales:

Etiquetas obligatorias:

  • <urlset> (Información sobre la totalidad de las URLs incluidas en el archivo).
  • <url> (Información concreta sobre cada URL).
  • <loc> (Etiqueta donde se especifica la URL).

Etiquetas opcionales:

  • <lastmod> (Incluye la fecha de la última actualización de la URL).
  • <changefreq> (Indica la frecuencia de modificaciones que puede tener la página).
  • <priority> (Establece la prioridad de una URL sobre otra).

2. Indexar el archivo sitemap.xml

Una vez generado el archivo debemos conseguir su indexación. ¿Cómo lo hacemos? Lo primero que tenemos que hacer es subir el archivo generado a nuestra página web. Se recomienda que se incluya la raíz de la web (www.dominio.com/sitemap.xml)

El segundo paso es indicar a los buscadores la localización del mismo. El archivo debemos subirlo a través de Webmaster Tools o herramientas para webmasters en buscadores como Bing o Yahoo.

Dentro de WMT debemos entrar en https://www.google.com/webmasters/tools/home?hl=es

En el apartado “Rastreo/Sitemaps” debemos añadir nuestro sitemap incluyendo la URL donde se localice en nuestra página y enviarlo.

configurar-sitemap

Una vez enviado, la herramienta nos indicará el número de páginas enviadas, y cuando las spiders de Google rastreen la página se nos mostrará el número de páginas indexadas sobre el total de las que tenemos incluidas en el sitemap.

como-indexar-en-google

Esto es muy útil para detectar errores de indexación de nuestra página, ya que desde Webmaster Tools podemos comprobar qué páginas no se han indexado y por qué dentro del apartado “Errores de rastreo”.

Tipos de sitemap:

Además de indicar la estructura de URLs de nuestra página, podemos utilizar el archivo sitemap para apuntar la existencia de otros tipos de contenido, como imágenes, vídeos, noticias o especificaciones móviles.

Las extensiones para este tipo de contenido en el sitemap son:

Sitemap Imágenes: xmlns:image=http://www.google.com/schemas/sitemap-image/1.1

Sitemap Vídeo: xmlns:video=http://www.google.com/schemas/sitemap-video/1.1

Sitemap Móvil: xmlns:mobile=http://www.google.com/schemas/sitemap-mobile/1.0

Sitemap Noticias: xmlns:news=http://www.google.com/schemas/sitemap-news/0.9

 

Otras recomendaciones:

  1. Incluye el sitemap también dentro de archivo robots.txt

Otra manera de indexar más rápidamente nuestras páginas es incluyendo la ruta del sitemap dentro del archivo robots.txt, de forma que indicaremos a los motores de búsqueda la localización del mismo.

Para incluirlo sólo tenemos que indicar, preferiblemente en la última línea del archivo robots, la ruta del sitemap de la siguiente forma:

Sitemap: www.dominio.com/sitemap.xml

  1. Fracciona el archivo sitemap si tu página genera un alto número de URLs

Algunas páginas contienen un número muy elevado de URLs. Para mejorar y controlar de manera más eficaz la indexación de las mismas podemos generar distintos archivos sitemap.xml estructurados por secciones, categorías, etc.

El número máximo de URLs que debe incluir un archivo sitemap es de 50.000, siempre y cuando no supere los 50MB de tamaño total. Aunque no se recomienda acercarse mucho a esos límites, es mejor realizar sitemaps más pequeños.

Además, recuerda que a través de Webmaster Tools puedes controlar los errores de indexación de cada una de las URLs, por lo que en el caso de contar con una web muy extensa esto nos ayudará a localizar de forma más sencilla y ordenada los errores de indexación.

  1. Utiliza el archivo sitemap para incluir etiquetas alternativas

Podemos utilizar también el archivo sitemap para apuntar otras etiquetas relevantes para el contenido de nuestra página, como por ejemplo la etiqueta hreflang para indicar los idiomas en los que se muestra nuestra página.

  1. Actualiza el sitemap periódicamente

El archivo sitemap debe actualizarse cada vez que se generen URLs nuevas que tengan que ser indexadas. Una vez actualizado debe enviarse de nuevo a través de las herramientas nombradas anteriormente para su correcta indexación.

 

Enlaces de interés:

Imagen vía Balakov.

The following two tabs change content below.

Laura López

Nací en Málaga y dicen que seseo.

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (Ninguna valoración todavía)
Cargando…
Comentarios:
  • Roberto
    Responder

    Muy buen articulo. Me ha servido.

    13 Mayo, 2016 en 8:41 pm
  • roberto
    Responder

    Gracias muy bueno

    13 Mayo, 2016 en 8:43 pm

Deja un comentario:

cinco + dieciseis =