¿Qué es un Sitemap?¿Cómo se hace un sitemap de Imágenes?
Sitemap, Páginas Web, XML, SEO2016-03-15 11:54:05Greetik Soluciones SLCómo puedes hacer un sitemap, por qué son importantes, ¿Sabes que también se pueden hacer de im...200900

¿Por qué necesita mi web un Sitemap?

Porque es una buena manera de facilitarle la vida a google para que encuentre todas nuestras páginas. Bien, para comprender esto hay que saber cómo funciona un buscador. Los buscadores (Google, Bing, Yahoo), entran en nuestras webs y tratan de navegar como si fuesen un usuario normal y corriente en su casa, accediendo enlace a enlace de una a otra ¿Qué ocurre si no tenemos correctamente enlazada nuestras páginas? pues que habrá algunas a las que no llegue y estos buscadores no sabrán nunca que existen.

Un sitemap es una página de nuestra web donde están todos los enlaces y todas las páginas que existen dentro de ella. Quizá recuerdes hace unos años todos los sitios web tenían uno en HTML, como una página más del portal, esto permitía también al usuario hacerse una idea de cómo estaba estructurada la web y hacer click en ellos, el sitemap mantenía el diseño ya que como estaba en HTML, era algo visible y estaba al alcance de cualquier visitante, se le podían añadir estilos.

Ahora se tratan de seguir unos estándares, el sitemap se hace en formato XML y lo habitual es ponerlo en el directorio raíz, (¡mira el nuestro! http://greetik.com/sitemap.xml), con este formato, lo primero, le facilitas la tarea de obtener tus enlaces a los rastreadores, y lo segundo, puedes añadir datos a los enlaces, no solo añadir la url, si no que puedes agregar cada cuánto cambia esa página, cuándo fue la última vez que se modificó... A ver, en http://www.sitemaps.org/ tienes toda la documentación, pero para que no tengas que perderte entre párrafos, te vamos a contar cuáles son las etiquetas más comunes:

  • loc: Es la url en sí de la página, ojo, procura que se corresponda con la url canónica.
  • changefreq: Frecuencia con la que actualizas esa página en concreto. Los valores posibles son:
    • always: siempre, esto lo ponemos para páginas que cambian cada vez que son mostradas.
    • hourly: cada hora.
    • daily: diariamente.
    • weekly: cada semana.
    • monthly: mensualmente.
    • yearly: anualmente
    • never: Nunca, para páginas archivadas.
  • lastmod: Última vez que esa página cambió, el formato es "aaaa-mm-dd".
  • priority: Es un número que va de 0 a 1 y por defecto será 0.5, la prioridad es relativa, se mide dentro de nuestro portal web, con lo que le daremos más o menos importancia a cada una de nuestras páginas en el entorno de nuestra web, de poco vale ponerle a todas un "1", o el mismo número vaya, porque el buscador interpretará que son todas igual de relevantes.

¿Qué es la url cánonica? Eso que hemos dicho un poco más arriba, quizá nunca te hayas percatado, pero probablemente a tu web se pueda entrar de distintas formas:

  • http://greetik.com (sin www)
  • http://www.greetik.com (con www)
  • http://greetik.com/ (sin www y con /)
  • http://www.greetik.com/ (con www y con /)

Google diferencia hasta 4 url distintas solo para tu index, imagínate que además pudieses acceder añadiendo detrás /inicio, por ejemplo, yo sé que tú, como el resto de los mortales ves lo mismo, pero es importante que comprendas que a google no le da igual y no quiere tener repetida cada una de tus url cuatro, seis o diez veces para mostrar el mismo contenido, así que dentro de nuestras páginas podemos indicarle cuál es exactamente la url de la web para que te indexe solo una aunque seas accesible de más formas, si entras en el código fuente de cualquiera de nuestras webs, ésta mismamente, arriba verás algo así: <link rel="canonical" href="http://greetik.com/" /> que es la manera de especificar esto.

¿Sabes que también puedes hacer un sitemap de imágenes? Claro, ya sabes que google tiene un buscador de imágenes ¿Por qué no darle también una relación de todas ellas? Sigue el mismo proceso que el sitemap general, en formato XML y con una limitación de 1000 imágenes por sitemap. Al igual que en el anterior, lo bueno es que podemos añadir cierta información a cada imagen, y esto sí es útil, porque un texto descriptivo ayuda mucho para encontrar luego una foto que no es algo tan sencillo de interpretar qué se ve, aquí tienes el nuestro de ejemplo http://greetik.com/sitemapimages.xml.

Igual que antes, te vamos a dejar un enlace a la documentación completa, con la que podrás saber mucho más que leyendo nuestro post https://support.google.com/webmasters/answer/178636?hl=es, pero si quieres saber lo básico, los principales atributos de cada imagen son:

  • loc: La imagen en sí, la url para acceder a ella.
  • caption: Sería el equivalente al pie de foto.
  • title: El título de la imagen.
  • geo_location: Con un texto de la ubicación es suficiente ("Cáceres, Spain") para geolocalizar tu imagen.

Si en tu sitio tienes vídeos, también puedes hacer un sitemap con ellos.

¿Y ahora qué hago con mis sitemaps? Tenemos que contar a los buscadores que los tenemos y dónde los tenemos para que puedan visitarlos, recorrerlos e indexar todo nuestro contenido, que se lee rápido, pero ese proceso le lleva a google un rato, en cualquier caso ¿Cómo hacemos esto?

  • Podemos indicar en el robots.txt que tenemos un sitemap. En el fichero robots.txt se indica habitualmente qué queremos que indexe el buscador (por ejemplo, si nuestra web tiene un panel de administración en /administrador) no queremos que ese panel aparezca en google, y se lo haremos saber escribiéndolo en el robots.txt. Pero también se pueden indicar otras cosas como por ejemplo, los sitemaps que tenemos añadiendo esta línea:
    Sitemap: http://greetik.com/sitemap.xml
  • Si tenemos varios, en el propio sitemap general, poner enlaces a los otros sitemaps.
  • Podemos enviárselo directamente a los buscadores, pero esto lo explicaremos en otro post.
  • Podemos hacer todos los pasos.

Esperamos haberte aclarado un poco qué es esto de los sitemaps, por qué son necesarios y cómo hacerlos, en cualquier caso, si tienes dudas, ya sabes, puedes dejar tu web en manos de Greetik Soluciones SL y ya nos preocuparemos nosotros por ti de estos asuntos.