SEO

May 022016 4 Responses

Movidas SEO en ecommerce

Gran post de la amiga MJ Cachon sobre cómo puedes meter la gamba a fondo en el SEO de tu ecommerce. MJ nos desgrana un par de puntos de corte técnico que debes tener en cuenta de cara al posicionamiento de tu tienda online.

¡Al turrón!

Movidas SEO en ecommerce

¿Quiéres saber cómo la puedes liar parda con tu ecommerce?
¿Cómo puedes volver loco a Google?
Te contamos un par de maneras muy sutiles, atentos:

Interpretación libre de la anotación hreflang

Dice la documentación de Google lo siguiente:

“Muchos sitios web proporcionan contenido a usuarios de todo el mundo y dicho contenido puede estar traducido u orientado a usuarios de una determinada región. Google usa los atributos rel=”alternate” hreflang=”x” para mostrar la URL de idioma o de región correcta en los resultados de búsqueda”

Y después, nos explica los 3 escenarios habituales:

  • Solo se traduce la plantilla del sitio
  • Existen pequeñas variaciones regionales (ejemplo: Inglés de UK vs Inglés de USA)
  • Contenido traducido al completo.

El “cómo” hacerlo, tampoco parece ofrecer muchas dudas:

  • Etiquetas en el <head>
  • Encabezado http
  • Sitemap

Amigos, esto no:

Untitled-2

No es correcto usar 2 dominios que no tienen nada que ver, más cuando las urls que se añaden, son independientes y sus temáticas no tienen nada que ver.

La finalidad última de esta etiqueta es la de informar de la equivalencia de contenidos, indicando idioma de cada contenido, y cuando corresponda, la orientación geográfica.

Con el ejemplo del marcado, ese x-default, también es incorrecto, pues le estamos diciendo:

  • Webtematica1.es > selector de idioma
  • Webtematica2.es > idioma Es orientado a país Es.
  • En.webtematica1.es > idioma En orientado a país Gb (United Kingdom of Great Britain and Northern Ireland)

canonical cristo

Problemático cuanto menos, sobre todo si pensamos que esta implementación se hace así en la home y en páginas interiores de categorías y productos.

hreflang cristo

Esto puede (no) hacerse, desde el propio código, como por el sitemap. Más información y tips en este post de MJ Cachón: Revisando el hreflang con Screaming Frog

Con los Canonical no juegues….

Dos canonicals prácticamente aleatorios

Otra forma de jugar al despiste es usar varias etiquetas canonical por url, y ya que estamos, variarlos para que sean distintos, y así unas veces se referencian a si mismos, otras veces a urls con parámetros bloqueadas en robots, y otras, el canonical apunta a versiones de otro idioma. ¡Que no nos pille el patrón!

Recordando la etiqueta canonical no es una directiva, por lo tanto, no tiene por qué ser obedecida por los buscadores, el 100% de las veces.

Su función es establecer la url preferida entre varias urls que muestren mismo o contenido muy similar.

Si con uno, ya es una etiqueta “peligrosa” si no se usa bien, imaginaros si usamos 2 y encima se contradicen. Aunque en realidad lo que ocurre es que es ignorada la etiqueta, valora ahora si prefieres que la ignore o qué…

Ponerle canonicals de productos a categorías

La cosa es que si vas a poner un canonical del producto a la categoría, pues puedes estar provocando que no se indexen las fichas de producto, y queden en su lugar, las de categoría, ¿tiene sentido? Pues no, deberían estar ambas, con un canonical hacia si mismas, indexaditas y esperando a captar el tráfico orgánico que les corresponda.

Le estamos diciendo que nuestra url preferida es una Categoría y que el Producto no aparezca en los resultados… Descorazonador, ¿verdad?

Un canonical que apunta a un “noindex” o a un “404”

Nuevamente, estaríamos mareando a Google maravillosamente, vamos a decirle cuales son nuestras urls preferidas, y resulta que son urls que no queremos indexar o que responden un error.

O es que adoras tu custom 404 o no has pensado bien lo que estás haciendo.

Abr 042016 3 Responses

Caso práctico: frecuencia de rastreo y redirecciones

Hace unos meses cayó en mis manos un proyecto muy interesante de SEO on page. Se trata de un ecommerce con, aproximadamente, 5.000 URLs de categorías y productos. ¿Que cuántas URLs tenía indexadas en Google? Sorpresa:

1

¿Pero, qué?

Filtros abiertos, fijo que es eso

Lo primero que piensas es que no es la primera vez que ves esto y que debe haber filtros abiertos e indexándose. Un clásico que me he encontrado más de una vez y de dos.

Después de hacer varios crawlings generales y de parámetros de filtros (precio, orden, características, atributos, búsqueda…) no llegué a ninguna conclusión satisfactoria. ¡NINGUNA! No era ningún filtro. Mamma mía, ¿qué coño había pasado aquí?

Después de volverme loco buscando por aquí y por allí, mirando robots.txt, htaccess y dándole más vueltas al tema que una peonza, detecté un patrón gracias al informe de “Mejoras de HTML” de Search Console. Atención:

2

Curioso, porque las meta descripciones eran únicas. Desplegando algunas de las celdas con más duplicados me encontré con esto:

3

Es decir, un producto con 6 colores, generaba 6 URLs diferentes. La “padre” y 5 URLs más, 1 para cada color.

El comportamiento a nivel de indexación en Google era:

  1. Se crea el producto padre
  2. Se crean las 5 variaciones de color
  3. Eso crea 6 URLs con el mismo contenido
  4. Esas URLs van a parar al sitemap.xml
  5. Esas URLs van a parar al mapa de productos (en html) del site
  6. Se rastrean las 6 URLs
  7. Se indexan las 6 URLs
  8. A posteriori, las 5 URLs de colores se redirigen a la URL padre
  9. Ergo, tenemos 6 URLs indexadas, 5 de ellas con un 301

Imaginad este comportamiento para un catálogo de unos 4.800 productos (y 200 categorías) con un mínimo de 2 combinaciones. Hay productos que no tienen combinaciones y que solo tienen una URL. Hay productos que tienen 23 combinaciones y que generan 23 URLs.

Todo este pastizal de URLs había provocado que se indexaran 13.400 URLs, muchas de las cuales eran redirecciones y que estaban ocupando el lugar de “URLs buenas”.

Adiós, frecuencia de rastreo

¿Qué había pasado debido a la combinación de este factor (301 a mansalva enviados al índice de Google) combinándolo con:

  • varios centenares de error 404?
  • Y, sorpresa final, URLs con error 404 que devuelven un status 200 (ok)

4

Páginas rastreadas al día y kilobytes descargados al día casi al 50%. El bot de Google había acabado literalmente hasta los cojones de perder el tiempo rastreando URLs de mierda, por lo que nos había bajado las páginas rastreadas al día de 6.100 a 3.300. Ojo cuidao con estas cosas.

¿Forma de resolverlo? Evitar esas redirecciones 301 (hacer que no se generen directamente las URLs), desindexar todas las 301 indexadas. Eliminar todas las 301 que había en el sitemap y en el mapa del sitio en HTML, caparlas por robots.txt (ya puestos) y “patapum-parriba”.

1 2 3 4 5 42