Dic 212015

SEO Prestashop: parámetros que suelen duplicar contenido

Tweet about this on Twitter2Share on LinkedIn14Email this to someoneShare on Google+0

A estas alturas, la mayoría de vosotros ya estaréis familiarizados con los contenidos duplicados y sus implicaciones a nivel de SEO. Si no es así, os dejo varios artículos que he escrito donde resumo los principales indicadores de penalización por Google Panda y cómo combatirlos:

Es raro que hagas contenido duplicado en tu página sin saberlo. Todos sabemos cuando copiamos algo o cuando scrapeamos contenido de otras webs para nuestra tienda online. Pero, a veces, no sabemos cuándo ese contenido duplicado se está creando automáticamente. Y ese es el punto que vamos a abordar hoy.

Una cosa que repetiré más adelante, por defecto, Prestashop no genera el robots.txt.
Tienes que hacerlo a mano. Así que, por defecto, todos los parámetros están abiertos.
Quedémonos con esta idea que puede desatar una auténtica tormenta de mierda de duplicados.

La forma de prevenir el contenido duplicado y/o de arreglar esos duplicados es:

  • Usando el archivo robots.txt
  • Estando al loro del contenido duplicado que aparece en Google Webmaster Tools (ahora Search Console) controlando 2 reportes:
    • Aspecto de la búsqueda > Mejoras de HTML
    • Rastreo > Parámetros de URL

Si vamos desplegando los duplicados en Mejoras de HTML (guíate por “meta descripciones duplicadas”), iremos viendo los parámetros que causan dichos duplicados:

duplicados

Mismo caso para la sección “Parámetros de URL” que nos chivará aquellas URL que generan parámetros. Cuidadín que Google lo encuentra casi todo. Este es el aspecto del robots.txt de una web:

  • Disallow: /*tag=
  • Disallow: /*id_currency=
  • Disallow: /*search_query=
  • Disallow: /*id_lang=
  • Disallow: /*back=
  • Disallow: /*utm_source=
  • Disallow: /*utm_medium=
  • Disallow: /*utm_campaign=

Y este es el aspecto de Parámetros de URL de esa misma web:

parametros_url

 

 

Como bien indica la misma página de parámetros de URL “Ayuda a Google a rastrear tu sitio con mayor eficacia indicando cómo se deben gestionar los parámetros de tus URL“. Debes indicarle al buscador qué hacer con esas URLs, es decir, si indexarlas o no, ya que, por defecto, las indexará (si no están en el robots.txt). Dile si son relevantes o no para ti.

A través de los datos de estos dos informes podremos detectar duplicados por, por ejemplo:

  • Paginaciones
  • Quick views
  • Filtros (módulo navegación por facetas)
  • Addons de blog
  • Addons de atributos
  • Etc

¿De qué depende que tenga abiertos o no a indexación estos parámetros?

De si tienes bien definido tu robots.txt, de la versión de Prestashop (según la versión se crean algunos de ellos o no) y de los módulos que tengas activados o no.

Los parámetros que más duplicados suelen crear en Prestashop son

  • p: paginación
  • manufacturer_rewrite: que duplica la página de fabricante (por una parte tenemos la URL limpia y por otra la URL con ese parámetro)
  • content_only: que suele aparecer en links a páginas CMS donde se muestra la versión de texto a pelo, sin la carcasa de la web
  • quick_view: donde se muestra el preview del producto en una capa
  • selected_filters: donde el módulo de facetas crear todas las variaciones de atributos
  • module=smartblog + controller=category: los 2 parámetros que provocan duplicados en el addon de prestashop llamado “SmartBlog”
  • live_configurator_token = el parámetro que genera el live editor de Prestashop, ¡hay que caparlo!
  • Parámetros de ordenación de categoría: orderby, orderway, n (número de productos por página), id_category. Todos, junto con el primero de los parámetros que hemos visto (p) pueden combinarse entre si.
  • Parámetro de búsqueda en Prestashop: search_query
  • Tag, el módulo de etiquetas
  • Controller: prefijo de los controladores del core de Prestashop
  • id_currency, el módulo de monedas
  • id_lang, el parámetro de idioma, si la URLs no está pasada a friendly (por ejemplo, id_lang=3 es el español, en friendly sería /es/)
  • back, instrucción de volver atrás
  • utm_source, utm_medium, utm_campaign, los 3 parámetros del URL builder de Google para trackear campañas
  • El festival de no capar la página de carrito de la compra y checkout, crea los parámetros:
    • add
    • id_product
    • ipa
    • token
    • todos pueden combinarse entre si
  • Otros parámetros: si decides abrirlo todo, otros parámetros que pueden crearte duplicados son:
    • id_employee, theme, id_shop (id de la tienda, creado por live configurator, todos pueden combinarse entre si)
    • f (creado por módulos de paginación)
    • pag (creado por módulos de paginación)
    • nosto (módulo nosto)

¿Cómo bloqueo estos parámetros?

A través del fichero robots.txt, que tendrás que editar a mano.

Algunos de estos parámetros ya vienen desactivados por defecto en Prestashop.

Repásalos y ten en cuenta que el archivo robots.txt no se genera solo (ergo, por defecto está todo abierto), tienes que generarlo tú a través de Preferencias > SEO + URLs. Al final de la página están las opciones de robots.txt que, básicamente, son crear o no el archivo xD

prestashop-robotstxt

Una vez hecho esto, el archivo robots.txt se genera en la raíz de tudominio.com/robots.txt

Recapitulación de parámetros enseñados en este post

Y que deberías valorar capar si te están duplicando URLs (no todos están en todos los prestashops):

  • add
  • back
  • content_only
  • controller
  • f
  • id_category
  • id_currency
  • id_employee
  • id_lang
  • id_product
  • id_shop
  • ipa
  • live_configurator_token
  • manufacturer_rewrite
  • module
  • n
  • nosto
  • orderby
  • orderway
  • p
  • pag
  • quick_view
  • search_query
  • selected_filters
  • tag
  • theme
  • token
  • utm_campaign
  • utm_medium
  • utm_source

Para caparlos en robots.txt. Advertencia: NI SE TE OCURRA copiar y pegar esto en tu robots.txt sin saber antes si quieres indexar o no esos parámetros porque puedes liar pollos como para montar una granja.

  • Disallow: /* add=
  • Disallow: /* back=
  • Disallow: /* content_only=
  • Disallow: /* controller=
  • Disallow: /* f=
  • Disallow: /* id_category=
  • Disallow: /* id_currency=
  • Disallow: /* id_employee=
  • Disallow: /* id_lang=
  • Disallow: /* id_product=
  • Disallow: /* id_shop=
  • Disallow: /* ipa=
  • Disallow: /* live_configurator_token=
  • Disallow: /* manufacturer_rewrite=
  • Disallow: /* module=
  • Disallow: /* n=
  • Disallow: /* nosto=
  • Disallow: /* orderby=
  • Disallow: /* orderway=
  • Disallow: /* p=
  • Disallow: /* pag=
  • Disallow: /* quick_view=
  • Disallow: /* search_query=
  • Disallow: /* selected_filters=
  • Disallow: /* tag=
  • Disallow: /* theme=
  • Disallow: /* token=
  • Disallow: /* utm_campaign=
  • Disallow: /* utm_medium=
  • Disallow: /* utm_source=

 

Tweet about this on Twitter2Share on LinkedIn14Email this to someoneShare on Google+0
1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (5 promedio de votos: 4,60 sobre 5)
Loading...