
¿Qué es el contenido duplicado y cómo evitarlo?
El contenido duplicado es uno de los grandes problemas de los motores de búsqueda como Google. El contenido duplicado existe cuando en diferentes URLs aparece contenido similar. Esto es un dolor de cabeza para Google o los motores de búsqueda similares porque no saben qué mostrarte, no saben qué es lo mejor para tu búsqueda en particular.
Tener contenido original en tu sitio es la mejor manera de mejorar la clasificación de las páginas y hacer que Google te quiera. Esta guía te ayudará a comprender qué es el contenido duplicado, cuáles son las causas del contenido duplicado y cómo resolver y prevenir estos problemas, para que puedas aplicar esta información a la estrategia de contenido de tu sitio web.
También te puede interesar:
¿Por qué tu web necesita contenido único?
Aunque hay muchos motivos por los que su web debe tener contenido original, las tres principales podrían ser:
- Mejores posibilidades de clasificación
- Mejor experiencia de usuario
- Conversiones de ventas
El contenido debe ser único para clasificar bien en los SERP; desde la perspectiva de la creación de contenido, es esencial que sepas qué es el contenido duplicado y qué implicaciones tiene para SEO.
Piensa en tu motor de búsqueda como una guía, está en un viaje y sabe a dónde quiere ir, lo describe en tu guía (Google) y te dará las mejores direcciones para llegar allí. Cuando duplicas contenido en diferentes URL, tu viaje tomará caminos ligeramente diferentes y terminará en lugares ligeramente diferentes. Y quizás, no en el mejor destino.
Desde el punto de vista de un investigador, esto no es tan malo, ya que obtienes la información que necesitas al fin y al cabo. Sin embargo, desde un punto de vista de marketing, esto es terrible. Tu artículo puede haber sido recogido por varios bloggers diferentes, algunos de ellos se han vinculado a una URL, mientras que otros se han vinculado a otra. Esto reduce tus posibilidades de obtener una alta calificación en un motor de búsqueda.
Principales causas del contenido duplicado
En esta sección encontrará información sobre las diferentes causas de contenido duplicado:
- Contenidos de proveedores
- Copia de contenido popular
- Mala interpretación de la URL
- Comentar paginación
- Versiones para imprimir en el sitio web
- Páginas de autor en blogs
Contenidos de proveedores
Existen varias causas para el contenido duplicado, pero el problema más común radica en los contenidos de los proveedores. Esto sucede cuando realizas la publicación de contenido (parcial) en sitios de terceros, a menudo practicados por vendedores, pero también por proveedores en la web.
Si gestionas una web de comercio electrónico, es probable que los productos que recibas de tu proveedor tengan descripciones de los productos proporcionados por el fabricante. De lo que puedes no ser consciente es que estas mismas descripciones de productos se han enviado a todos los sitios de comercio electrónico que utilizan el mismo proveedor que tú.
Este contenido duplicado llevará a una clasificación de página más baja para tu sitio, pero también a una tasa de conversión más baja cuando se trata de ventas. Tener descripciones de productos únicas y atractivas se convierte en más ventas para tu negocio.
Copia de contenido popular
Puede parecer una buena idea y una manera fácil de crear contenido para tu sitio, pedir prestado o usar información de un sitio popular que tiene muchas visitas para una búsqueda de Google. Sin embargo, el mayor problema con esto, aparte de las posibles infracciones de derechos de autor, es que no ofreces nada nuevo a sus lectores y, por lo tanto, no los involucras con tu temática.
Al proporcionar este contenido prestado sin información nueva, estás perdiendo a posibles clientes. Además, cuantas más personas utilicen este contenido adquirido y se vinculen a diferentes URL, más difícil será para tu motor de búsqueda crear una lista de resultados de búsqueda. La red enredada que crea este contenido duplicado causa problemas importantes para Google y, por lo tanto, para tu negocio. .
Mala interpretación de la URL
Otra causa frecuente de contenido duplicado es la mala interpretación de las URL por parte de los buscadores. Tanto los desarrolladores web, los motores de búsqueda, los proveedores como los propietarios de negocios hablan un idioma diferente, y esto a menudo dificulta la comunicación.
Los proveedores envían la misma descripción de producto a cada sitio de comercio electrónico en un lenguaje descriptivo y técnico que nada tiene que ver con lo que esperan encontrar tus clientes en tu web. Es función del gestor de la web escribir un contenido de valor y único para sus clientes.
Por otra parte, los motores de búsqueda también tiene su propio idioma y hay que optimizar el contenido también para ellos. Encontrar el equilibrio entre la satisfacción de los clientes y la optimización para los buscadores es la fórmula con la que conseguir el éxito empresarial.
Parámetros de URL
Los parámetros de URL utilizados para el seguimiento y la clasificación también crean enormes problemas para que su URL tenga un alto rango en las búsquedas en los motores de búsqueda. El uso de parámetros de URL causa una gran cantidad de contenido duplicado en su sitio.
Los parámetros de URL son parámetros cuyos valores se configuran automáticamente en la URL de un sitio que se obtienen por la plantilla y las fuentes de datos. Esto hace que las páginas sean increíblemente dinámicas, pero también crea ese contenido duplicado molesto. Si estás tratando de rastrear dónde un usuario hizo clic en tu sitio se recomienda usar una URL diferente a la original.
Lo que la mayoría de la gente no sabe es que esto causa confusión en el motor de búsqueda y por lo tanto hace que su clasificación sea más baja. Y esto es cierto para cualquier parámetro que coloque en su URL, cada pequeño cambio que realice para agregar otro parámetro crea otra página de contenido duplicado por la que está compitiendo dentro de un ranking de motores de búsqueda.
Parámetros activos que crean contenido duplicado
Hay algunos parámetros que se pueden encontrar con frecuencia, los Parámetros Activos, que pueden cambiar el contenido de tu página. Por ejemplo, si está ordenando por marca, género, tamaño, país o cualquier otro tipo. Cada vez que esto sucede, se crea contenido duplicado de esa página y, por lo tanto, se reduce su capacidad para posicionarse en Google. Estos parámetros se verían así:
- Clasificación (por ejemplo, sort = price_ascending): cambia el orden en el que se presenta el contenido.
- Reducción (por ejemplo, t-shirt_size = XS): filtra el contenido en la página.
- Especificación (por ejemplo, store = women): determina el conjunto de contenido que se muestra en una página.
- Traducción (por ejemplo, lang = fr): muestra una versión traducida del contenido.
- Paginación (por ejemplo, página = 2): muestra una página específica de un listado o artículo largo.
Parámetros pasivos que enmascaran contenido único
Los Parámetros pasivos, por otro lado, no tienen ningún efecto en cómo se ve su página web para el usuario, estos son a menudo parámetros que se usan para rastrear las visitas a su sitio, referencias de otros sitios web, pero no tienen forma de cambiar lo que aparece en la pantalla. Pueden verse así:
http://www.example.com/products/women/dresses?sessionid=12345
http://www.example.com/products/women/dresses?sessionid=34567
http://www.example.com/products/women/dresses?sessionid=34567&source=google.com
Los parámetros pasivos también pueden aparecer cuando los usuarios están agregando cosas a su carrito de compras. Es esencial que pueda realizar un seguimiento de los parámetros de URL y si están creando o no contenido duplicado en su sitio. Un recurso útil que puede utilizar es el Administrador de etiquetas de Google. Esta herramienta le permite realizar un seguimiento y mantenerse al día con los diferentes parámetros de URL que pueden estar afectando el estado de clasificación de su sitio web.
WWW vs. Non-WWW
Otro problema importante que puede enfrentar en su sitio web es www vs. el contenido que no es www. Cuando su sitio está disponible en ambos formularios, esto también crea problemas de contenido duplicado. Su contenido ya no es original porque se puede acceder a ambas versiones de su sitio.
Otras causas comunes de contenido duplicado
Como parte de la estrategia de contenido de tu sitio web debes evitar el contenido duplicado en tu sitio web, hay varias otras cosas que debes tener en cuenta como son la paginación de comentarios, las versiones para imprimir y las páginas de autor en los blogs.
Paginación de comentarios
En muchas plataformas de desarrollo de sitios web hay una opción para paginar los comentarios. Lo que esto significa que, nuevamente, produces contenido duplicado. Por ejemplo, tendrás tus artículos, URL más / comment-page-1 /, + / comment-page-2 / etc.
Versiones amigables para imprimir
Las versiones amigables para la impresora de su sitio web también son una forma molesta y menos conocida para confundir a los motores de búsqueda con contenido duplicado. Puedes tomar medidas para que Google no encuentre estas versiones, con esto debería de bastar para eliminar el problema de contenido duplicado.
Archivo del Autor
Los archivos de autor y los archivos basados en fecha también son un problema para el contenido duplicado porque tienen el mismo contenido que la página de inicio. La forma de evitar esto es agregar una etiqueta «noindex» en el archivo del autor y en los archivos basados en la fecha.
Resolviendo el problema de contenido duplicado
El contenido duplicado se puede crear deliberadamente, debido a una interferencia externa, o por accidente por parte de su desarrollador web. Cualquiera que sea la razón es que el resultado es el: un motor de búsqueda confuso y un ranking de páginas más bajo. Las situaciones, como la creación accidental de contenido duplicado, se enumeran a continuación y se pueden corregir fácilmente:
Correcciones fáciles para contenido duplicado (lista de verificación)
- ID de sesión: simplemente desactive esta opción en la configuración de su sistema.
- Códigos de afiliación: en la mayoría de los casos, puede utilizar el seguimiento basado en hashtag en lugar del seguimiento basado en parámetros.
- Versiones amigables para la impresora: completamente innecesarias y en su lugar, solo debe imprimir una hoja de estilo.
- Paginación de comentarios: esta configuración se puede desactivar en Configuración – Discusión y solucionará la mayoría de sus problemas.
- Dominios: los antiguos sitios web de WWW y no WWW, ¡la respuesta simple es simplemente elegir uno! También puede establecer una preferencia en las Herramientas para webmasters de Google, pero necesitará ambas versiones del nombre de dominio.
Ya sea que sus problemas se solucionen fácilmente o no, es una buena idea usar esto como una guía o lista de verificación de las cosas que debe hacer en su página web, ya que le permitirá evitar el contenido duplicado.
Solución: una URL «canonical»
El hecho de que varias URL lleven al mismo contenido es un problema importante, pero se puede resolver fácilmente. Para resolver este problema, tienes que crear una URL canónica.
Hay varios pasos que puede seguir para definir una URL canónica para su sitio o contenido. Puede hacer esto para las búsquedas de Google de las siguientes maneras.
- Seleccione y use consistentemente su dominio preferido.
- Use un Sitemap para asegurarse de que el mismo contenido tenga su URL preferida.
- Use 301 redirecciones para cualquier URL que sea canónica.
- Determinar cómo manejar los parámetros dinámicos.
- Seleccione y especifique el enlace canónico en su encabezado HTTP.
- Utilice HTTPS en lugar de HTTP para enlaces canónicos
Soluciones prácticas
Identificación de problemas de contenido duplicado
Una de las preocupaciones más importantes a las que se enfrentan los propietarios de un sitio web es el hecho de que pueden no saber si tienen problemas de contenido duplicado.
Sin embargo, hay formas de averiguar si la información en su sitio es contenido duplicado. Las Herramientas para webmasters de Google son una forma de buscar, al igual que hacer una búsqueda de título o fragmento de su contenido original.
Evitar / corregir el contenido duplicado
Puedes evitar el contenido duplicado con herramientas profesional de pago o gratuitas. Al usar estas herramientas para crear tu contenido abolirás este tipo de contenido.
Cada texto escrito que escriban tus redactores debes pasarlo por un escaneo de plagio antes de editarlo. Esto asegura que cada texto sea único.
Si se encuentra texto copiado se puede volver a escribir esos textos. A continuación, para hacer que el texto sea único, también se debe optimizar para SEO.
301 Redireccionando
En algunos casos, no es posible detener la creación de URL incorrectas y contenido duplicado.
Sin embargo, si encuentras que hay una página con contenido duplicado que no puedes eliminar, deberás redirigirla a la URL canónica adecuada.
Último recurso: enlace al contenido original
Contenido original y enlace hacia atrás: si no puede realizar ninguna de las soluciones anteriores porque no tienes la experiencia, puedes volver al artículo original en la parte superior o inferior del artículo.
Podría ser algo que haces en el feed RSS. Si Google encuentra diferentes enlaces que apuntan a tu artículo, entenderá rápidamente que la tuya es la versión canónica del artículo.
Buscando Título o Fragmentos
El uso de un buscador puede ayudarte a detectar contenido duplicado. Hay bastantes buscadores que son bastante útiles para encontrar palabras clave duplicadas particulares. Todo lo que tienes que hacer es escribir la siguiente frase en Google:
Sitio: example.com intitle: «Keyword X»
El uso de comillas dobles garantizará que Google busque la frase exacta que escribió en el cuadro de búsqueda.
Luego, Google resaltará todas las páginas que contengan la palabra clave o frase en particular que ingresó. Cuanto más precisa sea la oración, más fácil será eliminar el contenido duplicado. A veces incluso vale la pena buscar algunas oraciones completas desde tu página.
Herramientas para detectar el contenido duplicado
Hay una gran infinidad de herramientas tanto de pago como gratuitas en la red, aquí algunas de las más fiables:
- Copyleaks
- Siteliner
- Copyscape
- Small Seo Tools (Plagiarism Checker)
- Hive Digital Duplicate Content
- Google Search Console