El contenido duplicado es uno de los errores SEO más comunes. Ya sea en un blog, en un eCommerce o en cualquier tipo de sitio Web, el mismo supone un grave problema tanto para el posicionamiento de cara a Google como para la experiencia del los usuarios.
Aunque muchos aún cometen el error de infravalorar su importancia, la realidad es que la mayoría de buscadores persiguen y castigan estas duplicidades.
En la actualidad, tener páginas repetidas, contenidos a los que se puede acceder desde diferentes URLs o el simple hecho de copiar textos de otros lugares, podría acarrearte una posible sanción de Panda y lograr que tu Posicionamiento SEO caiga en picado.
Por ello, antes de mostrarte cómo detectarlo, quiero comenzar explicándote en detalle su definición y los efectos nocivos que este problema puede tener sobre la estrategia de visibilidad de tu sitio Web.
¿Qué es el contenido duplicado?
El contenido duplicado es cuando un texto se encuentra replicado parcial o totalmente en diferentes URLs, ya sean del mismo dominio o en otros sitios web diferentes.
Es decir, esto puede producirse tanto porque 2 URLs de diferentes sitios web poseen el mismo contenido, como por el resultado de repetir o duplicar los textos dentro de tu propias páginas.
En la mayoría de los casos, las replicas externas suelen suceder por culpa de la copia o el plagio. En cambio, el contenido duplicado interno se da cuando tengo más de una URL que conduce a la misma página o por la duplicidad de la información en nuestras páginas.
Se estima que un contenido se puede considerar como duplicado, cuando éste se encuentra literalmente ya publicado en al menos en un 30% en otra URL.
Por el contrario, el mismo es considerado original cuando aproximadamente más del 70% del texto no tiene una estructura literal idéntica a otro.
Sea como fuere, debes tener claro que replicar o copiar textos no está bien visto por ningún buscador.
Los motores de búsqueda como Google persiguen esta práctica. Además, el gran avance en sus algoritmos, ha provocado que cada vez sea más sencillo para él detectar dichas copia, diferenciándola del original.
¿Te pueden penalizar por estas duplicidades?
En la mayoría de los casos, el contenido duplicado, al igual que la canibalización de palabras clave, más que acarrearnos una penalización como tal, bajarán la calidad de nuestras páginas y reportarán una perdida de posiciones o desindexación de las mismas.
Eso sí, un sitio Web que abusa constantemente de estas prácticas será castigado o penalizado por Panda, que es el algoritmo de Google encargado de controlar estos temas.
¿Por qué el contenido duplicado afecta negativamente al posicionamiento Web?
Existen varias razones por las que la duplicidad de contenido y el SEO no se llevan nada bien:
► Reducirá tu tráfico web
Publicar contenido duplicado empezará por reducir las visitas que llegan a tu sitio. Esto echa por tierra todo el trabajo que hayas podido hacer en cuanto a, por ejemplo, el «Keyword Research» y búsqueda de palabras clave longtail, para posicionar adecuadamente tus artículos.
Y es que no importa cuánto te esfuerces, ya que este problema pesará mucho más que todo lo que puedas llegar a optimizar en tus páginas.
► Sufrirás desindexaciones de páginas
Posteriormente, los motores de búsqueda podrían desindexar alguna de tus URL’s.
Esto supondrá un golpe importante para tu posicionamiento, que no lograrás remontar con facilidad, incluso si dejas de publicar material copiado.
► Toda tu estrategia digital perderá fuerza
Si vas perdiendo la indexación de alguna de tus páginas, todo tu plan o estrategia que hayas planteado en un principio se resentirá, ya que no podrás contar con ellas para posicionarte ni lograr resultados.
De forma lenta pero segura, tu web perderá empuje, como un avión que ha perdido uno de sus motores.
► Puedes cabrear al Panda
Finalmente, debes saber que, si repites esta práctica durante demasiado tiempo, no sólo no estarás mejorando ningún aspecto de tu estrategia, sino que algoritmos como el de Panda podrían penalizar tu dominio por completo, dejándolo sin visibilidad.
En la práctica, esto supone casi desaparecer de Internet, que es obviamente todo lo contrario a lo que pretendías cuando comenzaste con tu negocio online.
Si te fijas, no hay estrategia de marketing o comunicación que pueda salvarte de semejante «castigo». Del mismo modo, por mucho que publiques contenido de calidad, con un SEO muy trabajado y estudiado, si gran parte del mismo es copiada, tu sitio caerá.
¿Por qué el contenido duplicado es perjudicial para el usuario o lector?
Ahora me gustaría analizar contigo esta situación desde el punto de vista del lector, es decir, cuando publicas contenido duplicado y éste se percata de ello:
Obviamente, también el que consume tus textos puede verse afectado de forma directa o indirecta.
Poniéndome en su lugar, quizás él haya visto la misma información en otros sitios de internet, o tal vez sea tu sitio el primer lugar al que llega para descubrir textos ya compartido en otras webs.
En esta situación, el factor que más se resintiría sería la experiencia del usuario. Pero además, estarás afectando a otros factores como:
1) Información poco fiable
Si varias personas publican lo mismo, se puede entender como que, al menos una de ellas está intentando engañar al visitante.
Esto es así porque significa que no se aplican filtros ni revisiones. Se publica sin contrastar, algo que siempre es indeseable cuando buscas contenido de calidad.
2) Perderán el interés por leerte
La lectura es repetitiva, es decir, que el visitante se aburrirá, porque percibe que lo que está viendo es algo a lo que ya accedió previamente.
3) Se genera un clima de desconfianza
Tu lector podría percatarse de que, si se copia, las partes implicadas no se preocupan lo suficiente por su contenido. Debido a esto, la retención será menor, así como las probabilidades de fidelizar a ese usuario dentro de tu estrategia de captación.
En todos estos escenarios has de considerar relevante que tu usuario se sentirá, como mínimo, defraudado.
Más allá de las penalizaciones que pueda imponer un motor de búsqueda de forma automática, las del usuario serán sin duda las que más consecuencias tengan.
¿Cuáles son las mejores herramientas para detectar (y evitar) contenido duplicado?
Como has visto, no existe un único formato, sino que podrías tener interés en resolver los problemas del contenido duplicado On-site o del que se genera en todo Internet (Off-site).
Entonces, para rastrear e identificar está duplicidades, o detectarlas inclusive antes de que las publiques en una web, puedes ayudarte de estas herramientas:
► SEMrush
A través de la auditoría de tu propio sitio, SEMrush te permite conocer esta interesante información de forma pormenorizada.
Lo puedes encontrar bajo el sufijo «Site Audit» y, tras esperar unos instantes, la herramienta te sacará un completo análisis del contenido de tu sitio.
► Screaming Frog
Esta potente herramienta te permite, además de analizar un dominio en busca de posibles mejoras en el SEO de sus etiquetas y de su estructura en general, rastrear la posibilidad de duplicidades de contenido.
Empleando el filtro «URL > Duplicate» de Screaming Frog podrás conocer qué páginas dentro de tu web están sufriendo este mal.
► Plagiarisma.net
Personalmente, Plagiarisma es una de las herramientas gratuitas para detectarlo que más uso, por su sencillez y efectividad a la hora de dar con duplicidades en Internet.
Su funcionamiento es muy sencillo y tiene 2 formas de usarlo:
- Buscar copiando y pegando el texto en cuestión en su buscador: aquí, si usas su versión gratuita, podrás añadir, en una misma búsqueda, un máximo de 2.000 palabras. Aún así, podrás copiar y pegar trozo a trozo todo el texto que quieras analizar.
- Sube tu archivo desde tu disco duro o desde drive: es una forma alternativa pero, según lo mires, bastante más cómoda. Sin embargo, si Plagiarisma detecta que el texto subido tiene más de 2.000 palabras, también te lo notificará.
► Siteliner
El funcionamiento de Siteliner es sencillo: simplemente debes introducir en su buscador la URL que «sospeches» que ha publicado contenido duplicado y ésta te dirá si, efectivamente, lo es.
En caso de que la respuesta sea afirmativa, podrás conocer qué párrafos o fragmentos del mismo lo son y en qué proporción.
► Virante Tools
Esta aplicación web es similar a la anterior. Pertenece a la compañía «Hive Digital», que dispone además de otras funcionalidades bastante interesantes de análisis web.
Con el buscador de Virante Tools podrás introducir la URL en cuestión y ver si existen otras anteriormente publicadas.
► Google Search Console
A través de la anteriormente llamada «Webmaster Tools» de Google, podrás también identificar este problema.
Tan sólo debes ir a la sección «Apariencia en el buscador > Mejoras de HTML» y ver si en la opción de «Etiquetas de títulos duplicados» tienes alguna anormalidad.
Puede ser que se repita el título en las paginaciones de tu blog, pero también que, al tener una web con varios años de antigüedad, hayas escrito 2 o más contenidos similares y Google lo haya detectado.
► Copyscape
Se trata de una herramienta muy usada por la mayoría de bloggers de marketing, al estar presente en numerosos listados. Pero, además de ser conocida, es también muy efectiva.
Una vez te registres en la plataforma de Copyscape, podrás analizar tu sitio en busca de URL’s de este tipo que debas arreglar.
► Plagium
A través de Plagium puedes hacer multitud de cosas en torno al problema del contenido duplicado: checkear URL’s de manera individual, comparar dos páginas para comprobar si Google los trataría como «duplicate content», etc.
Lo mejor de todo es que, si te registras gratuitamente, podrás subir directamente un fichero de texto en Word, PDF, etc. y la herramienta lo analizará y comparará con lo que ya hay publicado en la web.
Truco: consejo extra para detectar copias
Recuerda que, en todo lo referente al contenido duplicado, no se trata simplemente de pasar una herramienta para detectar este problema y olvidarse para siempre, sino que es positivo (y conveniente) que realices un seguimiento periódico de este tema en tu sitio Web con cierta regularidad.
Sea como fuere, me gustaría terminar con un pequeño «truco» para identificar desde el buscador si un determinado fragmento ha sido publicado por otra web.
Tienes la posibilidad de escribir ese fragmento entre comillas en Google. Esto te mostrará cualquier resultado indexado que repita esa misma estructura, ¡que no es poco!
De esta manera, y sin necesitar ninguna herramienta externa, podrías conocer si el trozo de texto que «sospechas» que puede estar usándose en otro sitio, está ya publicado externamente.
Veamos un ejemplo práctico
Ahora, déjame que te lo muestre con un ejemplo práctico.
Tomamos un fragmento de la definición de la herramienta SEMrush que realice en una guía de mi blog (josefacchin.com/semrush) y lo buscamos «entre comillas» en Google (como en la anterior imagen).
Al mirar los diferentes Rich Snippets en la página de resultados, nos encontramos con dicha guía en el 1º resultado orgánico, pero con otros tantos contenidos que han utilizado mis textos en sus presentaciones o artículos del blog.
En este caso, para mi no es muy perjudicial a nivel de posicionamiento, ya que Google me toma como el primero y principal para esa búsqueda.
¿Peligroso? En teoría, NO mucho. Teniendo en cuenta la autoridad de mi blog y que por lo visto yo he indexado el primero para esta búsqueda en concreto… Son los demás textos los que pierden su calidad y originalidad para el buscador al quedar como copias del mío.
Es aquí, en donde podemos sacar una pequeña conclusión: si tienes problemas con otros sitios que copian tus artículos, cada ves que los publiques uno nuevo pide en Search Console que el mismo sea indexado cuanto antes.
Conclusión
El contenido duplicado, como has podido aprender hoy, podría arruinar toda tu estrategia SEO. Podría ser algo más benevolente, pero ciertamente el tema es así.
A modo de cierre, es positivo que tengas muy presente que los motores de búsqueda detectan cualquier texto previamente publicado e indexado.
Si ciertas ideas, citas o pequeños fragmento están presentes en otras páginas web, en teoría no pasará nada, pero si la cosa aumenta en un alto “porcentaje” al texto total, las alarmas se dispararán. Y con ello, los posibles castigos por parte de los buscadores.
Para evitar males mayores, realiza auditorías con regularidad, y saca partido a las muchas herramientas de las que dispones para detectarlo On y Off-site.
¿Has tenido alguna vez contenido duplicado en tu sitio? ¿Cómo lo solucionaste?
Imágenes principales (Cloning machine) propiedad de Shutterstock.
Hagas lo que hagas, ¡evita copiar! Es imposible que tu proyecto triunfe con esa estrategia, por mucho que trabajes tu Posicionamiento On-page.
También te puede interesar:
pilar
Posted at 11:24h, 08 octubreHola, dos dominios con distinta extensión un .es y un .shop cada uno en un idioma diferente, pero las mismas fotos. Lo que variaría sería el texto en otro idioma ¿se consideraría duplicado? Gracias