Cómo detectar el contenido duplicado en tu web

¿Tienes un blog, tienes una página web? Entonces, tienes contenido duplicado. Sí, ya sé que tú cuidas mucho tus textos. Estoy convencida de que redactas con tu propio estilo, porque eso de copiar es muy feo.

Pero, por desgracia, todas las personas que tenemos un blog, una página web, tenemos contenido duplicado. Ojo, esto no es lo mismo que tener contenido plagiado. Ahora te explicaré la diferencia.

Voy a enseñarte a detectar contenido duplicado que puedas tener en tu sitio web, y cómo puedes corregir esto, ¿me acompañas?

Derechos de autor

Qué es el contenido duplicado

El contenido duplicado no es otra cosa que una cantidad importante de fragmentos de un texto que aparece en varios dominios a la vez, bien a través de una copia literal del contenido, bien manteniendo coincidencias bastante similares.

Lo más habitual es que ni siquiera seas consciente de esto que te estoy contando. Incluso, es posible que sufras contenido duplicado dentro de tu propia página web.

Debes tener cuidado con esto para evitar posibles penalizaciones de Google. Tengo que decirte que Google sabe detectar cuándo tienes contenido duplicado sin mala intención. En principio no te penalizará por ello, pero te aconsejo que trates de corregir estos errores para que interprete que vas por el buen camino.

Buscando el contenido duplicado

Porque, cuando alguien llega y te copia tu contenido, generalmente un spammer, está infringiendo un delito. Hay mucha gente que piensa que como Internet es gratis todo vale. Y no, no todo vale; coger un texto que no es tuyo, traértelo a tu web y no mencionar a su autor es un delito que se llama plagio. Y en casi todos los países del mundo está penado con multas considerables.

Google sabe que esto puede pasar, y en la modificación de su algoritmo diseñó Google Panda con el fin de detectar y terminar con este problema.

Es verdad que cuando lees algún blog que te habla de SEO casi nunca encuentras un apartado donde te advierten de la importancia de comprobar la duplicidad de tus contenidos. Algo que, por otro lado, resulta de vital importancia para cuidar la SEOsalud de tu blog o página web.

6 Consejos para evitar el contenido duplicado en tu sitio web

La verdad es que no es nada sencillo detectar el contenido duplicado que puedas tener dentro de tu página web, especialmente si no eres un profesional del SEO.

Voy a darte unas pautas para que evites la aparición del temido contenido duplicado dentro de tu página web.

1. Establece el dominio preferido

El dominio preferido es el que quieres utilizar para indexar las páginas de tu sitio web. Es lo que también se llama el “dominio canónico”.

Los enlaces se pueden dirigir a tu página web con o sin “www.” de la URL. Tú decides cómo quieres que se utilice tu web en los resultados de búsqueda.

Mi consejo es que agregues las dos opciones para que Google no malinterprete los datos cada vez que realice un rastreo en tu página web. Te lo explico con un ejemplo: supón que tú prefieres que te encuentren por el dominio https://tudominio.com en lugar de https://www.tudominio.com.

Para evitar problemas con el rastreo de tu página, debes añadir los dos dominios a pesar de que pongas uno como dominio canónico.

Esto lo haces desde la configuración del sitio en Google Search Console.

El dominio canónico

Imagina que el dominio de tu página web es hoyeslunes.com. Si tú quieres que la URL canónica sea hoyeslunes.com, para comprobar que la otra URL, www.hoyeslunes.com, funciona, tienes que poner esto en el buscador de Google:

Comprobación de URL canónica

Es decir, tienes que introducir la URL no canónica. El resultado te llevará a tu dominio canónico, es decir, a hoyeslunes.com.

2. Cuidado con las etiquetas

Al contrario de lo que piensa mucha gente, las etiquetas no te ayudan en el posicionamiento de tu página web o blog. Yo te aconsejo que solo las utilices cuando sea necesario.

Un consejo, define entre 25 y 50 etiquetas relacionadas con tu marketing de contenidos. Pero, por favor, no caigas en el error de tener un amplio listado de etiquetas con uno o dos posts por cada una de ellas.

Así que, si lo tienes clarísimo, evita utilizarlas y así te ahorrarás la posibilidad de generar contenido duplicado en tu sitio web.

3. Atención a las categorías

Cuando defines las categorías de tu página web, también tienes que asignar a cada una de ellas un meta title y una meta description. Exactamente igual que cuando publicas un artículo o un post.

Otro aspecto importante que debes cuidar es la descripción de cada categoría. Es muy frecuente que la gente no le dé importancia a estos detalles; y de repente un día se encuentran con que en su página web está llena de contenidos iguales.

También corres el riesgo de sufrir contenido duplicado en las páginas de una misma categoría. Para evitar este error puedes utilizar los atributos de HTML rel=”next” y rel=”prev”; es lo que se conoce como contenido paginado y el objetivo está en indicar la relación que existe entre algunas URLs concretas.

4. Meta Title y Meta Description

Cuando creas contenido para tu web o blog tienes que tener mucho cuidado con la información que pones tanto en el meta title como en la meta description. Debes crear contenidos únicos en estos dos apartados para cada texto que publicas.

El meta title y la meta description

En este artículo del blog ya te hablé de la importancia de hacer un SEO y un copy impecables. Mucha gente olvida esta parte, probablemente por desconocimiento. Y al final es bastante habitual encontrar contenidos idénticos en ambos campos para URLs diferentes; algo totalmente desaconsejable.

5. No copies contenido de otras web

Sí, a todos nos pasa que cuando estamos haciendo curación de contenido encontramos textos muy atractivos y explícitos sobre lo que queremos hablar.

Pero no te aconsejo que hagas un copy/paste sin citar la fuente desde donde has cogido ese texto. ¿Te gustaría que alguien lo hiciera contigo?

Si no quieres citar la fuente, entonces cambia todo el sentido al texto sin desviarte del contenido y lo que deseas contar. ¡Hazlo tuyo!, al fin y al cabo tú nunca escribirás de igual manera que otros redactores o copys, ¿no te parece?

6. Pon en nofollow todo el contenido irrelevante

Una manera de reducir el riesgo de generar contenido duplicado es no indexar los contenidos de tu web que son poco relevantes.

no follow

Además, algo muy importante que debes tener en cuenta es que si tú eres el único editor de tu blog y no marcas “noindex, follow” en la casilla de autor, estás generando contenido duplicado. Tienes que decirle a Google que no indexe esta página marcando la casilla que te he comentado.

Causas que pueden generar contenido duplicado fuera de tu web

También puedes encontrarte con este problema en casos como estos:

  1. Localización: ocurre cuando escribes el mismo contenido en varias páginas diferentes. Por ejemplo, cuando tienes varias páginas con los dominios de cada país, .es, .mx, y escribes el mismo contenido en todas, o muy parecido, puedes tener problemas de duplicidad.
  2. Sindicación: esto es bastante habitual. Ocurre cuando envías tus contenidos a otros sitios con la intención de promocionarlos para atraer tráfico. El ejemplo más claro lo tenemos en las Redes Sociales, donde tú envías el contenido y lo publican completo en lugar de seleccionar un fragmento.
  3. Plagio: este es el caso más descarado e irrespetuoso que puedes sufrir. Ocurre cuando alguien te copia todo tu contenido y lo publica en otras webs.

Si alguna vez eres víctima de plagio te aconsejo lo siguiente. En primer lugar, ponte en contacto con la web que te ha plagiado para pedirles que lo retiren; puede ser que no se hayan dado cuenta.

En caso de no obtener una respuesta positiva, envía una solicitud directamente a Google pidiendo la retirada del contenido que te han plagiado. Aquí tienes el acceso al sitio desde donde puedes enviar esa solicitud.

Cómo puedes comprobar el contenido duplicado en tu web

Supongo que después de llegar hasta aquí, lo primero que estarás pensando es cómo saber si tengo contenido duplicado.

Para poder detectarlo es necesario que te ayudes de una serie de herramientas sencillas que te harán un diagnóstico de cómo tienes tus contenidos.

Veamos algunas de ellas.

Es la mejor herramienta que te indicará cualquier anomalía en la duplicidad de tus contenidos. Te aconsejo que cuando quieras comprobar si tienes contenido duplicado en tu página web, comiences por Google Search Console.

Una vez que abres la aplicación debes dirigirte a Aparición en búsquedas y después Mejoras en HTML. Si va todo bien, verás un mensaje como este:

Google Search Console

Esta herramienta es una de las más completas que puedes encontrar a la hora de analizar y detectar contenidos duplicados y errores en tu blog.

Tiene una versión free que te permite analizar hasta 500 URLs. Las variables que te interesan son URI, Page Titles, Meta Description y H1. Todo esto te saldrá cuando utilizas el filtro Duplicate.

Aplicación Screaming Frog

Es otra herramienta gratuita muy útil para un primer vistazo en la investigación de tu contenido duplicado.

Cuando introduces la URL de tu página web te devuelve el análisis de estos siete aspectos básicos que debe cumplir tu blog para no tener duplicado el contenido.

Aplicación Hive Digital

Por ejemplo, si la primera opción Header Check saliera con un aspa rojo, significa que esta página web no tiene la URL canónica. Es lo primero que tendrías que hacer, tal y como te he comentado en este artículo de hoy.

Esta es una de las herramientas que más me gustan. En su versión free te permite analizar hasta 520 URLs diferentes.

Te facilita muchísima información de manera muy visual. Además, la propia herramienta te lleva hacia la página y te muestra el contenido que está duplicado. Créeme que esto es muy útil para dummies.

Herramienta Siteliner

Como ves, la página que analicé con esta herramienta tiene un 30% de contenido duplicado. Si haces clic para ver qué contenido es, te lleva a la página y te lo muestra con colores. Es muy visual, me gusta mucho.

Hay otras herramientas de analítica web bastante más complejas que también te facilitan esta información de la duplicidad en tus contenidos. Te proporcionan análisis muy completos donde puedes ver qué páginas no tienes indexadas, si tienes enlaces rotos, en fin, mucha más información difícil de detectar a primera visa.

Te estoy hablando de SEMrush, MOZ o Advanced Web Ranking entre otras.

Herramientas que te ayudan a saber si tienes contenido duplicado fuera de tu sitio web

Te dejo una muestra de herramientas que te ayudarán a comprobar si alguien te ha hecho plagio. Ya sabes que si te ocurre esto, mi consejo es que se lo hagas saber al webmaster de la página que te ha plagiado.

Y si no te hace caso, tienes todo el apoyo de Google para presentar una solicitud de retirada del contenido que te han plagiado. Porque, si no lo haces, ¿cómo te sentaría que Google eligiera a quien te ha copiado y lo pusiera en lo más alto del posicionamiento?

Cuando introduces tu web en el buscador de esta herramienta, te devolverá las páginas web que están plagiando tus contenidos. Te aconsejo que no dejes de lado la información que pueda facilitarte Copyscape porque puede llegar a ser negativo para ti.

Si Google detecta este tipo de contenido duplicado no sabrá determinar cuál de los dos es el original; y puede llegar a penalizarte a ti, que eres el auténtico dueño de ese contenido.

Por eso, si detectas plagio te aconsejo que, además de tratar de eliminarlo como te he explicado anteriormente, analices cada cierto tiempo los blogs o páginas web que ya te han plagiado. Porque puede que vuelvan a hacerlo.

Herramienta Copyscape

Esta aplicación online es muy conocida y utilizada en la búsqueda de contenido duplicado. Es muy útil porque puedes buscar un trozo de texto concreto, e incluso totalmente exacto. Y también te da información de una URL que tú le indiques.

Te aconsejo que la utilices alguna vez.

Aplicación Plagiarisma

Existen más aplicaciones que te ayudan a detectar plagio. Puedes utilizarlas como complementarias a las que he dejado hoy aquí, que son las que más conozco y he usado.

Pero con estas que te he comentado tienes un elevado porcentaje de éxito en caso de que estés siendo víctima de plagio.

¿Tú utilizas alguna herramienta que no he mencionado?, ¿qué tal te va?, ¿has sufrido plagio alguna vez? ¡Cuéntanos!