Detecta Contenido duplicado en tu blog o sitio web


Cómo detectar el contenido duplicado en un sitio web



El contenido duplicado determina el grado de posicionamiento que da google a nuestra paginas, Por lo tanto si el contenido es original no brinda mayoy posibilidad a la hora de aparecer en los buscadores.

Copyspace




Contenido duplicado “in-site”
Por otro lado el contenido duplicado “inter-sites” es aquel contenido idéntico en varios sitios web. Es en esencia contenido copiado, contenido sindicado o contenido extraído de bases de datos, publicado en varias páginas de sitios web diferentes. Con la herramienta  podemos detectar, dada una URL de nuestro site, otros sitios web donde han copiado su contenido.
Puede ser que otra copia el contenido de su sitio web o blog, y su posición está en peligro por ellas. Para verlo, puede Copyscape, una herramienta en línea que la web en busca de sitios con idéntica o muy similar a su contenido web (es la versión gratuita hasta diez resultados) Creeps uso

Si encuenta sitios de terceros, la replicación de su contenido, se puede contactar con ellos señalando, ellos eliminado o conseguirlos de Google utilizando el formulario oficial que tienen para ellos.

 (si no lo tienes consulta nuestra agenda para asistir a uno de los talleres sobre el tema o pasa por tu Centro SAT más cercano), puedes hacer la comprobación de forma sencilla:
  • En la sección "Aspecto de la búsqueda", haz clic en "Mejoras HTML" podremos ver si tenemos etiquetas de título o metadescripciones duplicadas. Aunque a veces la duplicidad puede ser de la etiqueta y no del contenido, es conveniente revisar las páginas que aparecen alli.
Contenido duplicado con Google Webmaster Tools
Haz una búsqueda en Google utilizando el comando site:
  • Teclea en la barra de búsqueda de Google el nombre exacto de uno de tus productos o servicios, seguido de un espacio y el texto "site:www.miempresa.es" (cambia www.miempresa.es por la dirección de tu web). Si aparece más de una URL en la que se muestra información de ese producto, tienes contenido duplicado.
En ambos casos el contenido duplicado es un factor que resta el posicionamientode un sitio web. Siempre ha sido un factor SEO, pero recientemente ha cobrado más protagonismo en el algoritmo de Google con la última actualización de este buscador: El Google Panda Update.
Al contenido duplicado dentro del propio sitio web se le debe dar un correcto tratamiento SEO puesto que supone disponer de varias URL con el mismo contenido, y esto puede perjudicar el posicionamiento de nuestro site por varias razones, entre ellas:
-          Google encuentra varias URL con el mismo contenido y no sabe discernircuál de esas URL debe posicionar mejor.
-          Gooogle no quiere “ensuciar” su índice con todas esas URLs.
-          Todas esas URL con el mismo contenido y las mismas palabras clave pueden llevar a pensar a Google que queremos engañarle para que nos posicione mejor porque tenemos varias páginas  sobre un mismo tema o keyword.
-          Esas páginas entran en competencia y canivalización dentro del propio site porque son diferentes URLs sobre la misma keyword.
El contenido duplicado “in-site” no solo se puede producir a nivel del propiocontenido textual, también en títulos y meta etiquetas “meta description”, imágenes o vídeos.
En este post me gustaría explicaros algunas técnicas para identificar este contenido duplicado, para después darle un correcto tratamiento SEO.
PASO 1 para identificar Contenido Duplicado: Comando site
-          Dominio con y sin www.: Si a tu sitio web se puede acceder con el nombre del dominio por ejemplo http://www.zoiseo.es y http://zoiseo.es tienes un problema de contenido duplicado.
Con el comando site: en Google podemos ver si existen indexadas páginas de ambas versiones del site.
Acompañando este comando de –www podremos extraer las páginas indexadas sin el dominio con www.
Contenido duplicado en un site sin www. en el dominio
Contenido duplicado en un site sin www. en el dominio
El comando –www también nos mostrará subdominios del dominio principal. Es posible que en estos subdominios también podamos encontrar contenido duplicado.
-          Variables  o parámetros dinámicos en la URL: Los parámetros dinámicos en URL pueden ocasionar que algunos elementos de contenido de la página con un parámetro X sean idénticos (por tanto duplicados) en la misma página con parámetro Y
Página web indexada con parámetros dinámicos
Página web indexada con parámetros dinámicos
Podemos detectar si las URL con parámetros están indexadas por Google añadiendo al comando site: inurl:[nombre_del_parámetro]
Detección de páginas indexadas con parámetros dinámicos
Detección de páginas indexadas con parámetros dinámicos
-          Si sospechamos que un contenido concreto lo hemos duplicado podemos comprobar si está indexado en Google con site: y entre comillas poner un extracto del texto en cuestión

Dos páginas con contenido duplicado
Tras esto podemos utilizar esta herramienta de WebConfs para ver el grado de duplicidad de contenido entre dos URL.
PASO 2 para detectar Contenido Duplicado: Google Webmaster Tools
-          Como indicaba antes, para Google los títulos y meta descripciones también son contenido duplicado. Por eso podemos echar mano de esta herramienta para detectar aquellas páginas con este problema.

Identificación de etiquetas duplicadas con Google Webmaster Tools

Entrando en detalle podremos encontrar la causa de esta etiquetas duplicadas. En este caso se debe a un parámetro sobre la URL que Google indexa.

Identificación de las URL con títulos y descripciones duplicadas con GWT


PASO 3 para detectar Contenido Duplicado: Xenu Link Sleuth
-          Esta herramienta que todo especialista SEO debería conocer rastrea un sitio web y nos proporciona, entre otros muchos datos,  información sobre posible URL con títulos duplicados.
Lo aconsejable es descargarse el informe de resultados a una hoja de Excel para poder trabajar mejor. En este caso vemos que existen enlaces a las urls con el parámetro “replytocom” por tanto este programita las rastrea y nos las presenta.

Utilización de Xenu para identificar contenido duplicado
No obstante, esto no quiere decir que tengamos un problema de contenido duplicado, un vistazo a este parámetro a través del comando site: nos demuestra que Google no indexa estas URL.
Comando site: para detectar páginas indexadas
No todas las URL que presenta Xenu están indexadas por Google y por tanto suponen un problema de contenido duplicado

PASO 4 para detectar Contenido Duplicado: Google Analytics
-          Después de seleccionar un período bastante amplio de tiempo, nos proponemos ver las páginas de destino del site.
Selección de páginas de destino
Selección de páginas de destino
-          Después seleccionamos que deseamos mostrar el título de la página. Una vez hecho esto, ordenamos los títulos de las páginas alfabéticamente.
Selección de títulos de las páginas de destino
Selección de títulos de las páginas de destino
-          Incluimos una dimensión secundaria: La página de destino, para poder ver la URL a la que hace referencia cada título de página.
Dimensión secundaria: página de destino para obtener la URL
Dimensión secundaria: página de destino para obtener la URL

-          Mostramos el máximo posible de filas (500). Después nos vamos a la URL de Google Analytics y cambiamos el 500 de “explorer-table.rowCount%3D500%” por el número de filas que nos interese mostrar, por ejemplo 1000.
-          Ahora que tenemos un buen número de filas sobre las que trabajar,exportamos a una hoja de Excel CSV los datos para poder filtrar más cómodamente en Excel y detectar los títulos duplicados.
Detección de títulos o páginas con contenido duplicado a través de Google Analytics
Detección de títulos o páginas con contenido duplicado a través de Google Analytics
Espero que os hayan resultado útiles estos consejos. En este post explico lasformas de tratamiento para solucionar el contenido duplicado.


SHARE

Oscar perez

Arquitecto especialista en gestion de proyectos si necesitas desarrollar algun proyecto en Bogota contactame en el 3006825874 o visita mi pagina en www.arquitectobogota.tk

  • Image
  • Image
  • Image
  • Image
  • Image
    Blogger Comment
    Facebook Comment

1 comentarios:

  1. Recoméndolles probar SiteAnalyzer - un programa gratuito de auditoría e análise técnica do sitio. Ao mesmo tempo, o conxunto de funcións non é prácticamente inferior ás contrapartes pagadas - https://site-analyzer.pro/

    ResponderEliminar