Skip to main content

Cosa sono i contenuti duplicati

Una definizione precisa non c’è. Ma in parole semplici possiamo definire i contenuti duplicati come un contenuto identico o molto simile riproposto su più pagine di un sito web o su più siti web esterni.

La guida ufficiale di Google Search Console si esprime in merito così:

Il termine “contenuti duplicati” si riferisce in genere a blocchi considerevoli di contenuti all’interno o tra i domini che sono identici o molto simili. In genere questa pratica non è all’origine ingannevole.

Guida ufficiale Google sui contenuti duplicati

Esempio pratico: si presenta una situazione di contenuti duplicati quando abbiamo sulla stessa pagina una porzione di testo oppure delle immagini che sono già presenti in altri siti web o in altre pagine del nostro sito web.

Precisazione: un contenuto può essere considerato duplicato anche se al suo interno presenta solo una leggera modifica di testo con sinonimi diversi o termini diversi. Non vengono considerati invece come contenuti duplicati tutti quei testi che sono riscritti in lingua diversa dall’originale.

Perché i contenuti duplicati sono considerati un errore SEO

I contenuti duplicati non sono considerati un vero e proprio errore SEO, ma se vengono riscontrati dagli algoritmi dei motori di ricerca in modo frequente, possono influire negativamente sul ranking del sito web nelle SERP.

I motivi principali di questa penalizzazione sono i seguenti:

  • Il primo motivo è che Google se riscontra due contenuti simili avrà difficoltà a stabilire qual è il contenuto più pertinente da posizionare.
  • Il secondo motivo riguarda la navigazione e l’esperienza utente. Infatti leggere un sito web che presenta al suo interno dei contenuti duplicati, per l’utente finale non crea un valore aggiunto e danneggiano la reputazione e l’autorità del sito web.
  • Il terzo motivo è che i contenuti duplicati sprecano inutilmente il crawl budget concesso dal Googlebot per il nostro sito web.
  • Il quarto motivo è che avere dei contenuti duplicati all’interno del sito web viola le policy di Google Adsense Publisher precludendo così la possibilità in un futuro di guadagnare dai banner pubblicitari di della rete display di Google Ads.

La causa che provocano contenuti duplicati sul sito web

Perché si creano i contenuti duplicati su un sito? Quali sono le cause principali che causano questa problematica? Vediamo insieme quali sono le cause:

1. Versioni diverse del sito 

Un errore tecnico, principalmente causato dal webmaster, che crea involontariamente una duplicazione completa del sito web.

Questa casistica si verifica ad esempio quando si hanno delle url con e senza prefisso www, oppure quando si effettua il passaggio da http a https.

Esempi di versioni differenti con www senza www, http e https:

https://www.tuodominio.it/
https://tuodominio.it/
http://www.tuodominio.it/
http://tuodominio.it

2. Varianti di maiuscole/minuscole negli URL

Anche gli URL che comprendono minuscole e maiuscole possono essere considerati contenuti duplicati da Google.

Si verifica, ad esempio, quando abbiamo due URL che rimandano alla stessa pagina e rappresentano lo stesso contenuto.

Esempi di URL con varianti maiuscole e minuscole:

https://www.tuodominio.it/url-a/
https://www.tuodominio.it/URL-A/

3. Parametri URL

I parametri URL di monitoraggio, se non gestiti correttamente, possono causare un errore di duplicazione contenuti.

Esempi di parametri URL:

https://www.tuodominio.it/borsello?type=borsa
https://www.tuodominio.it/borsello?source=google

4. Contenuti scarni (thin content) 

Ovvero, tutti quei contenuti che sono scarni di testo o che presentano elementi già presenti in altre pagine del sito.

Principalmente, un contenuto thin content si può definire tale quando il contenuto di una pagina non porta nessun valore aggiunto per l’utente finale e si limita a copiare altri elementi già presenti su altre URL.

Se usiamo ad esempio WordPress come CMS, i contenuti che possono essere classificati come thin content sono le pagine: “tag”, “autori” e “date”.

5. Boilerplate content 

Anche il boilerplate content (testi presenti nell’header, nel footer e nella sidebar) può creare una problematica di contenuti duplicati se non gestito correttamente.

Per molti siti web, infatti, l’header e il footer sono una parte fondamentale della navigazione utente, in quanto rappresentano una buona parte del testo on-page di una pagina.

Come individuare i contenuti duplicati 

Sono disponibili molti strumenti utili per l’individuazione dei contenuti duplicati all’interno di un sito.

Questi strumenti aiutano a effettuare un controllo generale e consentono di intervenire tempestivamente in caso di duplicazione di testi sul sito.

Come SEO specialist, possiamo fare affidamento a molti software online che possono aiutarci a risolvere questo problema. Eccone alcuni:

Strumenti per individuare contenuti duplicati interni al sito web

Siteliner

Il tool Siteliner permette di individuare tutti i contenuti all’interno di un sito in modo semplice e reattivo.

Per farlo, basta accedere al sito, inserire l’URL del tuo dominio e avviare la scansione.

Una volta completata la scansione, il tool mostrerà una schermata con i risultati ottenuti dalla scansione.

Screaming frog

Se si è invece più smanettoni e si vuole effettuare una scansione più approfondita, si può utilizzare il software Screaming Frog.

Attraverso una funzione dedicata all’individuazione dei contenuti duplicati su un sito web, il software è in grado di restituire il numero di duplicazioni e contenuti simili presenti in un sito.

Per accedere alla funzione, basta seguire questo percorso: Configuration > Content > Duplicates.

Modi per individuare contenuti duplicati esterni al sito 

Direttamente con Google

Se si ha un sito web di piccole dimensioni e con pochi contenuti, è possibile effettuare una verifica di individuazione di contenuti duplicati esterni anche con Google.

Attraverso gli operatori di ricerca del search engine, inserendo nella barra di ricerca il testo che si desidera controllare tra virgolette, Google è in grado di restituire tutte le pagine presenti nel suo indice con quel determinato testo.

Copyspace

Copyspace è uno strumento online che effettua una scansione in rete e individua eventuali contenuti duplicati presenti in altri siti web.

Per utilizzare lo strumento, basta inserire l’URL della pagina da scansionare e Copyspace troverà autonomamente tutte le copie del contenuto presenti su Internet.

Copyspace è uno strumento molto utile per i siti web con molte pagine, in quanto consente di individuare e risolvere rapidamente eventuali problemi di contenuti duplicati.

Come risolvere i problemi quando si riscontrano dei contenuti duplicati su un sito web

Per quanto riguarda la risoluzione dei problemi relativi ai contenuti duplicati su un sito web, l’obiettivo principale da perseguire è uno solo: specificare a Google e agli altri motori di ricerca quale è la pagina corretta da posizionare.

Ci sono molte soluzioni e strumenti che possiamo utilizzare. Alcuni possono essere utilizzati per risolvere le problematiche dei contenuti duplicati interni ad un sito, mentre altri strumenti possono essere utilizzati per risolvere i contenuti duplicati esterni ad un sito.

Contenuti duplicati al interno del sito come fare:

Per risolvere la problematica dei contenuti duplicati all’interno del sito, possiamo utilizzare molti strumenti a nostra disposizione. Vi riportiamo quelli consigliati dalla guida di Google Search Console.

Redirect 301

Inserire un re indirizzamento della pagina duplicata alla pagina corretta con il contenuto originale. Google, infatti, attraverso il re indirizzamento 301, è in grado di capire subito qual è la pagina più pertinente da posizionare.

Inoltre, si evitano anche tutte le problematiche di cannibalizzazione SEO che possono capitare in presenza di contenuti duplicati nel sito.

Il redirect 301 può essere effettuato attraverso dei plugin come Redirection se si utilizza WordPress come CMS oppure può essere creata una direttiva sul file .htaccess.

Usare il tag rel = canonical 

Un’altra soluzione citata dalla guida search console è quella di utilizzare il tag canonical. In presenza di questo tag, Google sarà in grado di capire in fase di scansione quale contenuto deve posizionare nelle SERP e quali varianti non deve indicizzare.

Esempio di codice HTML con inserito al suo interno l’attributo canonical:

<link href="https://www.tuosito.it/articolo-ufficiale" rel="canonical">

Usare il tag rel=alternate

Questo metodo è utile se il sito web in questione è multilingue. In questo caso, il tag rel alternate segnala a Google che il contenuto di una pagina non è duplicato, ma viene solo presentato in una lingua diversa da quella originale.

Contenuti duplicati esterni al sito come risolvere

Se invece si riscontra una problematica di duplicazione di contenuti duplicati esterni al sito web, si possono intraprendere questi azioni per sanare la situazione:

Rivendicare il contenuto

Il primo modo è quello di contattare il webmaster che ha inserito il contenuto duplicato e chiedere di rimuovere, modificare o farsi citare come fonte originale del contenuto originale del testo.

Inviare una richiesta DMCA 

Se il primo modo non va a buon fine, è possibile intervenire anche attraverso una richiesta DMCA.

Inserendo tutte le informazioni richieste dal form è possibile inviare direttamente a Google una richiesta di rimozione di contenuto copiato esterno al nostro sito per motivi di plagio.

Una volta ricevuta questa richiesta, il motore di ricerca interverrà per rimuovere le pagine dei trasgressori dai suoi indici, senza inviare notifiche al webmaster che ha violato le norme.

Domande frequenti sui contenuti duplicati

I contenuti social possono essere classificati come contenuti duplicati?

I contenuti social che riprendono un contenuto già presente sul sito web sono considerati come contenuti duplicati, ma Google non li penalizza in genere. 

L’algoritmo di Google è in grado di comprendere qual è il contenuto originale e di gestire queste situazioni in modo appropriato.

Esiste una penalizzazione se copio dei contenuti?

Se copi intenzionalmente dei contenuti per migliorare il ranking del sito web, Google potrebbe penalizzarti.

L’algoritmo Panda di Google è in grado di capire se il contenuto è stato creato per gli utenti o se è una semplice copia di un’altra pagina presente sul web.

Una penalizzazione da parte di Panda può portare a una diminuzione del traffico organico sul sito web e a una maggiore difficoltà a salire di posizioni nelle SERP.

Se riprendo un testo pubblicato su un altro sito a scopo di citazione rischio una penalizzazione per duplicazione di contenuti? 

No, riprendere una parte di testo da un altro articolo è una attività lecita, chiamata content curation, che serve a riprendere un concetto espresso da altre persone con lo scopo di portare più valore al lettore dell’articolo sul sito web. A patto però di citare sempre la fonte originaria delle informazioni.

Se invece si copia il testo senza citare la fonte originaria del contenuto, è molto probabile che Google penalizzi il sito per contenuto duplicato.

Se risolvo la problematica di duplicazione contenuti sul sito, il mio sito si posizionerà meglio sulle SERP?

Sì, un sito web che non presenta contenuti duplicati viene indicizzato più facilmente da Google e può posizionare più pagine, perché il crawler di Google (Googlebot) ha più risorse disponibili.

Gestione problematica dei contenuti duplicati sono una tassello fondamentale per la strategia SEO di un sito

La gestione dei contenuti duplicati di un sito web richiede esperienza e attenzione. Un’azione sbagliata può portare a una drastica perdita di posizioni nei motori di ricerca.

In questi casi, è consigliabile affidarsi a consulenti SEO esperti qualificati che sappiano aiutare a gestire e risolvere i problemi dei contenuti duplicati sul sito web.

Il nostro miglior consiglio è quello di richiedere una prima consulenza con il nostro team, in modo da verificare da vicino la SEO del sito web.

Pietro Gaito

Founder di MisaWeb Agency. Professionista e appassionato di Web Design e di Digital Marketing. Da 5 anni offriamo servizi professionali di sviluppo sito web, creazione e-commerce, consulenza SEO e gestione delle campagne pubblicitarie online. Richiedi subito un preventivo gratuito per lo sviluppo del tuo sito oppure richiedi una prima consulenza se desideri una campagna di digital marketing.

Skip to content