Un sito web è in continua evoluzione nell’arco della sua vita. Vengono aggiunti e rimossi contenuti in continuazione e ciò può portare alla creazione di errori, duplicazioni e contraddizioni all’interno di un portale. Per questo nello sviluppo del tuo sito devi affidarti a uno specialista SEO.
A questo proposito in questo articolo ci concentriamo sulle duplicazioni e come gestirle al meglio per evitare di danneggiare la SEO del nostro sito web.
In che modo le duplicazioni possono danneggiare la SEO?
Internet, a differenza di quello che si pensa comunemente, a un certo punto finisce. Il fatto che abbiamo a disposizione uno spazio inconcepibilmente vasto non ne determina l’inesauribilità.
La rete è soggetta a limiti di spazio presenti sui server che ospitano i siti web e proprio per questo le duplicazioni sono un grosso problema, soprattutto per i motori di ricerca.
Un motore di ricerca per poter rispondere con informazioni quanto più esatte possibili alle query dell’utente cosa fa? Scansiona il web, indicizza le pagine dei siti che incontra durante la scansione e li posiziona nelle SERP quando l’utente effettua la ricerca.
Quando parliamo di duplicazioni ci interessa la fase di indicizzazione. Cioè ci interessa sapere e comprendere quali pagine del nostro sito vengono inserite nell’indice di un motore di ricerca.
I contenuti duplicati vengono visti molto male da questi ultimi proprio per le risorse server limitate, seppur molto vaste, di cui dispongono.
E per far fronte a questi errori, i motori di ricerca hanno sviluppato algoritmi come Panda di Google che penalizza le pagine web duplicate e di scarsa qualità.
É quindi estremamente importante porre la giusta attenzione allo svilupparsi di duplicazioni di contenuto all’interno del nostro sito web. Tuttavia ci sono dei casi in cui non è possibile evitare la creazione di contenuti duplicati, pensiamo agli eCommerce.
In un ecommerce spesso sono presenti nelle pagine di categoria di prodotto o nelle pagine di negozio filtri che possono parametrizzare le URL creando pagine nuove (a ogni URL è associata una pagina web specifica e la posizione della stessa all’interno di un server, la modifica anche di una sola lettera, se la pagina è raggiungibile, ne crea una ex novo) ma con lo stesso identico contenuto.
Per far fronte a situazioni come questa viene utilizzato il tag canonical.
Tag link rel=”canonical” cos’è e cosa vuol dire canonico
Il canonical è un attributo inserito in un tag link utilizzato per indicare ai motori di ricerca che una pagina web ha una versione canonica ovvero una versione principale alla quale riferirsi in luogo di una versione parametrizzata o diversa.
Il canonical appare nel tag <HEAD> di una pagina HTML in questo modo:
<link rel=”canonical” href=”https://www.miosito.it/pagina1”>
In questo modo indichiamo che la pagina in cui è inserito questo tag ha una versione canonica ed è quella indicata nel tag.
A cosa serve tutto ciò? Come abbiamo detto serve a evitare le duplicazioni. In questo modo i motori di ricerca possono ignorare o comunque non inserire nell’indice le pagine non canoniche e duplicate.
Il canonical però non risolve ad esempio problemi di contenuto misto o esattamente duplicato. Avere ad esempio versioni in http e in https di una medesima pagina può essere una duplicazione e non è detto che la versione preferita dall’utente sia scelta dal motore di ricerca che considera il canonical solo un’indicazione. In questo caso sarà necessario effettuare dei redirect per evitare che ciò accada.
Quando si usa il canonical?
Esistono vari scenari in cui è utile sfruttare il canonical per preservare crawl budget e risorse di scansione e far indicizzare solo alcune pagine originali in luogo dei duplicati e sono:
- eCommerce;
- Siti internazionali;
- Siti che utilizzano filtri.
Canonical ed eCommerce
In un ecommerce è comune avere molte pagine che categorizzano prodotti e contengono filtri. Pensiamo a un ecommerce di abbigliamento che ha categorie specifiche per le t-shirt, i pantaloni e le scarpe. Ognuna di queste categorie conterrà un numero variabile di prodotti e i relativi filtri per colore, taglie e brand. Una volta selezionato un filtro può generarsi una pagina con una URL di questo tipo:
https://www.miosito.it/scarpe/?colore=rosso&taglia=XL
Questa pagine contiene di solito solo una porzione dei prodotti presenti nella pagina originale ma proprio perché questa porzione è presente viene generata una duplicazione. In questo caso è utile utilizzare il canonical per dire al motore di ricerca che sì la duplicazione esiste ma che deve considerare esclusivamente come valida la pagina indicata come canonica. La pagina filtrata conterrà all’interno del tag <head> quindi l’indicazione:
<link rel”canonical” href=”https://www.miosito.it/scarpe/”>
in cui indichiamo la pagina corretta. Ciò può avvenire anche ad esempio nelle schede prodotto quando un singolo prodotto può avere delle variazioni. Anche in questo caso è possibile utilizzare il canonical.
È comunque bene tenere a mente che il canonical è un’indicazione e può non essere rispettato e che possono esserci dei casi in cui vogliamo far indicizzare anche url parametrizzate, come ad esempio una variazione di colore di un prodotto che potenzialmente può rispondere in maniera adeguata a una ricerca effettuata su un motore di ricerca, di solito Google in Italia.
Canonical, hreflang e siti internazionali
Per siti internazionali oltre le duplicazioni che possono nascere dall’essere o meno un eCommerce c’è anche l’esigenza di ottimizzare la SEO internazionale con L’attributo hreflang. In questo caso bisogna porre molta attenzione a indicare negli attributi hreflang solo le versioni canoniche delle pagine alternative per le singole lingue. In caso contrario potrebbe venire ignorata la pagina alternativa e venire generati conflitti nell’indicizzazione del sito per i paesi in target.
Canonical e Filtri
Al pari di quanto avviene in campo eCommerce bisogna tenere sempre ben presente quanto i filtri vanno a impattare sulle risorse di scansione e sulla generazione di duplicazioni. Nel caso in cui non volessimo che questi tipi di siti generino pagine duplicate per mezzo di filtri dovuti a form o ad altri elementi dinamici possiamo utilizzare il rel canonical per evitare problemi di duplicazioni.
Duplicazioni evidenti, canonical o redirect?
Ho posto attenzione sulla canonicalizzazione delle pagine con filtri che non si vuole indicizzare e sottolineato più volte come il canonical sia una mera indicazione che diamo ai motori di ricerca per permettere la corretta indicizzazione delle nostre pagine.
Sottolineiamo anche che il canonical, in quanto elemento che ci aiuta a gestire l’indicizzazione, non ha nessuna influenza sul posizionamento organico, ha al più la funzione di indirizzare i bot per quanto riguarda la messa in indice e quindi ci permette di spingere alcune pagine che poi vogliamo posizionare.
Quando invece ci troviamo di fronte alla presenza di duplicazioni evidenti, dovuta ai motivi più disparati, può avere molto poco senso in quanto, essendo come più volte ripetuto ed è importante comprenderlo bene, i motori di ricerca possono ignorare i canonical e si può incorrere in cattive indicizzazioni e penalizzazioni.
Come implementare il canonical
Come abbiamo visto il canonical viene implementato nella sezione <head> dell’HTML delle pagine web tramite il tag <link> inserendo l’attributo rel in questo modo:
<link rel”canonical” href=”https://www.miosito.it/pagina1”>
Però ci sono anche modi alternativi per implementare il canonical ovvero:
Attraverso la sitemap.xml
Le pagine che vengono inserite all’interno delle sitemap.xml vengono considerate canoniche ed è quindi possibile inviarle ai motori di ricerca.
Tuttavia non sempre Google e i motori di ricerca considerano le url inserite in sitemap come canoniche.
Ê caldamente consigliato inserire nelle sitemap.xml esclusivamente URL canonici.
Attraverso l’intestazione http
É possibile inoltre utilizzare le intestazioni http in luogo del tag link.
Questa soluzione è utile quando non abbiamo necessità di inserire il canonical ad esempio in PDF o altri tipi di file. In questo caso inseriremo un’intestazione del tipo:
Link: <http://www.miosito.it/uploads/file.pdf>; rel=”canonical”
Questa soluzione non è supportata da tutti i motori di ricerca.
Conclusioni
La cosa migliore da fare quando si sviluppa un sito web e quando si gestiscono siti neonati è tenere sott’occhio la produzione di duplicazioni.
Per siti molto grandi e che probabilmente non si ha avuto la possibilità di gestire bisogna porre molta attenzione alle duplicazioni e all’uso dei canonical, in generale a tutto ciò che riguarda prima l’indicizzazione e poi passare all’ottimizzazione per il posizionamento.
In conclusione quindi possiamo affermare che il rel canonical è un attributo fondamentale per migliorare l’indicizzazione di un sito nei motori di ricerca. Non è una direttiva ma un consiglio. Bisogna tenere sott’occhio le duplicazione e il crawl budget per ottenere il meglio dai nostri siti web sui motori di ricerca.