Il «canonical», ovvero come gestire i contenuti duplicati

Uno degli argomenti più «spinosi» quando si parla di SEO è la «canonicalizzazione dei contenuti». È spinoso perché non viene mai spiegato in maniera «non tecnica» e, per questo motivo, sembra essere relegato a chi ha competenze informatiche.

___STEADY_PAYWALL___

Invece è molto importante capirlo e saperlo affrontare, perché è uno strumento preziosissimo per la gestione dei famigerati contenuti duplicati.

Facciamo un esempio banale.

Asfaltago

Prendiamo un sito di un’immobiliare che ha 20 annunci di case in vendita in un piccolo paese di provincia immaginario, per esempio il comune di Asfaltago.

Ipotizziamo che la URL in cui vengono presentati i 20 annunci agli utenti, quella relativa al comune di Asfaltago, sia

http://www.lamiasplendidaimmobiliare.it/asfaltago

URL semplice, parlante, chiarissima (chiaramente, non esiste. Se clicchi, troverai un codice di stato di Google, un errore 404, che indica, appunto, contenuto non esistente), sia per chi fa una ricerca sia per il motore di ricerca.

Immaginiamo ora che all’utente venga data la possibilità di ordinare per metratura o prezzo o caratteristiche (tipo riscaldamento autonomo o meno, posto auto etc).

In molti casi questo può essere effettuato attraverso un semplice form. E, in altrettanti casi, questo genera delle URL con parametro.

Tipo

www.lamiasplendidaimmobiliare.it/asfaltago?metr=from70to100&prezzo=from180to250

che potrebbe essere la url che viene offerta a un potenziale cliente dell’immobiliare che ha scelto gli appartamenti di Asfaltago fra 70 e 100 metri quadri e fra 180mila e 250mila euro di prezzo.

Oppure

www.lamiasplendidaimmobiliare.it/asfaltago?metr=from70to100&box=yes&risc=autonomo

che è per appartamenti da 70 a 100 metri quadri, con box e riscaldamento autonomo.

Ora. Non è detto che fra i 20 annunci ci siano appartamenti che rispondono a quelle richieste. Oppure potrebbero appartenere a quelle richieste tutti e 20 gli annunci, o solo 10, o 7. In ogni caso, si possono generare, a partire dalla medesima pagina (e quindi dal medesimo gruppo di annunci) decine, anche centinaia di pagine con URL diverse ma potenzialmente identiche. Con contenuti duplicati o vicini ad essere duplicati.

Verosimilmente, poi, in assenza di annunci con quelle caratteristiche, la funzione più ovvia è quella di mostrare, come risultato, gli altri annunci del paesello, per non lasciare al nostro potenziale cliente una pagina vuota. Ecco che la possibilità che i contenuti di queste centinaia di pagine siano esattamente duplicati aumenta.

Non solo: sono centinaia di pagine che Google rischia di indicizzare e che, nella stragrande maggioranza dei casi, peggiorano il posizionamento di un sito.

Allora, bisogna dire a Google che tutte le pagine «figlie» di ricerca di persone che stanno utilizzando il nostro servizio sono in realtà «copie» della pagina madre.

In altre parole, ciascuna pagina che ha una URL potenzialmente casuale come quelle che abbiamo visto sopra, deve comunicare al motore di ricerca che la sua pagina canonica è la principale,

www.lamiasplendidaimmobiliare.it/asfaltago

L’esempio vale per tutti gli e-commerce, tutte le categorie di prodotto ma anche tutti i siti che possono avere contenuti fortemente duplicati (varrebbe qui la pena di aprire una parentesi dell’uso di tag e categorie contemporaneamente, fortemente sconsigliato, ma ne farò un pezzo per un prossimo contenuto SEO di Wolf).

Vale anche per gruppi di siti.

Per esempio: se ho dieci siti diversi e per qualche motivo ho la necessità che la medesima notizia, il medesimo articolo o post, venga lanciato in maniera identica su tutti e dieci, è sufficiente sceglierne uno come «canonico» e fare in modo che gli altri nove comunichino correttamente al motore di ricerca che le le altre 9 pagine degli altri 9 siti sono «copie».

Questo si fa con una tag HTML relazionale.

La tag rel=canonical. Le specifiche di applicazione sono, chiaramente, spiegate da Google.

(7 settembre 2016)