HomeWeb marketingSemGli Errori di Copertura Indice della Nuova Search Console
  • Sem
  • 26 Lug 2018 (Aggiornamento)

Gli Errori di Copertura Indice della Nuova Search Console

In questo articolo scopri cosa vogliono dire gli errori delle pagine escluse, visibili nella sezione copertura indice della nuova…

Gli Errori di Copertura Indice della Nuova Search Console

Quick links

In questo articolo scopri cosa vogliono dire gli errori delle pagine escluse, visibili nella sezione copertura indice della nuova Google Search Console, e cosa fare per risolverli.

pagine escluse copertura indice

Sicuramente se hai un sito web e vuoi farlo trovare su Google l’hai aggiunto alla Google Search Console.
Se non l’hai fatto devi farlo. In pratica la Google Search Console ti permette monitorare il rendimento del sito internet su Google.

Se il tuo sito internet l’hai aggiunto alla Search Console, molto probabilmente, sia se sei webmaster esperto, sia che ne sai poco o nulla di realizzazione e gestione di siti web, con l’arrivo della nuova Search Console (in Beta quando è pubblicato questo articolo) qualche email dalla Google Search Console, riguardante vari problemi riguardanti il sito internet, ti è arrivata.

Questo non è altro che un bene, significa che lo strumento di Google funziona.
Informa i possessori/i gestori di siti web di possibili problemi che Google riscontra con il sito web.

Innanzitutto, la prima cosa che devi fare quando ricevi messaggi da Google è che non devi allarmarti.
Non per niente ho appena detto “possibili problemi“, non sempre sono errori.

Anche se venissero segnalati come tali.
Possono essere implementazioni strategiche fatte nella gestione del sito web.

I problemi delle pagine escluse dalla copertura indice

Anche se non ti devi allarmare devi comunque tenere a mente che, all’atto pratico, le pagine escluse dalla ricerca sono pagine non indicizzate da Google.

Questo può essere un problema dato che pagine non indicizzate non inviano traffico al sito web.
Devi verificare se sono errori, e correggerli se lo fossero.

Dato che la sezione delle pagine escluse, presenti nella copertura indice della Google Search Console, non è in tempo reale, per risolvere gli errori, innanzitutto ti consiglio di verificare la pagina online se ha effettivamente il problema. Potrebbe essere stato risolto.

Prima di verificare gli errori delle pagine escluse presenti nella copertura indice della Google Search Console, anche se è selezionato come predefinito, per vedere più problemi – quindi per risolvere il maggior numero degli stessi – ti consiglio di verificare che sia selezionato “tutte le pagine note” a Google:

Errori di Copertura Indice della Nuova Search Console

Ovviamente la priorità della risoluzione degli errori devono averle le pagine inviate a Google, ma, per fare un lavoro certosino è saggio approfondire tutte le pagine di cui Google è a conoscenza.

Di seguito, dopo il nome dall’errore riportato dalla Google Search Console nella sezione copertura indice, ti faccio presenti le cause più probabili del possibile problema, e cosa devi fare per risolverlo.

URL inviato non trovato (404)

L’errore di URL inviato ma non trovato significa che una pagina inviata a Google restituisce un codice di errore HTTP 404, ovvero è una pagina che non esiste.

Per risolvere l’errore, come prima cosa è giusto verificare se la pagina esiste o no. Per vari motivi potrebbe essere non trovata ma solo temporaneamente.

Se è presente l’avviso e la pagina non esiste, per risolvere l’errore, bisogna assicurarsi che la pagina non sia presente nella sitemap.xml del sito web oppure non bisogna inviarla a Google tramite ping od altri metodi.

L’URL inviato contiene un tag “noindex”

Come per le pagine web inviate che rispondono con risposta HTTP 404, anche le pagine inviate che contengono un noindex (tramite metatag, header od altro) bisogna prima verificare se sono online, e se hanno effettivamente un metatag noindex.

Però, se le pagine web hanno il noindex non sono necessariamente un errore, può essere stato messo deliberatamente.

L’errore è che le pagine con il noindex sono state inviate a Google.
Anche qui bisogna verificare che almeno non siano presenti nella sitemap del sito web e che non si inviino a Google tramite altri metodi.

L’URL inviato presenta un problema di scansione

L’errore che dice che una pagina web è stata inviata ma che presenta un problema di scansione, seppur sia un errore ambiguo/non ben definito – dato che le risposte HTTP che lo possono generare sono varie – è di semplice individuazione.

In questo caso Google consiglia di utilizzare lo strumento visualizza come Google presente nella Search Console, per vedere lo stato della risposta della pagina web.

Se l’header di risposta è 200 la si può inviare all’indice e/o marcare come corretto l’errore.
In caso contrario, sopratutto se è una pagina di valore/importante per il sito web si deve individuare cosa scaturisce l’errore e risolverlo.

Solitamente tramite codice, configurazioni avanzate od impostazioni del server.

Pagina con reindirizzamento

I siti web cambiano, a volte molto e si fanno dei redirect per spostare delle pagine web.

Solitamente se la migrazione delle pagine viene eseguita “perfettamente” non si visualizza questo errore.

Per non farlo visualizzare e/o per risolverlo bisogna innanzitutto accertarsi che le pagine con redirect non siano presenti in link interni del sito web od in siti esterni, e non inviarle a Google tramite la sitemap od in altri metodi.

Purtroppo – nel momento in cui è scritto questo articolo – nella nuova Search Console non si possono vedere i links all’interno del sito o presenti in siti esterni che rimandano a pagine vecchie a cui è stato fatto un redirect.

Per poter effettivamente risolvere l’errore bisognerà utilizzare tools appositi per individuare dove sono le pagine con reindirizzamento.

Pagina scansionata ma attualmente non indicizzata

Google decide in autonomia in basi a vari fattori le pagine da indicizzare, anche se le scansiona potrebbe decidere di non indicizzarle.
O semplicemente potrebbe non averlo ancora fatto.

Per sistemare questo avviso presente nella Search Console non c’è nulla da fare se non aspettare.

Se le pagine non venissero indicizzate dopo svariato tempo, e se “strategicamente” sono pagine importanti per il sito web si può cercare di individuare il motivo per cui non vengono indicizzate.

Partendo da verificarne la qualità per Google, assecondando le sue linee guida per i webmaster e pensando agli utenti.

Rilevata ma attualmente non indicizzata

Prima che venga scansionata una pagina web, in vari modi Google può essere a conoscenza della sua presenza, e la mette “in coda”, per la scansione e l’indicizzazione.

Questo messaggio puramente informativo della Google Search Console riferisce appunto che Google sa che la pagina esiste/le pagine esistono.

Esclusa in base il tag “noindex”

Se, ad esempio, si lascia indicizzare una pagina web, e, per varie ragioni la si vuole rimuovere dall’indice bisogna applicargli il metatag noindex oppure l’header HTTP X-Robots-Tag noindex.

Google lo fa presente tramite questo messaggio.

Teoricamente questo è un errore, infatti, se Google ha indicizzato una pagina vuol dire che gli assegna un certo “valore”.

Strategicamente non è del tutto vero.

Sopratutto, in base la strategia SEO utilizzata sul sito web si può decidere di sistemare questo avviso, oppure no.
Rimuovendo il noindex.

Pagina alternativa con tag canonical appropriato

Il rel=”canonical” serve per dire ai motori di ricerca che una pagina è una copia identica di un’altra. Un duplicato.

Se Google trova queste pagine duplicate le mostra nella nuova Google Search Console come pagine alternative.

Di per sé, se una pagina duplicata ha il tag canonical non è che un bene, e questo messaggio della Search Console è puramente informativo.

Se le pagine hanno il rel=”canonical” verso altre pagine bisogna solo assicurarsi di non inviarle a Google.

Bloccata da robots.txt

Oltre le risorse bloccate dal robots.txt quali CSS, file Javascript od immagini, che devono essere sbloccate (sopratutto) per far comprendere a Google che un sito web è Mobile Friendly, anche pagine web possono essere bloccate tramite il robots.txt.

Il messaggio della Search Console in questione riferisce che una o più pagine già indicizzate (o ritenute importanti da Google) sono bloccate dal robots.txt.

Anche se il robots.txt non impedisce l’indicizzazione, ma la scansione, se t’interessa far indicizzare la pagina o le pagine che hanno questo messaggio è una buona pratica non bloccare l’accesso allo spider di Google, ed agli spider che rispettano lo standard del robots.txt.

Bloccata a causa di una richiesta non autorizzata (401).

Se in directory del sito web sono contenuti dati che non vuoi rendere pubblici, e nemmeno consultabili se si viene a conoscenza dell’indirizzo internet è buona norma bloccare l’accesso a quella directory.

Solitamente tramite server. Non vanno usati solo metatag.

Però, se Google era a conoscenza di quella/quelle directory non può più accedervi, quindi lo riferisce.

Per assicurarti di prevenire, e per risolvere, questo errore devi assicurarsi di non fare riferimento (non linkare) pubblicamente in alcuna pagina ed in alcun sito accessibile online la directory/la pagina protetta.

Anomalia durante la scansione

L’errore delle pagine escluse della Search Console che riferisce di un anomalia durante la scansione forse è quello più generico e simile, se non uguale, all’errore “problema di scansione”.
Per risolvere questo errore non esiste “il metodo”.

Identificare il problema dell’anomalia durante la scansione però può essere molto semplice.
Basta usare lo strumento della Google Search Console che visualizza come Google.

Si potranno vedere risposte HTTP anomale od altri blocchi, si potrà quindi sistemare l’errore intervenendo tramite codice o configurazioni “avanzate”.

Non trovata (404)

Similmente all’errore “URL inviato non trovato”, tramite l’errore “Non trovata (404)“, anche se l’indirizzo web non è stato inviato, la Search Console informa di pagine che prima erano visualizzabili da Google e che non lo sono più.

Di per sé anche questo può non essere un errore, Google segnala solamente che non trova più una pagina che prima aveva scansionato/indicizzato.

Per risolvere il messaggio di pagine non trovate con codice di stato HTTP 404 è possibile vedere il paragrafo dove riferisco come gestire gli errori 404.

Soft 404

Le pagine che danno come status code HTTP 200 (ovvero come se fossero presenti) ma non mostrano contenuti Google le chiama/si chiamano “soft 404”.

Queste pagine/errori solitamente si verificano quando alle pagine 404 non viene fornito, tramite server, uno status code 404.

La prima cosa che devi fare per poter risolvere questo messaggio è verificare che le pagine inesistenti segnalate diano un codice di risposta 200 e che non diano contenuti.
Poi fare in modo che diano un codice di stato HTTP 404.

Di per sé, e solitamente, questo non è un errore grave e può essere anche ignorato.

Se tramite script presenti nel sito web si generano loop di pagine soft 404, o comunque loop di scansione che hanno pagine vuote con risposta HTTP 200 è sicuramente da identificare l’errore nel codice e risolverlo.

Url inviato non selezionato come canonico

Se ci sono contenuti uguali (duplicati) in un sito web la cosa giusta da fare è utilizzare il rel=”canonical” per dire a Google qual è la versione “preferita”, quella originale.

Se si richiede l’indicizzazione a Google, tramite la sitemap od altri metodi, di pagine duplicate (non canoniche), che hanno il canonical verso altre pagine, si visualizzerà questo messaggio di errore.

Per risolverlo basta inviare a Google solamente le pagine contenenti il canonical verso se stesse.
O comunque non inviare le pagine con il canonical verso altre pagine.

Google ha scelto una pagina canonica diversa da quella specificata dall’utente

Similmente agli URL inviato non canonici, le pagine canoniche diverse da quelle segnalate che Google ha scelto sono pagine duplicate “marcate” come originali.

In questo caso però, seppur possa venir inviata una pagina con il canonical verso se stessa, algoritmicamente Google potrebbe ritenere che altre pagine siano quelle “originali”.

In questa situazione la Google Search Console da un enorme suggerimento “strategico”, oltre mostrare possibili errori che possono causare uno scarso rendimento del sito web in termini di posizionamento e visite.

Tentare di correggere questo tipo di errore, magari rivedendo la struttura/strategia del sito web è doveroso, per farlo bisognerà assegnare il rel=”canonical” ad i contenuti che Google ritiene originali.

Conclusioni

Come ho introdotto l’articolo, dicendo che la nuova Search Console nel momento in cui è scritto questo articolo è in fase Beta, faccio anche presente che, con il passare del tempo, a discrezione di Google, vari termini degli errori potrebbero essere rinominati e tipologie di errore aggiunti o rimossi, come le funzionalità della Google Search Console.
Che cambiano con il passare del tempo.

Faccio presente anche che, sopratutto su siti web di grandi dimensioni è praticamente impossibile non avere errori od avvisi nella sezione della Google Search Console delle pagine escluse. Però non è “il male assoluto” averli, come si può capire anche leggendo questo articolo.

Tentare di risolvere il più errori possibile comunque è doveroso, e, dopo averli risolti dovrai controllare il sito web live, dato che l’intervallo di aggiornamento dell’interfaccia della Search Console, in questa sezione, non è in tempo reale.

Scritto per Marketers da Carlenzoli Yuri, consulente SEO e di Web Marketing. Visita il mio sito web per scoprire i servizi offerti e per contattarmi se non fossi in grado di risolvere gli errori della Google Search Console.