Gli errori di Copertura nella Search Console di Google

In questo articolo scopri cosa vogliono dire gli errori delle pagine escluse, visibili nella sezione copertura indice della nuova search console di Google e cosa fare per risolverli.

Sicuramente se hai un sito web e vuoi farlo trovare su Google l’hai aggiunto alla Google Search Console.

Se non l’hai fatto devi farlo. In pratica la Google Search Console ti permette monitorare il rendimento del sito internet su Google.

Se il tuo sito internet l’hai aggiunto alla Search Console, molto probabilmente, sia se sei webmaster esperto, sia che ne sai poco o nulla di realizzazione e gestione di siti web, qualche email dalla Google Search Console, riguardante vari problemi riguardanti il sito internet, ti è arrivata.

Questo non è altro che un bene, significa che lo strumento di Google funziona.

Big G informa costantemente i proprietari e i gestori di siti web dei problemi che riscontra per quanto riguarda l’indicizzazione dei contenuti.

Anche se non ti devi allarmare devi comunque tenere a mente che, all’atto pratico, le pagine escluse dalla ricerca sono pagine non indicizzate da Google.

Questo può essere un problema dato che pagine non indicizzate non inviano traffico al sito web.

Devi verificare se sono errori, e correggerli se lo fossero.

Dato che la sezione delle pagine escluse, presenti nella copertura indice della Google Search Console, non è in tempo reale, per risolvere gli errori, innanzitutto ti consiglio di verificare la pagina online se ha effettivamente il problema. Potrebbe essere stato risolto.

Prima di verificare gli errori delle pagine escluse presenti nella copertura indice della Google Search Console, anche se è selezionato come predefinito, per vedere più problemi – quindi per risolvere il maggior numero degli stessi – ti consiglio di verificare che sia selezionato “tutte le pagine note” a Google:

Ovviamente la priorità della risoluzione degli errori devono averle le pagine inviate a Google, ma, per fare un lavoro certosino è saggio approfondire tutte le pagine di cui Google è a conoscenza.

Innanzitutto, la prima cosa che devi fare quando ricevi messaggi da Google è che non devi allarmarti.

Non per niente ho appena detto “possibili problemi“, non sempre sono errori.

I problemi delle pagine escluse dalla copertura indice

Ecco l’elenco di problemi che potresti trovare nella sezione “Copertura” e come dovresti intervenire a seconda del nome dall’errore riportato dalla Google Search Console.

URL inviato non trovato (404)

L’errore di URL inviato ma non trovato significa che una pagina inviata a Google restituisce un codice di errore HTTP 404, ovvero è una pagina che non esiste.

Per risolvere l’errore, come prima cosa è giusto verificare se la pagina esiste o no. Per vari motivi potrebbe essere non trovata ma solo temporaneamente.

Se è presente l’avviso e la pagina non esiste, per risolvere l’errore, bisogna assicurarsi che la pagina non sia presente nella sitemap.xml del sito web oppure non bisogna inviarla a Google tramite ping od altri metodi.

L’URL inviato contiene un tag “noindex”

Come per le pagine web inviate che rispondono con risposta HTTP 404, anche le pagine inviate che contengono un noindex (tramite metatag, header od altro) bisogna prima verificare se sono online, e se hanno effettivamente un metatag noindex.

Però, se le pagine web hanno il noindex non sono necessariamente un errore, può essere stato messo deliberatamente.

L’errore è che le pagine con il noindex sono state inviate a Google.
Anche qui bisogna verificare che almeno non siano presenti nella sitemap del sito web e che non si inviino a Google tramite altri metodi.

L’URL inviato presenta un problema di scansione

L’errore che dice che una pagina web è stata inviata ma che presenta un problema di scansione, seppur sia un errore ambiguo/non ben definito – dato che le risposte HTTP che lo possono generare sono varie – è di semplice individuazione.

In questo caso Google consiglia di utilizzare lo strumento visualizza come Google presente nella Search Console, per vedere lo stato della risposta della pagina web.

Se l’header di risposta è 200 la si può inviare all’indice e/o marcare come corretto l’errore.

In caso contrario, soprattutto se è una pagina di valore/importante per il sito web si deve individuare cosa scaturisce l’errore e risolverlo.

Solitamente tramite codice, configurazioni avanzate od impostazioni del server.

Pagina con reindirizzamento

I siti web cambiano, a volte molto e si fanno dei redirect per spostare delle pagine web.

Solitamente se la migrazione delle pagine viene eseguita “perfettamente” non si visualizza questo errore.

Per non farlo visualizzare e/o per risolverlo bisogna innanzitutto accertarsi che le pagine con redirect non siano presenti in link interni del sito web od in siti esterni, e non inviarle a Google tramite la sitemap od in altri metodi.

Purtroppo – nel momento in cui è scritto questo articolo – nella nuova Search Console non si possono vedere i links all’interno del sito o presenti in siti esterni che rimandano a pagine vecchie a cui è stato fatto un redirect.

Per poter effettivamente risolvere l’errore bisognerà utilizzare tools appositi per individuare dove sono le pagine con reindirizzamento.

Pagina scansionata ma attualmente non indicizzata

Google decide in autonomia in basi a vari fattori le pagine da indicizzare, anche se le scansiona potrebbe decidere di non indicizzarle.
O semplicemente potrebbe non averlo ancora fatto.

Per sistemare questo avviso presente nella Search Console non c’è nulla da fare se non aspettare.

Se le pagine non venissero indicizzate dopo svariato tempo, e se “strategicamente” sono pagine importanti per il sito web si può cercare di individuare il motivo per cui non vengono indicizzate.

Partendo da verificarne la qualità per Google, assecondando le sue linee guida per i webmaster e pensando agli utenti.

Rilevata ma attualmente non indicizzata

Prima che venga scansionata una pagina web, in vari modi Google può essere a conoscenza della sua presenza, e la mette “in coda”, per la scansione e l’indicizzazione.

Questo messaggio puramente informativo della Google Search Console riferisce appunto che Google sa che la pagina esiste/le pagine esistono.

Esclusa in base il tag “noindex”

Se, ad esempio, si lascia indicizzare una pagina web, e, per varie ragioni la si vuole rimuovere dall’indice bisogna applicargli il metatag noindex oppure l’header HTTP X- Robots-Tag noindex.

Google lo fa presente tramite questo messaggio.

Teoricamente questo è un errore, infatti, se Google ha indicizzato una pagina vuol dire che gli assegna un certo “valore”.

Strategicamente non è del tutto vero.

Sopratutto, in base la strategia SEO utilizzata sul sito web si può decidere di sistemare questo avviso, oppure no.

Rimuovendo il noindex.

Pagina alternativa con tag canonical appropriato

Il rel=”canonical” serve per dire ai motori di ricerca che una pagina è una copia identica di un’altra. Un duplicato.

Se Google trova queste pagine duplicate le mostra nella nuova Google Search Console come pagine alternative.

Di per sé, se una pagina duplicata ha il tag canonical non è che un bene, e questo messaggio della Search Console è puramente informativo.

Se le pagine hanno il rel=”canonical” verso altre pagine bisogna solo assicurarsi di non inviarle a Google

Bloccata da robots.txt

Oltre le risorse bloccate dal robots.txt quali CSS, file Javascript od immagini, che devono essere sbloccate (sopratutto) per far comprendere a Google che un sito web è Mobile Friendly, anche pagine web possono essere bloccate tramite il robots.txt.

Il messaggio della Search Console in questione riferisce che una o più pagine già indicizzate (o ritenute importanti da Google) sono bloccate dal robots.txt.

Anche se il robots.txt non impedisce l’indicizzazione, ma la scansione, se t’interessa far indicizzare la pagina o le pagine che hanno questo messaggio è una buona pratica non bloccare l’accesso allo spider di Google, ed agli spider che rispettano lo standard del robots.txt.

Bloccata a causa di una richiesta non autorizzata (401)

Se in directory del sito web sono contenuti dati che non vuoi rendere pubblici, e nemmeno consultabili se si viene a conoscenza dell’indirizzo internet è buona norma bloccare l’accesso a quella directory.

Solitamente tramite server. Non vanno usati solo metatag.

Però, se Google era a conoscenza di quella/quelle directory non può più accedervi, quindi lo riferisce.

Per assicurarti di prevenire, e per risolvere, questo errore devi assicurarsi di non fare riferimento (non linkare) pubblicamente in alcuna pagina ed in alcun sito accessibile online la directory/la pagina protetta.

Anomalia durante la scansione

L’errore delle pagine escluse della Search Console che riferisce di un’anomalia duirante la scansione forse è quello più generico e simile, se non uguale, all’errore “problema di scansione”.

Per risolvere questo errore non esiste un metodo assoluto.

Identificare il problema dell’anomalia durante la scansione però può essere molto semplice.

Basta usare lo strumento della Google Search Console che visualizza come Google.

Si potranno vedere risposte HTTP anomale od altri blocchi, si potrà quindi sistemare l’errore intervenendo tramite codice o configurazioni “avanzate”.

Non trovata (404)

Similmente all’errore “URL inviato non trovato”, tramite l’errore “Non trovata (404)“, anche se l’indirizzo web non è stato inviato, la Search Console informa di pagine che prima erano visualizzabili da Google e che non lo sono più.

Di per sé anche questo può non essere un errore, Google segnala solamente che non trova più una pagina che prima aveva scansionato/indicizzato.

Per risolvere il messaggio di pagine non trovate con codice di stato HTTP 404 è possibile vedere il paragrafo dove riferisco come gestire gli errori 404.

Soft 404

Le pagine che danno come status code HTTP 200 (ovvero come se fossero presenti) ma non mostrano contenuti Google le chiama/si chiamano “soft 404”.

Queste pagine/errori solitamente si verificano quando alle pagine 404 non viene fornito, tramite server, uno status code 404.

La prima cosa che devi fare per poter risolvere questo messaggio è verificare che le pagine inesistenti segnalate diano un codice di risposta 200 e che non diano contenuti.
Poi fare in modo che diano un codice di stato HTTP 404.

Di per sé, e solitamente, questo non è un errore grave e può essere anche ignorato.

Se tramite script presenti nel sito web si generano loop di pagine soft 404, o comunque loop di scansione che hanno pagine vuote con risposta HTTP 200 è sicuramente da indentificare l’errore nel codice e risolverlo.

Url inviato non selezionato come canonico

Se ci sono contenuti uguali (duplicati) in un sito web la cosa giusta da fare è utilizzare il rel=”canonical” per dire a Google qual è la versione “preferita”, quella originale.

Se si richiede l’indicizzazione a Google, tramite la sitemap od altri metodi, di pagine duplicate (non canoniche), che hanno il canonical verso altre pagine, si visualizzerà questo messaggio di errore.

Per risolverlo basta inviare a Google solamente le pagine contenenti il canonical verso se stesse.
O comunque non inviare le pagine con il canonical verso altre pagine.

Google ha scelto una pagina canonica diversa da quella specificata dall’utente

Similmente agli URL inviato non canonici, le pagine canoniche diverse da quelle segnalate che Google ha scelto sono pagine duplicate “marcate” come originali.

In questo caso però, seppur possa venir inviata una pagina con il canonical verso se stessa, algoritmicamente Google potrebbe ritenere che altre pagine siano quelle “originali”.

In questa situazione la Google Search Console da un enorme suggerimento “strategico”, oltre mostrare possibili errori che possono causare uno scarso rendimento del sito web in termini di posizionamento e visite.

Tentare di correggere questo tipo di errore, magari rivedendo la struttura/strategia del sito web è doveroso, per farlo bisognerà assegnare il rel=”canonical” ad i contenuti che Google ritiene originali.

Conclusioni

Come detto all’inizio dell’articolo, è giusto considerare che col passare del tempo, a discrezione di Google, vari errori potrebbero essere tolti, sostituiti, rinominati, così come vale per le funzionalità stesse della Google Search Console.

Che cambiano con il passare del tempo.

Faccio presente anche che, sopratutto su siti web di grandi dimensioni è praticamente impossibile non avere errori od avvisi nella sezione della Google Search Console delle pagine escluse. Però non è “il male assoluto” averli, come si può capire anche leggendo questo articolo.

Tentare di risolvere il più errori possibile comunque è doveroso, e, dopo averli risolti dovrai controllare il sito web live, dato che l’intervallo di aggiornamento dell’interfaccia della Search Console, in questa sezione, non è in tempo reale.

Aggiungi una recensione
product image
Media degli utenti
1star1star1star1star1star
Storico dei voti
5 based on 5 votes
Servizi
Gli errori di Copertura nella nuova Search Console di Google
TVA Consulting Roma

Dal blog di Valerio Tavano: collaborazioni, aggiornamenti e opinioni.

Come funzionano i sensori d’allarme?

Come funzionano i sensori d’allarme?

Il PANNELLO DI CONTROLLO è il modulo centrale dell'antifurto, un dispositivo appositamente progettato per garantire una maggiore protezione all'interno dell'abitazione o dell'attività commerciale. Permette di attivare e disattivare l'allarme o scegliere una modalità parziale giorno / notte /...

NEWSLETTER

RIMANI AGGIORNATO

Pin It on Pinterest