HomeWeb marketingWeb AnalyticsCome eliminare il traffico spam da Google Analytics: la Guida Completa

Come eliminare il traffico spam da Google Analytics: la Guida Completa

In questa guida imparerai tutte le migliori strategie per eliminare in maniera semplice ghost spam, referral spam e lingue fasulle.

Come eliminare il traffico spam da Google Analytics: la Guida Completa

Quick links

In questa guida imparerai tutte le migliori strategie per eliminare in maniera semplice ghost spam, referral spam e lingue fasulle.

Entri tutto contento nel tuo account di Google Analytics, guardi il report Sorgente/Mezzo e davanti agli occhi ti si presenta questo

referral-spam

Una scarica di felicità ti pervade e pensi: Evviva! Guarda quanto traffico referral! Finalmente mi stanno linkando e laggente mi vede!

Ma poi approfondisci andando sul report Referral e vedi qualcosa di simile a questo

siti-referral-spam

Questo purtroppo è spam.

Che cos’è lo spam in Google Analytics?

É traffico inutile, che non viene dai tuoi utenti ma è generato automaticamente da bot e motori che creano interazioni false (hit) apposta.

Al momento attuale è possibile falsificare qualsiasi interazione di Google Analytics.

Gli spammer possono falsificare:

  • Traffico referral
  • Traffico organico
  • Traffico proveniente dai social media
  • Eventi
  • Lingue
  • Richieste URI
  • Nomi Host
  • Ecc.

Per fare tutto questo gli bastano solo l’ID di monitoraggio della tua proprietà e riuscire a smanettare con il Measurement Protocol.

Perché esiste lo spam in Google Analytics? 

Ovviamente per un ritorno economico, l’obiettivo finale di chi fa spam è promuovere una pagina, avere la tua email o mandarti ad uno store online per ottenere un affiliazione.

Ultimamente lo spam è stato utilizzato anche per fare propaganda politica

spam-trump

Questo ti ricorda qualcosa?

Una vera noia.

Ma non ti preoccupare, in questa guida scoprirai tutti i trucchi per avere un account Google Analytics libero dallo spam.

Perché dovresti preoccuparti di referral spam?

Per due ragioni:

• Dati corrotti: Un sito con migliaia di visite al giorno non sentirà tantissima differenza con qualche centinaio di hit falsi al mese

Ma se a un blog di deodoranti che puzzano arrivano 30 sessioni al giorno fittizie è un bel problema, diventa impossibile fare marketing sulla base di dati non veritieri.

report-referral-spam

Guarda questo report: è quasi tutto spam, è impossibile capirci qualcosa e riuscire a distinguere i dati falsi da quelli veritieri.

• Sicurezza e velocità del server: Non gli hai chiesto di venire sul tuo sito, di conseguenza stanno usando le risorse del tuo server per qualcosa che non vuoi e che non ti serve.

Il che potrebbe voler dire un sovraccaricamento del server e di conseguenza tempi di caricamento maggiori. In più non sai cosa stanno facendo mentre stanno sul tuo sito ( stanno cercando vulnerabilità? Non puoi saperlo).

Ti ho messo abbastanza paura? 😉

Ora che hai capito quanto sia importante avere un account di Google Analytics senza spam possiamo iniziare 🙂

Alla fine di questa guida avrai ottenuto tre importanti risultati:

  • Proteggerai i tuoi dati
  • Fermerai spam e altro traffico irrilevante
  • Pulirai i tuoi dati storici

Sei pronto?

Tranquillo, le soluzioni che andrò a suggerirti non sono complicate.

Iniziamo!

Proteggere i tuoi dati

Questo passo è importante! Utilizza la vista per fare esperimenti, non usare mai la vista definitiva per fare queste cose, solo quando sarai sicuro che tutto sarà stato impostato correttamente potrai applicare queste soluzioni nella vista principale.

Come e perché creare nuove viste l’ho spiegato in questo articolo.

Fermare il traffico spam e altro traffico irrilevante

Il prossimo passo è eliminare lo spam che gonfia i dati nei tuoi report con le seguenti soluzioni:

  • Proprietà maggiore di -3
  • Filtro per traffico fantasma
  • Filtro per traffico referral
  • Filtro per lingue false
  • Abilitare l’impostazione “Escludi bot e spider noti”

1. Proprietà maggiore di -3

Se hai un nuovo sito questa soluzione potrebbe essere utile per evitare molto (ma non tutto) il traffico spam.

Perché?

Quando crei un nuovo account di Google Analytics, crei anche una proprietà e una vista.

La proprietà ti assegna un ID di monitoraggio presente nello snippet di codice su ogni pagina del tuo sito.

Come puoi vedere dall’ID di monitoraggio alla fine c’è il numero identificativo della proprietà utilizzata.

ID-monitoraggio-proprietà

Puoi creare fino a 50 proprietà all’interno dello stesso account.

Molti bot fantasma colpiscono di base la proprietà “-1” (ultimamente anche la -2, -3) per questo ti consiglio creare la quarta proprietà per il tuo sito web e utilizzarla come principale.

NB: Utilizza questa soluzione solo per nuovi siti web. Se utilizzi questo trucco per un sito web che ha già Google Analytics installato, i nuovi dati andranno nella nuova proprietà ma quelli vecchi rimarranno nella proprietà precedente. Molto scomodo.

crea-nuova-proprietà-google-analytics

2. Filtro per traffico fantasma

I bot fantasma non visitano mai realmente il tuo sito, arrivano ai server di Google Analytics e appaiono nei loro report.

Questo tipo di spam non conosce il vero nome del tuo server per questo andrà creare un nome host falso oppure risulterà nei report di Google Analytics come “not set”.

Metodi come filtri Javascript, plugin WordPress e .htaccess non servono, perché in realtà non c’è traffico sul tuo sito web.

Di conseguenza per questo tipo di spam l’unica soluzione è creare un filtro sul Nome Host.

Andiamo a vedere insieme come fare:

Step-1. Trova i tuoi Nomi Host validi

Attenzione! Non confondere Nome Host con Sorgente.

La sorgente è da dove i tuoi utenti arrivano (Google, Twitter, Youtube, Facebook ecc.)

Il nome host è il sito web su cui i tuoi utenti arrivano.

I nomi host validi sono quei siti su cui hai configurato il tuo codice di monitoraggio di Google Analytics.

Nella maggior parte dei casi è il tuo sito web ma possono anche essere:

  • Sottodomini (blog.dominio.it, store.dominio.it)
  • Servizi di pagamento per ecommerce ( fastspring, clickbank, ecc)
  • Servizi video (youtube)

Un nome host NON valido è un servizio o un sito web che non gestisci o su cui non hai controllo.

Per capire cosa intendo segui questi passaggi:

  • Seleziona un periodo temporale di un anno ( puoi farlo con il menù a tendina in alto a destra)
  • Rapporto Pubblico > Tecnologia > Rete > Nome Host

rapporto-rete-nome-host

 

rapporto-nome-host-spam

Come puoi vedere dall’immagine, il report è pieno di spam.

  • Segnati i nomi host che ritieni legittimi, cioè quelli in cui SAI e RICORDI di avere configurato il tuo codice di monitoraggio.

A costo di sembrare banale, non credo tu abbia mai impostato Google Analytics su siti web come  BBC, FoxNews, Nypost e Google.

Non sono siti web reali e non hanno nulla a che fare con il tuo sito.

Step-2. Crea un’espressione regolare con i tuoi nomi host validi.

Non andare nel panico 😉

Può sembrare complicato ma ti assicuro che non lo è!

Andrai poi ad inserire questa espressione in un filtro apposta.

Le regole sono queste:

  • tra un dominio e l’altro c’è bisogno di questo simbolo:   |
  • prima di ogni punto va messo:  /  ( per esempio: parrucchepergatti/.com)
  • nel caso di più sottodomini non è necessario metterli tutti ma basta solo il dominio principale

Un esempio di espressione regolare sarà così costruita:

dominio/.com|serviziodipagamento/.com|altrodominio/.com

Per approfondire le espressioni regolari vedi Google 🙂

Step-3. Crea un filtro

Ti ricordi come fare vero? 😉 ( se non ti ricordi, nel mio articolo dove spiego come configurare Google Analytics trovi tutte le informazioni)

  • Nome filtro: Nomi Host Validi
  • Tipo di filtro: Personalizzato
  • Includi > Campo filtro: Nome host
  • Pattern filtro: incolla l’espressione regolare che hai creato
  • Verifica filtro
  • Salva

filtro-nomi-host-validi

3. Filtro per traffico referral spam

Al contrario dei bot fantasma i crawler visitano realmente il tuo sito web.

Questo tipo di spam è più subdolo da eliminare perché in questo caso vengono utilizzati nomi host legittimi.

Non ti preoccupare, anche in questo caso il trucco sta nell’applicare un altro filtro.

Anzi quattro filtri.

Quattro?

Ebbene sì 😉

Qui di seguito troverai quattro espressioni regolari, dovrai andare a creare un filtro per ognuna di queste espressioni.

anticrawler|best-seo-offer|best-seo-solution|buttons-for-website|buttons-for-your-website|7makemoneyonline|-musicas*-gratis|kambasoft|savetubevideo|ranksonic|medispainstitute|offers.bycontext|100dollars-seo|sitevaluation|dailyrank

videos-for-your-business|success-seo|rankscanner|doktoronline.no|adviceforum.info|video–production|sharemyfile.ru|seo-platform|justprofit.xyz|127.0.0.1|nexus.search-helper.ru|rankings-analytics.com|dbutton.net|o00.in|wordpress-crew.net

fast-wordpress-start.com|top1-seo-service.com|^scripted.com|uptimechecker.com|uptimebot.net|rankings-analytics.com|^uptime.com|.responsive-test.net|dogsrun.net|free-video-tool.com|keywords-monitoring(-your)?-success.com|a.pr-cy.ru

fix-website-errors.com|seo-2-0.com|platezhka.net|timer4web.com|1-99seo.com|1-free-share-buttons.com|uptime-alpha.net|3-letter-domains.net|datract.com|lifehacĸer.com|top10-way.com|google-liar.ru|motherboard.vice.com|petitions.whitehouse.gov

Ogni filtro dovrà essere impostato così:

  • Nome filtro: Spam
  • Tipo di filtro: Personalizzato
  • Escludi > Campo filtro: Sorgente Campagna
  • Pattern filtro: inserisci espressione regolare
  • Verifica filtro
  • Salva

filtro-crawler-spam

Alla fine avrai quattro filtri (Spam 1, Spam 2, Spam 3 e Spam 4)
4. Filtro per le lingue false

Le lingue false sono l’ultimo colpo di genio da parte degli spammer.

Per evitare di entrare nel pannello di Google Analytics e vedere questo

lingue-false-spam

dovrai creare un ultimo filtro.

Prometto che è l’ultimo 😉

Ecco come dovrà essere impostato:

  • Nome filtro: Lingue false
  • Tipo filtro: Personalizzato
  • Escludi > Campo filtro: Lingua
  • Pattern filtro: .{13,}|\.
  • Verifica filtro
  • Salva

filtro-lingue-false

5. Abilitare “Escludi tutti gli hit da bot e spider noti”

Alcuni crawler non sono spam ma non sono nemmeno utili per i tuoi report in Google Analytics.

In questo caso la soluzione è semplicissima:

  • Amministratore
  • Impostazione Vista
  • Seleziona la spunta nella sezione “Filtro bot”

filtro-bot

Pulire i dati storici con un segmento avanzato

I filtri in Google Analytics non sono retroattivi, di conseguenza i dati storici saranno pieni di spam anche dopo aver utilizzato i filtri che ti ho descritto in precedenza.

Per eliminare il traffico spazzatura dai tuoi dati storici ci vuole un segmento avanzato.

Ecco come come fare:

  • Nella sezione Rapporti clicca su “Tutti gli utenti” e poi su +Nuovo Segmento

segmento-referral-spam

  • Inserisci un nome per il segmento (per es. “Tutti gli utenti(no Spam)”)
  • Seleziona “Condizioni”

Prima condizione:

Filtro > Sessioni > Includi

  • Nome Host > corrisponde a Regex > incolla l’espressione regolare che hai utilizzato precedentemente per il filtro “Nomi Host Validi”
  • Clicca su Aggiungi filtro

Seconda condizione:

Filtro > Sessioni > Escludi

  • Sorgente > corrisponde a RegEx > incolla l’espressione regolare che hai utilizzato per il filtro “Spam 1”
  • Clicca su O ( di fianco all’espressione regolare)
  • Sorgente > corrisponde a RegEx > incolla l’espressione regolare che hai utilizzato per il filtro “Spam 2”
  • Ripeti per tutte e quattro le espressioni regolari che ti ho segnalato prima.
  • Salva il segmento 🙂

segmento-avanzato-spam

Il modo migliore per verificare che il segmento sia stato correttamente configurato è metterlo a confronto con il segmento di default “Tutti gli utenti”, per visualizzare le differenze tra i dati.

Con questa ultima soluzione vedrai i tuoi report senza spam, l’importante è che il segmento rimanga selezionato.

Non dovrai utilizzare questo segmento per sempre, piano piano i filtri cominceranno a funzionare e di conseguenza i report saranno liberi da traffico falso.

Cinque domande e risposte sul traffico spam

1. Ho un sacco di spam in Google Analytics, può influire sulla SEO?

No, almeno non direttamente.

Google ha comunicato che i dati provenienti da Google Analytics non vengono utilizzati come fattori di ranking.

C’è un però.

Se lavori su dati sballati come fai a migliorare la tua strategia SEO per scalare la SERP?

Quindi sì, indirettamente influisce 😉

2. Se aggiungo i domini spam nell’Elenco di Esclusione Referral li eliminerò dai report, no?

No. 😛

Questa soluzione nasconde il problema senza risolvere nulla.

La lista di esclusione di referral è stata creata per evitare che i visitatori che finiscono in un altro dominio come parte naturale del processo di acquisizione vengano contati come una nuova sessione quando tornano ( per es. Un visitatore viene mandato a Paypal, paga e poi torna sul sito).

Se andrai ad aggiungere un dominio spam a questa lista, non lo vedrai più all’interno del Rapporto Referral, ma sarà ancora incluso all’interno del traffico diretto.

Questo che vuol dire?

Che dai report sarà sparito ma le metriche saranno ancora sballate.

3. Se blocco lo spam dai miei server tramite file .htaccess avrò risolto il problema?

In giro troverai articoli in cui c’è scritto che cambiare le impostazioni del tuo server aiuta a eliminare lo spam dalla radice ma in realtà non è proprio così.

A parte il fatto che è più semplice impostare qualche filtro su Google Analytics che andare a smanettare sul server ma il punto è che per il traffico fantasma questa soluzione non funziona.

Per il semplice motivo che ai tuoi server i bot fantasma non ci arrivano, perché non è traffico reale. Compaiono solamente nei server di Google Analytics.

Certo che puoi, ma non te lo consiglio 😉

Nelle migliori delle ipotesi sono link che portano a pagine di servizi, store ecc.

Fastidiosi ma innocui.

Nella peggiore dell’ipotesi ti becchi un bel virus.

Quindi lascia stare e non farlo.

5. Sono entrato nel report Referral ma non so se una determinata fonte è spam o meno, c’è qualche modo per capirlo?

Questo sito aggiorna ogni settimana la lista di tutti i tipi di spam (ghost, referral, lingue ecc), se hai qualche dubbio cerca qui.

Siamo arrivati alla fine, ora hai in mano tutti gli strumenti necessari per eliminare lo spam da Google Analytics.

Ricorda che lavorare con dati puliti e precisi è fondamentale per stabilire strategie vincenti.

Perciò non rimandare, dacci dentro e fammi sapere nei commenti com’è andata 🙂

Buon lavoro!