Kaip pašalinti netikrus lankytojus iš Google Analytics?

Praeitą savaitę R. Golcas rašė, kad Google Analytics interneto svetainių lankomumo statistikoje atsirado netikrų lankytojų. Tai spam traffic rūšis, kai kitų svetainių savininkai iš savo serverių generuoja falsifikuotus apsilankymus į jūsų svetainę. Jūsų serveriui jie nurodo, kad lankytojas atėjo paspaudęs nuorodą jų svetainėje. Bet iš tikrųjų nei jokių nuorodų, nei lankytojų nėra.

 
Tai savotiškas neetiškos reklamos ir black-hat SEO metodas. Jūs nueinate į jų svetainę pasižiūrėti, ar ten tikrai yra nuoroda į jūsų svetainę, ir taip tampate realiu lankytojų jų reklamos prigrūstame puslapyje. Semalt.com atveju, jie netgi tapo plačiai žinomu produktu. Visi ėmė diskutuoti, kas tas Semalt.com ir kodėl jis į viso pasaulio svetaines siunčia lankytojus.
 
Yra dar keletas techninių niuansų, ko gali siekti lankytojų srauto falsifikuotojai, bet jų visų esmė ta pati – jums iš to nieko gero. Tokie „lankytojai“ iškreipia jūsų svetainių lankomumo statistiką, vagia duomenų srautą, bereikalingai apkrauna serverį ir t.t. Todėl uždrauskite jiems lankytis jūsų svetainėse.
 
 

Google Analytics

Su Google Analytics paskyros filtrais galite nustatyti, kad sistema neskaičiuotų tam tikrų lankytojų. Eikite Admin > Account > All Filters. Čia matote visus jūsų paskyroje jau naudojamus statistikos filtrus. Spauskite [+ NEW FILTER] ir sukurkite naują filtrą.
 
Kadangi po tokį filtrą teks sukurti kiekvienai spam svetainei, sugalvokite tvarkingus filtrų pavadinimus pagal blokuojamų svetainių adresus. Toliau filtro tipas (angl. filter type) turi būti Custom, o veiksmas Exclude. Duomenų tipas (angl. filter field) turi būti Referral. Sąlygoje (angl. filter pattern) įveskite blokuojamo lankytojų šaltinio adresą.
 
Google Analytics filtrų sąlygos rašomos Regular Expression sintakse, kurioje simbolis „.“ reiškia ne tašką, o bet kokį simbolį. Kad jis taptų paprastu tašku, prieš jį reikia įterpti simbolį „“. Pavyzdžiui, blokuojamas adresas atrodo taip: semalt.semalt.com. Plačiau, kaip rašyti Regular Expression reikšmes, galite paskaityti Google Analytics pagalbos svetainėje.
 
Sukurtas filtras atrodo taip:
 
google-analytics-filtrai
 
Toliau pateikiamas nustatymas Apply Filter to Views leidžia pasirinkti, ar filtrą taikyti visiems, ar tik daliai duomenų. Kadangi čia blokuojame lankytojus, kurių iš viso nenorime matyti, pasirinkite visus duomenis. T.y. visi pasirinkimai turi būti dešinėje pusėje, prie Selected views.
 
Kai išsaugosite filtrą, visi nauji lankytojai bus juo filtruojami. Tie, kurie atitiks sąlygas (šiuo atveju, skelbsis, kad atėjo iš semalt.semalt.com), į statistiką nebus įtraukiami. Deja, jau sukaupti duomenys nebepasikeis, t.y. iki filtro sukūrimo atėję lankytojai vis vien liks istoriniuose duomenyse, net jei ir atitinka naujo filtro sąlygas.
 
Google Analytics filtrai leidžia pašalinti netikrus lankytojus iš statistikos. Bet tie lankytojai vis tiek ir toliau gali lankytis jūsų svetainėje. Pavyzdžiui, jei stebite savo svetainę su Pingdom arba Uptime Robot, šios sistemos ir toliau galės tikrinti, ar jūsų svetainė veikia, bet nebematysite jų kaip lankytojų.
 
Jei esate garantuoti, kad tai tikrai falsifikuotas srautas ir tų serverių iš viso nenorite prileisti prie savo svetainės, užblokuokite juos savo Apache serveryje. Tuomet ne tik nematysite jų statistikoje, bet jie ir nebenaudos jūsų duomenų srauto bei neapkraus serverio. Tą galite padarysi su Apache .htaccess nustatymais.
 
 

Lankytojų blokavimas per Apache

 
Pagrindiniame jūsų svetainės kataloge tikriausiai yra failas .htaccess. Jame keičiami web serverio nustatymai. Jei jo nematote, tikriausiai esate neteisingame kataloge. Retais atvejais jo nebūna, tuomet jį sukurkite.
 
Ką nurodysite tame faile, tai iš karto bus priimta kaip serverio nustatymas visiems lankytojams. Todėl jei ten padarysite klaidą, svetainė nustos veikti ir rodys klaidą 500 Internal Error. Todėl prieš koreguodami šį failą, pasidarykite atsarginę jo kopiją ir viską koreguokite labai atidžiai.
 
Kad užblokuotumėte nepageidaujamus lankytojus, pačiame failo viršuje įterpkite šį kodą:
 

RewriteCond %{HTTP_REFERER} ^http://([^.]+.)*semalt.com [NC]
RewriteRule (.*) http://www.semalt.com [R=301,L]

 
Kiekvienoje eilutėje yra 4 tarpais atskirtos reikšmės. Pirmoji reiškia nustatymo tipą. Mūsų atveju pirmoje eilutėje yra sąlyga (RewriteCond), o antroje – taisyklė (RewriteCond), kuri bus vykdoma tenkinant aukščiau esančią sąlygą. Jei blokuosite daugiau nei vieną lankytojų šaltinį, galite sukurti daugiau tokių sąlygos ir taisyklės porų.
 
Antrasis nustatymas sąlygos eilutėje (%{HTTP_REFERER}) yra duomenų tipas. Šiuo atveju tai HTTP_REFERER – lankytojo šaltinis, kurį nurodo lankytojo naršyklė. Jei norite blokuoti lankytojus pagal kitus kriterijus, galite naudoti kitus duomenų tipus. Jų visų sąrašas pateikiamas Apache svetainėje.
 
Trečias sąlygos nustatymas (^http://([^.]+.)*semalt.com) yra sąlygą tenkinanti reikšmė. Ji rašoma Regular Expression sintakse. Pavyzdyje bus blokuojami visi semalt.com subdomenai. Jei rašysite paprastus pilnus adresus, prieš kiekvieną tašką adrese įterpkite simbolį „“.
 
Ketvirtas sąlygos nustatymas ([NC]) yra papildomas funkcijos parametras. [NC] reiškia, kad nebus vertinami skirtumai tarp didžiųjų ir mažųjų raidžių (angl. no case). [NC,OR] reikštų, kad toliau prieš taisyklę eina dar viena sąlyga, pvz.: antra spam svetainė.
 
Antras nustatymas taisyklės eilutėje ((.*)) nurodo adresą, kuriuo buvo kreiptasi. Kadangi mums nesvarbu, į kurį puslapį nori ateiti šie lankytojai, o juos visus blokuojame, pagal Regular Expression sintakę nurodome (.*) – bet kas tenkina sąlygą.
 
Trečias taisyklės nustatymas (http://www.semalt.com) nurodo adresą, kur nukreipti lankytoją. Šiuo atveju jį kreipiame atgal į tą svetainę, iš kurios jis atėjo. Ten galite paprastai parašyti bet kokį URL adresą.
 
Ketvirtas taisyklės nustatymas ([R=301,L]) yra papildomas funkcijos parametras. R nurodo, kad tai išorinis nukreipimas su kodu 301 (Permanent). L reiškia Last – po šios sąlygos įvykdymo tolimesni .htaccess failo nustatymai nebebus apdorojami, lankytojai bus iš karto nukreipiami. Plačiau apie visus parametrus galite pasiskaityti Apache svetainėje.
 
Tokių sąlygų ir taisyklių porų susikurkite tiek, kiek lankytojų šaltinių norite užblokuoti. Visi lankytojai, kurie tenkins šias sąlygas, bus nukreipti atgal ir į jūsų svetainę niekaip negalės patekti. Vadinasi, nepateks jie ir į jūsų svetainės lankomumo statistiką.