Як обчислити і вичистити спамерських пошукових роботів, розповідає Бізнес Майстерня.
Припустимо, у вас є ресурс з якоюсь невеликою аудиторією, пошукова оптимізація якого поки передбачає медійного seo просування сайту. З якоїсь причини ви відчуваєте, що частина цієї аудиторії вам нерелевантна, але не знаєте, наскільки ця частина більша. Ваші здогадки не безпідставні, бо до половини трафіку в інтернеті — боти.
Розповідаємо, як зрозуміти, чи є боти на вашому сайті, скільки їх і як позбутися від цієї зарази за допомогою Google Analytics.
Перші кроки
Спочатку потрібно вивантажити всі можливі показники активності користувачів на сайті (показник відмов, відсоток нових користувачів, середній час сесії та інше) по різних фільтрах (джерела трафіку, канали, операційні системи, браузери, типи пристроїв).
Далі знаходимо статистичні показники, які сильно відрізняються від норми. За норму можна прийняти середнє значення по всіх сайтах, з якими ви працюєте. Якщо такого досвіду у вас немає, то можна приблизно розрахувати норму, ґрунтуючись на показниках одного сайту.
Приклад. Припустимо, трафік на сайт приходить з 10 браузерів, показники в GA по 9 з них приблизно схожі, а ось по одному сильно відрізняються, це і буде приводом для більш детальної перевірки даного джерела. Для геолокації підхід такий самий.
Такі аномалії можуть викликати боти. Але буває і так, що дає збої сам лічильник. Це можливо в наступних випадках.
- Встановлено два і більше лічильника GA на один сайт. В такому випадку лічильники можуть перебивати дані один одного.
- Лічильник встановлено не там. Рекомендується встановлювати лічильник аналітики перед закриваючим тегом head.
- Встановлено стару версію Google Analytics.
- У вас односторіночний сайт, навігація по якому здійснюється без зміни url. У такому випадку, без додатково налаштованих подій, показник відмов буде прямувати до 100%, а час на сайті до 0.
- Налаштовані події на різні pop-up events, які автоматично спрацьовують на сайті і скручують показник відмов до 0%.
- Лічильник GA встановлений не на всі сторінки сайту.
Приклади аномальної статистики з GA, яка допоможе виявити ботів
Приклад 1. Нових сеансів менше 5% (зазвичай можна подивитися, скільки у вас нових сеансів в ретаргетингу, і поставити це значення). Занадто високі або дуже низькі показники відсотка відмов, сторінок за сеанс, середньої тривалості сеансу.
В даному випадку неможливо дати якісь точні бенчмарки, тому що потрібно орієнтуватися на середні показники, а вони індивідуальні для кожного сайту.
Приклад 2. Аномальний коефіцієнт досягнення мети як в загальному по каналу, так і по якомусь фільтру.
Приклад 3. Великий відсоток трафіку припадає на користувачів, у яких GA не зміг розпізнати вік або стать.
Раніше в GA цей трафік вказувався як not set або взагалі не показувався в фільтрі по демографії. Це не найочевидніший параметр для визначення шахрайського трафіку, бо Google фізично не може визначати стать і вік у 100% трафіку, але якщо ми бачимо велику частку таких сеансів, то краще з цим розібратися.
Приклад 4. Дуже низький відсоток нових сеансів на сайті з певного каналу.
Низький відсоток, звичайно, може бути обумовлений тим, що аудиторія сайту в принципі невелика і на нього заходять одні і ті ж користувачі, але в інших випадках варто перевірити джерело таких відвідувань, тому що цілком можливо, що дані сесії генеруються одним ботом, тому і показник нових сеансів низький.
Приклад 5. Дивна активність з інших технологічних фільтрів: ОС, браузеру, пристрою, IP-адреси.
Іноді слід звернути увагу на технологічні звіти GA — там також зустрічається багато цікавого. Часто ми можемо бачити великий відсоток трафіку з нецільового для нас гео, або дивні показники з будь-якого браузера або операційної системи.
Висновок
Описане вище — елементи «обов'язкової програми» боротьби з ботами. Якщо ми маємо справу з більш досконалими «створіннями», які ведуть себе як нормальні користувачі, є ще один підхід.
Поведінка людини і бота на сайті може відрізнятися тим, що людина, перейшовши на сайт, розуміє, які області тут клікабельні, які йому цікаві, і звертає увагу тільки на деякі кнопки.
А бот клікає на сайті всі елементи, які для цього призначені. Щоб відсіяти даний тип шахрайства, ми можемо додати на сайт невидимий оку клікабельним піксель і налаштувати в GA відповідні події і цілі, пов'язані з кліком по цьому пікселю. Таким чином канал, з якого будуть приходити сеанси з цілями, які спрацювали при натисканні на даний піксель, потрібно буде додатково перевірити на якість трафіку, тому що справжній відвідувач (не бот) може зробити таку подію на сайті тільки випадковим чином.
Але таких сеансів було не більше 0,1% від загальної кількості аудиторії на сайті.
Обробка: Vinci