Как очистить отчёты Аналитикс от спама

В последнее время, в отчётах многих аккаунтов Аналитикс стали появляться «чужеродные вкрапления», чаще всего это ложные события или псевдо переходы с сайтов, известные как referral-спам:

Реферальный спам в Гугл Аналитикс

Откуда спам появляется?



Причиной появления этого мусора стал Measurement Protocol, ставший доступным с выходом последней версии Universal Analytics. Сама по себе это вещь полезная, так как позволяет отправлять в Аналитикс данные с любых платформ и устройств, а не только с сайта. Буквально, с помощью простого браузера вы можете отправить любое событие Аналитикс в любой аккаунт, без проверок и валидаций.

Но как мы знаем, в плохих руках даже безобидный робот Чаппи может стать опасным оружием ;) Поэтому и здесь нашлись умельцы, которые стали использовать эту технологию во вред — рассылать спам, просто перебирая номера аккаунтов.

Важно отметить, что такой способ спама никак не затрагивает ваш сайт, он только засоряет отчёты Аналитикс. Поэтому если вы видите в своих отчётах подобный спам, то не стоит сразу паниковать, что вас взломали. Скорее всего это просто спам-трафик.

Но в некоторых случаях, действительно причиной спама может быть взлом сайта или активность ботов. Поэтому, если метод очистки от спама, предложенный в этой статье, вам не поможет, тогда стоит провести более тщательную проверку на ботов или взлом.

Несмотря на то, что прямой угрозы спам-трафик не несёт, очищать его всё равно нужно. Так как он искажает ваши показатели, да и порой просто мешает работать с отчётами.

Как быстро выявить спам трафик



У всей этой спам схемы есть один недостаток, который помогает довольно точно вычислить, что это спам. Рассыльщики такого спама просто перебирают номера счётчиков, они не знают доменов, которым эти счётчики принадлежат. В этом можно убедиться, если отобрать спам трафик и посмотреть для него параметр «имя хоста».

У нормального трафика имя хоста должно содержать название вашего домена или на крайний случай домены сервисов, которые пользуются вашим сайтом:
У нормального трафика правильные хосты в Аналитикс

У спам трафика обычно либо вообще не указан домен, либо указаны какие-то явно левые названия:
Хосты реферального спама в Аналитикс

Соответственно, весь трафик, у которого имя хоста не совпадает с вашим доменом, с высокой вероятностью является спамом.

Как очистить отчёты от спама



Для этого нам надо будет настроить фильтр, который будет исключать всё, что не соответствует вашему домену. Сделаем это по шагам.

Шаг 1: Заходим в отчёты «Аудитория -> Технологии -> Сеть», над открывшейся таблицей кликаем ссылку «Имя хоста». Перед вами откроется список доменов вашего сайта, как их определяет Аналитикс. Из этого списка вам надо выбрать достоверные домены. Обычно это сам домен сайта, его поддомены и иногда несколько сервисов (переводчики).

Шаг 2: Складываем полученный список доменов в RegEx строку, которую будем использовать в фильтре. Для этого запишите все домены в строку, вместо запятых поставьте «|», а перед каждой точкой поставьте «\». Поддомены можно не писать, они зачтутся с основным доменом. Должно получится примерно так:
domen1\.ru|domen2\.ru|translate-tool\.com

Шаг 3: Заходим в раздел «Администратор» и настраиваем фильтр для вашего представления, как показано на картинке:

Фильтр для очистки реферального спама в Аналитикс

Такой фильтр будет пускать данные только для ваших доменов. Теперь спам трафик перестанет поступать в ваш профиль. Но что делать с тем спамом, который уже накопился в отчётах? Для этого переходим к следующему шагу.

Шаг 4: Чтобы очистить отчёты ретроспективно, надо создать сегмент, который исключит из отчётов активность с других доменов, как показано на картинке:

Сегмент для очистки отчётов Аналитикс от реферального спама

Применяйте этот сегмент при работе со старыми данными.

Вот такой довольно простой, но действенный способ.

Удачного вам анализа!

Время публикации: 05 Авг 2015
Опубликовано в рубрике Google Analytics - Ответы на вопросы |