Какие данные запрещено собирать в Google Analytics

Не все знают об этом, но в Google Analytics запрещено отправлять или загружать данные позволяющие идентифицировать конкретного пользователя. За нарушение ваш аккаунт могут заблокировать.

Вот выдержка из правил:

Не загружайте никакие данные, позволяющие идентифицировать личность пользователя (имена, номера социального страхования, адреса электронной почты и т. п.) или отдельное устройство (например, уникальный идентификатор мобильного телефона, если его нельзя сбросить), даже в хешированной форме.
Если вы нарушите указанные выше правила, ваш аккаунт Google Analytics может быть закрыт, а все данные утрачены.
Чтобы не попасть впросак и потом не лить горькие слезы, всегда внимательно проверяйте данные, которые вы загружаете.

Но даже если вы специально не отправляли никаких пользовательских данных, они все равно могут присутствовать в Google Analytics.

Как? Очень просто, чаще всего в этом виноваты параметры форм, которые попадают в URL по мере заполнения или в момент отправки формы.
А как мы помним Google Analytics фиксирует все посещенные пользователем URL.

Чтобы проверить есть ли пользовательские данные в адресах ваших страниц, проделаем следующее:

  1. Зайдем в отчет «Поведение > Контент сайта > Все страницы».
  2. Выберем период побольше (например год).
  3. Введем в строку поиска символ «@» (так мы найдем все URL, содержащие адреса электронной почты).
    Расширенный фильтр Google Analytics
  4. И увидим следующее (если не увидим, то разработчики сайта молодцы).
    Персональные данные в Google Analytics

Ужас-ужас… Помимо адресов электронной почты в URL содержатся номер телефона и ФИО!

Чтобы такого не происходило, во-первых необходимо попросить разработчиков сайта отсылать результаты формы на сервер не через GET-запрос, а через POST, во-вторых использовать фильтры Google Analytics вырезающие пользовательские данные.

Ниже я делюсь некоторыми популярными фильтрами.

Фильтрация e-mail

  1. Заходим в «Администратор > Аккаунт > Все фильтры» и нажимаем «Добавить фильтр».
  2. Для фильтрации e-mail в URL будем использовать пользовательский фильтр «Найти и заменить».
  3. Выбираем поле фильтра «URI запроса».
  4. В строке поиска указываем регулярное выражение
    ([a-zA-Z0-9_.+\-]+(@|%40)[a-zA-Z0-9\-]+.[a-zA-Z0-9\-.]+)
  5. В «Заменить строку» указываем то, на что будем заменять найденный e-mail.
  6. И нажимаем «Сохранить».
    Настройка фильтра Найти и заменить в Google Analytics

Теперь, благодаря данному фильтру, все адреса электронной почты попадающие в URL будут заменяться на указанное нами слово, либо удаляться совсем (если ничего не указано в поле замены).

Фильтрация номера телефона

По тому же принципу работает фильтр замены номера телефона, здесь я укажу только регулярное выражение необходимое для поиска и замены.

((8|\+7)[\- ]?)?(\(?\d{3}\)?[\- ]?)?[\d\- ]{7,10}

Из важного

  • Фильтр применяется только к новым данным, поступающим в Google Analytics после его публикации. То есть исторические данные затронуты не будут.
  • Фильтр применяется всего один раз на URL, то есть если у вас в URL содержится несколько адресов электронной почты, нужно создать дополнительную копию фильтра.
  • Помимо URL вы можете фильтровать различные параметры, такие как имя хоста, название страницы, действие по событию, ключевое слово и тп.
    Типы фильтруемых данных в Google Analytics

Как применять фильтр «Найти и заменить» для фильтрации событий я описал в статье «Русскоязычные типы звонков CallTouch в Google Analytics».
Пользуйтесь!

Роман Романчук

Эксперт по маркетинговой и продуктовой аналитике, ex-директор по аналитике Сравни.
3 replies on “ Какие данные запрещено собирать в Google Analytics ”
  1. Спасибо за полезный материал. Я правильно понимаю, что фильтр будет применяться только к данным в интерфейсе GA? То есть если у нас подключен BQ, то там все останется в первоначальном виде, вместе с имейлами в урлах?

    1. BQ связывается с определенным представлением GA, к данным в котором уже применен фильтр, то есть при экспорте в BQ данные будут такие же, как в и представлении.

  2. что-то у меня странно получается, я сделал все что указанно.
    В реальном времени вырезает, в отчетах по страницам я вижу исходные данные что ни так?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *