Объединяем данные из нескольких источников в Google Data Studio

В Data Studio наконец-то появился долгожданный функционал, позволяющий объединять данные из разных источников в рамках одной визуализации. Об этой возможности я начал мечтать, когда еще только познакомился с этим замечательным инструментом.

Давайте же разберемся подробнее, что это за функционал, как им пользоваться и подходит ли он для «сквозной аналитики» 🙂

Зачем нужно объединение данных?

По умолчанию, визуальные элементы Data Studio позволяют использовать в качестве источника, какой-то один вариант. Объединение данных позволяет создавать диаграммы на основе нескольких источников, называемых совмещенными источниками данных . Например, вы можете объединить два разных источника данных — Google Analytics и Google Sheets, чтобы отслеживать эффективность вашего сайта в одной визуализации.

Создание таких источников непосредственно в Data Studio устраняет необходимость использовать промежуточные приложения или программы, экономя ваше время и деньги.

Как работает объединение данных?

Совмещенные источники создаются путем объединения всех записей из одного источника с записями до четырех других источников данных. Чтобы объединить данные, каждый источник должен иметь один или несколько ключей, благодаря которым будет происходить соединение (например Client ID). Совмещенные источники включают все записи из самого первого источника данных в редакторе объединения, а также соответствующие записи из источников находящихся справа.

Например, на картинке ниже вы видите два источника данных: «Google Analytics» и «Выгрузка из CRM». Ключом соединения является Client ID.

Совмещение данных

Технически, совмещенный источник данных является продуктом операции внешнего соединения (вспоминаем LEFT JOIN из статьи об SQL) . При соединении данных из источника под названием «Google Analytics» (A) и источника «Выгрузка из CRM» (B) результатом будут являются все записи первого источника и записи во втором источнике, которые используют одни и те же значения ключа.

left join

Ограничения

Однако у данного функционала есть ряд существенных ограничений:

  • Совмещенные источники данных относятся к отчету, в котором они были созданы. Чтобы повторно использовать совмещенный источник данных в другом отчете, нужно скопировать и вставить визуализацию с данным источником в новый отчет;
  • Можно объединить не более 5 источников данных в одной диаграмме;
  • Совмещенные источники доступны только в отчетах и вы не увидите их в разделе «Источники данных»;
  • Создание вычисляемых полей в совмещенных источниках данных в настоящее время не поддерживается. Что на мой взгляд является критичным и делаем функционал сырым, так как даже банально посчитать конверсию не получится.

Тестируем функционал

Для начала давайте определимся с тем что мы имеем и что хотим получить?

  1. В качестве первого источника — данные из счетчика Google Analytics, в котором настроена фиксация Client ID.
  2. В качестве второго источника — выгрузка из CRM в Google Sheets, где также содержится Client ID, который мы будем использовать в качестве ключа для объединения данных.

    Данные из crm

  3. Директором по маркетингу перед нами поставлена задача — узнать, кто из клиентов оплачивает выставленные счета при помощи техники Apple (наверное, хочет выявить аудиторию наиболее подверженную маркетинговым уловкам, ха-ха).

Создаем совмещенный источник данных

Чтобы получить такой отчет, нам необходимо совместить данные из Google Analytics и выгрузку из CRM (которые предварительно должны быть добавлены в Data Studio, как отдельные источники). Делается это следующим образом:

  1. Заходим в отчет и рядом с названием основного источника данных нажимаем на специальную кнопку «Совмещение данных»:

    Совмещение данных

  2. Далее попадаем в редактор объединения данных, в котором выбираем источники для объединения, ключ для связки (Client ID) и необходимые нам параметры и показатели:

    Редактор объединения данных

  3. Сохраняем и приступаем к созданию отчета.

Создаем отчет

Как создавать диаграммы и прочие визуализации в данной статье я разбирать не буду, так как подробно рассказывал об этом в одной из ранних статей — «Data Studio — базовые знания».

В отчете я решил вывести:

  • Диаграммы с типом устройства и его названием;
  • Таблицу содержащую подробную информацию о клиенте;
  • А также фильтры по статусу из CRM и бренду.

Теперь давайте посмотрим что получилось:

Отчет на основе данных GA и CRM

Выводы

Функционал хороший, нужный и давно ожидаемый, но по моему скромному мнению еще достаточно сырой. Так что будем ждать обновлений!

А пока, для чего-то серьезного используем Power BI 😉

Роман Романчук

Эксперт по маркетинговой и продуктовой аналитике, ex-директор по аналитике Сравни.
16 replies on “ Объединяем данные из нескольких источников в Google Data Studio ”
  1. Роман, добрый день! Подскажите, пожалуйста, в чем может быть ошибка? У меня не получается корректно вывести данные при сведении двух таблиц. Пытаюсь объединить таблицу расхода по площадкам с выручкой.
    Данные без объединения http://dl4.joxi.net/drive/2018/08/22/0003/0230/237798/98/025fdefd1d.jpg
    Данные после объединения http://dl4.joxi.net/drive/2018/08/22/0003/0230/237798/98/9a95761ef2.jpg
    Самое интересное, что в таблице с расходами всего расходов на 11600
    Настройки связи: http://dl3.joxi.net/drive/2018/08/22/0003/0230/237798/98/ffbe436a73.jpg

  2. Добрый день. Есть два источника данных: Яндекс Директ и Гугл Аналитикс. При построении отчетов расходы обычно берем из Яндекс Директа, а доход из Электронной коммерции в Аналитиксе. Как объединить эти два канала информации, чтобы выводить такие показатели как ДРР?

    1. Здравствуйте, Владимир!
      В первую очередь вам необходимо собрать расходы и доходы в едином источнике данных. Для этого загружайте расходы по Яндекс.Директ в Google Analytics при помощи бесплатного решения от OWOX https://support.owox.com/hc/ru/articles/216649768-%D0%98%D0%BC%D0%BF%D0%BE%D1%80%D1%82-%D1%80%D0%B0%D1%81%D1%85%D0%BE%D0%B4%D0%BE%D0%B2-%D0%9F%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D1%8C%D1%82%D0%B5-%D0%BD%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B9%D0%BA%D0%B8-%D0%B2-Google-Analytics
      И далее, уже в Data Studio, используя лишь один коннектор к Google Analytics, вы можете построить любой отчет и посчитать ДРР.

  3. а если я хочу соединить три источника данных, все таблицы должны быть связаны между собой? Например, у меня 1 таблица с лидами и 2 справочника — в одном статусы лидов, в другом менеджеры. справочники между собой не связаны (статусы и менеджеры), но data studio требует связи

    1. В Data Studio, вам нужен какой-либо идентификатор для объединения, присутствующий во всех таблицах.
      То что вы хотите сделать, можно реализовать либо в базе данных, либо в Power BI.

  4. Создание вычисляемых полей в совмещенных источниках данных в настоящее время не поддерживается. Спасибо, а то два часа промучался, думал я чего-то не догоняю, оказывается сор мной всё ок)

  5. Подскажите можно ли в одной таблице просуммировать данные из разных аккаунтов гугл аналики?
    например подсчитать сколько всего было пользователей на разных сайтах, что-то типа пользователи на сайте А + пользователи сайта Б

  6. Здравствуйте! Не получается объеденить google ads и yandex direct, потому что у гугла почему то ключ объединения не data , а «день». Или наоборот, у гугла «день», а у директа такого показателя нет http://prntscr.com/m05gzg
    http://prntscr.com/m05hlb

    Как их подружить?

    1. Здравствуйте!
      А какая разница, как называются параметры? Главное чтобы в значении была дата.
      Объединяйте по «data» и «день».
      Также вы можете в источнике данных переназвать параметры, как захотите.

  7. Здравствуйте, подскажите, пожалуйста, как объединить данные из Яндекс Директ и Google Analytics. Не получается совместить, так как нет ни одного общего поля. Выглядит вот так — https://yadi.sk/i/K-HWg9lVs3gZXw
    Насколько я понимаю, проблема может быть в разном формате даты или в разном языке интерфейса. Но, почему-то в google data studio все поля из GA на русском, хотя язык аккаунта у меня там выбран английский — https://yadi.sk/i/0PNjrkO3rX0FlQ
    Как можно было бы это решить?
    Спасибо!

  8. Добрый день.
    А есть какая-то возможность построить отчет в Дата студии, совместим данные по продажам из CRM и расходы на рекламу из Analytics, связав их через Client ID?
    Пока нет идей….
    А в Power Bi в стандартном коннекторе нашел только расходы на адвордс. А если я заливаю расходы и из директа через Овокс, в power как-то можно их достать?
    Или такое делается исключительно через заливку данных в облако и там уже все считать?
    Спасибо

    1. Добрый день!
      > А есть какая-то возможность построить отчет в Дата студии, совместим данные по продажам из CRM и расходы на рекламу из Analytics, связав их через Client ID?
      Расходы нельзя привязать к пользователям. Только к источнику, каналу, кампании и ключевому слову.
      Подробнее тут http://thisisdata.ru/courses/digital-analytics/section3-lesson2/

      > А в Power Bi в стандартном коннекторе нашел только расходы на адвордс. А если я заливаю расходы и из директа через Овокс, в power как-то можно их достать?
      Все правильно, абсолютно все расходы, которые вы импортируете в GA (в том числе по Директу), будут находиться в adCost https://developers.google.com/analytics/devguides/reporting/core/dimsmets#view=detail&group=adwords&jump=ga_adcost

      1. Спасибо. С Power bi разобрался, да там просто ad cost.

        А вот с DataStudia, я понимаю что по источникам. Но я думал так:
        Весь расход за день (ну или расход за период по источникам) делим на кол-вто заказов из СРМ за этот период (по источникам или в сумме).
        Так-то вроде несложно, но при объединении данных свои поля создавать нельзя..
        И как это обойти идей нет.
        В PB это сделал через меру, но GDS мне больше нравится 😉

  9. Создание вычисляемых полей в совмещенных источниках данных в настоящее время не поддерживается. Что на мой взгляд является критичным и делаем функционал сырым, так как даже банально посчитать конверсию не получится.

    Вот этого прям катасторфически не хватает. Странно, они вроде используют sql стандарт left outer join, и казалось бы, в памяти все равно будут храниться поля из объединенных данных, но при этом над ними нельзя производить вычисления((

    UPD: кстати появилась возможность создавать вычисляемые поля на объединенных данных, только что случайно обнаружил

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *