Czy atrybucja w GA4 stanowi przełom? Jakie zmiany wprowadzono w modelowaniu atrybucji w porównaniu z Universal Analytics? Artykuł ten jest całościowym omówieniem atrybucji w Google Analytics.
W dzisiejszym świecie konwersję poprzedza zazwyczaj nie jeden, ale wiele punktów styku klienta z marką. Atrybucja polega na określaniu roli poszczególnych interakcji w generowaniu konwersji i przypisywaniu kanałom marketingowym liczbowego udziału we wszystkich konwersjach.
Jeśli w atrybucji stawiasz pierwsze kroki, warto wpierw zapoznać się z serią artykułów na temat modelowania atrybucji lub artykułem pomocy GA4 na temat atrybucji.
Wiosną 2024 roku wprowadzono zmianę w terminologii Analytics. Dotychczasowe „konwersje” zostały przemianowane na „kluczowe zdarzenia”, dla odróżnienia od „konwersji” wykorzystywanych w Google Ads, które mogą być tworzone na podstawie zdarzeń i współdzielone z Analytics.
Jak działa atrybucja w Google Analytics 4
Universal Analytics (UA) raportował według jednego modelu atrybucji, który przypisywał cały udział w konwersji ostatniemu poprzedzającemu ją kliknięciu (last click). Wizyta bezpośrednia nie jest kliknięciem, niemniej – dla uniknięcia wątpliwości – model ten nazywano również modelem ostatniego kliknięcia niebezpośredniego.
Inne modele atrybucji były dostępne wyłącznie w raportach ścieżek wielokanałowych, np. w porównaniach modeli atrybucji.
W GA4 mamy szerszą dostępność różnych modeli atrybucji, ale zależy to od zakresu, w jakim przygotowujemy raport – czy jest to zakres źródła sesji, zdarzenia czy pierwszej wizyty użytkownika.
Atrybucja w GA4 odbywa się na trzech odrębnych płaszczyznach: źródła sesji, pierwszej wizyty i zdarzenia.
W Universal Analytics wymiary źródła miały wyłącznie zakres sesji.
Uwaga. W artykule tym termin “źródło” używany będzie w szerszym rozumieniu jako każdy wymiar wskazujący pochodzenie wizyty, np. zgrupowanie kanałów, źródło (source), medium, treść reklamy, kampania, grupa reklam, słowo kluczowe, wyszukiwane hasło itp.
Źródło sesji
Atrybucja na poziomie sesji – co nie powinno być zaskoczeniem – określa źródło danej sesji. Wykorzystywana jest m.in. w raportach pozyskania ruchu w sekcji Raporty. Działa ona podobnie, jak w Universal Analytics, czyli zawsze wg metody ostatniego kliknięcia niebezpośredniego (last non-direct click).
Znaczy to, że źródłem sesji po prostu jest źródło, które rozpoczęło daną sesję, np. wejście z Facebooka lub organicznych wyników wyszukiwania. Ale jeśli sesja została rozpoczęta w wyniku wizyty bezpośredniej, źródłem sesji będzie źródło wcześniejszej wizyty, o ile taka miała miejsce.
Przypomnijmy, wizyta bezpośrednia (direct) oznacza, że Analytics nie wie, skąd przyszedł dany użytkownik, bo kliknięcie nie przekazuje referrera, parametru gclid czy utm. Więcej w artykule o wizytach bezpośrednich w Analytics.
Dlatego, podobnie jak w Universal Analytics, sesja będzie miała źródło direct tylko wtedy, gdy w ramach okna konwersji (w terminologii Analytics: okresu ważności, lookback window) Analytics nie widzi żadnych wcześniejszych wejść użytkownika z innego źródła. Domyślne okres ważności dla kluczowych zdarzeń w GA4 to 90 dni, w UA domyślnie było to 6 miesięcy. Do okresów ważności jeszcze wrócimy w tym artykule.
A tak w ogóle, czym jest sesja?
Sesja w rozumieniu Analytics nie jest tożsama z sesją przeglądarki.
W GA4 sesję rozpoczyna wejście na stronę www lub do aplikacji, a kończy ją brak aktywności przez określony limit czasu (domyślnie jest to 30 minut – zob. ten artykuł pomocy Analytics).
Zamknięcie okna przeglądarki nie kończy sesji. Jeśli zamkniemy okno przeglądarki, ponowne wejście na stronę w ramach limitu czasu będzie wciąż należało do tej samej sesji – chyba, że przeglądarka działa w trybie incognito lub innym, który kasuje cookies i dane przeglądarki po zamknięciu okna.
W Universal Analytics, sesja dodatkowo (niezależnie od czasu jej trwania) kończyła się o północy, co już nie ma miejsca w GA4.
Gdy w Universal Analytics użytkownik w trakcie trwania sesji wchodził ponownie z nowego źródła, dotychczasowa sesja była przerywana i rozpoczynała się nowa sesja z tym nowym źródłem.
W GA4 już tak się nie dzieje. Jeśli w trakcie sesji będzie miała miejsce wizyta z nowego źródła, nie zostanie stworzona nowa sesja, a źródło wizyty dla trwającej sesji pozostanie bez zmian.
Nie znaczy to, że wizyta z nowego źródła jest ignorowana. Źródło nowej wizyty zostanie odnotowane, a w raportach atrybucji na poziomie zdarzenia (o czym za chwilę) będą uwzględnione wszystkie źródła, z których nastąpiło wejście w każdej z sesji. Zob. też ten artykuł pomocy Analytics (wersja angielska jest bardziej precyzyjna, ale uwaga: w tym filmie jest wiele, delikatnie mówiąc, nieścisłości).
Typowym przykładem wejścia w trakcie sesji mogą być powroty z bramek płatności podczas finalizowania zakupu e-commerce lub ze stron serwerów poczty w przypadku np. odzyskiwania hasła lub potwierdzania rejestracji. W GA4 przynajmniej nie będą one sztucznie zawyżały liczby sesji.
Niemniej, takie wejścia stanowią tzw. przekierowania z niechcianych witryn odsyłających, które należy wykluczać. Wykluczenie będzie skutkowało traktowaniem takich wizyt na równi z wizytami bezpośrednimi. W GA4 będą one więc de facto ignorowane: ani źródło, ani liczba sesji się nie zmienią, a dostępne w GA4 modele atrybucji, w których obowiązuje zasada non-direct, nie przypiszą im żadnej wartości (o czym w dalszej części artykułu).
Źródło pierwszej wizyty
Atrybucja w kontekście pierwszej wizyty to nowość wprowadzona w GA4. Jej celem jest wskazanie, skąd użytkownik przyszedł do nas po raz pierwszy.
Jest to zwiastun zmiany paradygmatu mierzenia efektywności marketingu, w którym operujemy już nie klasycznym ROAS (przychody vs koszty), ale pojęciami LTV i CAC (wartość klienta w czasie vs koszt akwizycji).
Intuicyjnie, podejście takie jest bliższe analizie użytkowników aplikacji, gdzie najpierw trzeba doprowadzić do jej instalacji, a następnie angażować użytkownika w samej aplikacji. Niemniej, uogólnienie takiego podejścia na użytkowników stron www ma również głęboki sens.
Pierwsza wizyta ma miejsce po wywołaniu w systemie zdarzenia first_visit dla strony www lub first_open dla aplikacji. Nazwy chyba nie wymagają wyjaśnienia – jest to de facto pierwsze wyświetlenie przez danego użytkownika strony w witrynie lub ekranu aplikacji, na których zainstalowano śledzenie Analytics.
Źródło pierwszej wizyty jest więc atrybutem użytkownika i wskazuje, skąd nastąpiło pierwsze wejście tego użytkownika na stronę lub do aplikacji.
Źródło pierwszej wizyty jest przypisywane w modelu ostatniego kliknięcia niebezpośredniego. Chodzi oczywiście wyłącznie o te kliknięcia, które poprzedzały pierwsze otwarcie aplikacji lub pierwsze wejście na stronę (późniejsze nie są brane pod uwagę).
Raz nadane źródło pierwszej wizyty nie ulega zmianie, tzn. użytkownik, który odwiedził pierwszy raz stronę, po czym zainstalował aplikację i zaczął z niej korzystać – nie będzie miał zmienionego źródła pierwszej wizyty po pierwszym otwarciu aplikacji, oczywiście o ile Google Analytics będzie w stanie technicznie powiązać aktywności na stronie i w aplikacji z tym samym użytkownikiem.
Źródło pierwszej wizyty będzie mogło być wyzerowane w przypadku utraty ciągłości śledzenia, np. po braku wizyt przez okres ważności cookie Analytics. Do okresu gromadzenia danych i ważności cookie Analytics jeszcze wrócimy w tym artykule.
Atrybucja w zakresie zdarzenia
Zdarzenie jest podstawą raportowania w GA4. Administrator konta Analytics może oznaczyć niektóre zdarzenia jako kluczowe zdarzenia. Raporty w ustalonym modelu atrybucji można tworzyć wyłącznie dla kluczowych zdarzeń. Model ten wybieramy sami spośród modeli dostępnych w ustawieniach usługi (zob. ilustracja kilka akapitów poniżej). Domyślnie jest to model data-driven, ale możemy go w dowolnej chwili zmienić. Zmiana ta jest retroaktywna, tj. działa wstecz, czyli będzie miała wpływ również na dane historyczne.
Analytics pozwala na modelowanie atrybucji tylko dla kluczowych zdarzeń.
Mówi się, że Google Analytics zrywa z modelem ostatniego kliknięcia. Czy rzeczywiście? W praktyce atrybucja inna niż last-click, o ile ustawimy ją sobie jako obwiązującą dla zakresu zdarzeń, dostępna jest w przypadku samodzielnie dostosowanych raportów, np. w sekcji Eksplorowanie, które wykorzystują wymiary na poziomie zdarzenia, np. raport źródło – kluczowe zdarzenia.
Podstawowe zestawienia z sekcji Raporty: pozyskania ruchu i użytkowników, stosują wymiary źródła wykorzystujące model ostatniego kliknięcia (niebezpośredniego). Jest to (na szczęście) wyraźnie zaznaczone w nazwie wymiaru, np. Sesja – źródło.
Warto więc pamiętać, że Źródło, Źródło sesji i Źródło pierwszej wizyty to trzy różne wymiary, z różnymi dostępnymi modelami.
Zakres | Model Atrybucji | Gdzie dostępne |
Sesja | Ostatnie kliknięcie | Np. raport pozyskania ruchu |
Pierwsza wizyta użytkownika | Ostatnie kliknięcie (poprzedzające pierwszą wizytę) | Np. raport pozyskania użytkownika |
Zdarzenie | Model wybrany w ustawieniach usługi (domyślnie data-driven) | Raporty własne, np. w sekcji Eksplorowanie |
Ustawienia modelu atrybucji
W ustawieniach usługi Google Analytics 4 możemy zdefiniować obowiązujący model atrybucji. Będzie on miał zastosowanie w całej usłudze GA4, niemniej warto przypomnieć: dotyczyć to będzie wyłącznie raportów w zakresie zdarzenia.
Raporty źródła sesji i źródła pierwszej wizyty będą wciąż w modelu ostatniego kliknięcia niebezpośredniego.
Do wyboru jest kilka modeli atrybucji, znanych z Universal Analytics (opisane we wspomnianym już artykule pomocy Analytics).
Warto jednak zwrócić uwagę, że:
- Wszystkie modele nie przypisują wartości wejściom bezpośrednim, chyba że nie mają innego wyjścia, bo na ścieżce nie ma żadnej innej interakcji – czyli wszystkie stosują zasadę „non-direct”, czego nie było w Universal Analytics.
- Modele preferujące Google Ads przypisują całą wartość kluczowych zdarzeń reklamom Google Ads, o ile wystąpiły na ścieżce. Aktualnie dostępny jest jeden model preferujący Google Ads – model last click, który jest odpowiednikiem „ostatniego kliknięcia Google Ads” znanego z Universal Analytics. W razie braku Google Ads na ścieżce, model ten działa jak „zwykły” last click.
- Poza kliknięciami, modele uwzględniają „zaangażowane wyświetlenia” reklam w YouTube, czyli obejrzenie całości lub 30 sekund filmu reklamowego oraz inne związane z tą reklamą kliknięcia (szczegóły w tym artykule pomocy Google Analytics).
Przypomnijmy: zmiana ustawień modelu atrybucji działa retroaktywnie, tzn. będzie zastosowana również do danych sprzed wprowadzenia zmiany. Zapisane eksploracje podczas ich wyświetlania będą przeliczane na nowo.
Uwaga. Od roku 2023 modele pierwszego kliknięcia, liniowy, uwzględniania pozycji i rozkładu czasowego nie są już dostępne.
Okres ważności
Ustawienia Google Analytics określają długość okresu ważności kluczowych zdarzeń (lookback widnow), czyli czasu, w którym interakcje są uwzględniane do atrybucji – więcej w artykule na ten temat). Domyślnie jest to 90 dni, ale można ten okres zmienić na 60 lub 30 dni (zob. ilustracja powyżej).
Zgodnie z dokumentacją Analytics, ustawienia okresu ważności dotyczą wszystkich modeli atrybucji i wszystkich typów kluczowych zdarzeń w Google Analytics 4, a więc ustawienie to dotyczy również atrybucji na poziomie sesji, a także porównań modeli atrybucji.
W przypadku atrybucji źródła pierwszej wizyty mamy oddzielnie definiowany okres ważności (domyślnie 30 dni, można go zmienić na 7 dni). Zastanawiasz się, dlaczego jest to definiowane inaczej? Jeśli tak, to przede wszystkim warto zastanowić się, dlaczego w ogóle mamy jakikolwiek okres ważności (lookback window) dla pierwszej wizyty. I dlaczego w ogóle mówimy o modelu atrybucji dla pierwszej wizyty, który – przypomnijmy – to zawsze ostatnie kliknięcie niebezpośrednie.
Pierwsza wizyta ma przecież swoje źródło w momencie jej rozpoczęcia, a wcześniejszych wejść na stronę, a co za tym idzie, ich źródeł – nie mamy. Jaki jest więc sens patrzeć głębiej, niż pierwsza interakcja ze stroną/aplikacją?
Wynika to z możliwości wzbogacania przez Google Analytics 4 danych zbierane przez nasz kod śledzący o m.in. posiadane przez Google informacje o zalogowanych użytkownikach, dzięki czemu może odnotować, że przed pierwszą wizytą dany użytkownik na innym urządzeniu miał zaangażowaną interakcję z naszą reklamą na YouTube. Wiąże się to z funkcjami Google Signals i wykorzystaniu danych przekazanych przez użytkowników – które trzeba aktywować i skonfigurować dodatkowo.
Podobnie, w przypadku pierwszego wejścia do aplikacji (first_open), może się ono odbyć podczas sesji bezpośredniej, ale wynikać z wcześniejszych kliknięć reklamy zachęcającej do instalacji aplikacji.
Dlatego, jeśli źródło sesji pierwszej wizyty jest nieznane (jest to wizyta bezpośrednia, direct) Google Analytics może spróbować przypisać źródło pierwszej wizyty wcześniejszej interakcji, o ile miała miejsce w okresie ważności.
W GA4 mogą być odnotowywane interakcje z reklamami, które miały miejsce przed pierwszą wizytą użytkownika.
Zmiany okresu ważności nie działają retroaktywnie. Oznacza to, że obowiązują dopiero od momentu ich wprowadzenia.
Niezależnie od ustawień atrybucji, zaangażowane wyświetlenia reklam YouTube uwzględniane są wyłącznie w dwudniowym okresie ważności.
Pożegnanie z logiką cookie?
Jest to niuans, ale warty odnotowania. W Universal Analytics domyślny okres ważności dla raportów pozyskania wynosił 6 miesięcy i jego ewentualna zmiana była również nieretroaktywna. Zmiana dotyczyła jednak nie zdarzeń, ale interakcji, które miały miejsce od momentu wprowadzenia zmiany. Odwzorowywało to logikę cookie źródła _utmz, które miało czas trwania nadawany w momencie jego utworzenia, czyli wejścia z danego źródła. Co prawda Universal Analytics nie wykorzystywał już cookie _utmz (było one we wcześniejszych wersjach), ale dla zachowania spójności danych ich logika była utrzymywana.
Przykładowo, zmiana okresu ważności w Universal Analytics z 30 na 90 dni nie powodowała natychmiastowego uwzględnienia interakcji sprzed 90 dni dla zdarzeń od dnia zmiany, bo „cookie źródła” interakcji starszych niż 30 dni już „wygasło”. Musiał upłynąć okres przejściowy, po którym wszystkie zdarzenia były w pełni raportowane wg nowego okresu ważności (w tym przykładzie dochodzenie do pełnego raportowania w nowym okresie ważności trwałoby 90 dni).
GA4 wykorzystuje inny model danych, bez ciągłości z danymi UA, przez co mógłby zerwać z tymi zaszłościami, i odnosić zmiany okresu ważności do wszystkich zdarzeń które miały miejsce od momentu zmiany tak, jak to się odbywa obecnie w Google Ads. Interpretacja takich danych jest dużo łatwiejsza.
Mógłby, ale tak się nie dzieje. Zmiany okresu ważności w GA4 dotyczą interakcji, które w dniu zmiany wciąż znajdowały się w ramach okresu ważności. Przykładowo, przy zmianie okresu ważności z 30 na 90 dni, kluczowe zdarzenia nie będą natychmiastowo raportowane z 90-dniowym okresem ważności Musi upłynąć okres przejściowy – w tym przykładzie: 60 dni (interakcje z dotychczasowego, 30-dniowego okresu ważności będą zachowane). W przypadku skrócenia okresu ważności, np. z 90 na 30 dni, zmiana będzie działała natychmiastowo do wszystkich konwersji od dnia zmiany.
Czas trwania cookie i retencja danych
Cookie Google Analytics 4 ma standardowy okres ważności (czas trwania) 24 miesiące, ale można go zmienić w przedziale od jednej godziny do 25 miesięcy (lub ograniczyć do sesji). Kolejne wizyty mogą ten limit czasu odnawiać. Będzie to okres, w którym Analytics będzie w stanie rozpoznać powracającego użytkownika, w szczególności pamiętać jego źródło pierwszej wizyty – zob. ten artykuł pomocy GA4).
Nie znaczy to jednak, że GA4 będzie tak długo “pamiętać” dane użytkownika. Poza czasem trwania ciasteczka, mamy jeszcze okres przechowywania danych w GA4 (data retention). Domyślnie jest to jedynie 2 miesiące, ale można (tzn. należy) to ustawienie zmienić na 14 miesięcy (dla płatnej wersji Analytics 360 może to być nawet do 50 miesięcy) – zob. ten artykuł pomocy Analytics). Po upływie tego czasu dane na poziomie użytkownika są usuwane z serwerów Google. Aby zachować te dane, trzeba je wyeksportować np. do BigQuery (zob. ten artykuł pomocy GA4).
W szczególności oznacza to, że raporty w sekcji Eksplorowanie można wykonywać tylko w granicach tego okresu (zauważ, nie da się wybrać zakresu dat wychodzącego poza ten okres).
Ograniczenia te nie dotyczą standardowych raportów, które przechowują dane zagregowane – te dane zachowamy “na zawsze”.
Należy zakładać, że dla bezpłatnej wersji GA4 dane o źródle pierwszej wizyty użytkownika zostaną skasowane po 14 miesiącach nieaktywności, podobnie jak zresztą wszystkie pozostałe jego dane i po upływie tego czasu będzie on traktowany jak nowy użytkownik (za wyjątkiem zagregowanych danych sekcji Raporty).
Eksport konwersji do Google Ads
Eksport kluczowych zdarzeń do Google Ads jest często wykorzystywany w miejsce natywnego kodu konwersji Google Ads, jako najszybszy sposób implementacji śledzenia konwersji w reklamach, choć w dobie powszechnego stosowania GTM ta oszczędność czasu wydaje się iluzoryczna, a rozwiązanie wiąże się z pewnymi niuansami, z których stosujący je często nie zdają sobie sprawy.
W 2023 roku wprowadzono dodatkowe, opisane poniżej ustawienia dające lepszą kontrolę nad zasadami importu konwersji z Analytics do Google Ads.
Kluczowe zdarzenie wyeksportowane do Google Ads staje się konwersją. Eksport konwersji z Analytics może się odbywać na dwa sposoby:
Kanały płatne
Przypisanie do kanałów płatnych powinno działać w sposób zbliżony do tego, jak działa natywny kod śledzenia konwersji Google Ads. Ilekroć na ścieżce pojawi się reklama Google Ads, zostanie ona uwzględniona w atrybucji w pełnym wymiarze, a pozostałym kanałom, jak np. wizytom z bezpłatnych wyników wyszukiwania (organic) czy kliknięciom reklam w mediach społecznościowych nie będzie przypisywana wartość.
Jest to obecnie domyślny sposób eksportu dla kont utworzonych od momentu udostępnienia tej funkcji.
Kanały płatne i bezpłatne
Przypisanie do kanałów płatnych i bezpłatnych będzie uwzględniać inne kanały na ścieżce, tak jak to robi Analytics.
Przykładowo, w modelu ostatniego kliknięcia będzie to oznaczało, że wejścia z innych źródeł następujące po wizytach z Google Ads nadpiszą to źródło i taka konwersja nie zostanie zaimportowana do Google Ads.
W modelu data-driven będzie to oznaczać, że eksportowana wartość zostanie pomniejszona o wartość przypisaną pozostałym kanałom na ścieżce (w pewnych sytuacjach może to oznaczać, że wartość ta będzie wynosić 0, jeśli tak uzna algorytm atrybucji data-driven, i wtedy żadna wartość konwersji w Google Ads nie zostanie odnotowana).
W starszych kontach, założonych w czasie, gdy była to jedyna dostępna opcja, pozostała ona niezmieniona (teraz oczywiście można zmienić).
Więcej informacji w tym artykule pomocy Google Ads.
Uwaga. Google przez kanały płatne w tym przypadku rozumie reklamy Google, a kanały bezpłatne to pozostałe źródła, w tym inne reklamy.
Problemy z konwersjami eksportowanymi
Przeciwko wykorzystywaniu konwersji importowanych z Google Analytics z przypisaniem do kanałów płatnych i bezpłatnych (opcja 2) do optymalizacji kampanii Google Ads przemawia wiele argumentów, jak zmniejszenie ilości sygnałów dla Google Ads w porównaniu z natywnym śledzeniem konwersji Google Ads i egzotyczna atrybucja w przypadku stosowania modelu single touch takiego jak model ostatniego kliknięcia.
Można argumentować, że przypisanie do kanałów płatnych i bezpłatnych umożliwia uwzględnienie współdziałania innych kanałów z Google Ads.
Przykładowo, jeśli zaczęliśmy masową kampanię w social media, wyniki Google Ads mogą się poprawić, ale pojawia się pytanie, czy nie należałoby uwzględnić tego w wartości przypisywanej reklamom w Google Ads? Zmniejszenie eksportowanej wartości mogłoby powstrzymać algorytmy optymalizujące Google Ads przed nadmiernymi wydatkami i zbyt optymistycznym podejściem do własnej skuteczności.
Z drugiej strony, skoro prowadzona jest kampania i utrzymuje się wysoka konwersyjność, czy nie lepiej właśnie w tym czasie nie temperować reklam w Google?
Niezależnie od przyjętej strategii, ustawienie eksportu z przypisaniem do kanałów płatnych i bezpłatnych naraża nas na niebezpieczeństwo w przypadku nieprzewidzianych błędów konfiguracyjnych Google Analytics oraz tagowania linków, takich jak niepożądane referrale czy nadmiarowe parametry utm, które mogą sztucznie wpływać na raportowanie i zniekształcać optymalizację.
Przykładowo, jeśli pojawi się nowa, popularna bramka płatności i nie zostanie ona natychmiast wykluczona z atrybucji jako niechciane odesłanie, może spowodować, że zostanie do niej jako źródła ruchu przypisana wartość, co spowoduje spadek wartości konwersji eksportowanej do Google Ads, co może być sygnałem dla optymalizatora, że pogorszyła się skuteczność reklam i należy ograniczyć wydatki.
Stosując tę opcję eksportu (kanały płatne i bezpłatne), trzeba więc na bieżąco monitorować poprawność danych w Analytics bo mogą one bezpośrednio wpłynąć na algorytmy optymalizacyjne.
Import konwersji z Analytics może dostarczyć ciekawych danych, niemożliwych do zebrania w Google Ads, ale wykorzystywanie ich jako celów optymalizacji kampanii Google Ads wymaga świadomego i umiejętnego doboru ustawień. Zob. też w ten artykuł na LinkedIn Pulse.
Porównania modeli atrybucji
Niezależnie od ustawień modelu atrybucji na poziomie usługi, Google Analytics umożliwia porównywanie różnych modeli atrybucji w sekcji Reklama. Obecnie dostępne są dokładnie te same modele, które możemy wybierać w ustawieniach usługi i nie ma możliwości ich modyfikacji, czyli tworzenia modeli niestandardowych.
Co ciekawe, GA4 umożliwia raportowanie w dwóch aspektach czasowych atrybucji – do czasu interakcji z reklamą oraz do czasu wystąpienia zdarzenia (w Universal Analytics dostępna była wyłącznie druga opcja).
Przypisanie do czasu interakcji typowe jest dla systemów reklamowych, gdzie konwersje przypisywane są do kliknięć, a co za tym idzie – kosztów. Dzięki temu unika się dziwnej sytuacji, w której mamy raportowane konwersje, które zaszły po zakończeniu kampanii, w okresie, w którym nie wydajemy nic na reklamę. Pozwala to też na rzetelne powiązanie kosztów z przychodami.
Z drugiej strony, przypisanie do czasu interakcji może spowodować, że łączna liczba konwersji (kluczowych zdarzeń) zmieni się w zależności od modelu atrybucji, bo różne modele mogą przypisać wartość do kliknięć spoza okresu raportowania. Ponadto, do czasu zakończenia okresu ważności, najnowsze raporty mogą się zmieniać w czasie – co nie ma miejsca w przypadku, gdy wszystkie kluczowe zdarzenia przypisane są do czasu ich zajścia.
Jak widać, oba podejścia mają swoje zalety i wady, więc dobrze, że mamy możliwość korzystania z obydwu.
Najpopularniejsze ścieżki atrybucji
Raport ścieżek atrybucji w GA4 został wzbogacony o dodatkowe dane: czasu do kluczowego zdarzenia oraz liczby interakcji dla danej ścieżki, co pewnym sensie rekompensuje brak raportów upływu czasu i długości ścieżki, które stanowiły osobne raporty w UA.
To, co może w pierwszym momencie dziwić, to możliwość wyboru modelu atrybucji dla tego raportu. Rzecz jasna, model atrybucji nie wpływa na ścieżki atrybucji – pozostają one takie same, nie zmienia się ich długość ani czas do kluczowego zdarzenia.
Rzecz w tym, że w GA4 na wizualizację ścieżki nałożono jeszcze udział, jaki przypisano danej interakcji lub ich serii w danym modelu atrybucji. W modelu last click ostatnie interakcje będą miały 100% udziału w atrybucji, ale w pozostałych – rozkład będzie inny, co pozwala chociażby lepiej zrozumieć, jak w naszym przypadku zadziałał model data-driven.
Ponadto, ponad raportem ścieżek umieszczono dodatkowe wykresy słupkowe, wizualizujące sposób, w jaki dany model atrybucji przypisał wartość kanałom na początku, w środku i na końcu ścieżki. Początek to pierwsze 25% interakcji na ścieżce, koniec to ostatnie 25%. Środek to pozostałe 50% interakcji pomiędzy początkiem i końcem ścieżki.
Jeśli dziwi Cię, że wizualizacja ta nie przypisuje udziałów w oczekiwanej proporcji modelom multi-touch, to zwróć uwagę, że w przypadku ścieżek z dwiema interakcjami dla modeli multi-touch, mamy tylko interakcję pierwszą i ostatnią (nie ma środkowych), a w przypadku ścieżki z jedną interakcją – mamy tylko interakcję ostatnią (co chyba najbardziej zniekształca raport, pewnie lepiej by było, gdyby Analytics w tej sytuacji podzielił wartość w równych częściach ułamkowych, tzn. jedyna interakcja byłaby w jednej trzeciej pierwsza, w jednej trzeciej środkowa i w jednej trzeciej ostatnia).
Tak więc, model atrybucji będzie miał wpływ wyłącznie na wykresy słupkowe w górnej części raportu oraz na procentowe udziały w samej wizualizacji ścieżek. Dane liczbowe z tabeli (interakcje na ścieżkach, kluczowe zdarzenia, przychody, długość ścieżki i czas do wystąpienia zdarzenia) pozostaną bez zmian niezależnie od modelu atrybucji.
Pracując zarówno z raportem ścieżek, jak i z porównaniem modeli atrybucji należy pamiętać (podobnie jak w UA) o wybraniu najpierw konkretnego kluczowego zdarzenia, którego atrybucję chcemy modelować, bo domyślnie te zestawienia wykonywane są łącznie dla wszystkich kluczowych zdarzeń w usłudze.
Zakresy (scope) w raportach
Powtórzmy – w GA4 mamy do dyspozycji źródła w trzech zakresach: sesji, użytkownika i zdarzenia.
- W przypadku źródła zdarzenia (event scope) wykorzystywany jest model atrybucji określony w ustawieniach usługi.
- Źródło sesji (session scope) przypisywane jest na początku sesji do ostatniej niebezpośredniej interakcji i pozostaje niezmienne dla danej sesji, nawet jeśli w jej trakcie nastąpi wizyta z innego źródła. Dlatego w pewnym sensie jest to “pierwsze źródło” sesji, choć przypisane w modelu last-click.
- Analogicznie, źródło pierwszej wizyty użytkownika (user scope) przypisywane jest ostatniej niebezpośredniej interakcji przed pierwszą wizytą i już nigdy się nie zmienia.
W Google Analytics wszystkie wymiary (dimensions) oraz dane, zwane też metrykami (metrics) działają w przypisanym sobie zakresie. Przykładowo, wymiar strony wejścia (landing page) ma zakres sesji, a wymiar strony (page) ma zakres zdarzenia.
Zestawianie wymiarów i metryk z różnego zakresu, choć technicznie możliwe, może czasem prowadzić do mylących lub trudnych do interpretacji raportów.
Przykładowo, wymiar strony (pages) należy zestawiać z wyśwetleniami strony (page views), a nie z sesjami. Jeśli zestawimy strony z sesjami, Universal Analytics pokaże liczbę sesji zbliżoną do sesji z daną stroną wejścia (tą stroną, którą przypisał do sesji spośród iluś odwiedzonych w trakcie danej sesji). W GA4 będzie to raczej liczba sesji, w której dana strona uczestniczyła, a suma sesji dla poszczególnych stron będzie większa od łącznej liczby sesji.
Jeśli się głębiej zastanowić, wykonywanie takich raportów nie ma większego sensu – dlatego niejasna interpretacja tych liczb nie powinna nam spędzać snu z powiek.
Niemniej, niektóre raporty zestawiające wymiary i dane z różnych zakresów będą miały sens. Przykładowo, dla wymiarów źródła w GA4:
- Liczba zdarzeń (event scope) w połączeniu z wymiarem źródła nowego użytkownika (user scope), pokazuje ile zdarzeń wygenerowali użytkownicy, których pierwsza wizyta pochodziła z danego źródła.
- Liczba zdarzeń (event scope) w połączeniu z wymiarem źródła sesji (session scope), pokazuje ile zdarzeń wygenerowali użytkownicy podczas sesji, które miały dane źródło.
Dokumentacja GA4 nie wskazuje, jak interpretować liczbę sesji lub użytkowników zestawionych ze źródłem (event scope). Raporty takie, choć da się wykonać, zawierają często wiele pozycji not set – ale znów, jeśli się zastanowić, tworzenie takich zestawień nie ma sensu.
Zob. też wspomniany już wcześniej artykuł pomocy GA4 na temat zakresów (wersja angielska jest bardziej precyzyjna).
Dane modelowane
Na koniec warto podkreślić fundamentalną zmianę w Google Analytics 4, w którym dane zbierane przez kod śledzący mogą być wzbogacane o dane modelowane.
Dane modelowane tworzone są na podstawie informacji pochodzących z bezciasteczkowego śledzenia w consent mode dla użytkowników, którzy nie wyrazili zgody na śledzenie, a także na podstawie danych dotyczących użytkowników zalogowanych w Google oraz innych estymacji Google pozwalających na modelowanie danych.
Dane te są fragmentaryczne, ale stosując ekstrapolacje, Google jest w stanie uzupełniać brakujące dane.
Dzięki modelowaniu anych w GA4 widzimy więc co prawda przybliżony, ale bardziej odpowiadający rzeczywistości obraz podróży użytkownika.
Ponieważ użytkownik ten był zalogowany do Google, system Google posiada informację, że te dwa zdarzenia faktycznie dotyczą jednego użytkownika. Dlatego Google Analytics 4 wykorzystując posiadane przez siebie dane, może zdarzenia tych z urządzeń, z których z pozoru korzysta dwóch użytkowników – przypisać do jednego użytkownika. Urealnia to (zmniejsza) raportowaną liczbę użytkowników i pozwala poprawnie przypisać dane zdarzenie – w tym przypadku do reklamy na YouTube.
Oczywiście, nie wszyscy użytkownicy są zawsze zalogowani do Google, a wielu po prostu z konta Google nie korzysta. Aby więc obraz był pełniejszy, Google Analytics przez analogię będzie zakładać, że użytkownicy niezalogowani zachowują się podobnie i będzie czasem uzupełniać brakujące źródła, np. dopisując je do kluczowych zdarzeń, które dotychczas były przypisane do direct.
W podobny sposób estymowane jest zachowanie użytkowników, którzy nie wyrazili zgody na śledzenie. Znając liczbę odsłon i kluczowych zdarzeń ze strony użytkowników, którzy odmówili zgody, można modelować, ile za tymi odsłonami stoi użytkowników oraz które ze źródeł doprowadziły do kluczowych zdarzeń:
Źródło grafiki: artykuł pomocy Google Ads
Proces wzbogacania danych Analytics o dane posiadane przez Google może trwać nawet tydzień, dlatego dane z ostatnich dni mogą się w przyszłości zmienić. Z opóźnieniami mieliśmy zresztą do czynienia również w Universal Analytics, gdzie większość raportów mogło notować opóźnienia do 48 godzin.
Zauważmy, że różnego rodzaju rozwiązania technologiczne zwiększające ochronę prywatności użytkownika, takie jak PCM firmy Apple czy podobne rozwiązania planowane przez Google – losowo opóźniają raportowanie o 24-48 godzin. Dlatego musimy się przyzwyczaić do tego, że pełen obraz danych analitycznych dostępny będzie dopiero po pewnym czasie.
Złożoność tych procesów może powodować, że pomiędzy danymi w różnych raportach będziemy obserwować większe lub mniejsze rozbieżności. Do tego przypuszczalnie trzeba się będzie przyzwyczaić, choć miejmy nadzieję, że w miarę wychodzenia GA4 z chorób wieku dziecięcego te niedoskonałości będą coraz mniej istotne.
Zresztą, trzeba pamiętać, że Google Analytics to nie program księgowy. Jego zadaniem nie jest ewidencja wszystkich zdarzeń co do jednego, ale wskazywanie trendów i wspieranie podejmowania decyzji – do czego przybliżone dane w zupełności wystarczą.
Wersja angielska tego artykułu dostępna jest na portalu Search Engine Land.
Podziękowania dla Martyny Zastrożnej, Karola Dziedzica, Macieja Lewińskiego, Artura Maciorowskiego i Mariusza Michalczuka za konsultację artykułu.