RSS
2022/08/19 07:13

Atrybucja w Google Analytics (GA4)

Czy atrybucja w GA4 to przełom? Jakie zmiany wprowadzono w modelowaniu atrybucji w porównaniu z Universal Analytics? Artykuł ten jest całościowym omówieniem różnic między GA4 a Universal Analytics w tym zakresie.

W dzisiejszym świecie konwersję poprzedza zazwyczaj nie jeden, ale wiele punktów styku klienta z marką. Atrybucja polega na określaniu roli poszczególnych interakcji w generowaniu konwersji i przypisywaniu kanałom marketingowym liczbowego udziału we wszystkich konwersjach.

Jeśli w atrybucji stawiasz pierwsze kroki, warto wpierw zapoznać się z serią artykułów na temat modelowania atrybucji lub artykułem pomocy GA4 na temat atrybucji.

Jak działa atrybucja w Google Analytics 4

Universal Analytics (UA) raportował według jednego modelu atrybucji, który przypisywał cały udział w konwersji ostatniemu poprzedzającemu ją kliknięciu (last click). Wizyta bezpośrednia nie jest kliknięciem, niemniej – dla uniknięcia wątpliwości – model ten nazywano również modelem ostatniego kliknięcia niebezpośredniego.

Inne modele atrybucji były dostępne wyłącznie w raportach ścieżek wielokanałowych, np. w porównaniach modeli atrybucji.

W GA4 mamy szerszą dostępność różnych modeli atrybucji, ale zależy to od zakresu, w jakim przygotowujemy raport – czy jest to zakres źródła sesji, zdarzenia (w szczególności konwersji) czy pierwszej wizyty użytkownika.

Atrybucja w GA4 odbywa się na trzech odrębnych płaszczyznach: źródła sesji, pierwszej wizyty i zdarzenia.

W Universal Analytics wymiary źródła miały wyłącznie zakres sesji.

Uwaga. W artykule tym termin “źródło” używany będzie w szerszym rozumieniu jako każdy wymiar wskazujący pochodzenie wizyty, np. zgrupowanie kanałów, źródło (source), medium, treść reklamy, kampania, grupa reklam, słowo kluczowe, wyszukiwane hasło itp.

Źródło sesji

Atrybucja na poziomie sesji – co nie powinno być zaskoczeniem – określa źródło danej sesji. Wykorzystywana jest m.in. w raportach pozyskania ruchu w sekcji Raporty. Działa ona podobnie, jak w Universal Analytics, czyli zawsze wg metody ostatniego kliknięcia niebezpośredniego (last non-direct click).

Znaczy to, że źródłem sesji po prostu jest źródło, które rozpoczęło daną sesję, np. wejście z Facebooka lub organicznych wyników wyszukiwania. Ale jeśli sesja została rozpoczęta w wyniku wizyty bezpośredniej, źródłem sesji będzie źródło wcześniejszej wizyty, o ile taka miała miejsce.

Przypomnijmy, wizyta bezpośrednia (direct) oznacza, że Analytics nie wie, skąd przyszedł dany użytkownik, bo kliknięcie nie przekazuje referrera, parametru gclid czy utm. Więcej w artykule o wizytach bezpośrednich w Analytics.

Dlatego, podobnie jak w Universal Analytics, sesja będzie miała źródło direct tylko wtedy, gdy w ramach okna konwersji Analytics nie widzi żadnych wcześniejszych wejść użytkownika z innego źródła. Domyślne okno konwersji (lookback window) w GA4 to 90 dni, w UA domyślnie było to 6 miesięcy. Do okien konwersji jeszcze wrócimy w tym artykule.

A tak w ogóle, czym jest sesja?

Sesja w rozumieniu Analytics nie jest tożsama z sesją przeglądarki.

W GA4 sesję rozpoczyna wejście na stronę www lub do aplikacji, a kończy ją brak aktywności przez określony limit czasu (domyślnie jest to 30 minut – zob. ten artykuł pomocy Analytics).

Zamknięcie okna przeglądarki nie kończy sesji. Jeśli zamkniemy okno przeglądarki, ponowne wejście na stronę w ramach limitu czasu będzie wciąż należało do tej samej sesji – chyba, że przeglądarka działa w trybie incognito lub innym, który kasuje cookies i dane przeglądarki po zamknięciu okna.

W Universal Analytics, sesja dodatkowo (niezależnie od czasu jej trwania) kończyła się o północy, co już nie ma miejsca w GA4.

Gdy w Universal Analytics użytkownik w trakcie trwania sesji wchodził ponownie z nowego źródła, dotychczasowa sesja była przerywana i rozpoczynała się nowa sesja z tym nowym źródłem.

W GA4 już tak się nie dzieje. Jeśli w trakcie sesji będzie miała miejsce wizyta z nowego źródła, nie zostanie stworzona nowa sesja, a źródło wizyty dla trwającej sesji pozostanie bez zmian.

Nie znaczy to, że wizyta z nowego źródła jest ignorowana. Źródło nowej wizyty zostanie odnotowane, a w raportach atrybucji na poziomie zdarzenia (o czym za chwilę) będą uwzględnione wszystkie źródła, z których nastąpiło wejście w każdej z sesji. Zob. też ten artykuł pomocy Analytics (wersja angielska jest bardziej precyzyjna).

Typowym przykładem wejścia w trakcie sesji mogą być powroty z bramek płatności podczas finalizowania zakupu e-commerce lub ze stron serwerów poczty w przypadku np. odzyskiwania hasła lub potwierdzania rejestracji. W GA4 przynajmniej nie będą one sztucznie zawyżały liczby sesji.

Niemniej, takie wejścia stanowią tzw. niepożądane odesłania, które należy wykluczać. Wykluczenie będzie skutkowało traktowaniem takich wizyt na równi z wizytami bezpośrednimi. W GA4 będą one więc de facto ignorowane: ani źródło, ani liczba sesji się nie zmienią, a dostępne w GA4 modele atrybucji, w których obowiązuje zasada non-direct, nie przypiszą im żadnej wartości (o czym w dalszej części artykułu).

Źródło pierwszej wizyty

Atrybucja w kontekście pierwszej wizyty to nowość wprowadzona w GA4. Jej celem jest wskazanie, skąd użytkownik przyszedł do nas po raz pierwszy.

Jest to zwiastun zmiany paradygmatu mierzenia efektywności marketingu, w którym operujemy już nie klasycznym ROAS (przychody vs koszty), ale pojęciami LTV i CAC (wartość klienta w czasie vs koszt akwizycji).

Intuicyjnie, podejście takie jest bliższe analizie użytkowników aplikacji, gdzie najpierw trzeba doprowadzić do jej instalacji, a następnie angażować użytkownika w samej aplikacji. Niemniej, uogólnienie takiego podejścia na użytkowników stron www ma również głęboki sens.

Pierwsza wizyta ma miejsce po wywołaniu w systemie zdarzenia first_visit dla strony www lub first_open dla aplikacji. Nazwy chyba nie wymagają wyjaśnienia – jest to de facto pierwsze wyświetlenie przez danego użytkownika strony w witrynie lub ekranu aplikacji, na których zainstalowano śledzenie Analytics.

Źródło pierwszej wizyty jest więc atrybutem użytkownika i wskazuje, skąd nastąpiło pierwsze wejście tego użytkownika na stronę lub do aplikacji.

Źródło pierwszej wizyty jest przypisywane w modelu ostatniego kliknięcia niebezpośredniego. Chodzi oczywiście wyłącznie o te kliknięcia, które poprzedzały pierwsze otwarcie aplikacji lub pierwsze wejście na stronę (późniejsze nie są brane pod uwagę).

Raz nadane źródło pierwszej wizyty nie ulega zmianie, tzn. użytkownik, który odwiedził pierwszy raz stronę, po czym zainstalował aplikację i zaczął z niej korzystać – nie będzie miał zmienionego źródła pierwszej wizyty po pierwszym otwarciu aplikacji, oczywiście o ile Google Analytics będzie w stanie technicznie powiązać aktywności na stronie i w aplikacji z tym samym użytkownikiem.

Źródło pierwszej wizyty będzie mogło być wyzerowane w przypadku utraty ciągłości śledzenia, np. po braku wizyt przez okres ważności cookie Analytics. Do okresu gromadzenia danych i ważności cookie Analytics jeszcze wrócimy w tym artykule.

Atrybucja w zakresie zdarzenia

Zdarzenie jest podstawą raportowania w GA4 i w odniesieniu do zdarzenia (i to każdego, nie tylko zdarzenia konwersji) można tworzyć raporty w ustalonym modelu atrybucji. Model ten wybieramy sami spośród modeli dostępnych w ustawieniach usługi (zob. ilustracja kilka akapitów poniżej). Domyślnie jest to model data-driven, ale możemy go w dowolnej chwili zmienić. Zmiana ta jest retroaktywna, tj. działa wstecz, czyli będzie miała wpływ również na dane historyczne.

GA4 pozwala na modelowanie atrybucji dla każdego zdarzenia, nie tylko dla zdarzeń konwersji.

Mówi się, że Google Analytics zrywa z modelem ostatniego kliknięcia. Czy rzeczywiście? W praktyce atrybucja inna niż last-click, o ile ustawimy ją sobie jako obwiązującą dla zakresu zdarzeń, dostępna jest w przypadku samodzielnie dostosowanych raportów, np. w sekcji Eksplorowanie, które wykorzystują wymiary na poziomie zdarzenia, np. raport źródło – konwersje.

Podstawowe zestawienia z sekcji Raporty: pozyskania ruchu i użytkowników, stosują wymiary źródła wykorzystujące model ostatniego kliknięcia (niebezpośredniego). Jest to (na szczęście) wyraźnie zaznaczone w nazwie wymiaru, np. Sesja – źródło.  

Warto więc pamiętać, że Źródło, Źródło sesji i Źródło pierwszej wizyty to trzy różne wymiary, z różnymi dostępnymi modelami.


Zakres


Model Atrybucji


Gdzie dostępne


Sesja


Ostatnie kliknięcie


Np. raport pozyskania ruchu


Pierwsza wizyta użytkownika


Ostatnie kliknięcie


Np. raport pozyskania użytkownika


Zdarzenie


Model wybrany w ustawieniach usługi (domyślnie data-driven)

Raporty własne, np. w sekcji Eksplorowanie

Ustawienia modelu atrybucji

W ustawieniach usługi Google Analytics 4 możemy zdefiniować obowiązujący model atrybucji. Będzie on miał zastosowanie w całej usłudze GA4, niemniej warto przypomnieć: dotyczyć to będzie wyłącznie raportów w zakresie zdarzenia.

Raporty źródła sesji i źródła pierwszej wizyty będą wciąż w modelu ostatniego kliknięcia niebezpośredniego.

Do wyboru jest kilka modeli atrybucji, znanych z Universal Analytics (opisane we wspomnianym już artykule pomocy Analytics).

Warto jednak zwrócić uwagę, że:

  • Wszystkie modele nie przypisują wartości wejściom bezpośrednim, chyba że nie mają innego wyjścia, bo na ścieżce nie ma żadnej innej interakcji – czyli wszystkie stosują zasadę „non-direct”, czego nie było w Universal Analytics.
  • Modele preferujące Google Ads przypisują całą wartość konwersji reklamom Google Ads, o ile wystąpiły na ścieżce. Aktualnie dostępny jest jeden model preferujący Google Ads – model last click, który jest odpowiednikiem „ostatniego kliknięcia Google Ads” znanego z Universal Analytics. W razie braku Google Ads na ścieżce, model ten działa jak „zwykły” last click.
  • Poza kliknięciami, modele uwzględniają „zaangażowane wyświetlenia” reklam w YouTube, czyli obejrzenie całości lub 30 sekund filmu reklamowego oraz inne związane z tą reklamą kliknięcia (szczegóły w tym artykule pomocy Google Analytics).

Przypomnijmy: zmiana ustawień modelu atrybucji działa retroaktywnie, tzn. będzie zastosowana również do danych sprzed wprowadzenia zmiany. Zapisane eksploracje podczas ich wyświetlania będą przeliczane na nowo.

Okno konwersji (okres ważności)

Ustawienia Google Analytics określają długość okna konwersji, zwanego też okresem ważności (czas, w którym interakcje są uwzględniane do atrybucji – więcej w artykule o oknach konwersji). Domyślnie jest to 90 dni, ale można ten okres zmienić na 60 lub 30 dni (zob. ilustracja powyżej).

Zgodnie z dokumentacją Analytics, ustawienia okna konwersji dotyczą wszystkich modeli atrybucji i wszystkich typów konwersji w Google Analytics 4, a więc ustawienie to dotyczy również atrybucji na poziomie sesji, a także porównań modeli atrybucji.

W przypadku atrybucji źródła pierwszej wizyty okno konwersji ma oddzielnie definiowany okres ważności (domyślnie 30 dni, można go zmienić na 7 dni). Zastanawiasz się, dlaczego jest to definiowane inaczej? Jeśli tak, to przede wszystkim warto zastanowić się, dlaczego w ogóle mamy jakiekolwiek okno konwersji dla pierwszej wizyty. I dlaczego w ogóle mówimy o modelu atrybucji dla pierwszej wizyty, który – przypomnijmy – to zawsze ostatnie kliknięcie niebezpośrednie.

Pierwsza wizyta ma przecież swoje źródło w momencie jej rozpoczęcia, a wcześniejszych wejść na stronę, a co za tym idzie, ich źródeł – nie mamy. Jaki jest więc sens patrzeć głębiej, niż pierwsza interakcja ze stroną/aplikacją?

Odpowiedź to Google Signals. O ile włączymy tę opcję, Google Analytics 4 będzie wzbogacać dane zbierane przez nasz kod śledzący o m.in. posiadane przez Google informacje o zalogowanych użytkownikach, dzięki czemu może odnotować, że przed pierwszą wizytą dany użytkownik na innym urządzeniu miał zaangażowaną interakcję z naszą reklamą na YouTube.

Podobnie, w przypadku pierwszego wejścia do aplikacji (first_open), może się ono odbyć podczas sesji bezpośredniej, ale wynikać z wcześniejszych kliknięć reklamy zachęcającej do instalacji aplikacji.

Dlatego, jeśli źródło sesji pierwszej wizyty jest nieznane (jest to wizyta bezpośrednia, direct) Google Analytics może spróbować przypisać źródło pierwszej wizyty wcześniejszej interakcji, o ile miała miejsce w okresie okna konwersji.

W GA4 mogą być odnotowywane interakcje z reklamami, które miały miejsce przed pierwszą wizytą użytkownika.

Zmiany okna konwersji nie działają retroaktywnie. Oznacza to, że obowiązują dopiero od momentu ich wprowadzenia.

Niezależnie od ustawień atrybucji, zaangażowane wyświetlenia reklam YouTube uwzględniane są wyłącznie w dwudniowym oknie konwersji.

Pożegnanie z logiką cookie?

Jest to niuans, ale warty odnotowania. W Universal Analytics domyślne okno konwersji dla raportów pozyskania wynosiło 6 miesięcy i jego ewentualna zmiana była również nieretroaktywna. Zmiana dotyczyła jednak nie konwersji, ale interakcji, które miały miejsce od momentu wprowadzenia zmiany. Odwzorowywało to logikę cookie źródła _utmz, które miało czas trwania nadawany w momencie jego utworzenia, czyli wejścia z danego źródła. Co prawda Universal Analytics nie wykorzystywał już cookie _utmz (było one we wcześniejszych wersjach), ale dla zachowania spójności danych ich logika była utrzymywana.

Przykładowo, zmiana okna konwersji w Universal Analytics z 30 na 90 dni nie powodowała natychmiastowego uwzględnienia interakcji sprzed 90 dni dla konwersji od dnia zmiany, bo „cookie źródła” interakcji starszych niż 30 dni już „wygasło”. Musiał upłynąć okres przejściowy, po którym wszystkie konwersje były w pełni raportowane wg nowego okna konwersji (w tym przykładzie dochodzenie do pełnego raportowania w nowym oknie konwersji trwałoby 90 dni).

GA4 działa w oparciu o inny model danych, bez ciągłości z danymi UA, przez co mógłby zerwać z tymi zaszłościami, i odnosić zmiany okna konwersji do wszystkich konwersji które miały miejsce od momentu zmiany tak, jak to się odbywa obecnie w Google Ads. Interpretacja takich danych jest dużo łatwiejsza.

Mógłby, ale tak się nie dzieje. Zmiany okna konwersji w GA4 dotyczą interakcji, które w dniu zmiany wciąż znajdowały się w oknie konwersji. Przykładowo, przy zmianie okna konwersji z 30 na 90 dni, konwersje nie będą natychimiastowo raportowane z 90-dniowym oknem konwersji. Musi upłynąć okres przejściowy – w tym przykładzie: 60 dni (interakcje z dotychczasowego, 30-dniowego okna konwersji będą zachowane). W przypadku skrócenia okna konwersji, np. z 90 na 30 dni, zmiana będzie działała natychmiastowo do wszystkich konwersji od dnia zmiany.

Czas trwania cookie i retencja danych

Cookie Google Analytics 4 ma standardowy okres ważności (czas trwania) 24 miesiące, ale można go zmienić w przedziale od jednej godziny do 25 miesięcy (lub ograniczyć do sesji). Kolejne wizyty mogą ten limit czasu odnawiać. Będzie to okres, w którym Analytics będzie w stanie rozpoznać powracającego użytkownika, w szczegółności pamiętać jego źródło pierwszej wizyty – zob. ten artykuł pomocy GA4).

Nie znaczy to jednak, że GA4 będzie tak długo “pamiętać” dane użytkownika. Poza czasem trwania ciasteczka, mamy jeszcze okres przechowywania danych w GA4 (data retention). Domyślnie jest to jedynie 2 miesiące, ale można (tzn. należy) to ustawienie zmienić na 14 miesięcy (dla płatnej wersji Analytics 360 może to być nawet do 50 miesięcy) – zob. ten artykuł pomocy Analytics). Po upływie tego czasu dane na poziomie użytkownika są usuwane z serwerów Google. Aby zachować te dane, trzeba je wyeksportować np. do BigQuery (zob. ten artykuł pomocy GA4).

W szczególności oznacza to, że raporty w sekcji Eksplorowanie można wykonywać tylko w granicach tego okresu (zauważ, nie da się wybrać zakresu dat wychodzącego poza ten okres).

Ograniczenia te nie dotyczą standardowych raportów, które przechowują dane zagregowane – te dane zachowamy “na zawsze”.

Należy zakładać, że dla bezpłatnej wersji GA4 dane o źródle pierwszej wizyty użytkownika zostaną skasowane po 14 miesiącach nieaktywności, podobnie jak zresztą wszystkie pozostałe jego dane i po upływie tego czasu będzie on traktowany jak nowy użytkownik (za wyjątkiem zagregowanych danych sekcji Raporty).

Eksport konwersji do Google Ads

Eksport konwersji do Google Ads jest często wykorzystywany w miejsce kodu konwersji Google Ads, jako najszybszy sposób implementacji śledzenia konwersji w reklamach, choć w dobie powszechnego stosowania GTM ta oszczędność czasu wydaje się iluzoryczna, a rozwiązanie to ma wiele wad, z których stosujący je często nie zdają sobie sprawy.

Przeciwko wykorzystywaniu konwersji importowanych z Google Analytics do optymalizacji kampanii Google Ads przemawia wiele argumentów, jak zmniejszenie ilości sygnałów dla Google Ads w porównaniu z natywnym śledzeniem konwersji Google Ads, egzotyczna atrybucja, a także uzależnienie od nieprzewidzianych błędów konfiguracyjnych Google Analytics oraz tagowania linków, takich jak niepożądane referrale czy nadmiarowe utm.

Dlatego, choć import konwersji z Analytics może dostarczyć ciekawych danych, niemożliwych do zebrania w Google Ads, to wykorzystywanie ich jako celów optymalizacji kampanii Google Ads może nie być optymalne. Więcej na ten temat przeczytasz w tym artykule na LinkedIn Pulse.

Jeśli importujesz konwersje z GA4 do Google Ads, to niezależnie od ustawień atrybucji w GA4, będą one importowane w modelu ostatniego kliknięcia niebezpośredniego, czyli podobnie jak w Universal Analytics, zaimportujesz tylko te konwersje, których źródło z kampanii Google nie zostało nadpisane przez późniejsze kliknięcia, np. organiczne wyniki wyszukiwania czy reklamy w social media.

Porównania modeli atrybucji

Niezależnie od ustawień modelu atrybucji na poziomie usługi, Google Analytics umożliwia porównywanie różnych modeli atrybucji w sekcji Reklama. Obecnie dostępne są dokładnie te same modele, które możemy wybierać w ustawieniach usługi i nie ma możliwości ich modyfikacji, czyli tworzenia modeli niestandardowych.

Co ciekawe, GA4 umożliwia raportowanie w dwóch aspektach czasowych przypisania konwersji ­– do czasu interakcji oraz do czasu konwersji (w Universal Analytics dostępna była wyłącznie druga opcja).

Przypisanie do czasu interakcji typowe jest dla systemów reklamowych, gdzie konwersje przypisywane są do kliknięć, a co za tym idzie – kosztów. Dzięki temu unika się dziwnej sytuacji, w której mamy raportowane konwersje, które zaszły po zakończeniu kampanii, w okresie, w którym nie wydajemy nic na reklamę. Pozwala to też na rzetelne powiązanie kosztów z przychodami.

Z drugiej strony, przypisanie do czasu interakcji może spowodować, że łączna liczba konwersji zmieni się w zależności od modelu atrybucji, bo różne modele mogą przypisać konwersje lub ich części do kliknięć spoza okresu raportowania. Ponadto, do czasu zakończenia okna konwersji, najnowsze raporty mogą się zmieniać w czasie – co nie ma miejsca w przypadku, gdy wszystkie konwersje przypisane są do czasu konwersji.

Jak widać, oba podejścia mają swoje zalety i wady, więc dobrze, że mamy możliwość korzystania z obydwu.

Najpopularniejsze ścieżki konwersji

Raport ścieżek konwersji w GA4 został wzbogacony o dodatkowe dane: czasu do konwersji oraz liczby interakcji dla danej ścieżki, co pewnym sensie rekompensuje brak raportów upływu czasu i długości ścieżki, które stanowiły osobne raporty w UA.

To, co może w pierwszym momencie dziwić, to możliwość wyboru modelu atrybucji dla tego raportu. Rzecz jasna, model atrybucji nie wpływa na ścieżki konwersji – pozostają one takie same, nie zmienia się ich długość ani czas do konwersji.

Rzecz w tym, że w GA4 na wizualizację ścieżki nałożono jeszcze udział, jaki przypisano danej interakcji lub ich serii w danym modelu atrybucji. W modelu last click ostatnie interakcje będą miały 100% udziału w konwersji, ale w pozostałych – rozkład będzie inny, co pozwala chociażby lepiej zrozumieć, jak w naszym przypadku zadziałał model data-driven.

Ponadto, ponad raportem ścieżek umieszczono dodatkowe wykresy słupkowe, wizualizujące sposób, w jaki dany model atrybucji przypisał wartość kanałom na początku, w środku i na końcu ścieżki. Początek to pierwsze 25% interakcji na ścieżce, koniec to ostatnie 25%. Środek to pozostałe 50% interakcji pomiędzy początkiem i końcem ścieżki.

Jeśli dziwi Cię, że wizualizacja ta nie przypisuje udziałów w oczekiwanej proporcji modelom multi-touch, to zwróć uwagę, że w przypadku ścieżek z dwiema interakcjami dla modeli multi-touch, mamy tylko interakcję pierwszą i ostatnią (nie ma środkowych), a w przypadku ścieżki z jedną interakcją – mamy tylko interakcję ostatnią (co chyba najbardziej zniekształca raport, pewnie lepiej by było, gdyby Analytics w tej sytuacji podzielił wartość w równych częściach ułamkowych, tzn. jedyna interakcja byłaby w jednej trzeciej pierwsza, w jednej trzeciej środkowa i w jednej trzeciej ostatnia).  

Tak więc, model atrybucji będzie miał wpływ wyłącznie na wykresy słupkowe w górnej części raportu oraz na procentowe udziały w samej wizualizacji ścieżek. Dane liczbowe z tabeli (interakcje na ścieżkach, konwersje, przychody, długość ścieżki i czas do konwersji) pozostaną bez zmian niezależnie od modelu atrybucji.

Pracując zarówno z raportem ścieżek, jak i z porównaniem modeli atrybucji należy pamiętać (podobnie jak w UA) o wybraniu najpierw konkretnej konwersji, którą chcemy modelować, bo domyślnie te zestawienia wykonywane są łącznie dla wszystkich konwersji w usłudze.

Zakresy (Scope) w raportach

Powtórzmy – w GA4 mamy do dyspozycji źródła w trzech zakresach: sesji, użytkownika i zdarzenia.

  • W przypadku źródła zdarzenia (event scope) wykorzystywany jest model atrybucji określony w ustawieniach usługi.
  • Źródło sesji (session scope) przypisywane jest na początku sesji do ostatniej niebezpośredniej interakcji i pozostaje niezmienne dla danej sesji, nawet jeśli w jej trakcie nastąpi wizyta z innego źródła. Dlatego w pewnym sensie jest to “pierwsze źródło” sesji, choć przypisane w modelu last-click.
  • Analogicznie, źródło pierwszej wizyty użytkownika (user scope) przypisywane jest ostatniej niebezpośredniej interakcji przed pierwszą wizytą i już nigdy się nie zmienia.

W Google Analytics wszystkie wymiary (dimensions) oraz dane, zwane też metrykami (metrics) działają w przypisanym sobie zakresie. Przykładowo, wymiar strony wejścia (landing page) ma zakres sesji, a wymiar strony (page) ma zakres zdarzenia.

Zestawianie wymiarów i metryk z różnego zakresu, choć technicznie możliwe, może czasem prowadzić do mylących lub trudnych do interpretacji raportów.

Przykładowo, wymiar strony (pages) należy zestawiać z wyśwetleniami strony (page views), a nie z sesjami. Jeśli zestawimy strony z sesjami, Universal Analytics pokaże liczbę sesji zbliżoną do sesji z daną stroną wejścia (tą stroną, którą przypisał do sesji spośród iluś odwiedzonych w trakcie danej sesji). W GA4 będzie to raczej liczba sesji, w której dana strona uczestniczyła, a suma sesji dla poszczególnych stron będzie większa od łącznej liczby sesji.

Jeśli się głębiej zastanowić, wykonywanie takich raportów nie ma większego sensu – dlatego niejasna interpretacja tych liczb nie powinna nam spędzać snu z powiek.

Niemniej, niektóre raporty zestawiające wymiary i dane z różnych zakresów będą miały sens. Przykładowo, dla wymiarów źródła w GA4:

  • Liczba zdarzeń (event scope) w połączeniu z wymiarem źródła nowego użytkownika (user scope), pokazuje ile zdarzeń wygenerowali użytkownicy, których pierwsza wizyta pochodziła z danego źródła.
  • Liczba zdarzeń (event scope) w połączeniu z wymiarem źródła sesji (session scope), pokazuje ile zdarzeń wygenerowali użytkownicy podczas sesji, które miały dane źródło.

Dokumentacja GA4 nie wskazuje, jak interpretować liczbę sesji lub użytkowników zestawionych ze źródłem (event scope). Raporty takie, choć da się wykonać, zawierają często wiele pozycji not set – ale znów, jeśli się zastanowić, tworzenie takich zestawień nie ma sensu.

Zob. też wspomniany już wcześniej artykuł pomocy GA4 na temat zakresów (wersja angielska jest bardziej precyzyjna).

Dane modelowane

Na koniec warto podkreślić fundamentalną zmianę w Google Analytics 4, w którym dane zbierane przez kod śledzący mogą być wzbogacane o dane modelowane.

Dane modelowane tworzone są na podstawie informacji pochodzących z bezciasteczkowego śledzenia w consent mode dla użytkowników, którzy nie wyrazili zgody na śledzenie, a także na podstawie danych Google Signals dotyczących użytkowników zalogowanych w Google.

Dane te są fragmentaryczne, ale stosując ekstrapolacje, Google jest w stanie uzupełniać brakujące dane.

Dzięki Google Signals w GA4 widzimy więc co prawda przybliżony, ale bardziej odpowiadający rzeczywistości obraz podróży użytkownika.

Przykładowo, Universal Analytics odnotował wejście użytkownika z reklamy na YouTube na iPhone, który to użytkownik nie wrócił już później na stronę. Universal Analytics odnotował też konwersję z wejścia bezpośredniego innego użytkownika na komputerze z Chrome dla Windows.

Ponieważ użytkownik ten był zalogowany do Google, system Google posiada informację, że te dwa zdarzenia faktycznie dotyczą jednego użytkownika. Dlatego Google Analytics 4 wykorzystując Signals, może zdarzenia tych z urządzeń, z których z pozoru korzysta dwóch użytkowników – przypisać do jednego użytkownika. Urealnia to (zmniejsza) raportowaną liczbę użytkowników i pozwala poprawnie przypisać daną konwersję – w tym przypadku do reklamy na YouTube.

Oczywiście, nie wszyscy użytkownicy są zawsze zalogowani do Google, a wielu po prostu z konta Google nie korzysta. Aby więc obraz był pełniejszy, Google Analytics przez analogię będzie zakładać, że użytkownicy niezalogowani zachowują się podobnie i będzie czasem uzupełniać brakujące źródła, np. dopisując je do konwersji, które dotychczas były przypisane do direct.

W podobny sposób estymowane jest zachowanie użytkowników, którzy nie wyrazili zgody na śledzenie. Znając liczbę odsłon i konwersji ze strony użytkowników, którzy odmówili zgody, można modelować, ile za tymi odsłonami stoi użytkowników oraz które ze źródeł doprowadziły do konwersji:

Źródło grafiki: artykuł pomocy Google Ads

Proces wzbogacania danych Analytics o Google Signals może trwać nawet tydzień, dlatego dane z ostatnich dni mogą się w przyszłości zmienić. Z opóźnieniami mieliśmy zresztą do czynienia również w Universal Analytics, gdzie większość raportów mogło notować opóźnienia do 48 godzin.

Zauważmy, że różnego rodzaju rozwiązania technologiczne zwiększające ochronę prywatności użytkownika, takie jak PCM firmy Apple czy podobne rozwiązania planowane przez Google – losowo opóźniają raportowanie konwersji o 24-48 godzin. Dlatego musimy się przyzwyczaić do tego, że pełen obraz danych analitycznych dostępny będzie dopiero po pewnym czasie.   

Złożoność tych procesów może powodować, że pomiędzy danymi w różnych raportach będziemy obserwować większe lub mniejsze rozbieżności. Do tego przypuszczalnie trzeba się będzie przyzwyczaić, choć miejmy nadzieję, że w miarę wychodzenia GA4 z chorób wieku dziecięcego te niedoskonałości będą coraz mniej istotne.

Zresztą, trzeba pamiętać, że Google Analytics to nie program księgowy. Jego zadaniem nie jest ewidencja wszystkich zdarzeń co do jednego, ale wskazywanie trendów i wspieranie podejmowania decyzji – do czego przybliżone dane w zupełności wystarczą.

Podziękowania dla Martyny Zastrożnej, Karola Dziedzica, Macieja Lewińskiego, Artura Maciorowskiego i Mariusza Michalczuka za konsultację artykułu.



Author

Witold Wrodarczyk

CEO, Adequate Interactive Boutique Google Ads & Analytics Certified Facebook Blueprint Certified Facebook Marketing Consultant

Adequate - Interactive boutique

Address:
ul. Zygmunta Słomińskiego 15/59
00-195 Warszawa
Phone:
(+48) 22 299 50 28

Read our Privacy Policy including IMPORTANT INFORMATION about cookies we use here and how we process your data.