Wspomaganie czy kanibalizacja – Modelowanie atrybucji w praktyce (cz. 12)

Poprzedni artykuł (cz. 11): Łańcuchy Markowa

Narzędzia modelowania atrybucji mogą być pomocne przy rozwiązywaniu szeregu praktycznych problemów analityki w e-commerce. Analizując ścieżki wielokanałowe często spotkamy się z wzajemnym przeplataniem kanałów, gdzie w konwersjach uczestniczą – w różnych konfiguracjach – interakcje z różnymi źródłami ruchu. Kliknięcia z określonych źródeł mogą być zarówno ostatnimi na ścieżce konwersji, jak również pojawiać się wcześniej na tej ścieżce (mówimy o kliknięciach wspomagających).

Terminy konwersje wspomagane i kliknięcia wspomagające nie są najlepszym tłumaczeniem określeń assisted conversions i assist clicks. Słowo “wspomagane” sugeruje, że dane kliknięcie w jakiś sposób wsparło zajście konwersji, czyli że zwiększyło jej prawdopodobieństwo.

Faktycznie jednak tego nie wiemy. Nie jest wykluczone, że wpływ danego kliknięcia jest znikomy, można również teoretycznie wyobrazić sobie sytuacje, w których dana interakcja ma ujemny wpływ na konwersje. Dlatego znacznie lepszym określeniem byłoby kliknięcia asystujące lub kliknięcia towarzyszące.

Pojawienie się na ścieżce określonej interakcji nie zawsze musi zwiększać prawdopodobieństwo konwersji. Jeżeli dwa źródła się przenikają, suma ich oddziaływań może być większa, mniejsza lub równa ich oddziaływaniu z osobna. Mówimy, że źródła mogą się wzmacniać (2+2=5) lub kanibalizować (2+2=3), bądź też równoprawnie uczestniczyć w oddziaływaniu na konwersje (2+2=4):

Jedynym sposobem rzeczywistej weryfikacji, z którą sytuacją mamy do czynienia, są testy z grupą kontrolną (zob. Test inkrementalnej skuteczności remarketingu).

Narzędzia modelowania atrybucji pozwolą jednak uzyskać dodatkowe informacje, dzięki którym można lepiej zrozumieć skalę wzajemnego nakładania się kanałów.

Kto mówi prawdę?

Systemy reklamowe pokazują zazwyczaj zupełnie inny obraz skuteczności, niż widzimy to w Analytics. Czy oznacza to, że dane są nieprawidłowe? Nie. Po prostu mają one zupełnie inne modele atrybucji.

Każdy z systemów reklamowych widzi wyłącznie „swój wszechświat”, czyli kliknięcia własnych reklam. Analytics musi dokonać atrybucji między pokrywającymi się źródłami, gdy użytkownik odwiedzi kilka różnych źródeł przed konwersją.

Zobaczmy, jak będzie wyglądać to z punktu widzenia Google Ads, systemu afiliacyjnego i Analytics.

Z punktu widzenia Google Ads sytuacja wygląda tak:

A tak widzi to system afiliacyjny:

Dla każdego z tych systemów śledzenia konwersji pozostałe źródła “nie istnieją”. Systemy te owszem, raportują konwersje “last click”, ale pod warunkiem że jest to kliknięcie pochodzące z danego systemu. W ten sposób do sporej części konwersji roszczą sobie prawa obydwa źródła:

Widzimy więc, że spora część konwersji jest “wspólna”, czyli dochodzi do wzajemnego pokrywania się kanałów.

Wzajemne pokrywanie się kanałów

Spróbujmy przyjrzeć się konkretnemu przykładowi. Reklamodawca e-commerce pozyskuje istotną część ruchu z reklamy w wyszukiwarce Google (Google Ads) płatnej za kliknięcie (CPC), a także z programu partnerskiego (afiliacyjnego), w którym rozlicza się za sprzedaż (CPA).

Reklamodawca wie, że cześć ruchu z Google Ads to ruch związany z marką, którego porównywanie z innymi źródłami nie ma sensu. Dlatego dla potrzeb analizy wydziela grupę ścieżek wielokanałowych Google Ads Search Non-Brand, w którym zawarte są tylko słowa kluczowe niezwiązane z marką.

W Google Analytics reklamodawca widzi dane o transakcjach z poszczególnych źródeł:

Źródło sesjiSesjeWsp. konw. Transakcje
Google Ads Search Non-Brand3155210,69%2187
Affiliate341370,37%125

Okazuje się jednak, że liczby te w żaden sposób nie przystają do danych, które raportuje mu agencja zarządzająca Google Ads, ani do tych danych o sprzedaży, które raportuje administrator programu partnerskiego, na podstawie czego naliczana jest prowizja CPA dla partnerów. Każdy twierdzi, że konwersji wygenerowanych przez niego jest znacznie więcej!

Co jest przyczyną tych różnic? Nie, nie są nią straty danych wynikające z próbkowania czy też inne “błędy” Google Analytics. Podstawową przyczyną są różne modele atrybucji stosowane przez każdy z systemów raportowania:

  • Raport pozyskania ruchu Google Analytics przypisuje transakcje do ostatniej wizyty niebezpośredniej w okresie ostatnich 90 dni (stosowane jest ustawienie domyślne).
  • Sieć partnerska (afiliacyjna) przypisuje konwersje do ostatniego kliknięcia w link partnera w okresie 90 dni przed konwersją (zgodnie z regulaminem programu partnerskiego).
  • W Google Ads transakcje przypisywane są do ostatniego kliknięcia w link Google Ads w okresie 90 dni przed konwersją (zastosowano ustawienie niestandardowe, domyślnie jest to 30 dni)

Dla systemów śledzenia konwersji sieci afiliacyjnej oraz dla Google Ads nie ma znaczenia to, że wcześniej lub później dany użytkownik wchodził z innych źródeł. Jeśli chociaż jedna z interakcji była kliknięciem w link afiliacyjny / reklamę Google Ads, każdy z systemów będzie “rościł prawa” do tej konwersji.

Znaczy to, że w niektórych sytuacjach zarówno Google Ads jak i program partnerski w swoich systemach będą raportowały daną transakcję jako “swoją”, podczas gdy w raporcie Google Analytics transakcja ta będzie mogła mieć jeszcze inne źródło (np. Facebook).

Dzięki własnym modelom atrybucji (zob. artykuł Modele single-touch) możemy odwzorować modele stosowane przez zewnętrzne systemy śledzenia konwersji. Spróbujmy więc uzyskać raporty, które przypiszą konwersje tak, jak to wygląda z punktu widzenia Google Ads oraz systemu afiliacyjnego.

Aby to osiągnąć, stworzymy modele atrybucji, które przypiszą konwersje (a) do ostatniego kliknięcia w reklamę Google Ads niezwiązaną z wyszukiwaniem marki oraz (b) do ostatniego kliknięcia afiliacyjnego.

Dzięki tym modelom widzimy, ile konwersji miało na swojej ścieżce Google Ads Search Non-Brand (3172) i afiliacje (471).

Dane modelu Last Affliate Click powinny pokrywać się z tym, co raportuje system afiliacyjny. W stosunku do raportów konwersji w panelu Google Ads, w modelu Last Google Ads Non-Brand Search Click wystąpią różnice wynikające z wydzielenia konwersji dla słów typu brand (związanych z wyszukiwaniem marki): jeżeli po kliknięciu w słowo non-brand nastąpi kliknięcie w słowo brand i konwersja, w modelu atrybucji Last Google Ads Non-Brand Search Click zostanie ona przypisana do słowa non-brand, podczas gdy w Google Ads będzie ona przypisana do słowa związanego z marką, które wystąpiło bezpośrednio przed konwersją. Mogą też wystąpić róznice wynikające z czasu raportowania konwersji.

W raporcie widzimy drastyczny spadek konwersji przypisanych do kanału Affliate w modelu Last Google Ads Non-Brand Search Click. Dzięki temu modelowi widzimy, że 90,45% konwersji, które miały na ścieżce kanał Affiliate, miały również na ścieżce kanał Google Ads Search Non-Brand.

Źródło sesji i źródło transakcji w Analytics

W Google Analytics (począwszy od GA4) wprowadzono odrębne pojęcie źródła sesji i źródła konwersji.

Źródłem sesji jest źródło pierwszej wizyty w trakcie sesji. Tu mamy atrybucję ostatniego kliknięcia (niebezpośredniego). Jeśli w danej sesji będzie miała miejsce konwersja, zostanie ona przypisana do tego źródła sesji.

Źródło konwersji wykorzystuje model atrybucji określony w ustawieniach i uwzględnia wszystkie wizyty w granicach okna konwersji. Przy zastosowaniu modelu ostatniego kliknięcia (kanały płatne i bezpłatne) będzie to ostatnia wizyta przed transakcją.

W Google Analytics (począwszy od GA4) nowa wizyta w trakcie trwającej sesji nie powoduje zmiany źródła sesji. To pozostaje niezmienne aż do jej zakończenia. Taka wizyta będzie jednak miała wpływ na źródło konwersji.

Szerzej opisane zostało to w artykule o atrybucji w Google Analytics [GA4].

Powyżej: Źródłem sesji dla tej transakcji będzie Google Ads, ale źródłem (last click) będzie Afiliacja.

Spójrzmy w takim razie na porównanie dwóch raportów eksplorowania w Analytics: źródła sesji i źródła dla kanałów Cashback i Vouchers:

Widzimy, że między tymi kanałami występują spore różnice w tych dwóch raportach. Kanał Vouchers ma ponad 2x więcej przypisanych konwersji niż źródeł sesji z konwersją. Oznacza to, że w połowie przypadków wejście z kanału Vouchers nastąpiło w trakcie już otwartej sesji, w której później miała miejsce konwersja.

Wygląda na to, że przynajmniej połowa konwersji raportowanych dla tego kanału w modelu ostatniego kliknięcia pochodziła z innych źródeł, a wejście z kanału Vouchers nastąpiło już w trakcie istniejącej sesji.

Jeśli użyjemy wymiarów Souce i Session source w jednej eksploracji, będzie można zobaczyć, z jakich innych źródeł rozpoczynała się sesja, podczas której dokonały się konwersje z kanałów Cashback i Vouchers.

Jak widać, najczęściej byli to użytkownicy, którzy odwiedzili stronę bezpośrednio lub z Google i którzy w trakcie trwającej sesji ponownie weszli na stronę, tym razem już z przekierowania z Vouchers lub Cashback.

Prawdopodobny scenariusz jest tu taki, że użytkownicy zauważyli okienko „podaj kod zniżkowy” podczas finalizacji transakcji i zaczęli go poszukiwać w sieci, po czym wrócili na stronę z kuponem zniżkowym, zaliczoną do źródła Cashback lub Vouchers (zob. artykuł Kupony rabatowe – świetna promocja czy manipulacja).

Wykorzystanie segmentów Analytics do analizy atrybucji

Sekcja modelowania atrybucji w Google Analytics daje stosunkowo niewiele możliwości. Spektrum modeli zostało mocno ograniczone, podobnie jak możliwości ich dostosowania.

Niektóre funkcje modeli atrybucji można jednak odtworzyć lub przynajmniej zbliżyć się do nich wykorzystując segmenty w eksplorowaniu.

Sekwencja Źródło > Transakcja

Segment użytkowników, którzy (na przestrzeni wszystkich sesji) mieli wizytę z danego źródła, a następnie transakcję, pozwoli wskazać wszystkie transakcje, które nastąpiły po wizycie z danego źródła.

Ważne, by była to sekwencja, ponieważ tworząc prosty segment źródło AND transakcja wyodrębnimy również tych użytkowników, którzy odwiedzili stronę z danego źródła po dokonaniu transakcji.

Stwórzmy więc segment użytkowników, którzy przed transakcją mieli źródło Cashback lub Vouchers oraz segment użytkowników, którzy przed transakcją mieli takie źródło sesji. W eksploracji pokrywania się segmentów możemy zobaczyć, że również w tym ujęciu widzimy prawie dwa razy więcej źródeł niż źródeł sesji.

Segmenty takie mogą też się przydać do wskazania przychodów, które nastąpiły po wizycie z danego źródła niezależnie od miejsca na ścieżce. Pozwala to uzgodnić raporty Analytics i np. Facebooka. Poniżej widać porównanie

  • Transakcji, dla których facebook.com było ostatnim źródłem przed transakcją (usługa wykorzystuje model last click)
  • Transakcji, dla których facebook.com był na ścieżce konwersji (Segment Facebook>$)

W ten sposób łatwo jest wskazać, dlaczego w raportach Analytics nie widać większości konwersji raportowanych w Facebooku i gdzie one „zginęły”. W znacznej mierze, przykryła je atrybucja.

Porównując raporty Facebooka należy zwrócić uwagę, że raporty Facebooka mogą, w zależności od wybranej tam atrybucji, raportować również konwersje po wyświetleniu. Z kolei konwersje po kliknięciu zawierają również konwersje po kliknięciach nie prowadzących do wejścia na stronę (a więc takich, których Analytics nie odnotuje, jako wizyt z Facebooka) – będą to także np. kliknięcia reakcji („like”).

Wykorzystując segmenty pamiętajmy, że choć umożliwiają one wyodrębnienie podobnych danych, nie są one tożsame z raportami atrybucji, zwłaszcza w kontekście okien konwersji (zob. artykuł pomocy Analytics dot. segmentów)

Warto przeczytać: Przewodnik po atrybucji w Google Analytics

Autor

Data

Zobacz najnowsze wpisy