Wyrażenia regularne w Google Analytics
Wyrażenia regularne (regex) występują nie tylko w językach programowania, ale także w różnych narzędziach marketingowych. Nie wyobrażam sobie bez nich pracy z Google Analytics. Parafrazując znane powiedzonko, marketer bez wyrażeń regularnych bywa jak żołnierz bez karabinu.
W tym artykule wytłumaczę jak działa regex i pokażę przykłady jego wykorzystania w Google Analytics, Google Tag Manager i Google Data Studio. Warto je opanować, bo ułatwiają i przyśpieszają pracę z narzędziami analitycznymi. Czasem bez wyrażeń regularnych w zasadzie nie da się osiągnąć zamierzonego celu.
Także jeśli do tej pory nie miałeś styczności z tematem, koniecznie czytaj dalej.
Wyrażenia regularne w Google Analytics
Dostępne symbole i sposób ich działania różni się nieco w zależności od języka programowania czy narzędzia. W tym artykule skupię się wyłącznie na środowisku związanym z Google Analytics.
Na początek przejdźmy przez wszystkie symbole, jakie możesz wykorzystać budując wyrażenia regularne w tym narzędziu.
Symbole wieloznaczne
. (kropka) – oznacza jeden dowolny znak. Może to być litera, cyfra lub symbol (np. %, $, itp.). Jeśli chcesz w wyrażeniu regularnym umieścić przykładowo 3 dowolne znaki, to musisz wpisać trzy kropki. Przykładowo do wyrażenia ^.ara dopasowane będą słowa kara, parapet czy para, ale niedopasowane będą słowa przywara czy chmara.
? (znak zapytania) – odpowiada dopasowaniu do poprzedniego znaku 0 razy lub 1 raz. Przykładowo zapis 255? pozwala dopasować 25 lub 255, ale już nie 2555, 2550 czy 25555.
+ (plus) – oznacza dopasowanie do poprzedzającego znaku 1 lub większą liczbę razy (bez górnego limitu). Czyli do wyrażenia 500+ będą dopasowane takie ciągi, jak 500, 5000, 50000, i tak dalej.
* (gwiazdka) – dopasoawnie do poprzedzającego znaku 0 lub więcej razy. Podobnie jak w przypadku plusa, z tym wyjątkiem, że znak poprzedzający może nie występować w ogóle i dopasowanie także zadziała. Przykładowo do ciągu 98* będą dopasowane 9, 98, 988, 9888, itd.
| (pionowa kreska) – to nic innego, jak spójnik LUB. Zazwyczaj wykorzystuje się go w połączeniu z nawiasami półokrągłymi, tworząc na przykład taki zapis: (facebook|instagram|twitter). Do tego wyrażenia dopasowane byłoby każde z wymienionych w nim słów.
Znaki zakotwiczenia
Znaki zakotwiczenia są odpowiedzialne za określenie początku i końca wyrażenia.
^ (daszek) – oznacza początek wyrażenia regularnego, czyli innymi słowy określa, od jakich znaków musi się rozpocząć ciąg, aby był dopasowany. Przykładowo do regexa ^radom dopasowane będzie słowo radomskie (“Ale jak Pan Major woli, to Franz ma Camele” – przepraszam, musiałem), ale już słowo stradom nie będzie dopasowane, bo zaczyna się od liter “st”.
$ (dolar) – “the almighty dollar” ma taką specjalną moc, że oznacza koniec wyrażenia. Przykładowo wyrażenie radom$ pozwoli dopasować słowo stradom, ale radomskie już nie.
Kombinacja daszku i dolara pozwala uzyskać dopasowanie ścisłe. Przykładowo wyrażenie ^arbuz$ dopasuje tylko i wyłącznie słowo arbuz i nic więcej.
Grupy i zakresy
() (nawias półokrągły) – głównie wykorzystuje się go do grupowania innych symboli i konstruowania wyrażeń z wykorzystaniem spójnika LUB, czyli symbolu I. Poza tym nawias półokrągły ma też swoje własne znaczenie, a jest nim dopasowanie do symboli umieszczonych wewnątrz nawiasów w identycznej kolejności. Przykładowo do wyrażenia (456) będzie dopasowany ciąg 456789, ale już 645 nie będzie dopasowany.
[] (nawias kwadratowy) – oznacza dopasowanie znaków umieszczonych w kwadratowych nawiasach w dowolnej kolejności. Przykładowo wyrażenie regularne [14] oznacza, że dopasowany będzie do niego ciąg 781402, 417812, ale też 47812. Znaki z kwadratowego nawiasu nie muszą się znajdować obok siebie w ciągu – mogą być umieszczone w dowolnym miejscu.
– (myślnik) – można go wykorzystać wewnątrz kwadratowych nawiasów do określenia zakresu znaków. Czyli zamiast pisać [0123456789], można wykorzystać zapis [0-9], a efekt będzie identyczny. Dopasowanie do dowolnej litery możesz uzyskać zapisem [a-z], a do dowolnej WIELKIEJ litery wyrażeniem [A-Z].
Znak zmiany znaczenia
/ (backslash, czy też ukośnik tylny w wolnym tłumaczeniu na polski) – znak, który anuluje specjalne znaczenie symbolu. Przykładowo zapis \., spowoduje, że kropka będzie oznaczać rzeczywiście kropkę, a nie jeden dowolny znak. Zapis \$ spowoduje, że dolar będzie traktowany jak tekst, a nie jak symbol oznaczający zakończenie wyrażenia regularnego.
Jak testować wyrażenia regularne
Jak pewnie się domyślasz, cała zabawa polega na takim łączeniu ze sobą różnych symboli, aby uzyskać dopasowanie do konkretnej grupy wyrażeń. Ręczne sprawdzanie, czy wyrażenie regularne na pewno zadziała w 100% poprawnie, jest obarczone ryzykiem błędu. Zawsze można coś przeoczyć. Dlatego warto się tutaj wesprzeć narzędziami do testowania wyrażeń regularnych.
Takich stron jest całkiem sporo. Nie mam ulubionej, więc przedstawię tutaj kilka przykładów – wybierz tę, która najbardziej Ci odpowiada pod kątem interfejsu.
- https://regexr.com/
- https://regex101.com/
- https://www.regextester.com/
- https://www.analyticsmarket.com/freetools/regex-tester/
Zwłaszcza w przypadu wykorzystywania wyrażeń regularnych w filtrach w Google Analytics, gdzie popełnienie błędu skutkuje trwałą i nieodwracalną zmianą w danych, koniecznie przetestuj regex przed dodaniem w ustawieniach GA.
Google Analytics dla Ecommerce
(praktyczny kurs online)
Zaawansowany kurs online z elementami Data Studio i GTM.
Zbuduj kompleksowy system raportowania, który pomoże Ci zwiększyć rentowność Twojego e-commerce.
📹 11h praktycznych materiałów wideo
🎓 Gotowe skrypty i szablony
👥 Dostęp do zamkniętej grupy na Facebooku
📄 Certyfikat ukończenia kursu (PDF)
Kurs obejmuje zarówno Universal Analytics, jak i podstawowe aspekty Google Analytics 4!
Co ważne:
📌 Duży nacisk położony jest na aspekt wdrożeniowy z wykorzystaniem GTM, dataLayer, wtyczek lub z programistami.
📌 Kurs zawiera pełne wdrożenia na przykładzie konkretnych platform: PrestaShop, WooCommerce.
Po kursie będziesz umieć:
✅ Bezbłędnie skonfigurować Google Analytics dla e-commerce
✅ Wdrożyć Enhanced E-commerce na różnych platformach, a także na dedykowanym systemie we współpracy z programistami
✅ Podnieść konwersję dzięki analizie właściwych danych
✅ Skracać czas konieczny do analizy danych
✅ Dobierać metryki przydatne w e-commerce
✅ Wykorzystywać Google Data Studio do budowania przejrzystych raportów
✅ Wykrywać błędy w działaniu Twojego sklepu lub strony www
Wyrażenia regularne – przykłady w Google Analytics
Przechodzimy do praktycznych przykładów. Pokażę Ci na scenariuszach z życia wziętych jak wyrażenia regularne przydają się w codziennej pracy z Google Analytics.
Raporty
Regex przydaje się do filtrowania raportów w Google Analytics. Można go wykorzystać praktycznie wszędzi i ułatwić sobie pracę.
Przykładowo chciałbym zobaczyć w tabeli wszystkie wpisy, które zawierają w tytule strony słowa “Google Analytics”, “Google Tag Manager” lub “Data Studio”. W filtrze wybieram dopasowanie do wyrażeń regularnych i wpisuję (Google Tag Manager|Google Analytics|Data Studio).
Efekt:
Wykorzystanie wyrażenia regularnego to jedyny sposób na odfiltrowanie raportu w ten sposób. Alternatywą mogłoby być zastosowanie wielu warunków, ale nie mamy tam możliwości wyboru spójnika LUB, przez co taka metoda nie zadziała.
Zwrócony tylko jeden wynik – artykuł, który faktycznie zawierał w tytule obie frazy:
Tak więc aby zebrać potrzebne dane bez znajomości wyrażeń regularnych, musielibyśmy osobno odfiltrować raport dla każdej z trzech fraz, wyeksportować dane i złączyć je w Google Sheets lub Excelu. Niepotrzebna, ręczna praca – lepiej napisać prosty regex.
Cele
Załóżmy scenariusz, w którym posiadasz dwie strony podziękowania: jedna po wypełnieniu formularza kontaktowego dla leadów B2B, a druga dla B2C. Posiadają one następujące adresy URL:
- B2B – /sukces
- B2C – /b2c-sukces
Chcesz utworzyć jeden cel zbiorczy, który będzie zliczać konwersje z obu tych adresów URL.
Konfigurując cele w Google Analytics możesz skorzystać z opcji Miejsce docelowe, ale jeśli nie znasz wyrażeń regularnych, to masz do dyspozycji jedynie warianty Zaczyna się od lub Równa się.
Żadna z dwóch pierwszych opcji nie pozwala na uchwycenie obu adresów URL. Natomiast możesz to łatwo zrobić przez wyrażenie regularne, wpisując na przykład sukces, co pozwoli zliczać wizyty na każdym adresie URL zawierającym to słowo.
Wyrażenia regularne możesz też wykorzystać do zdefiniowania ścieżki celu, ale tylko wtedy, gdy ten wariant był użyty jako typ dopasowania adresu URL w miejscu docelowym.
Filtry
W kwestii filtrów mamy do czynienia z podobnymi operacjami jak w kontekście raportów. Jednym z moich ulubionych filtrów jest usuwanie subdomen z odesłań z platform social media, głównie z Facebooka.
Taki filtr możesz łatwo dodać dzięki regexowi. Wpisując .* przed słowem facebook wskazujesz na dowolną liczbę jakichkolwiek znaków, więc takie wyrażenie uchwyci między innymi:
- lm.facebook.com
- m.facebook.com
- l.facebook.com
W polu Zastąp ciąg umieszczamy docelową wartość pola Źródło kampanii. Dla przypadków, które łapią się w zdefiniowane wyżej wyrażenie regularne, nastąpi nadpisanie finalnej wartości tego pola.
Filtry mają opcję testowania ich wpływu na raporty w Google Analytics. To dobra praktyka, żeby przed zapisaniem filtra (którego działania nie da się cofnąć!) sprawdzić jak wpłynie on na dane.
Segmenty
Im bardziej szczegółowy segment chcesz zbudować, tym większa szansa, że będziesz potrzebować regexa.
Przykładowo segment dla ruchu z reklam w social media mógłby wyglądać następująco:
Bez regexa potrzebna byłaby gimanstyka z wieloma warunkami łączonymi spójnikami LUB / I, na przykład w taki sposób:
Trochę więcej zbędnego klikania, prawda?
Wyrażenia regularne – przykłady w Google Tag Manager
Kolejnym narzędziem, w którym przydaje się znajomość regexa, jest Google Tag Manager. Konfiguracja warunków w regułach potrafi być zawiła i bez wyrażeń regularnych czasem nie da się osiągnąć zamierzonego rezultatu.
Regex w GTM
W GTM dostępne są 4 warunki dotyczące regex:
Mamy więc dopasowanie lub niedopasowanie do wyrażenia regularnego, w wariancie z uwzględnieniem wielkości liter (domyślnie) i bez.
Regex możesz też wykorzystać przy definiowaniu reguły w oparciu o niestandardowe zdarzenie (Custom Event):
Google Tag Manager
(praktyczny kurs online)
Kurs online od podstaw do poziomu średnio-zaawansowanego. Opanuj narzędzie cenione przez klientów i pracodawców, z którym życie analityka, marketera czy specjalisty e-commerce staje się prostsze.
📹 5h krótkich, praktycznych lekcji.
🎓 Quiz sprawdzający wiedzę po każdym module
📄 Certyfikat ukończenia kursu (PDF)
Po kursie będziesz umieć:
✅ Zainstalować GTM na stronie
✅ Skonfigurować śledzenie zdarzeń Universal Analytics i Google Analytics 4
✅ Monitorować każdą interakcję ze stroną, jaka jest dla Ciebie istotna (kliknięcia, wideo, scrollowanie, formularze, przyciski, menu, etc.)
✅ Dodać tagi konwersji Google Ads, piksel Facebooka, Snapchata czy LinkedIn
✅ Budować dataLayer i komunikować się z programistami
✅ Mierzyć wysyłki formularzy kontaktowych
✅ Poradzić sobie, gdy gotowe wtyczki do dataLayer nie dają rady
✅ Korzystać z pełni możliwości, jakie dają tagi, zmienne i reguły w GTM
✅ Optymalizować czas potrzebny na wdrożenie
✅ Bezpiecznie pracować z GTM, aby niczego nie popsuć
Tabela wyrażeń regularnych
Tabela wyrażeń regularnych jest przydatnym typem zmiennej w momencie, gdy w zależności od danej wejściowej chciałbyś przekazać do innego narzędzia (np. do Google Analytics) odpowiednią wartość.
Przykładowo można w ten sposób zbudować grupowanie treści i w zależności od adresu URL przypisać mu odpowiednią kategorię. Oczywiście rekomendowane rozwiązanie to korzystanie z dataLayer, ale nie zawsze jest to możliwe i trzeba sobie radzić ”sposobem” – wtedy właśnie tabele regex się przydają.
Wyrażenia regularne – przykłady w Google Data Studio
Google Data Studio również pozwala na wykorzystanie wyrażeń regularnych i ich znajomość potrafi uratować sytuację. W przypadku gdy musisz stworzyć zaawansowane filtry lub pogrupować dane, regex jest nieoceniony.
Na przykład weźmy na tapetę filtr, który ma uchwycić karty produktu o dość nieprzyjemnej konstrukcji adresu URL:
Inne zastosowanie to dopasowanie wymiaru w źródle danych z wykorzystaniem REGEXP_REPLACE, czyli odpowiednie “obcięcie” wartości parametrów UTM z niepotrzebnych fragmentów:
Na Data Studio lista narzędzi pozwalających wykorzystywać wyrażenia regularne się nie kończy, ale nie ma sensu się powtarzać w nieskończoność. Ogólnie rzecz biorąc regex przyda Ci się niemal wszędzie.
Podsumowanie
Wyrażenia regularne nie są najłatwiejsze, to fakt. Ale warto podejść do nich z cierpliwością i nauczyć się je wykorzystywać w pracy. Dla analityka czy marketera ich wartość jest nieoceniona.
Zdjęcie autorstwa Startup Stock Photos z Pexels