ATAXO - hlavní stránka

Regulární výrazy v Google Analytics

Jan Bednář | | Google Analytics

I když je možné se bez ní obejít, základní znalost regulárních výrazů je dobrá pro použití Google Analytics, zejména pro nastavení cílů či filtrů. Pokud si nejste jistí v kramflecích, tento článek Vám může pomoct.

Co je to regulární výraz

Regulární výrazy se nejčastěji používají při programování. Jde o textový řetězec, který obsahuje znaky se speciálním významem - metaznaky. Abyste mohli regulární výrazy používat, musíte znát jejich význam.

Kde a proč se regulární výrazy používají

V Google Analytics se regulární výrazy používají

  • při zadávání cílů, pokud použijete Regular expression match
  • ve filtrech
  • ve vyhledávacím okně v jednotlivých reportech

Regulární výraz můžete použít buď jako podmínku – např. započítat URL jako cíl, pokud odpovídá výrazu, nebo pro získání nějaké hodnoty, se kterou chcete dál pracovat – např. vyjmout něco z refereru a uložit do user defined. Jejich výhoda spočívá v tom, že pomocí metaznaků může jednomu regulárnímu výrazu odpovídat více různých řetězců. Tak si můžu například jako jeden cíl nadefinovat více různých stránek:

  • Regulární výraz: potvrzeni-objednavky\.html\?id=(2|5)
  • Vyhovující URI:
    • potvrzeni-objednavky.html?id=5
    • potvrzeni-objednavky.html?id=2

Použití v pokročilých filtrech

V pokročilých filtrech lze regulární výrazy použít nejen jako podmínku, ale také pro získání nějaké části řetězce, se kterým pracujeme. Každé závorky vytváří jeden element a elementy jsou číslovány zleva. Tyto elementy pak můžeme vložit do pole Constructor. Elementy z pole A jsou označeny jako $A1, $A2 atd., elementy z pole B jako $B1, $B2 atd.

V následujícím příkladu chci sledovat, kolik lidí navštíví stránku s detailem jednotlivých projektů. Z navštívené URI (pokud odpovídá mému regulárnímu výrazu) vyjmu název projektu a uložím ho do user defined. Toto jsou možné příklady:

  • Regulární výraz: detail/(.*)
  • URI:
    • detail/123-bozske-kopecky
    • detail/50-penthouse
    • detail/50-penthouse

V prvním případě dostanu 123-bozske-kopecky, ve druhém 50-penthouse, ve třetím nic, protože URI neodpovídá mému regulárnímu výrazu.

  

Kam jít dál

Google má ve své conversion university prezentaci o použití regulárních výrazů.

Pro testování výrazů můžete použít Regular Expression Test Tool. Google Analytics používají typ POSIX.

Základní metaznaky

  • . tečka zastupuje jakýkoliv znak
  • \ ruší speciální význam metaznaků; \. odpovídá obyčejné tečce
  • [] hranaté závorky samy o sobě zastupují jeden znak, který musí odpovídat jednomu ze znaků, které do nich vepíšete; např. [ab] odpovídá písmenu a nebo b
  • [a-z] v hranatých závorkách lze definovat také rozsah znaků; například [a-z] odpovídá všem (malým) písmenům, [1-5] odpovídá číslům jedna až pět
  • ? otazník je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo nulakrát; např. [ab]? odpovídá jednomu nebo žádnému výskytu písmene a nebo b
  • + plus je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo vícekrát; např. [1-9]+ odpovídá jednomu nebo více číslům za sebou
  • * hvězdička je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo nulakrát; např. /* odpovídá jednomu nebo více výskytů lomítka
  • () kulaté závorky vytváří skupinu. K té se může vztahovat kvantifikátor; např. (http)? Odpovídá jednomu nebo žádnému výskytu řetězce http; S těmito skupinami lze také dále pracovat.
  • | znamená nebo; například a|b znamená to samé jako [ab]; google\.(cz|sk) odpovídá buď google.cz nebo google.sk
  • ^ stříška znamená začátek řetězce; uvnitř hranatých závorek ale stříška znamená negaci; například [^/?] odpovídá kterýkoliv znak kromě lomítka a otazníku.
  • $ dolar znamená konec řetězce
  • \s jakákoliv mezera
Sdílet na Facebooku T Sdílet na Twitteru linkuj.cz pošli na vybrali.sme.sk