I když je možné se bez ní obejít, základní znalost regulárních výrazů je dobrá pro použití Google Analytics, zejména pro nastavení cílů či filtrů. Pokud si nejste jistí v kramflecích, tento článek Vám může pomoct.
Co je to regulární výraz
Regulární výrazy se nejčastěji používají při programování. Jde o textový řetězec, který obsahuje znaky se speciálním významem - metaznaky. Abyste mohli regulární výrazy používat, musíte znát jejich význam.
Kde a proč se regulární výrazy používají
V Google Analytics se regulární výrazy používají
- při zadávání cílů, pokud použijete Regular expression match
- ve filtrech
- ve vyhledávacím okně v jednotlivých reportech
Regulární výraz můžete použít buď jako podmínku – např. započítat URL jako cíl, pokud odpovídá výrazu, nebo pro získání nějaké hodnoty, se kterou chcete dál pracovat – např. vyjmout něco z refereru a uložit do user defined. Jejich výhoda spočívá v tom, že pomocí metaznaků může jednomu regulárnímu výrazu odpovídat více různých řetězců. Tak si můžu například jako jeden cíl nadefinovat více různých stránek:
- Regulární výraz: potvrzeni-objednavky\.html\?id=(2|5)
- Vyhovující URI:
- potvrzeni-objednavky.html?id=5
- potvrzeni-objednavky.html?id=2
Použití v pokročilých filtrech
V pokročilých filtrech lze regulární výrazy použít nejen jako podmínku, ale také pro získání nějaké části řetězce, se kterým pracujeme. Každé závorky vytváří jeden element a elementy jsou číslovány zleva. Tyto elementy pak můžeme vložit do pole Constructor. Elementy z pole A jsou označeny jako $A1, $A2 atd., elementy z pole B jako $B1, $B2 atd.
V následujícím příkladu chci sledovat, kolik lidí navštíví stránku s detailem jednotlivých projektů. Z navštívené URI (pokud odpovídá mému regulárnímu výrazu) vyjmu název projektu a uložím ho do user defined. Toto jsou možné příklady:
- Regulární výraz: detail/(.*)
- URI:
- detail/123-bozske-kopecky
- detail/50-penthouse
- detail/50-penthouse
V prvním případě dostanu 123-bozske-kopecky, ve druhém 50-penthouse, ve třetím nic, protože URI neodpovídá mému regulárnímu výrazu.
Kam jít dál
Google má ve své conversion university prezentaci o použití regulárních výrazů.
Pro testování výrazů můžete použít Regular Expression Test Tool. Google Analytics používají typ POSIX.
Základní metaznaky
- . tečka zastupuje jakýkoliv znak
- \ ruší speciální význam metaznaků; \. odpovídá obyčejné tečce
- [] hranaté závorky samy o sobě zastupují jeden znak, který musí odpovídat jednomu ze znaků, které do nich vepíšete; např. [ab] odpovídá písmenu a nebo b
- [a-z] v hranatých závorkách lze definovat také rozsah znaků; například [a-z] odpovídá všem (malým) písmenům, [1-5] odpovídá číslům jedna až pět
- ? otazník je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo nulakrát; např. [ab]? odpovídá jednomu nebo žádnému výskytu písmene a nebo b
- + plus je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo vícekrát; např. [1-9]+ odpovídá jednomu nebo více číslům za sebou
- * hvězdička je kvantifikátor, který udává, že předcházející znak se může vyskytovat jednou nebo nulakrát; např. /* odpovídá jednomu nebo více výskytů lomítka
- () kulaté závorky vytváří skupinu. K té se může vztahovat kvantifikátor; např. (http)? Odpovídá jednomu nebo žádnému výskytu řetězce http; S těmito skupinami lze také dále pracovat.
- | znamená nebo; například a|b znamená to samé jako [ab]; google\.(cz|sk) odpovídá buď google.cz nebo google.sk
- ^ stříška znamená začátek řetězce; uvnitř hranatých závorek ale stříška znamená negaci; například [^/?] odpovídá kterýkoliv znak kromě lomítka a otazníku.
- $ dolar znamená konec řetězce
- \s jakákoliv mezera


