Как да пишете и тествате Regex филтри за Google Analytics (с примери)

Регулярни изрази Regex Google Analytics Филтри

Както при много от моите статии тук, правя проучване за клиент и след това пиша за него тук. За да бъда честен, има няколко причини защо ... първо е, че имам ужасна памет и често изследвам собствения си уебсайт за информация. Второто е да помогнете на други, които също могат да търсят информация.

Какво е редовен израз (Regex)?

Regex е метод за разработка за търсене и идентифициране на шаблон от символи в текста, за да съответства или замества текста. Всички съвременни езици за програмиране поддържат регулярни изрази.

Обичам регулярните изрази (регулярен), но те могат да бъдат малко разочароващи или вбесяващи, за да се учат и тестват. Google Analytics има някои невероятни възможности ... където можете да създавате изгледи с регулярни изрази или да филтрирате данните си в рамките на регулярни изрази.

Например, ако исках да видя само трафика на страниците ми с маркери, бих могъл да филтрирам за / tag / в структурата на постоянната си връзка, като използвам:

/tag\/

Синтаксисът е критичен там. Ако просто използвах „tag“, щях да получа всички страници с термина tag в тях. Ако използвах “/ tag”, тогава ще бъде включен всеки URL, който започва с tag, например / управление на тагове защото Google Analytics по подразбиране включва всеки символ след регулярния израз. Така че, трябва да се уверя, че имам включена следната наклонена черта ... но тя трябва да има символ за бягство.

регулярно изражение на филтъра на страниците

Основи на синтаксиса на Regex

Синтаксис Описание
^ Започва с
$ Завършва със
. Заместващ знак за всеки символ
* Нула или повече от предишния елемент
.* Съвпада с всякакви знаци в
? Нула или еднократно на предишния елемент
+ Един или повече пъти от предишния елемент
| Операторът OR
[abc] A или b или c (може да бъде произволен брой знаци)
[az] Диапазон от a до z (може да бъде произволен брой знаци)
[AZ] Обхват от А до Я (с главни букви)
[0-9] Обхват от 0 до 9 (може да е произволно число)
[a-zA-Z] Обхват от a до Z или от A до Z
[a-zA-Z0-9] Всички буквено-цифрови знаци
1 {} Точно 1 екземпляр (може да е произволен брой)
{1-4} Обхват от 1 до 4 екземпляра (може да бъде произволен брой)
{1,} 1 или повече екземпляра (може да бъде произволен брой)
() Групирайте правилата си
\ Избягайте от специални герои
\d Цифров знак
\D Нецифрен знак
\s Бяло пространство
\S Небели пространства
\w дума
\W Недума (пунктуация)

Примери за регулярни изрази за Google Analytics

Така че нека да дадем някои примери за някои Персонализирани филтри. Един от моите колеги ме помоли за съдействие, за да идентифицирам вътрешна страница с пътя на / индекс в допълнение към всички публикации в блога, написани с годината в постоянната връзка:

Моят персонализиран модел на филтър за полето за филтриране URL адрес на заявка:

^/(index|[0-9]{4}\/)

Това основно гласи да се търси / индексира ИЛИ който и да е 4-цифрен цифров път, завършващ с наклонена черта. Създадох изглед в Анализ и добавих това като филтър:

Филтър на изглед на Google Analytics

Ето още няколко примера:

  • Имате блог с годината в URL постоянната връзка и искате да филтрирате списъка към всяка година. Така че искам всякакви 4 цифрови цифри, последвани от наклонена черта. Заявете модел на филтър за URl:

^/[0-9]{4}\/

  • Искате да сравните всичките си страници, където има заглавието сертификат or сертифициране в него. Образец на филтъра на заглавието на страницата:

(.*)certificat(.*)

  • Искате да сравните две целеви страници въз основа на техния носител на кампанията, предаден в URL адрес на кампания в Google Analytics като utm_medium = директна поща or платено търсене.

(direct\smail|paid\ssearch)

  • Искате да сравните всички продукти, които са мъжки ризи, въз основа на URL пътя. Заявете модел на филтър за URl:

^/mens/shirt/(.*)

  • Искате да сравните всички страници, номерирани на URL пътя, който завършва с номера. Заявете модел на филтър за URl:

^/page/[1-9]*/$

  • Искате да изключите набор от IP адреси. Изключете образеца на филтър за IP адреси:

123\.456\.789\.[0-9]

  • Искате да включите благодарна страница.html, където изпращането е било успешно въз основа на низ за заявка успех = вярно. Заявете модел на филтър за URl:

thankyou\.html\?success=true

Как да тествате вашите изрази за регулярни изрази

Вместо опити и грешки в Google Analytics, често просто прескачам regex101, фантастичен инструмент за тестване на вашите регулярни изрази. Той дори разбива синтаксиса за вас и предоставя подробности за регулярния ви израз:

регулярни изрази regex101

Изграждане, тестване и отстраняване на грешки на регулярни изрази

Какво мислите?

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните за коментарите ви.