Google Analytics- നായി Regex ഫിൽട്ടറുകൾ എങ്ങനെ എഴുതാം, പരീക്ഷിക്കാം (ഉദാഹരണങ്ങളോടെ)

പതിവ് എക്‌സ്‌പ്രഷനുകൾ‌ റെജെക്സ് Google Analytics ഫിൽ‌റ്ററുകൾ‌

എന്റെ പല ലേഖനങ്ങളും പോലെ, ഞാൻ ഒരു ക്ലയന്റിനായി കുറച്ച് ഗവേഷണം നടത്തുകയും അതിനെക്കുറിച്ച് ഇവിടെ എഴുതുകയും ചെയ്യുന്നു. സത്യം പറഞ്ഞാൽ, ഇതിന് രണ്ട് കാരണങ്ങളുണ്ട്… ആദ്യം എനിക്ക് ഭയങ്കര മെമ്മറിയുണ്ട്, കൂടാതെ പലപ്പോഴും വിവരങ്ങൾക്കായി എന്റെ സ്വന്തം വെബ്‌സൈറ്റ് ഗവേഷണം നടത്തുകയും ചെയ്യുന്നു. രണ്ടാമത്തേത് വിവരങ്ങൾക്കായി തിരയുന്ന മറ്റുള്ളവരെ സഹായിക്കുക എന്നതാണ്.

എന്താണ് റെഗുലർ എക്സ്പ്രഷൻ (റിജെക്സ്)?

വാചകവുമായി പൊരുത്തപ്പെടാനോ മാറ്റിസ്ഥാപിക്കാനോ വാചകത്തിനുള്ളിലെ പ്രതീകങ്ങളുടെ പാറ്റേൺ തിരയാനും തിരിച്ചറിയാനുമുള്ള ഒരു വികസന രീതിയാണ് റെജെക്സ്. എല്ലാ ആധുനിക പ്രോഗ്രാമിംഗ് ഭാഷകളും റെഗുലർ എക്സ്പ്രഷനുകളെ പിന്തുണയ്ക്കുന്നു.

എനിക്ക് പതിവ് പദപ്രയോഗങ്ങൾ ഇഷ്ടമാണ് (regex) പക്ഷേ അവ പഠിക്കാനും പരീക്ഷിക്കാനും അൽപ്പം നിരാശാജനകമോ പ്രകോപിപ്പിക്കലോ ആകാം. Google അനലിറ്റിക്‌സിന് അതിശയകരമായ ചില കഴിവുകളുണ്ട്… അവിടെ നിങ്ങൾക്ക് പതിവ് എക്‌സ്‌പ്രഷനുകൾ ഉപയോഗിച്ച് കാഴ്ചകൾ സൃഷ്ടിക്കാനോ പതിവ് എക്‌സ്‌പ്രഷനുകളിൽ നിങ്ങളുടെ ഡാറ്റ ഫിൽട്ടർ ചെയ്യാനോ കഴിയും.

ഉദാഹരണത്തിന്, എന്റെ ടാഗ് പേജുകളിലെ ട്രാഫിക് മാത്രം കാണണമെങ്കിൽ, ഇനിപ്പറയുന്നവ ഉപയോഗിച്ച് എന്റെ പെർമാലിങ്ക് ഘടനയിൽ / ടാഗ് / എന്നതിനായി ഫിൽട്ടർ ചെയ്യാൻ കഴിയും:

/tag\/

വാക്യഘടന അവിടെ നിർണ്ണായകമാണ്. ഞാൻ “ടാഗ്” ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ, ടാഗ് എന്ന പദം ഉള്ള എല്ലാ പേജുകളും എനിക്ക് ലഭിക്കും. ഞാൻ “/ ടാഗ്” ഉപയോഗിച്ചിട്ടുണ്ടെങ്കിൽ, ടാഗിൽ ആരംഭിക്കുന്ന ഏത് URL ഉം ഉൾപ്പെടുത്തും / ടാഗ് മാനേജുമെന്റ് കാരണം പതിവ് എക്‌സ്‌പ്രഷനുശേഷം ഏതെങ്കിലും പ്രതീകങ്ങൾ ഉൾപ്പെടുത്തുന്നതിൽ Google Analytics സ്ഥിരസ്ഥിതിയാണ്. അതിനാൽ, ഇനിപ്പറയുന്ന സ്ലാഷ് ഉൾപ്പെടുത്തിയിട്ടുണ്ടെന്ന് ഞാൻ ഉറപ്പാക്കേണ്ടതുണ്ട്… പക്ഷേ അതിൽ ഒരു രക്ഷപ്പെടൽ പ്രതീകം ഉണ്ടായിരിക്കണം.

പേജ് ഫിൽട്ടർ റിജെക്സ്

റിജെക്സ് സിന്റാക്സ് അടിസ്ഥാനങ്ങൾ

പദവിന്യാസം വിവരണം
^ ആരംഭിക്കുന്നു
$ അവസാനിക്കുന്നു
. ഏത് കഥാപാത്രത്തിനും വൈൽഡ്കാർഡ്
* മുമ്പത്തെ ഇനത്തിന്റെ പൂജ്യമോ അതിലധികമോ
.* ലെ ഏതെങ്കിലും പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു
? മുമ്പത്തെ ഇനത്തിന്റെ പൂജ്യം അല്ലെങ്കിൽ ഒരു സമയം
+ മുമ്പത്തെ ഇനത്തിന്റെ ഒന്നോ അതിലധികമോ തവണ
| അല്ലെങ്കിൽ ഓപ്പറേറ്റർ
[abc] എ അല്ലെങ്കിൽ ബി അല്ലെങ്കിൽ സി (എത്ര പ്രതീകങ്ങളാകാം)
[az] A മുതൽ z വരെയുള്ള ശ്രേണി (എത്ര പ്രതീകങ്ങളാകാം)
[AZ] A മുതൽ Z വരെയുള്ള ശ്രേണി (വലിയക്ഷരമാക്കി)
[ക്സനുമ്ക്സ-ക്സനുമ്ക്സ] 0 മുതൽ 9 വരെയുള്ള ശ്രേണി (ഏത് നമ്പറും ആകാം)
[a-zA-Z] A മുതൽ Z വരെ അല്ലെങ്കിൽ A മുതൽ Z വരെയുള്ള ശ്രേണി
[a-zA-Z0-9] എല്ലാ ആൽഫാന്യൂമെറിക് പ്രതീകങ്ങളും
{1} കൃത്യമായി 1 ഉദാഹരണം (ഏത് നമ്പറും ആകാം)
{1-4} 1 മുതൽ 4 സംഭവങ്ങളുടെ പരിധി (ഏത് നമ്പറും ആകാം)
{1,} ഒന്നോ അതിലധികമോ ഉദാഹരണങ്ങൾ (ഏത് നമ്പറും ആകാം)
() നിങ്ങളുടെ നിയമങ്ങൾ ഗ്രൂപ്പുചെയ്യുക
\ പ്രത്യേക പ്രതീകങ്ങൾ ഒഴിവാക്കുക
\d അക്ക പ്രതീകം
\D അക്കമില്ലാത്ത പ്രതീകം
\s വൈറ്റ് സ്പേസ്
\S വെളുത്ത ഇതര ഇടം
\w വാക്ക്
\W നോൺ-വേഡ് (ചിഹ്നനം)

Google Analytics- നുള്ള Regex ഉദാഹരണങ്ങൾ

അതിനാൽ ചില ഉദാഹരണങ്ങൾക്കായി നമുക്ക് ചില ഉദാഹരണങ്ങൾ നൽകാം ഇഷ്‌ടാനുസൃത ഫിൽട്ടറുകൾ. എന്റെ സഹപ്രവർത്തകരിലൊരാൾ എന്നോട് ഒരു ആന്തരിക പേജ് തിരിച്ചറിയാൻ സഹായം ചോദിച്ചു / സൂചിക പെർമാലിങ്കിൽ വർഷത്തിൽ എഴുതിയ എല്ലാ ബ്ലോഗ് പോസ്റ്റുകൾക്കും പുറമേ:

ഫിൽ‌റ്റർ‌ ഫീൽ‌ഡിനായുള്ള എന്റെ ഇച്ഛാനുസൃത ഫിൽ‌റ്റർ‌ പാറ്റേൺ‌ അഭ്യർ‌ത്ഥന Url:

^/(index|[0-9]{4}\/)

അടിസ്ഥാനപരമായി / സൂചിക അല്ലെങ്കിൽ 4-അക്ക സംഖ്യാ പാത തിരയുന്ന സ്ലാഷിൽ അവസാനിക്കുന്നതായി പറയുന്നു. ഞാൻ അനലിറ്റിക്സിൽ ഒരു കാഴ്ച സൃഷ്ടിക്കുകയും ഇത് ഫിൽട്ടറായി ചേർക്കുകയും ചെയ്തു:

Google Analytics കാഴ്ച ഫിൽട്ടർ

കുറച്ച് ഉദാഹരണങ്ങൾ കൂടി ഇതാ:

  • യു‌ആർ‌എൽ‌ പെർ‌മാലിങ്ക് പാതയിൽ‌ നിങ്ങൾ‌ക്ക് ഒരു ബ്ലോഗ് ഉണ്ട്, മാത്രമല്ല ഏത് വർഷവും പട്ടിക ഫിൽ‌റ്റർ‌ ചെയ്യാൻ‌ നിങ്ങൾ‌ താൽ‌പ്പര്യപ്പെടുന്നു. അതിനാൽ എനിക്ക് 4 സംഖ്യാ അക്കങ്ങൾ വേണം, അതിനുശേഷം ഒരു സ്ലാഷ്. URl ഫിൽട്ടർ പാറ്റേൺ അഭ്യർത്ഥിക്കുക:

^/[0-9]{4}\/

  • ശീർഷകമുള്ള നിങ്ങളുടെ എല്ലാ പേജുകളും താരതമ്യം ചെയ്യാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു സർട്ടിഫിക്കറ്റ് or സാക്ഷപ്പെടുത്തല് അതിൽ. പേജ് ശീർഷക ഫിൽട്ടർ പാറ്റേൺ:

(.*)certificat(.*)

  • ലെ പാസാക്കിയ കാമ്പെയ്ൻ മീഡിയത്തെ അടിസ്ഥാനമാക്കി രണ്ട് ലാൻഡിംഗ് പേജുകൾ താരതമ്യം ചെയ്യാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു Google Analytics കാമ്പെയ്‌ൻ URL utm_medium = ആയി നേരിട്ടുള്ള മെയിൽ or പണമടച്ചുള്ള തിരയൽ.

(direct\smail|paid\ssearch)

  • യുആർ‌എൽ പാതയെ അടിസ്ഥാനമാക്കി പുരുഷന്മാരുടെ ഷർട്ടുകളായ എല്ലാ ഉൽപ്പന്നങ്ങളും താരതമ്യം ചെയ്യാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു. URl ഫിൽട്ടർ പാറ്റേൺ അഭ്യർത്ഥിക്കുക:

^/mens/shirt/(.*)

  • നമ്പറിനൊപ്പം അവസാനിക്കുന്ന URL പാത്ത് അക്കമിട്ട എല്ലാ പേജുകളും താരതമ്യം ചെയ്യാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു. URl ഫിൽട്ടർ പാറ്റേൺ അഭ്യർത്ഥിക്കുക:

^/page/[1-9]*/$

  • ഒരു കൂട്ടം ഐപി വിലാസങ്ങൾ ഒഴിവാക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു. IP വിലാസ ഫിൽട്ടർ പാറ്റേൺ ഒഴിവാക്കുക:

123\.456\.789\.[0-9]

  • വിജയം = true എന്ന ചോദ്യത്തെ അടിസ്ഥാനമാക്കി ഒരു സമർപ്പിക്കൽ വിജയിച്ച ഒരു നന്ദി. Html പേജ് ഉൾപ്പെടുത്താൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നു. URl ഫിൽട്ടർ പാറ്റേൺ അഭ്യർത്ഥിക്കുക:

thankyou\.html\?success=true

നിങ്ങളുടെ റിജെക്സ് എക്സ്പ്രഷനുകൾ എങ്ങനെ പരീക്ഷിക്കാം

Google Analytics- ലെ ട്രയലിനും പിശകുകൾക്കും പകരം, ഞാൻ പലപ്പോഴും അതിലേക്ക് കടക്കും regex101, നിങ്ങളുടെ പതിവ് എക്‌സ്‌പ്രഷനുകൾ പരീക്ഷിക്കുന്നതിനുള്ള ഒരു മികച്ച ഉപകരണം. ഇത് നിങ്ങൾക്കായി നിങ്ങളുടെ വാക്യഘടനയെ തകർക്കുകയും നിങ്ങളുടെ പതിവ് പദപ്രയോഗത്തിന്റെ വിശദാംശങ്ങൾ നൽകുകയും ചെയ്യുന്നു:

പതിവ് പദപ്രയോഗങ്ങൾ regex101

ബിൽഡ്, ടെസ്റ്റ്, ഡീബഗ് റീജക്സ്

നീ എന്ത് ചിന്തിക്കുന്നു?

സ്പാം കുറയ്ക്കുന്നതിന് ഈ സൈറ്റ് Akismet ഉപയോഗിക്കുന്നു. നിങ്ങളുടെ അഭിപ്രായ ഡാറ്റ പ്രോസസ്സുചെയ്യുന്നത് എങ്ങനെയെന്നറിയുക.