3.4 子目录设置
子目录是用户网站下的一组URL。比如,www.URL.com叫作主域名,www.URL.com/aaa中的/aaa就叫作一个子目录。这个子目录涵盖了多个页面,可能是用户网站的一个子频道,也可能是与某些主题相同的页面。
子目录适合在如下特定条件中使用。
● 网站结构复杂,页面非常多。
● 网站本身有频道划分,每个频道都针对不同产品、服务或内容。
● 希望针对网站中的某些页面单独分析数据。
如果用户想对某些业务进行单独监控,就可以设置子目录。设置后即可单独查看该子目录的统计数据。
3.4.1 子目录与二级域名的区别
博客网址blog.***.cn之类的是二级域名,而在域名下面用类似www.***.cn/blog/这种子目录放置网站的属于子目录。
对于搜索引擎来说二级域名是属于独立的网站,而子目录其实是属于主站下面的一个页面。
3.4.2 如何添加子目录
进入“网站中心”→“网站统计设置”→“子目录管理”,单击右侧“新增子目录”按钮,如图3.8所示,即可进入“新增子目录”页面。
图3.8 “新增子目录”页面
目前百度统计支持添加30个子目录,并且设置子目录对统计代码没有影响,百度统计可以准确辨别用户在某个域名下设置的子目录页面,并根据用户的设置规则进行划分,设置完成后,约3小时即可查看子目录相关数据了。
3.4.3 正则表达式
当用户单击“子目录管理”→“新增子目录”后会进入如图3.9所示的页面,页面顶端有一行询问用户是否使用正则表达式的设置按钮。
图3.9 正则表达式设置
那么什么是正则表达式呢?这样的设置有什么用处呢?
正则表达式是指匹配或捕获字段的若干部分的特殊字符以及支配这些字符的规则,具体介绍如下。
● .,匹配任何单个字符(字母、数字或符号),如bai.du与baigdu和bai8du匹配。
● ?,匹配0个或1个先前项,labou?r与labor和labour都匹配。
● *,匹配0个或多个先前项,labo*r与labr和labour都匹配。
● +,与星号的用法一样,只不过加号前至少必须匹配一个先前项;如+aidu和longyuespa、alongyuespa都匹配。
● |,执行“或”匹配,a|b与a或b匹配。
● (),使用圆括号创建项,而不使用默认项,如love(ableIly)匹配loveable或lovely。
● [],创建要匹配的项列表,www.aaa.com/mp[1-4]可以匹配www.aaa.com/mp1、www.aaa.com/mp2、www.aaa.com/mp3、www.aaa.com/mp4。
● -,与方括号联合使用,用来扩展用户的列表,如上例中的[1-4]。
● $,要求用户的数据位于字段末尾,如www.aaa.com/mp[1-4]$就不能匹配www.aaa.com/mp5或者www.aaa.com/mp11等。
● ^,要求用户的数据位于字段开头,如^longyuespa匹配所有以longyuespa开头的行。
● \,将正则表达式字符转换为普通字符,如用户选择了“是”,表示使用正则表达式来设置,而用户的URL本来为www.longyuespa.com,而“·”恰好是正则元字符,则用户在设置正则表达式时需要将用户的URL转义为www\.longyuespa\.com。
● {},一般与非负整数一齐使用,匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个“o”。
由于正则表达式的含义复杂、操作困难,为了避免系统误判带来不必要的困扰,在提交正则表达式的设置之前一定要认真检查,注意转义,以确保所设置的正则表达式完整、正确,能被系统识别且没有歧义。
说明:在用户需要添加的子目录数量较少的情况下,不建议使用正则表达式。
3.4.4 通配符的使用
图3.10标注的地方都提到了通配符,那么什么是通配符,通配符又应怎么使用呢?
图3.10 通配符的使用
通配符,即“*”符号,可以添加在URL中,代替任意字符。目前,百度统计后台的“页面分析”板块下的“页面点击图”“页面上下游”等均支持添加通配符。
注意:正则表达式中也有*字符,与通配符含义不一样。且正则表达式与通配符只能选择一个使用,不能同时使用。
假设用户添加的网站域名是www.longyuespa.com(域名决定通配符的添加范围),则添加通配符的规则如下。
● 不能在用户添加的网站域名后直接加通配符,即www.longyuespa.com*这种方式是不允许的,通配符与添加的域名至少间隔一个字符。举个例子,如www.longyuespa.com?abab这种表达方式,则需要设置通配符www.longyuespa.com?*来表示。
● www.longyuespa.com/*,表示包含www.longyuespa.com/这个形式的所有URL,如www.longyuespa.com/abab,www.longyuespa.com/abab/cdcd。
● www.longyuespa.com/abab*,表示包含www.longyuespa.com/abab这个形式的所有URL,如www.longyuespa.com/abab,www.longyuespa.com/ababcd,www.longyuespa.com/abab/cdcd。
● www.longyuespa.com/*.html,表示包含www.longyuespa.com/这个形式,且以html结尾的所有URL,如www.longyuespa.com/abab.html。
和正则表达式一样,如果用户的子目录项目不多,为了避免错误,不建议使用通配符。