我们都知道监控和分析网站访问量的重要性,但是,在确定统计指标的重要性和稳定性方面看来仍有许多混乱的地方,我希望通过下面的分析澄清一些模糊的概念,并解释其不正确的原因。
关于网站流量统计最流行的术语可能就是“点击”,我认为对点击的理解只是初步的。按照定义,点击是服务器为了为了传送一个网页必须满足的所有个体的请求,除了基本的HTML外还应加上图片或声音文件。由此可以看出,点击数相对没有很大实际意义,特别是一个网页上有几幅图片或多媒体文件时。
页面浏览就显得比较有意义,但是由于其内在的缺陷,仍不够精确。页面浏览是访问者通过浏览器实际看到的页面数的总和。
无论点击还是页面浏览都存在下面两个主要问题:
(1)Catch
我们假定一个访问者正在你的网站上浏览一个网页,过一小段时间之后浏览同一网页,看到的很可能是浏览器的缓存中的内容,而不是网站的信息(因为读取缓存的内容更加快些),浏览者的ISP也有一个缓存,尤其在使用代理服务器的情况下更加明显,这种现象直接导致统计结果的不真实。
(2)SpidersorBots
正如上述名称所示,设计这些软件的目的是在网络上爬行、为网页编制目录,收集email地址或其它信息,这都记录为点击,即使你可以建立一个数据库不记录这些IP地址,但是这些IP地址列表每天都在变化,很难精确记录。
计算独特访问者会可靠一点,如果使用IP地址和(或)cookies组合的情况下更加明显,如果试图计算多少个访问者形成一次购买,那么这个资料就有其实际价值,缺点是许多人每次登陆时IP地址不同,而且有些人关闭了浏览器的cookies功能。
由此可知,没有哪一个统计指标能够完全反映访问者的所有信息,许多甚至只是粗略估计,要全面评价网站的效果,要考虑的因素还很多。下面将分析其中最重要的因素。




