|
|
1.远程数据跟踪 页读数增长的速度是多少?年底的时候我们期望的页读数是多少?网站的哪部分页读数增长得最快?哪部分最慢? 各种浏览器的比例随着时间变化的趋势是怎样的? 人们过多久访问我们的网站一次? 从其它网站的旗帜广告第一次进入我的网站的人,他们随后读了多少页? 一旦我们看到可用的各种类型的信息,我们就会得到需要长距离回答的各种问题。如果我们对回答这些问题感兴趣,那么多天的跟踪就会有用。 进行远程数据跟踪,可以考虑使用数据库。我们可以编写程序从点击数日志中提取想要的信息。如果数据库设计得合理,查询信息的时间比用程序从日志文件中提取信息快好多倍。数据量越大,这种差别越明显。 如果只存储感兴趣的点击,可以节省大量的数据空间。 也可用SQL从数据库中提取数据。SQL是一种小型的、简练的只需学很少的命令和语法的语言。而且,其命令结构简单明晰,好的程序员建立一个SQL查询比编程做同样的事快得多。而且其结果错误更少,更容易理解。 如果不想用SQL,可以用一种数据库访问工具如MS Access 或 Excel。这些工具都很好用,而且是图形界面。 2.计算访问时间 电子商务网站的市场部和广告部都喜欢统计访问时间,即某人在离开我们的站点前停留了多长时间。但是,用HTTP是不可能确定这个数值的。 假设一个客户在正午时访问Hot的一个页,然后该客户在12:28 p.m.访问Hot的另一页,那么该客户对Hot的访问时间是多长呢?该客户可能在这28分钟内一直盯着第一个Hot页,但是该客户也可能在这28分钟内新开了一个窗口,浏览另一个网站。 但是,我们的用户确实需要这种信息,那么该怎么告诉他们呢? 我们可以去Internet Advertising Bureau,它定义了一个访问为"没有连续30分钟的不活动的访问者的一系列页面请求 "。当有人问起我们的网站的访问时间时,我们也可以在IAB的定义的基础上告诉他们。 3.计算访问来源 如果访问者点击某个连接或某个旗帜广告到达我们的网站,他的浏览器会随着这个请求发送他刚离开的站点的URL,这个URL称为"referer"。 Netscape和IE对访问的来源的处理方式不同。如果我们点击原始页到一个有frame的页,Netscape将把原始页作为对包含frame的页和每个frame中的页的来源;IE把原始页作为包含frame的页的来源,这个包含frame的页反过来把它本身作为各个frame页的来源。进一步,我们可能还会得到每页的页读数的数据。如果把网站分成频道或部分,则可能得到每部分的数据。 需要注意的是,上述方法计算出的页读数不是我们的网站的实际页读数。这是因为我们统计的是在Web服务器的访问日志中计算访问记录,而很多请求从不在访问日志中留下痕迹。因为没有十全十美的方案,所以使用哪种统计方法取决于网站的实际情况。
三、计算访问人数 计算访问人数比计算页读数难得多,而且没有绝对可靠的计算访问者人数的方法。 基本上有三种信息可以用来跟踪访问者:IP地址、成员名(如果网站使用成员注册)和cookie。 最简单的办法是计算log文件中的唯一IP地址的数量。但是,最容易的办法通常不是最好的办法。这种方法是可用的最不准确的办法。大多数人在每次连接时得到不同的IP地址。这是因为很多ISP为用户赋予动态的IP地址,例如,当一个AOL用户上网时,AOL给他一个IP地址,当他断开连接时,AOL把这个地址赋给另一个用户。这样,当我们进行统计时,我们不知道这是两个用户。 如果要求用户使用成员身份登录,统计将很容易和准确。但很多人不喜欢需要登录的网站,这就使得跟踪成员名的统计没有实际意义。 最后,可以使用cookies。为每个访问者定义一个包含唯一值的cookie,我们把它称为机器ID。如果某人访问我们的网站时没有提供机器ID(可能她是第一次访问,或者她的浏览器不接受cookies),把她当作新用户,并为她访问的页发送一个cookie。 使用这种方法要注意的是: 1. 很多人关掉了cookies的功能; 2. 可以用浏览器删除旧的cookies; 3. cookie存储在访问者的机器上( 访问者可能用不只一台机器访问我们的网站);上一页 [1] [2] [3] [4] 下一页
|
|
|
|
|
|
|
|
 |
|