导读:相关指标定义:①中国互联网用户(Internet User of China):DCCI执行相对严格的定义,即每周至少登陆、使用、访问互联网至少一次者方被定义为中国互联网受众/用户。②统计样本(Sample):DCCI根据CNNIC及中国国家统计局等机构颁布的中国互联网用
相关指标定义:①中国互联网用户(Internet User of China):DCCI执行相对严格的定义,即每周至少登陆、使用、访问互联网至少一次者方被定义为中国互联网受众/用户。
②统计样本(Sample):DCCI根据CNNIC及中国国家统计局等机构颁布的中国互联网用户分布结构及中国人口分布结构,在注册、安装中国互联网客户端固定样本组(Panel)软件的用户范围内,依据样本结构进行随机抽取、反向剔除、身份确认。用户需要实名注册、在统计周期内持续安装、正常运行中国互联网客户端固定样本组(Panel)软件,且用户本人必须符合中国互联网用户特征参数的受众/用户。月度到达率统计样本要求该样本一个月之内的四个平均分布的时间段至少登陆、使用、访问过互联网四次或者四次以上。
③访问(Visit):用户与网站产生交互行为,发出一个访问请求并且在用户端完成页面下载过程,计为一次访问。
④页面浏览数(Page Views, PV):用户向被访问网站发出访问请求,并成功完整下载被访问页面,计为一个页面浏览。产生页面访问请求但是页面并没有完成页面的完整下载过程,该访问请求不计为有效PV;一次访问过程中在30分钟内连续点击同一个地址向同一个页面发出多次访问请求并成功完整下载页面的,只计为一个有效PV。
⑤访问频次(Visit Frequency):受众/用户进行网站访问,一旦出现两个相邻的页面请求且页面完整下载的时间间隔为大于30分钟时,该访问结束,记录为一次访问。或当用户产生第一个页面请求且页面完整下载后,30分钟及30分钟以上并没有产生第二个页面请求且页面完整下载时,该访问计为结束,也计为一次。
⑥月度到达率(Monthly reach rate):指中国互联网客户端固定样本组(Panel)Netmonitor网络监测系统月度符合样本结构等要求的有效统计样本中当月至少主动成功访问过一次某特定网站的样本量占当月有效样本总量的百分比。
⑦月度人均访问时长(Time Spent per visitor per Month ):某一自然月内,月有效统计样本访问的该网站的网站访问时长的总和除以月有效样本总量的值。访问时长只记录被访问网站被访问页面作为当前活动窗口下的活动时间,且单一页面作为活动窗口的活动时长有效记录值最长不超过20分钟。
⑧月度人均页面浏览数(PVs or Page Views per visitor per month ):某一自然月内,月有效统计样本访问该网站的各次访问中不连续重复的页面浏览数总和除以当月有效样本总量的值。
⑨月度人均访问频次(Visit Frequency per visitor per month):某一自然月内,某网站当月月有效统计样本访问某网站的访问次数总和除以当月有效样本总量的值。
⑩月度受众/用户重合度(Visitor Overlap):在月度时间区间内,同时访问A、B两个特定网站的受众数量占A网站月度受众到达数量的比例,称为A网站相对于B网站的月度受众重合度。 相关数据调研方法:
DCCI采用基于客户端固定样本组(Panel)监测方法的Netmonitor网络监测系统。相关技术、样本、方法、规范、指标均为国际范围内进行网站/媒介监测和受众/用户测量最前沿、最主流的标准。Netratings、Comscore等在北美、欧洲等国家和地区进行广泛、连续的互联网监测时也采用类似的panel方法。通过用户许可协议,按照严格的样本招募方法招募固定样本群(panel),通过样本授权许可的客户端软件实时持续统计固定样本组的上网行为,统计分析互联网受众的应用行为、习惯、需求、消费,科学、进行深入系统的网站/媒介的连续性监测。
Netmonitor系统经过2005、2006两年时间的开发,2007年开始大规模募集样本。截止到2007年底,符合结构等指标要求的有效样本量已经超过5万个,2008年样本规模将有成倍增加。样本募集严格执行客户端固定样本组(Panel)监测方法的样本结构要求,对中国互联网受众/用户的总体统计误差要求在1%(置信度95%)范围内,对网站/媒介要求统计误差在5%(置信度95%)范围内。
基于客户端固定样本组(Panel)监测方法的Netmonitor系统,能够实现传统调研方法、网站/媒介自身所不能实现的动态、立体监测。基于客户端固定样本组(Panel)的监测方法,与以下几种方法在样本、技术、规范、指标、定义等方面完全不同:基于浏览器插件的信息收集与统计、应用软件附带进行的用户信息采集与统计、Alexa基于插件的网站排名、基于网页套嵌码的流量统计、基于网站日志的数据统计、基于线下或者线上问卷进行的调研统计等。所以,相关统计数据以及能够产生的结果也存在较多差异。 相关数据统计差异:
1.样本募集结构、流程、定义和数据统计结果的差异。
基于客户端固定样本组(Panel)的监测方法,有效受众/用户的样本的募集和确认,基于CNNIC和国家统计局关于互联网用户结构和中国人口分布结构,严格执行随机抽取、反向剔除、身份确认的原则。用户在自愿、许可原则下实名注册、安装并持续正常运行调查软件。样本随时间推移进行更新、补充和校正。相关样本募集的流程、结构和原则避免了其它方法,尤其是基于插件的排名数据结构和结果失衡问题(插件即样本,或者无法基于用户信息进行深入的样本控制),也避免了作弊者通过程序提交虚假数据、制造流量、冲高排名等问题;样本募集采取非付费原则,避免了有偿样本的数据结构失真问题;更为严格的受众/用户定义(其他机构定义为半年访问一次或者只要访问一次即计为一个用户),使得系统所能产生的统计结果更加符合使用相关数据的产业投资者、网站决策者、广告投放者等专业人群的标准和需要。
2.方法本身的技术、局限和数据统计结果的差异。
以客户端固定样本组(Panel)监测方法与服务器端基于页面代码或者网站日志的监测方法相比较为例,前者相对于某一特定网站而言为抽样统计因而数据可能存在一定偏差,后者相对于某一特定网站为站内抽样或站内全流量统计数据因而相对完整。但是由于技术、费用等原因后者实际也经常采用站内抽样方法,另外由于数据来自站内,在外部的可信度偏低。
前者能够同时实现对受众/用户访问的几乎所有网站和互联网使用行为的监测、统计,能够对流量、用户进行各种横向统计分析,采用统一的样本、方法、指标、时间区间,而后者往往只能够在局部、在不同网站的不同时间段实现一个或者数个网站的流量数据统计,样本、指标、时间区间等不尽一致。
在数据结果上的差异是最主要的,以访问网站的独立用户数(UV)、页面浏览数(PV)、访问时长(duration)等3个指标的统计为例:
独立用户数(UV)的统计差异:如果受众/用户端电脑中Cookie被删除或者曾经被删除状态,则网站服务器端依据Cookie,对于访问该网站的用户数量统计结果会偏高。Comscore出具的一份研究报告曾经向美国业界表明,服务器端对用户数量的统计可能因此偏高30%以上。
页面访问量(page views)的统计差异——在服务器端的监测统计方式之下,机器人、搜索爬虫、作弊程序等带来的非有效用户页面访问请求都有可能被记录为有效页面访问。受众/用户向服务器发出访问请求后即使页面下载不完整、不成功,只要服务器记录到了访问请求都可能会被计为有效页面访问。每次访问30分钟之内连续点击同一个地址向同一个页面发出多次访问,可能会被记录为多个PV;页面打开后很快被关闭没有形成有效浏览的页面访问也会被计为有效PV。客户端固定样本组(Panel)监测方法中,这些都不会被记录为有效PV。
访问时长的统计差异:客户端固定样本组只统计用户电脑当中的当前活动窗口的活动时间且该时间有最大时长限制,同时可以测量离线时长。服务器端监测方法目前尚不能区分当前活动窗口和非活动窗口,无法按照与用户在客户端发生的应用行为完全相符的方式进行统计。
实现对于互联网网站/媒介与受众/用户的精确测量意义重大,但是目前中国国内各个方面尚处于初级阶段。据悉,DCCI将在客户端固定样本组(Panel)监测方法的Netmonitor网络监测系统的基础上,进一步联合业界各方不断探索、不断深入、不断完善,促进客观、有效的互联网数据的产生和使用,以此促进网站与用户能见度、网络广告与营销精准度的提高。
分享定义