浦国华1
,徐金强
2
(11杭州商学院统计与计算科学学院,浙江杭州 310035;21浙江大学,浙江杭州 310027)
摘要:市场网络调查方法是随计算机应用技术和互联网的普及而发展起来的新型调查方法。目前人们对市场网络调查的认识比较模糊,容易产生混淆,导致实际应用中误用各种网络调查方法,甚至得出错误的结论。文章客观地评价了现有的各种市场网络调查方法,详细地比较了各种方法的优劣和适用条件,并提出了相关建议。关键词:市场调查:网络调查方法;概率方法;覆盖误差:拒答误差
中图分类号:F723 文献标识码:A 文章编号:1000-2154(2003)10-0025-04
收稿日期:2003-08-07
基金项目:浙江省重点学科(杭州商学院统计学)专项经费资助。作者简介:浦国华(19-),男,江苏无锡人,杭州商学院副教授。
市场网络调查是传统的市场调查理论与互联网
信息技术相结合的产物。在市场竞争日益激烈的今天,各种调查方法层出不穷,而市场网络调查虽然是随互联息技术发展起来的新生事物,但也正演变出多种方法。我们比较和分析各种市场网络调查方法,目的是让人们更全面、更客观地认识各种方法,并在实际中准确地利用这些方法。
一、市场网络调查方法的种类
非概率方法
概率方法
1娱乐性调查1网上拦截调查2不严格的自选调查2清单抽样
3
志愿者组成的实验调查
3
事先征集网民志愿者的实验调查
4
事先征集普通总体志愿者的实验调查
在实际应用中,目前市场网络调查方法的种类繁多,下表所列是现在运作的主要网络调查类型。这些方法的比较及评价必须结合其目的和各种误差源的影响。我们把市场网络调查基于概率和非概率
的方法分成两大类。需要提醒注意的是,非概率调查中,目标总体人数未定,因此也无法得知每个个体入选样本的非零概率。因此,对这个总体的描述仅仅是根据约定俗成的判断,而不是建立在概率统计原则之上的。
二、市场网络调查中非概率方法的比较(一)娱乐性网络调查
娱乐性网络调查,主要是出于娱乐的目的而在网络上所作的问卷调查。一些网站专门张贴问卷供人回答,他们通常对于张贴什么题目和什么人来回答问题并没有。况且他们通常并不追求调查的科学性与代表性,其主要宗旨是作为一个交换意见的平台。其调查通常以适时的点击作为呈现的结果。从科学的眼光来看,这种方法算不上是一种调查。但由于它的普及以及在一些人的心中可能会与真正的调查混淆,在此也作简单介绍。
另外一种娱乐性的网络调查是许多媒体网站中进行的“每日热点”调查。C NN 的快速调查就是其中一例,它表示:“该调查并不是科学的,它只反映了参与调查的上网者的意见。调查的结果不能推广到所有的网民,当然更不能推广为普通民众的意
第10期总第144期商 业 经 济 与 管 理
N o 110V ol 1144 2003年10月
BUSINESS ECON OMICS AN D ADMINISTRATION
Oct.2003
见。”(http ://w w w.cnn.com/)这种“方便面”式
的调查在许多访问量极高的网站中常有表现。
总之,此类网络调查随处可见,它们通常只能反映那些参与调查者的意见,而不能推广到总体,而且其调查也往往比较肤浅。不过到目前为止,它们还没有对正统的(科学的)调查形成任何实质性的威胁,它们的调查结果也还没有被误用。
(二)不严格的自选调查
此类调查通常会在门户网站或者某网站的入口处发出调查的邀请。这可能是目前最为常用的网络调查方式,也是对正规调查威胁最大的一种,因为它有时会声称调查的科学性。一般而言,这些调查没有任何进入调查的,对于多次完成问卷也没有任何的控制。这种方法可以视作在杂志中插入插页进行调查的方式。这种方法与第一种网络调查类型的区别就在于,第一种类型的调查很少做出科学性的承诺,而此方法会声称自己的科学性。而且,这种类型的调查通常会通过获得某权威机构的支持而被人看作是正当的调查。
此类调查的典型代表是美国乔治亚G VU 中心(http ://w w w.gvu.gatech ,edu )所做的互联网用户调查。G VU 调查中心在1998年底完成了其第十次网络调查,他们的技术报告指出,调查采用的是非概率抽样的方法。调查通过互联网相关的新闻组、大网站的广告条、G VU 的邮件列表等方式邀请自愿的人们参与调查,目的是使互联网使用者有更多的机会参与调查,这次调查参与的人数超过了5000人。G VU 的研究报告认为,与“其他使用随机抽样技术的网民数据”相比,G VU 的数据在网民的经验、使用程度和使用技巧上“存在偏差”。因为接受这种调查的网民并不是通过严格的抽样组成的,网民与普通人相比本身对互联网的熟悉程度和兴趣性存在差异,更何况该调查是在互联网上进行的。
类似的例子还有许多,它们通常都是由一个具有科学的可信度的机构进行的,在数据收集之后也都声称自己的样本对总体的代表性和有效性。类似这种经过小心设计和操作的网络调查所得出的结论往往存在较大的局限性,由此推测全体人口必然有误差,有限地利用此类调查的结论不失为明智之举。
(三)志愿者组成的实验调查
此方法通过在高访问量的网站和门户网站中召集志愿者进行调查实验。在注册时,收集这些志愿者的个人变量,为以后的调查组成一个大型的潜在被调查者数据库。要参加以后的调查,必须是受到邀请的个体,以电子邮件和密码的确认来控制进入调查的样本(前两类的网络调查并不控制进入样本的个体)。这种网络调查备受媒体关注,之后又受到了调查业内人士的重视。这种方法似乎是网络调查业中发展最快的,目前已经有了几十种类似的实验。
一个特定的调查对实验个体的选择是以准抽样或者是概率抽样的方法进行的。研究者可以对某一类的被调查者有特别的控制,或者对被调查者的个人特征严加控制,也可以有大量备选的个体,但这些特点并不能改变该方法的本质。与前面讨论过的其他调查方法相似,最初实验的形成也是一个志愿者自选参与调查的过程。关于此方法的最著名的例子是Harris 在线调查。当然,此类网络调查还不能真正称为概率方法的原因也很清楚,其成员数据库主要是由志愿者组成的。
三、市场网络调查中概率方法的比较
与前面的几种网络调查类型不同的是,概率的方法是以各种概率抽样为前提所进行的。做这种抽样并不一定意味着有良好的代表性,因为拒答仍然会威胁到这些调查的价值。但与非概率设计不同的是,这些方法使我们可以计算拒答率,从而可以通过设计(而不是事后的分层)来调整调查方法。由于上网还不够普及,也没有一个现成的网民抽样框,要达到概率的网络抽样有两种方法。一种是把样本为上网者,也就是把感兴趣的总体为网民。另一种方法是使用备选的方法(如与随机拨号电话抽样的复合设计)来确定,并达到对一个更为广泛范围内的总体进行抽样。下面我们讨论几种方法。
(一)网上拦截调查网上拦截调查是在网站中拦截浏览者。通常是采用系统等距抽样的方法,每隔N 个浏览者邀请一位参与调查。该方法的抽样框严格为该网站的浏览者以避免抽样框覆盖不足所造成的误差。为避免同一人多次填答问卷,调查采用C ookie 技术加以控制。由于了对更广泛总体的推广,此类研
62 商 业 经 济 与 管 理2003年
这种调查方法所面临的两个主要问题是时间问题与拒答问题。首先,时间问题是指邀请访问者填答问卷所需时间。由于采用拦截浏览者的方式,除非是热门网站,否则什么时候才能等到足够的浏览者谁也不可预料,这势必会延长调查周期。其次,即使用等距抽样的方法拦截到浏览者,但被调查者会不会接受合作也难以估计,拒答成为又一难点。
(二)高覆盖总体清单基础上的抽样
目前,上网和使用网络远未普及,我们应该重视的问题是网络调查中覆盖范围的误差即个体被抽样框所忽略带来的误差。但对于特定的群体网络调查还是有很高的覆盖率,因此在了范围后,网络调查对这部分群体还是可行的。例如,现在大学生基本上成为上网一族,针对大学生的有关调查可采用网络调查的方式。高覆盖总体清单基础上的抽样方法是先取得一个上网者的清单或者抽样框,然后通过电子邮件邀请调查参与者,并控制一人完成多份问卷或者多人完成一份问卷的可能性,来获取相关信息资料的网络调查方法。系统内部的调查往往可采用此类方法。经过的总体达到了很高的覆盖率,甚至是完全没有覆盖范围的误差问题。
在最近的一项研究中,密西根大学的学生通过网络填答问卷。先从学校的注册处得到学生的电子邮件地址清单,用它来邀请并加以控制的实施网络调查。因为所有在校学生都被分配了一个电子邮箱帐户,在填答问卷的过程中,系统向其帐户内发电子邮件,以确认哪些人需回答问卷。但只有5%的样本实际回复了邮件(可能是由于他们使用另外的系统收发邮件,或者其系统并不能在收到邮件时及时通知)。当然,这种覆盖的水平已经超过了在普通总体中的电话调查。此类调查在校园中正方兴未艾。
清单基础上的抽样方法尽管已经排除了低覆盖率的误差问题,但拒答仍然是此类调查中的大问题。例如,在密西根大学的学生调查中,回复邮件中的回答率仅为4115%(不包括部分填答问卷者)至4711%(包括部分回答问卷者)。而在密西根大学同时期做的另外一项网络调查的回答率也与此接近。总之,此类网络调查中,覆盖范围不再是个问题,但要提高回答率仍需研究。
(三)事先征集网民志愿者的实验调查
此方法是不同于非概率方法的网络实验调查。其根本的区别在于,非概率的方法是在志愿者的基础上组建实验,而该方法是使用概率抽样的方法,如随机拨号的电话调查等,来征募实验成员。通过电话调查收集个体的基本信息,区分出上网群体,并邀请符合条件的个体进入实验。通过这种方法,可以达到在网民或者上网者中进行概率抽样的目的。在同意加入实验后,实验的成员要发一封申请参与网络调查的电子邮件。通过UR L中的I D、个人的鉴定号码或者密码来控制个体进入调查,以保证只有受到邀请的个体才可以填答问卷。
如果所研究的目标总体正是由目前使用网络的个体组成,则这种调查方法不存在覆盖范围的误差问题,但拒答问题依然存在,而且会在此类调查的任何一个过程中发生影响。当最初电话征集网民时遇到拒答使我们无法知道其个人信息,如他们的社会经济特征,他们不参与调查的原因等。接着样本的流失发生在电话访谈的过程中,被调查者表示他们无法上网或者没有提供一个有效的电子邮件帐户。最后,即使在那些可以上网并且同意接受网络调查的人当中,许多人在收到调查邀请时也没能完成问卷。然而,至少在最后一种人中,我们已经通过电话调查略有了解,因此也可以通过比较已调查与未完成调查的个体,来测算拒答偏差。所以,这一方法有助于我们了解网络调查中的拒答偏差。
拒答的现象可能会在调查的各个阶段出现,但与非概率的志愿者实验不同的是,这里的拒答率是可以计算的。而且,可以在前面一个阶段收集数据了解在后面阶段中拒答所造成的偏差。换句话说,我们可以收集人口统计变量和其他的变量以比较上网者与不上网者、志愿参与者与非志愿参与者的资料,来了解覆盖范围的误差与拒答的偏差。这种方法还可以测定回答方式的影响,如通过电话调查或者网络调查的结果差异。
(四)事先征集普通总体志愿者的实验调查
事先征集普通总体志愿者的实验调查是唯一有可能得到全部总体并用概率抽样的方法,而不仅仅针对着上网者。从某些方面讲,这一方法与上一种的网络调查相类似,都是从对目标总体的概率抽样开始的,并使用非互联网的方法来寻求最初的参与
72
第10期浦国华,徐金强:各种市场网络调查方法的比较研究
者(如使用电话调查)。但上一种的方法只对报告
了使用网络的人继续调查,而本方法则提供必要的上网工具与设备,以换取潜在样本个体在后面的网络调查中的合作。这是唯一的一种可以将调查结果推广到整体(而不仅仅是网民)的调查方法。由于征集被调查者的成本相当高,因此该方法通常采用实验调查的设计。该方法在80年代最初应用于欧洲Videotex 、Minitel 和其他基于电视的文本信息系统中。例如,荷兰电视频道在1986年开始在抽中的被调查者家中安装终端电脑,以记录完整的周际调查。A. C.尼尔森、Arbitron 和其他调查公司也以类似的设计而在样本家庭安装了类似的装置。此方法的关键问题在于征集接受访谈者时的反应率较低。据估计,荷兰电视频道的调查其最初反应率约为20230%。但一旦一个家庭同意进入实验,则随后在实验调查中样本的流失较小,每个调查的家庭合作率较高。Intersurvey 公司近期已经在网络中使用了类似的方法,通过随机拨号的电话调查征集实验成员,并以网络电视设备和免费上网换取他们同意成为实验一员。最近,该公司号称已经征集到了几十万名实验成员。
该方法能解决网络调查中的两个主要问题:其一,覆盖范围的问题,即通过给实验成员上网的便利来换取相应的合作;其二,浏览器的兼容问题,通过向每个实验成员提供统一的上网设备来解决,即向所有实验成员提供一致、可信的调查系统,避免由上网设备带来的差异。但该方法不可逾越的问题仍然是拒答率,好在最初的随机拨号电话调查征集调查者的过程可以提供响应者与拒答者之间的差异,使得拒答偏差可以测量获得。如果使用实验设计的话,这种设计还可以测量实验状况的影响大小,并且,如果有必要的话,可以通过统计的处理来控制实验成员效应。由于这种方法是基于概率抽样的方法,因此也就可以估计调查的信度,并可以直接与传统方法获取的类似调查数据进行比较。
该方法除了上述优点之外,其不足在于费用昂贵,无论在征集样本个体还是维护实验上,花费都相当高。在目前,我们还不能评判这种高投入与以
概率抽样为基础而获得高质量的调查结果之间的效益。但无论如何,这种方法很有可能替代概率抽样基础上的传统调查方法。
四、结论市场调查方法随互联网的飞速发展正以不可想象的速度推陈出新。互联网真正使市场调查过程达到民主化。但我们认为,目前的市场网络调查,无论是简单的出于娱乐目的而设计的调查方法,还是以描述总体为目的的概率抽样基础上的调查方法,它们的质量参差不齐,效果也各有千秋。为此,有必要提醒大家要注意有关的调查质量指标。若对市场网络调查过分热衷而忽视它的缺陷,或强求市场网络调查要达到完美无缺的想法,都是不现实的。客观地评价各种调查方法,并根据实际状况选择合适的方法,应该是所有业内人士今后必须重视的问题。
市场网络调查已经影响到了许多调查研究人员,他们不但要熟悉市场调查理论和方法,而且要精通网络技术。各种方法中表现出来的覆盖误差、拒答误差和测量偏差等时时影响着调查质量。我们需要了解在将总体为上网者时,在什么情况下网络上的低反应率仍然可以提供有用的信息,或者说寻找能提高网络调查反应率的方法。在网络调查难以代表一个普通的总体时,通常会使用统计的方法来修正调查的结果。然而,以何种方式对志愿者实验加权以达到稳定、可信的解释,还有待研究。只有全面了解了这种新型的调查方法的优势与不足之后,我们才能充分发挥网络调查的潜能。参考文献:
[1]Judith T.Lessler ,William D.K alsbeek.调查中的非抽
样误差[M].北京:中国统计出版社,1997.
[2]Nigel Bradley.Sampling for Internet Surveys [J ].Journal O f
the Market Research S ociety ,1999,(10).
[3]浦国华,孙玉超.对未来网络调查的设想[J ].统计
与决策,2003,(5).
[4]Mick P.C ouper.Web surveys :A review of issues and
approaches [J ].public opinion Quarterly ,2000,(Winter ).
(编辑 晓理 校对 鲍观明)
82 商 业 经 济 与 管 理2003年