市场研究

您的位置:首页 >> 市场研究 >> 市场研究智库  

抽样市场调查设计

调查系统误差

     首先,任何调查所获信息(调查数据)质量都存在误差,而这种误差在评估调查质量时都是必须的,作为调查管理者必须判断这些结果的精度范围。因此,这就需要仔细研究所使用的调研方法可能导致的误差类型。

  综合市场调查理论和实践经验,智创咨询对调查中出现的误差做如下的概述。

     (1)抽样误差

     抽样过程中主要存在着以下两类误差:随机误差和系统误差。有时也称为偏差。调查中通常试图对目标总体中具有代表性的一个侧面进行调查而获得信息。它旨在根据抽取样本的调查结果而推测总体的情况。因此,即使样本选择过程是适当的,调查结果仍不免因偶然性而产生一定的误差(随机误差或随机抽样误差),这种误差是不可避免的,它只能随着抽样规模的增加而减小。通常在样本量设计时,我们可以以一定的置信水平来估计随机抽样的误差。

     (2)系统误差

     系统误差或偏差是指因调研设计或实施抽样设计中的错误或问题而产生的误差。如果抽样的结果与我们根据被调查对象的真实值所做的估计值总是有一定的偏差(固定的偏高或偏低),则抽样结果便很有可能存在系统误差。系统误差包括除随机抽样之外所有可能产生的误差。因此,有时系统误差又被称为非抽样误差,从系统上影响抽样调研的结果。非抽样误差分为样本设计误差和测量误差。样本设计误差是因样本设计或样本抽选过程而产生的误差。

     样本设计误差的产生有多种原因:

     抽样框误差——抽样框是指对于某一类人口类型和成员的一个总体清单。样本将从这个总体清单中加以选取。抽样框误差便是因不准确或不完整的抽样框而引起的误差。问题是,从包含抽样误差的抽样框中抽取的样本有时无法正确地代表调研目标的实际情况,这就存在抽样框误差。举个例子,以电话号码薄作为抽样框,在对某地区所有住户进行的某种意向调查时,就存在着抽样框误差。

     调研对象范围误差——调研对象范围误差是因为对调研对象范围限定的不准确而引起的误差。例如,我们将某项研究对象限定在 35 岁以上,后来,我们发现不少 35 岁以下的年轻人也应该包含在这个研究之中,即当初的我们的限定范围是不正确的,这样的抽样便产生了误差。

     选样误差——即使抽样框的组建与调研对象范围的确定都没有什么问题,抽样误差也有可能发生。抽选误差是因为不完整或不恰当的抽选过程,或者正确的抽选过程未得以恰当的执行而产生的误差。例如,在入户调查时,访问员会因为不同的原因绕开被认为是“不友好的”住户,这样的话便会产生选样误差。特别是在非随机抽样中,选样误差是一个更为严重的问题。

     (3)测量误差

     测量误差对于抽样调查的准确性来说,比随机误差更具危害性。在许多调查报告中,包括媒介上发布公众意向调查,都会给出一个误差指数。对很多调研报告使用者来说,一般认为这个指数是针对总体误差而言,其实并非如此。这个数字仅代表随机抽样误差,它并不包括样本设计误差,也没有涉及调研结果中的测量误差。

     测量误差是指所获得的原始信息(实际价值)与经测量处理的信息之间的差异。在信息处理过程中会因多种因素而产生测量误差。

     替代信息误差——是指实际所需的信息与调研者所收集信息之间的差距而产生的误差。这种误差与调研设计的主要问题有关,特别是对一些问题不恰当定义而产生的。

     调研员误差——是指因调研员与被调研者之间的相互作用而引起的误差。调研员有时会自觉或不自觉地影响被调研者,使之给出不真实或不准确的回答。

     测量工具误差——测量工具误差是指因测量工具或问卷而产生的误差。这种误差是由于所提出的问题或问卷设计中的某些因素而导致回答的偏差或者使回答时容易产生错误。这种类型的错误能够通过细致的问卷修改和在实地调研前进行充分的试调查而加以避免。

     数据处理误差——主要是指调研资料或调研数据在向计算机输入过程中所产生的误差。例如,在计算机辅助电话访谈中,访问员可能错误地输入某个问题的答案。这类错误可以通过在数据录入以及调研结果处理过程中严格的质量控制加以避免。

     拒访误差——如果我们从某个特定群体中抽选 400 个样本,理想的情况是对这 400 个样本都进行调查。而在实际中,这是很难实现的。在邮寄调研中,回答率一般在 5% 左右,甚至更低。因这种差异而引起的误差被称为“拒访误差”。很明显,回答率越高,拒访误差的影响便越小,因为拒访者在总体中占的比例减小了。

     拒访误差在以下三种情况下发生:
     ①在特定时间无法联系到被访者;
     ②虽然得到了默许,但在当时的环境下不能或不愿意接受访谈;
     ③虽然能够联系到被访者,但被访者拒绝接受访问。
     其中,最后一种情况最为严重。因为,前两种情况都有重新进行调研的可能。现在,拒访率已经达到了前所未有的水平,大约近40% 。好在大部分人并非在所有情况下都拒绝访问。

  回答误差——如果被访问者在某一特定问题的回答中有特定的偏向,则产生回答误差。回答误差的产生有两种基本的形式:有意错误与无意错误。有意错误的产生是因为被调查者故意对所提问题做出不真实回答;无意错误是指回答者希望能够做出真实、准确的回答,但却给出了不正确的答案。这种类型的误差可能是由于问题的格式、内容或其他原因造成的。

 

 

定量测量技术

     (1)测量概念

     市场调查测量是指在定量测量中将按特定的规则将数字或者符号合理分配给被调查的目标(包括人、态度、状态或者事件),将其特征量化的过程。普莱特咨询的量化概念强调的是:测量的不是被测量者本身,而是被测量者(通常是消费者)的态度、收入、品牌忠诚度以及相关因素等。

     测量另一方面的关键是制定和理解规则,它指示被调查者该怎么做。如,“您对咖啡的喜好程度做出评价,非常喜欢为 5 分,不喜欢为 1 分,并按相应的标准分配 2 、3 、4 分”。

     (2)测量程序(略)

     (3)测量标称(略)

     (4)测量可靠性

     测量的可靠性是指测量中可以避免随机误差,从而提供前后一致的数据的程度。随机误差越小,测量的客观性就越强,调查的结果就越可靠。通常,普莱特咨询采用如下三种方法评估测量的可靠性。

     二次测试法:为了评估测量的可靠性,普莱特咨询会采用在尽可能相同的条件下使用相同的测量工具进行重复测量,以确定测量的可靠性。

     等价测试法:在同一时间内,使用尽可能类似的两种工具对同一目标进行测量,然后评估其可靠性。

     比较测试法:在同一时间内,对测量的同一现象的不同样本进行比较。

 


抽样概念  

     抽样是市场调查执行中重要的环节,抽样方法选择的正确与否直接决定着调查数据的可靠程度,同时也就决定了调查的成败。因此,普莱特咨询总是把抽样作为调查中十分重要的环节对待,力争最大限度保证抽样的合理性和科学性。

     正确的抽样必须来自对抽样概念的正确理解,下面简单介绍与抽样相关的基本术语,同时也便于我们尊敬客户的理解。

     (1)总体与全域

     总体或全域,是指在市场调查中能提供所需信息的个人或者群体的全体。通常,在调查之前分析人员的首要任务是定义同质总体,并常常涉及到与之密切相关的产品和服务目标市场的界定。

     举例来说,一个研究人员正在为一种新型非处方感冒药进行产品创意测试。他也许会认为被调查的总体包括每个人,因为每个人都会有患感冒的可能性。但是即便如此,并非每个患者都会选择这种非处方药。在这种情况下,调查过程中的重要任务是确定哪些人是目标主体,这就要看感冒时他们是否选购或使用这种或多种品牌的药。只有那些购买或使用的人们,才应包括在总体内。

     为总体下定义是抽样调查中关键的一步,为达到市场研究目的,我们在定义调查“总体”时常常基于已有的和潜在的顾客特征。

     (2)抽样与普查

     普查这一概念用于描述获取总体中每个成员的信息。市场调研中并不经常用到普查,因为其同质总体一般情况下包括成千上万的个体,这样大规模地进行普查在成本和时间上的耗费都是巨大的,以致于在通常情况下是不可行的。

     统计学理论证明:一个相对较小、但精心选择的样本群能准确地反映出被抽查总体的特征,一个样本是总体所有成员的一个子集,从子集获得的有关信息,可以用来估测总体特征,这种方法就是抽样调查。

  尽管市场调查中很少用到普查,但是有时它们也适用于某些案例。譬如,在中国石油、麦当劳、中国电信等神秘顾客访问中,由于总体不大,因此采用的是普查的方式。另外,在工业品营销中,一个企业只向少量客户销售极为特殊的产品时,普查也是适当和可行的。

     完成一个具有可操作性的抽样计划大致需要下列步骤。

     (1)定义总体(全域)

     为了满足市场研究目标,确定可提供信息或与所需信息有关的个体或实体(所具有的特性是十分重要的。抽样总体可以从以下几方面特征进行描述:地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。在调查中,从调查问卷开始部分的过滤性问题,可以看出某个体是否属于总体。在实际应用中,即使有总体和样本清单,但仍有必要使用过滤性问题识别合格的被访问者。

     另外,普莱特市场研究中心为了确定总体,通常情况下,还需要确定那些应排除在外的被访问者的特征。例如,大部分商业市场调查就因为一些所谓的安全性问题而排除某些个体。通常,调查问卷上的第一个问题就是询问采访对象或其家庭成员是否从事市场调查、广告或生产与调查内容有关产品的工作,如果采访对象指出他们从事其中某项工作,那么就不必要去采访他了,这就是所说的安全性问题,因为这样的采访对象不保险。他们也许是竞争对手或为竞争对手服务的。

     (2)选择调查方法

     正如调查方法部分所描述的那样,资料收集方式对抽样过程有重要影响。例如,电话采访有一种内在优势,购物中心拦截顾客有着自身的劣势。

     (3)选择抽样框

     普莱特咨询把抽样框定义为被调查总体的数据清单(数据库或者数据仓),从抽样框中可以抽出适合访问的样本单位。普莱特咨询经过多年的积累,已经拥有了适合不同调查领域的抽样框,这些抽样框,可以部分地满足一些常规性调查的需要。众所周知,一些抽样框原来根本是不存在的,因此,在调查的初期还要建立符合需要的抽样框。例如,在一项调查中,调查的总体是那些在近 30 天内打三轮或三轮以上十八洞高尔夫球的人。但是,根本就没有一种计算方法可以完全提供这份名单。在不存在传统意义上的抽样框的情况下,我们需要依据能够产生具有希望特征的样本个体的程序来建立新样本框。

     (4)选择抽样方法

     制定抽样计划的第四步是选择抽样方法。选择哪种抽样方法取决于研究目的、研究经费、时间限制、欲调查问题的性质等。可供选择的重要抽样方法可以分为两大类: 概率抽样与非概率抽样,每大类中又有许多可供选择的具体方法。

     (5)确定样本量

     一旦选定抽样方法,下一步就要确定合适的样本量。样本量的确定方法将在样本量确定单元中给出。

     (6)制定抽样计划

     无论使用概率或非概率抽样,在一个研究项目的资料收集阶段必须指定和明确选择样本单位的操作程序。对于成功的概率抽样的来说,这个程序更为重要,必须详细、清晰。若不能知道合适的选择样本单位的操作程序,则整个抽样程序会陷入困境。

     (7)抽样计划的实施

     在实施适于操作的抽样计划前,应先对其进行讨论研究。这一步很重要,它包括检查、确定是否要根据拟好的详细程序来实施计划。

 


样本量确定  

     确定样本的数量是抽样调查中的重要环节,在充分满足调查内容要求情况下合理的确定样本量不能不说是摆在每个调查公司面前的重要课题,过多的样本量设计只会给客户增加经济负担,对普莱特咨询来讲,我们确定样本量的原则是:一是达到调查目的,二是给客户省钱。

     概率抽样的基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。因此,样本量的设计并不是越大越好,通常会受到经济条件的制约。

     通常,在概率抽样的情况下,普莱特咨询在确定样本量时会遇到如下情况:

     预算:预算的多少直接影响着调查样本量的设计,通常某一项调查为满足调查要求必须有一个最低的预算指标。如果低于这个指标的预算,不能满足调查最低精度的话,普莱特咨询建议要放弃这项调查任务。

     经验:一些客户会经常要求调查公司完成 200 、300 、400 等特定的样本量。这种样本量确定的方法一方面可能考虑了调查误差,另一方面也可能是凭着以前的调查经验。在这种情况下,如果普莱特咨询认为样本量的设计不能满足精度要求的时候,我们的项目经理会建议所需要增加的样本量,否则调查的结果会出现偏差。

     子群分析:在任何样本量确定的过程中,都必须考虑被调查样本的子群数。也就是说,当被调查样本群子群数比较多的时候,样本量就必须相应扩大。如:某一项调查 400 个样本量是基本满足要求的,但如果将这些样本量划分为男和女各占 50 %的话,那么,每个子群只有 200 个样本。如果进一步按年龄组细分的话,假设是两个年龄组,那每一个子群只有 100 个样本,这样的样本量就不能满足最初设计的要求了,因此必须按照子群要求设计样本量则是最合理的。

     统计分析:普莱特咨询在确定样本量时通常在考虑上述具体情况下,会考虑如下统计方面的因素,即:总体调查标准差;抽样允许的误差和预期置信度。
 


概率抽样方法  

     概率抽样概念

     定量市场调查中的概率抽样是指在调查总体样本中的每个单位都具有同等可能性被抽中的机会。在实际应用中,概率抽样方法是普莱特咨询最常用的方法之一。

     概率抽样包括以下几个方面的优点:

     -调查者可获得被抽取的不同年龄、不同层次的人们的信息;
     -能估算出抽样误差;
     -调查结果可以用来推断总体。例如,在一项使用概率抽样法的调查中,如果有 5 %的被访者给出了某种特定回答,那么,调查者就可以以此百分比再结合抽样误差,推及总体情况。

     另一方面,概率抽样也有一些弊病:

     -在大多数案例中,同样规模的概率抽样的费用要比非概率抽样高;
     -概率抽样比非概率抽样需要更多时间策划和实施;
     -必须遵守的抽样计划执行程序会大量增加收集资料的时间。

     下面,我们将介绍几种普莱特咨询最常采用的概率抽样技术。

     (1)简单随机抽样( Simple sampling )

     简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。

     在简单随机抽样条件下,抽样概率公式为:

     抽样概率=样本单位数∕总体单位数

     例如,如果总体单位数为 10000 ,样本单位数为 400 ,那么抽样概率为 4 %。

     简单随机抽样的优点在于,它看起来简单,并且满足概率抽样的一切必要的要求,保证每个总体单位在抽选时都有相等的被抽中的机会。简单随机抽样可以通过电话随机拨号功能完成这个步骤,可以从电脑档案中挑选调查对象。

     同样,简单随机抽样会遇到“样本可能分布不均匀”以及“没有好的抽样框”等问题。

     普莱特咨询在简单随机抽样过程中常使用的技巧为“抽签法”和“随机表”法。

     (2)等距抽样( Systematic sampling )

     在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。

     等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。

     样本距离可通过公式确定:样本距离 = 总体单位数∕样本单位数

     例如,假设你使用本地电话本并确定样本距离为100,那么100个中取1个组成样本。这个公式保证了整个列表的完整性。

     等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第5页开始,在该页上再另选一个数决定从该行开始。假定选择从第3行开始,这就决定了实际开始的位置。

     等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。

(3)分层抽样( Stratified random sampling )

     定量调查中的分层抽样是一种卓越的概率抽样方式,在普莱特咨询以往的调查中经常被使用。

     分层抽样的具体程序是:把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。

     总体各单位按主要标志加以分组,分组的标志与我们关心的总体特征相关。例如,我们正在进行有关啤酒品牌知名度方面的调查,初步判别,在啤酒方面男性的知识与和女性不相同,那么性别应是划分层次的适当标志。如果不以这种方式进行分层抽样,分层抽样就得不到什么效果,花再多时间、精力和物资也是白费。

     分层抽样与简单随机抽样相比,我们往往选择分层抽样,因为它有显著的潜在统计效果。也就是说,如果我们从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。

     在调查实践中,为提高分层样本的精确度实际上要付出一些代价。通常,我们现实正确的分层抽样一般有三个步骤:

     首先,辩明突出的(重要的)人口统计特征和分类特征,这些特征与所研究的行为相关。例如,研究某种产品的消费率时,按常理认为男性和女性有不同的平均消费比率。为了把性别作为有意义的分层标志,调查者肯定能够拿出资料证明男性与女性的消费水平明显不同。用这种方式可识别出各种不同的显著特征。调查表明,一般来说,识别出6个重要的显著特征后,再增加显著特征的辨别对于提高样本代表性就没有多大帮助了。

     第二,确定在每个层次上总体的比例(如性别已被确定为一个显著的特征,那么总体中男性占多少比例,女性占多少比例呢?)。利用这个比例,可计算出样本中每组(层)应调查的人数。

     最后,调查者必须从每层中抽取独立简单随机样本。

     (4)整群抽样( Cluster sampling )

     以上各种抽样类型全部是按单位抽取的,即按样本单位数,分别一个单位一个单位地抽取。在整群抽样中,样本是一组单位一组单位地抽取。

     整群抽样有两个关键步骤:

     -同质总体被分为相互独立的完全的较小子集。
     -随机抽选子集构成样本。

     如果调查者在抽中的子集中观察全部单位,我们就有了一级整群样本。如果在抽中的子集中再以概率方式抽取部分单位观察,我们就有了二级整群样本。分层和整群抽样都要将总体分为相互独立的完全子集。它们的区别是,分层抽样的样本是从每个子集中抽取,而整群抽样则是抽取部分子集。

     地理区域抽样是整群抽样的典型方式。挨门挨户去调查一个特定城市的调查者也许会随机抽选一些区域,较集中地访查一些群体,大量减少访问时间和经费。整群抽样被认为是概率抽样技术,因为它随机抽出群和随机抽出单位。值得注意的是,在整群抽样下,我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。一般来说,要解决这个问题可以扩大群数,然后从各群中抽取少量单位数,以保证样本的代表性。

 


非概率抽样方法  

     非概率抽样的概念

     非概率抽样也是市场调查中比较常采用的手段之一,如配额抽样等。非概率抽样是指从总体中非随机地选择特定地要素(单位)。有目的的非随机抽样可能会系统地排除或过分强调总体的某些部分特征。

     非概率抽样的缺点恰是概率抽样的优势:

     -不能估计出抽样误差;
     -不知道抽中的单位所具有代表性的程度;
     -非概率抽样的结果不能也不应该推算总体。

     在实际操作过程中,非概率抽样经常被市场调研人员使用,其原因与本身固有的优势有关:

     -非概率抽样比概率抽样费用低。非概率抽样的这一特点对那些精确性要求补不严格的调查有相当大的吸引力。试探性调查就是其中的一例。
     -一般来讲,非概率抽样实施起来要比概率抽样用的时间少。

     正式由于非概率抽样具有上述的不足,因此,如果合理运用非概率抽样,它能产生极具代表性得合理的抽样结果,是我们普莱特咨询经常思考并试图解决的一个重要问题。在实际应用过程中,非概率抽样的结果不能计算其抽样误差,这意味着评估非概率抽样的总体质量有很大的困难,因为我们清楚地知道它们不满足概率抽样所必需的标准,但问题是它们脱离标准有多远?调查设计者事先必须对非概率抽样进行评估,评估应该建立在对非概率抽样方法论仔细评价的基础上。评估需要注意的是,使用的抽样方法是否能够覆盖目标总体的各个部分?或者样本是否无目的地倾向于一些特殊群体?这些都是普莱特咨询调查人员在调查设计与抽样评估时必须仔细考虑的问题。

     在实际工作中,我们经常使用的非概率抽样方法包括四类:方便抽样、判断抽样、配额抽样和滚雪球抽样。

     (1)方便抽样( Convenience sampling )

     方便抽样是根据调查者的方便性,以无目标、随意的方式进行的抽样调查活动。例如,常见的无限制的街头拦访和随意的入户访问就是方便抽样的常见形式。在某些调查测试中,方便抽样会取得快速有效的结果。在进行探索性调研时,即缺乏经验而又急需真实数据的近似值时,这种方法也很实用。

     (2)判断抽样( Judgment sampling )

     判断抽样适用于调查员或者调查专家基于选择标准或者条件抽取典型样本的情况。一般商业机构进行的市场或产品测试调查基本上都属于判断抽样的范围。在进行探索性调研时,如抽取深度访谈样本的情况下,就可以采用这种方法。

     (3)配额抽样( Quota sampling )

     配额抽样是根据一定标志对总体分层或分类后,从各层或各类中主观地选取一定比例的调查单位的方法。所谓“配额”是指对划分出的总体各类型都分配给一定的数量而组成调查样本。因而,配额抽样较之判断抽样加强了对样本结构与总体结构在“量”的方面的质量控制,能够保证样本有较高的代表性。配额抽样类似于随机抽样中的分层抽样。不过,有两点重要的区别:首先,配额抽样的被调查者不是按随机原则抽出来的,而分层抽样必须遵守随机原则。其次,在分层抽样中,用于分类的标志,应联系研究目标来选择,而配额抽样无此要求。

     (4)滚雪球抽样( Snowball sampling )

     滚雪球抽样是指先对随机选择的一些被调查者实施访问,然后再请他们推荐属于研究目标总体特征的调查对象。这种方法用于低发生率或少见的总体中进行抽样,因为要找到这些少见的个体,代价是很大的,使得调查人员因为费用的原因不得不使用类似滚雪球这样的抽样技巧。

     滚雪球抽样调查的优点是调查费用大大减少,然而这种成本的节约是以调查质量的降低为代价的。整个样本很可能出现偏差,因为那些个体的名单来源于那些最初调查过的人,而他们之间可能十分相似,因此,样本可能不能很好地代表整个总体。另外,如果被调查者不愿意提供人员来接受调查,那么这种方法就会受阻。