数据分析师宝典
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.1 掌握基本的理论知识

数据分析师需要掌握的理论知识一般有两种,一种是数学统计知识,一种是市场研究知识。接下来我将重点论述这两个方面的内容。

3.1.1 数学统计知识

什么是统计?我们很难给出一个准确的定义,因为在不同的场合,统计这个词可以具有不同的意义。例如,统计可以指数据的搜集活动,也可以指统计活动的结果,还可指统计数据的方法和技巧。因此对于数据统计知识而言,我们很难进行具体的概括,不过好在我们可以从另一个角度出发,即从统计对象的角度出发,对数据统计知识进行简单的阐述。

1.统计对象的特点

一般来说,统计的对象是社会、自然总体的数量关系。统计对象的特点有以下几点:

(1)数量性

数量性是统计对象的基本特点,因为,数字是统计的语言,数据资料是统计的基础。例如,我们对国民生产总值进行分析时,首先需要认识其数量、构成等,之后才能正确地分析它的内在规律。

(2)总体性

对于每个个体来说,统计具有一定的随机性,而如果能够得到足够多的数据个体,统计就具有了相对稳定的特性,会显示出一定的规律。

例如,某企业对员工工资进行统计分析,其目的并不是分析个别人的工资,而是了解一个地区、一个企业的总体工资情况,这就是研究对象的总体性。

(3)变异性

变异性是指构成统计对象的各个单位,除了在某方面具有相同的性质,在其他方面必须有差异,而且这些差异不是事先给予的。例如,统计对象为某些机械学校,这些学校除了传授专业相同,学费、招生规模、专业设置等方面均有差异。如此一来,我们才能对其表现出来的差异进行统计分析。

2.统计计量划分

了解了统计对象的特点以后,我们就需要对统计对象进行计量划分。计量划分是指将统计对象按照属性、特征进行分类。美国社会学家、统计学家史蒂文斯依据变量的性质与数学运算的特点,列举出了4个统计计量尺度。

(1)定类尺度

定类尺度是指将数字作为不同类别的代码。这种情况下,数字仅表示不同类别的功能、品质、价格等差别,而不表示它们之间的顺序、大小。定类尺度的主要特征是“等于”或“不等于”。

例如,国民经济可以分为国有经济、集体经济、私营经济、个体经济,我们可以用①代表国有经济,②代表集体经济,③代表私营经济,④代表个体经济。而国有经济又有国有企业、国有联营企业之分,所以我们可以用⑪代表国有企业,⑫代表国有联营企业等。

这里一个数字的代码表示经济的大类,而两个数字的代码则表示经济大类中的各个小类。不同代码反映同一类型中的各类别数据,并不能体现其顺序大小。

(2)定序尺度

定序尺度指数字不仅可以表示不同类别,还可以展示数据的大小顺序关系,从而排列出各类别的次序。定序尺度的主要特征是“大于”或“小于”。

例如,某工厂按照生产的产品的性能优劣,将产品划分为优等品、上等品、合格品等。这种尺度虽然不能体现出一个优等品等于几个上等品,但却能够明确表示优等品质量好于上等品,而上等品质量又好于合格品等。

(3)定距尺度

定距尺度是指对数据次序的间距的计量,它通常使用度量单位作为计量尺度。相比于定序尺度,定距尺度更为高级,它不仅能区分数据种类并进行数据排序,还能准确指出各类别之间的差距是多少。因此,定距尺度的主要特征是“加号”或“减号”。

例如,A学生一学期语文课程的分数,从高到低排序分别为95分、90分、85分。这些数据不仅具有高低之分,还具有明确的数值差距,95分比90分高5分,比85分高10分等。

定距尺度的计量结果可以视为可加减运算的数值,但这些数值不能进行乘除运算,其原因在于序列中没有一个具有确定意义的“比较”位。例如,学生A语文得了90分,学生B语文得了0分,这里可以说学生A比学生B多了90分,却不能说学生A的成绩是学生B成绩的90倍。因为“0”并不是一个具有确定意义的标准,学生B得了0分并不意味着学生B毫无语文知识。这正是定距尺度的显著特点。

(4)定比尺度

定比尺度是反映数据之间的构成、比重、比值等数量关系的尺度。它在定距尺度的基础上形成,因此能够显示更加深刻的数据关系。定比尺度的主要特征是“除号”或“乘号”。

例如,对某个地区的人口密集程度进行分析时,我们需要用该地区人口数除以土地面积。这个指标能够反映不同地区的人口密度差异,例如甲地区人口为50万,乙地区人口为20万,但甲地区面积为50万平方公里,乙地区的面积为10万平方公里,最后甲地区的人口密度仅为1人/平方公里,而乙地区的人口密度为2人/每平方公里,显然乙地区的人口密度要大于甲地区的人口密度。

上述4种计量尺度对各类别数据的计量级别是由低到高逐步递进的。高级别的计量尺度拥有低层次计量尺度的全部功能,但反过来,低级别的计量尺度无法实现高级别计量尺度的功能。因此在统计分析中,一般要求计量尺度越高级越好。

3.统计的具体步骤

运用统计知识解决实际问题,一般需要如下步骤:建立模型,收集数据,整理数据,进行统计推论、预测、决策。当然,这些环节只供大家参考,在实际解决问题过程中并非要求必须如此。

(1)建立模型

模型是指关于所研究对象的某种假设,简单来说,就是规定一定的范围。例如,研究中学生的作息规律、分析企业的利润率等。建立模型需要结合概率知识、以往的经验、总体中抽取的数据等。

(2)收集数据

收集数据有普查、抽样调查、特定实验3种方式。普查是指对样本总体中的所有个体都加以观察。抽样调查是指从总体中抽出一部分数值进行观察。以特定实验的方式收集的数据要具有代表性。

(3)整理数据

整理数据的目的是将隐藏在数据之中有价值的信息提取出来,并通过适当的图表,例如散点图、条形图等将其展示出来。

(4)统计推论

统计推论是指依据总体样本以及从总体样本中抽取出的调查样本,做出某些样本分布的推论。统计推论的前提是数据的收集与整理。

(5)统计预测

统计预测的对象是随机变量,它是指在将来某个时刻可能产生的数值,或者在某种理想条件下产生的变量值等。例如,预测某种护肤品未来一年的销售量、预测某个孩子三年后的身高等。

(6)统计决策

统计决策指依据统计推论、统计预测,并考虑到决策的后果而制订的一种策略。其目的是使企业获得最大的利润,并且尽可能降低风险,减少损失。例如,某家超市要决定今年电器产品的进货数量,于是专门请来了数据分析师进行分析。数据分析师依据抽样调查的结果,预测今年超市电器产品的销售量为3000件。而每积压一件电器产品会损失100元,每卖出一件产品会赚取300元,超市要依据这些数据做出有关进货数量的决策。

3.1.2 市场研究知识

市场研究又称为市场调查,它实际上是指运用科学的方法,有目的地搜集、记录、整理市场的相关信息资料,从而了解市场的现状及其发展趋势,为决策者提供客观的、正确的资料。

市场调查的内容包括市场环境调查,例如对经济环境、社会文化环境等的调查;市场基本状况调查,例如对市场规范、总体需求量、市场占有率等的调查;客户调查,例如对现有客户、潜在客户的调查;竞争对手调查,例如对竞争对手的市场占有率等的调查。此外市场调查还包括对渠道、客户需求等的调查。

1.市场调查数据收集的三种方法

市场调查的数据收集方法分为三种,如图3-1所示。

图3-1 市场调查的三种数据收集方法

(1)观察法

观察法又分为直接观察法与实际痕迹测量法两种。

直接观察法是指调查者有目的、有计划地对调查对象的行为、言语、表情进行观察记录。这种方法取得的往往是第一手数据,它最大的特点是所得信息真实生动,但也会因为调查者的主观意见而使观察结果过于片面。一般而言,直接观察法多用于监视系统,例如商店的监控摄像头。

实际痕迹测量法是指对某个具体的事件留下的痕迹进行观察,该方法一般用于对客户流量、广告效果的调查。例如,网站的点击量、客户停留时间和登录页面时间等,这些数据都能显示出客户流量情况。

(2)提问法

它是指以问题形式将需要调查的事项通过面对面、书面、电话等方式,向被调查者提出,以获取所需要的信息的方法,这是市场调查中最常见的一种方法。提问法分为面对面调查、电话调查、书信调查、问卷调查四种,这些方法的优缺点各有不同。面对面调查能直接获取被调查者的意见,富有灵活性,但这种方式耗费的成本较多,并且调查结果容易受到调查者能力强弱的影响;邮寄调查成本较低,但回收率极低,速度慢。电话调查速度快,成本最低,但只限于部分有电话的用户,调查结果不具有普遍性;调查问卷几乎没有其他三种方法的缺点,不仅速度快,而且成本低,也不受调查者能力强弱影响,但这种方法得来的结果也容易受到调查者主观意见的影响。

(3)实验法

它通常用来分析某种因素对市场产品销售量的影响,一般先通过小规模调查实验,分析实验结果后再确定是否值得推广。它的应用范围较广,某件产品的品质、包装、价格、广告、陈列方法等进行改变时都可以采取这种方法,来调查客户的反应。

2.市场调查的主体流程

简单介绍完市场调查的方法以后,如果你还想对市场调查有更深入的认识,就必须对市场调查的主体流程有个大概的了解。

市场调查的主体流程分为两个方面:信息收集、调研分析。信息收集为市场调查提供数据;而调研分析能够对数据的内在规律进行深入的剖析,并为调查报告提供参考。企业的许多决策与方案便是依据调查报告制订的。

(1)信息收集

信息收集是指针对企业目前所处的市场环境进行数据资料的收集。资料的真实性与有效性对调查分析结果的科学性有着重要影响,而收集资料的真实性和有效性直接取决于信息收集的方法。

例如,某个大型企业想要举办一次促销活动,为了保证促销活动的效果符合预期,该企业举办了一次声势浩大的市场调查活动,既送小礼品,又举办抽奖活动,同时又采用了问卷调查与街头询问的方法。依据这些途径得到的数据而举办的促销活动效果却不尽人意,销售量只达到了预期的一半。

原因在于在利益驱动下被调查者提供的虚假信息占据了较大的比例,甚至调查者本身也存在一定的作假行为,比如,企业的目标客户是15~35岁的人,但调查者为了完成任务,也向50岁以上的客户散发调查问卷。

因此企业如果想要确保调查结果的科学性,就需要深入市场,通过设定一个调查课题,确定调查范围,制订出一个切实可行的调查计划,并且做好数据筛选工作。调查计划包含了调查课题、调查时间、调查人员、调查地点、调查费用、调查对象、调查方法等内容,同时调查人员超过3人时,需要明确各自的责任与权力,选出临时负责人,提高调查效率。

深入市场的调查方法强调数据收集过程中调查者的技巧与能力。在调查技巧上,调查者需要确定合理的数据收集渠道来收集信息,行业商场、经销商、行业会展等渠道为专业性较强的渠道,是调查者信息收集的重点渠道;报纸、网络、电话等渠道专业性较差,可以作为数据收集的补充渠道。在调查能力方面,调查者需要善于观察、提问、记录,在与人交谈的过程中要多观察,适当的时候可以做一些笔记,这就要求调查者最好随身携带一个小巧的笔记本,及时将一些重要信息记录下来。

(2)调研分析

调研分析指对调查所得的数据信息汇总解析,并依据解析的结果撰写调查报告。调查报告是一种针对调查课题分析结果的总结性汇报书,它是调查实效价值的具体体现。

如果说信息收集是调查结果的质量线,那么调研分析就是调查质量的生命线,因为调研分析在众多无序且复杂的数据信息中提炼出了有价值的那一部分,它反映出调查者对市场的审视与剖析。

3.完善市场调查报告

对市场调查的主体流程有了深入了解后,你还需要清楚如何完善市场调查报告,它一般包括以下几个方面。

(1)调查目的

调查报告中要将此次市场调查的目的列举出来。例如,某次市场调查的目的是考察竞争对手的市场规模情况。

(2)调查对象

市场调查对象一般包含消费者、零售商、批发商,零售商与批发商为出售产品的商家,消费者为使用该产品的客户。这里需要注意的是,当以消费者作为调查对象时,产品的购买者与使用者可能不是同一个人,例如,对奶粉的调查,调查对象为孩子的母亲。此外,还需要注意某些特定的消费群体,例如化妆品的客户大多数为女性,酒类产品的客户大多数为男性。

(3)调查内容

调查内容是收集数据信息的依据,一般可依据市场调查目的进行确定。例如,调查客户行为习惯时,可按照客户购买、使用、使用后评价等方面列出调查的具体内容。这里需要注意的是,调查内容要全面具体、条理清晰、简练。

(4)调查问卷

调查问卷是市场调查的重要工具,调查问卷设计得好坏直接影响到市场调查结果的正确与否。一般而言设计调查问卷需要注意以下几点。

① 调查问卷的设计应突出调查主题。

② 调查问卷中的问题要让被调查者易于接受,避免出现令被调查者难堪的问题。

③ 调查问卷中的问题要符合逻辑顺序,一般可遵循较简单回答的问题放在前面,较难回答的问题排到中间部分,比较敏感的问题放到最后这样的顺序。

④ 调查问卷的内容应尽量使用直接的词汇,保证被调查者一眼望去就能理解问题的含义。

⑤ 调查区域范围

调查区域范围的选取要尽可能具有代表意义。例如,在某个城市做市场调查时,由于调查样本太大,调查范围难以覆盖城市的每个角落,这个时候可以依据城市的人口分布情况,在城市中划出若干个调查范围,其主要依据是人均收入、文化程度等因素,同时保证各个区域的综合分布情况能够大体上反映城市的总体情况,最后将总样本依据比例分配到各个调查区域。如此一来,就可以缩小调查范围,减少访问工作量,提高效率,减少费用。

(6)样本的抽取

企业要求调查结果越准确,需要抽取的样本就越多,但调查成本也会相应增加,因此调查样本的抽取需要依据市场调查目的而定。通常而言,在一个中等规模的城市抽取的样本数量大概为200~1000个。

(7)资料的收集与整理

市场调查中,常用的资料收集方法有提问法、观察法与实验法。这几种调查方法由于各自的特点,适用于不同的调查场合,企业需要依据自身需求来选择。资料的整理一般可利用Excel表格,该表格可以很方便地获得大量统计数据。