大多数公共管理研究的目标是为那些必须作决定的管理者和官员提供信息,以便提高他们做决定的质量。在这些公共和非盈利机构管理者的很多职责中,他们必须确定优先事项,辨明条件并作出决定,设定目标并加以管理,以及雇用、激励并且在必要的时候开出员工。他们接受、发出或传递指示,作出有目的有策略的计划,监督他们职员的表现,以及向上级管理人员汇报他们的进展。高级管理人员常常要求向外部的股东汇报组织的进展,包括投资者、银行家、金融分析家以及一般公众。
在上述的每个任务中,管理者都必须作决定。他们比较几个可行方案,权衡每个方案的成本和收益然后选择并完善其中最好的那个。为了提高决策质量,他们常常咨询研究机构。过去大多数这种研究都遵循定量的范例,现在很多仍然如此。
为了作出有效的行政命令,管理者必须知道如何进行定量研究和解释定量数据。数字的合理使用比起只用文字能够使交流变得更加容易、快速和有效。
然而,在很好地理解定量测量方法之前无法使用统计及统计方法。下一章开始我们首先讨论四种测量方法,它将对学习其他最常用的定量研究起指引作用。本站的重点在于如何使用和解释统计方法,而非统计分析理论。
测量基本理论
要使每一个阅读研究报告的人都理解测量值的涵义,关键是对手头的研究报持使用合适的测量范围。在下面的讨论中,测量范围和数据类型会经常交替使用来指代表变量和与之相关的类型和层次的数据。定量变量能够计算。当对一系列变量赋于不同的值后—例如变量特性的阴性和阳性—不同且特殊,那么它的意义也被定下来了。
测量的四个层次
研究人员使用四种不同的测量数据:(1)名义数据,(2)(3)(4)。统计学家设计出许多不同的检验方法用来分析这些数据。
在辨别这些数据的尺度类型的时候,他们中的每一中都必须符合一个或两个定律。从名义数据—被认为是表达数据意义能力最弱的—到表达能力更强的数据就要符合更多的测量定律。
定类数据
定类数据,作为表达能力最弱的数据,必须通过一个检验:即不同的数字代表不同的涵义。名义范围,如同它所暗示的一样,仅仅是一些分类数据的名称。在这些范围中,被分配给不同种类的数据的区别仅仅是量值不同而已。这意味着他们不是某些东西的计算值而是被赋给包含若干组的一类统计量的值。
在名义数字层,数字或标签仅仅起到区分作用。这里数字和标签没有其他作用或目的,也不提供额外的信息。此外,一旦对一类变量赋值,所有与之具有相同特征的变量都得到相同的值。只有一个属性是单独列出的,例如阴阳性,只有这种特性才将变量进一步分类。典型的名义数据范围包括以下几种:
l .一和二的值随意地被分配给阴性或阳性类的变量
l .零和一被赋给使用服务者和非服务使用者。
l .一些数字往往有特定的占有者,政治团体人员,大学课堂,阅读报纸或杂志的人。
再次重申名义数据唯一要遵守的条件是不同的数据对应不同的事件。只有通过专为这一层数据发明的统计检验方法才能计算名义变量出现的次数。
定序数据
定序估计高于定类估计;相对于定类估计的仅仅有的一个性质,定序估计有更多性质。定序估计的保留定类估计的性质――事物能分到且只能分到一类中。U而它的第二个性质是定类估计没有的。第二个性质是这些类可以根据被估计的特征的等级进行排序。现在,对于定序数据(有时就简单的叫排序水平数据),度量标准不仅在性质上不同,而且在数量上的也有不同。我们总是按照一定的逻辑次序或数列中数据与数据在某一指标上有的差异的排序来命名研究对象。定序数据的缺陷在于数列不能确切给出一个事物比一个事物大或小多少;定序数据只能表现被估计事物特征的相对大小,却不能表现确切差异的程度。
定序估计的有代表性运用是用来度量人们的偏好和服务跟物品的排序。公共管理部门收集的大部分数据是以定序估计为基础。比如,有关政治的意见调查表和市民偏好的排序。
定距数据
度量数据的第三种类型是等间隔水平估计――一般也称为间隔水平估计。作为一个间隔水平估计必须满足三个性质。首先,事物能分到且只能分到一类中。其次,这些类可以根据被估计的特征的等级进行排序。第三个――最重要的性质――就是数据的相邻间隔是(或假定是)相等。
定距数据不仅能表现一个数据高于或低于另一个数据,还有可能精确的表现出这两个数据的差异的程度。数据间的间隔可以是任意大小的。间隔水平估计的零点可以被设在研究者需要的数列的任意地方。关键的要求就是每个间距的大小必须相同。数列的间距大小必须根据需要来定大小。举个例子来说,在允许有5个小数点的数列中,3和4与4和5的差距可以分成十份,百份,千份甚至分得更细,但每一份必须相等。所以,由于期望的精确度不同,可能会出现3.3,3.33,3.333几个同等的度量。1和2,3和4的差距不会改变,然而,只有精确度会变。
用华氏温度衡量温度是间隔水平估计一个很好的运用的例子。华氏温度有一个零点,不过这个零点在数列中和其他数据一样重要。还有其他比如等级平均,尺寸,IQ分数。用于同意中不同水平的态度数据被假定为等差数据。这使得态度数据成为全体社会研究者和管理研究者一个有很高期望的度量工具。
间隔水平估计不管是相对于定类估计还是定序估计,而言都能提供更多的信息,这是因为间隔相等的缘故。但是定距数据提供的信息仍有缺陷。比如,由于零点任意,这就不能表现一个数据是另一个数据两倍大或两倍小。我们不能说华氏100度就是华氏50度两倍暖和,也不能说,35度是70度的一半暖和。也不能说,强烈同意是它的相邻,同意,的两倍。我们只能说各个数据的间距是相等的。我们来看第四个水平,定比数据估计,就满足上述的情况。
一些分析人员轻视态度数据组成的定距数据,强调他们的有序性。他们提出一种作为“法令”的批评在:不要在定序数据作出定距数据的结论。尽管存在批评,很多公众社会和管理科学的研究继续在报告中把用在统计和用来解释统计检验的态度数据做为定距数据而非仅仅是定序数据。
定比数据
和其他三个数列或数据类型一样,定比数据估计也满足低水平估计的性质。事物能分到且只能分到一类中,这些类可以根据被估计的特征的等级进行排序,数据的相邻间距是(或假定是)相等。定比数据估计要求的第四个性质是度量数列有一个绝对的或固定的零点--尽管在特定的范围内它用不上。定比数据估计的例子有时间,距离,质量和这些的变幻的组合;销售量;购买数量;和摄氏温度。统计在公共管理研究运用中的过程中,间距和比率没什特殊价值。同样的估计可以用其中一个类型;也可用同种类型来翻译统计数据。总之,统计软件打包像社会科学统计打包(spss)综合了统计中的两种间隔水平估计和定比数据估计并化为一个叫做综合估计水平。
运用
定距数据和定比数据都有自己的统计检验;它们都称为“无参数”数据。这意味着它们不是由有总体特征的的标准分布决定。比如平均数。它们被称为自由分布。
对高水平估计的数据用低水平的统计检验是不恰当的。但是,低水平估计的数据可以运用高水平的统计检验,尽管很少这么做。低水平估计的数据用高水平的统计检验比用一个恰当的统计检验获得的信息要少。不过操作起来要简单。
统计的概念
统计运用在许多不同的领域。它用来表达报告中的数据。例如每天,每周或每月的顾客数;工作时间和薪水;单位成本;资金周转率;表现比;一个社区中居民的年龄和性别;和很多,很多领域。统计也用来界定许多用来收集,描述,分析和翻译数据的数学方法和过程。统计的过程包括时间的简单估计,确定估计量的主要价值,假设检验和确定两个变量个关系。
总之,统计既可用来表达数据,也可作为管理者和研究者把各种原始数据加工为有意义的数据的各种方法和工具。
一些统计的名词和概念
就像每一个规则和管理的运作一样,许多并不属于我们日常用语的概念和名词在估计操作时出现了。下面我们介绍一些概念的定义:
·描述性统计:用来汇总或描述数据组的方法和数据。
·推断性统计:用来估计或推断从一个样本数据得到总体的特征。
·样本:总体的一部分。样本要选整个总体中有代表性。
·估计总体:研究对象可能包括的各个估计值集合。总体可能包括产品,人工,顾客,公司,价格,或是和制造商或管理者利益有关的其它因素。估计总体也叫总体。
·统计量:用来汇总样本的信息的数值。比如,“20个学生的平均年龄是20.3。”
·参数:用来汇总总体有用的信息的数值。比如说,“所有新生的平均年龄是19.1,” 所有新生的平均年龄是参数。
·变量:具有为不同值得的特征。比如,储蓄帐户,股价,包装设计,重量,月销售量,性别,月薪等等。变量既有连续的又有离散的。
·连续变量:可以量化,比如重量或股价上升的百分比,就说有连续性。连续变量对度量连续数会起作用,比如,重量和不限定为具体,离散的类型或值。
·离散变量:离散变量的值只能在具体的数字或类型内变化 (又叫实值变量)。
·一元统计:一元统计是描述一个变量的统计。它包括恰当的反映数据指标:平均数,中位数和众数,标准差。
·二元统计:可以同时描述两个变量的统计。十字表格就是二元统计的运用的一个例子。期望值,百分比,相关度,不同的检验和许多别的统计检验都可能用到二元统计。
·多元统计:多元统计,也叫多元回归分析,使用在变量之间相互影响的统计。比如,公众对公园一个雕塑的认可度可能受美学,价格,作者的名气诸如此类因素影响。
统计运用:
统计可按许多不同的方法分类。一是根据用途分类。统计可以用来描述一些事件或推断另一组或更大组的相似指标。第一类用途叫做描述性统计,第二类用途叫推断性统计。描述性统计用来用数据描述事件,概念,人,工作和很多其它的事件。
描述性统计的另一个用途是汇总一组数据。一组数据是一个特定指标简单汇集。一组数据可以大到全体美国居民的每隔十年的人口普查所有指标汇总,也可小到一打或期中考试的分数。
推断性统计用来描述一类统计已达到下面三个目的中的一个或更多:
·为了归纳总体——估计总体——获取样本处。
·为了归纳或推断总体的特征值。
·为了预测事件的某个未来状态。
注意到所有的用途都运用于小数据组(样本)来推断大数据组(总体)。这就是推断性统计得名的原因。样本被用来代表总体的一部分。样本要选大总体中有代表性的。另一方面,总体是指标可能用到的各个方面的组合。总体包括产品,人工,顾客,公司,价格,和制造商利益有关的其它因素。就个体而言,每个人,每一项,或样本中的事件,总体或母体叫做一个总体单元。
另一个有时用来分辨总体的标志的是母体。总体和母体交替使用意味着人,条目或事件完全组合,而且在里面可以得到样本。
参数和统计量的区别:
统计的另一种分类是以是运用于一个样本还是它的母体为基础分类。这种运用的不同把统计分两类:参数统计和非参数统计。
参数是汇总总体有用的信息的数值。例如这样一个表达“所有加利福尼亚大学新生的平均年龄是18.8”。因为18.8是所有新生的平均年龄——总体——是参数。
另一方面,统计量是用来汇总样本的信息的数值。例如这样一个表达“30个波士顿大学新生抽样的平均年龄是20.3”这个样本平均数是统计量。在这个例子中,样本平均数大于这个地区所有大学新生这个总体的平均数,统计方法已经发展能确定两个平均数值是否“有偏”。
参数统计:
参数统计要求估计值是来自正态的动态分布。这并不是说所有估计值相同。只是所估计值按正态方式在不同值中变化。举个例子,估计随机抽取的一千家收入,如果把估计值给规范化,样本收入的分布就有期望接近总体分布——这种分布被期望是“正态”的。
规范后分布会产生一个典型贝尔斯曲线。这种曲线在两头值非常少,大量值分布在中间——接近样本的平均数附近。当要估计这个中间值,可以用小组的平均收入值来计算。推断性统计检验也可以这样用。
非参数统计:
非参数统计的过程中要用到定类数据和定序数椐。不对其分布进行假设;也不对总体进行假设。对于非参数统计,其分布不假设为正态。
举个例子,测试一个生产线的新产品,抽取了一些样本。检验产品是否能正常运作——也称“成败测试”。两个可能只会出现其中一个可能。我们不能确认这种成功和失败的分布是否是正态的。没有平均值;代替它的是,研究人员只能说有3%失败率或是97%成功率。3%和97%都是非参数统计。
在这个非参数统计的例子里,平均数被众数代替。众数是样本中出现的最多的数值。再者,众数是97。在两类或三类书中谈论平均数是无意义。而,众数,出现的最多的类型,才是有关的信息。
用统计表达事物
用数字代替词语来描述事物的一个很大的优点是数字对于发送者和接收者更容易达成共识,例如,一个人有6英尺高,另一个人5英尺9英寸高。当两个人站在同一的水平面上,很明显,第一个高于第二个人。但相差多少呢?通过观察两人很难发现。通过估计高度,就使知道确切值变为可能。
因为数字代替了只是说“这个人高”,就可能确切知道一个人比一个人高三英寸。而且,英语中的三和符号3代表相同数量。3英寸或3个香蕉与3个橘子有相同数量。
小数点和百分比是同样的适用这个概念。大多数人理解三分之一的含义,也知道33.3%与1/3几乎相同。尽管绝对数量,不同1/3加仑,与1/3升,1/3磅在份额上相同。任何事物的1/3总是一个1/3估计单位。数字使表达这些意思成为可能。
百分比也相同。100%任何事物质意味着全部,总数。另一方面110%是在总数上加了10%。而且,你每次运用它或表达它,总是一样的。这就是统计表达的益处:在翻译中不会忽略的任何事物。因为事物能被估计,所以可以被描述。
描述性统计的运用
描述性统计是指一组估计值(数字),它们汇总了很多数据,对于个体,它们有相同的意义。下面有一个关于一个管理者如何运用统计数据的例子。
一个公益项目的经理也许对知道代理人分配额数量感兴趣。当上次付款发生后,在这个电脑时代,经理要了解所有代理的月销售量,和每个代理的其他大量信息变得相对简单。但是,要快速提供这些数据是非常巨大的任务。就个体而言,它提供关于总体的信息非常少。经理可以用所有代理人的汇总的特征数字来代替——总之,就是汇总数据。描述性统计运用这样的汇总手段。
推断性统计的运用
就像前面提到的,统计主要组成运用推断的检验。运用这些工具,研究人员用小范围(样本)的特征值来假设或推断大范围(总体)的状况。比如,测试一个时间段一个产品运作从而推断整天产品的错误率。
如何运用推断性统计成为了主要运用统计管理人员的重要经验。再举一个例子,一天吃一片阿斯匹林可以减少得心脏病的可能。在阿斯匹林的检验中,招募1000个医生参加这个历经十年的检验。由一半每天吃阿斯匹林:另一半则注入安慰剂(有色粉)。
参与人被随机分组,为了没人知道他或她属于哪个组。几年后,吃阿斯匹林的患心脏病低于注入安慰剂,这个检验停了下来,并宣布了结果。服用阿斯匹林成为减少得心脏病的可能的一个选择。于是,推断使样本的结果运用于总体。
统计量的运用
统计量是对描述事物的数据的汇集。样本取之于总体。就像我们知道的,只有运用于样本的数值叫作“统计量”,而运用于总体的数值叫做“参数”。在学习把统计运用公共管理的过程中,这种不同不看成问题;管理这一本不会用总体去处理数据。
在统计中,估计是指涉从一些工具(如直尺,温度计)和调查表中得到的数值。调查表中包括一组问题回击。在调查表中在不同答案或不同的反应都设定了数值。
估计包括到三个不同的统计概念。第一个是,用仪器估计一组连续的数值。例如,浴室尺寸,邮资,直尺,量角器等等。第二个是,用来衡量一些抽象的概念如态度或个人意见的问题被社会学家来估计。第三个是,估计系统中增加量的估计。比如,英寸的估计和英尺,毫米或厘米,英尺磅的压力,每小时米,里路等等其它的。
随着社会科学的引导,公共管理把估计的概念扩张到关于消费者想法或日常问卷的调查的问题反应。估计也可以衡量意愿,同意度,期望度,次序,偏好和其他概念的水平或有无变化。在所有的运用中,对于变化的事物如事件,目标,特征,反应和性质都有一定的数值。
在制造和加工的过程中,事件的发生概率是有规律。比如,产品生产过程中不合格产品的数量和享受政府一定服务人数。估计用来产生数据。当对这些数据做分析和翻译那这些数据就变成了信息。
统计运用的例子
大多是情况下,所有部门和公共运作和非盈利性组织的经理都要用统计。例如,公共运作和非盈利性组织的经理用的统计的地方如下:
·项目管理与实施:新项目的计划,取得和销售管理要对环境趋势,明细成本,预算,库存控制和相似的组织——所有估计值进行统计分析。
·计划和预测:公共健康和福利机构的管理者要有规律的预测社区服务需要;管理者必须决定全体服务提供;为计划和预测,要用统计建立顾客趋势和人口统计。
·决策:决策包括研究,需求测试,和概念评价,而概念评价又包括收集,评价,和对消费偏好,习惯,生活方式,人口趋势的翻译,诸如此类。
·过程控制:保存统计记录和分析有助于质量控制,和标准有效的生产计划。药品管理者和医院工作人员保持统计记录来观察病人对药品的反应。
·人力资源:人力资源管理者比以前用更多统计去计算和预测工作场所的变化趋势,人员流动,缺勤,考评等等。越来越多领域需要运用统计纪录保持,统计分析,统计翻译
统计在公共管理中的运用:
公共管理要用描述性统计和推断性统计两种。在每一次运用时,数字信息表现为表格,图表和制图翻译。重要的统计和经常用的描述性统计和推断性统计将在下面一章讨论。
描述性统计
这里是四个基本管理者常用的描述性统计(Lang和 Hesis ,1994):
·中心趋势的分析:有平均数,总数,中位数。
·数据组的变量分析:有三个:标准差,分布,分位数范围。
·数据组的相对位置分析:包括百分位数和标准分数。最普遍的标准分数是z分数。
·变量相关性分析:相关性是用来衡量两个变量之际的联系程度。
广泛多样的描述性统计在这四个领域得到了发展。当然并不是所有令管理者和执行这满意的决定都和统计有关。这些精选的统计是广泛应用于组织,有组织的管理文献,而且,易运用,清晰的翻译的特征,它们适用于大多是统计打包软件。
推断性统计
这里是几个基本公共管理常用的推断性统计(例如,程序):
· t检验运用于不独立(不相关)平均数之间的差异的判断
· t检验运用于成对(相关)平均数之间的差异的判断
· 简单回归分析运用于衡量强度和两变量之间的关系
· 标准差的检验分析对两个或更多分布的一个标准差的差异
· 标准差的检验分析对两个或更多分布的两个或更多标准差的差异和由两个变量带来的影响。
· 协方差分析,运用于检验前后的分析。
除了这些容易运用和翻译统计检验,下面有些经常运用的统计运用:
· 决策中概率的运用
· 样本的概念和运用
· 预测工具
· 质量管理统计运用
在计算机中的运用
公共和非盈利性组织的管理者用统计工具去做决策和做交流工作。而且,不再需要任何人去记忆复杂的统计公式或用收进行复杂的统计计算。现在,管理者都有个人电脑。可利用的统计软件已经可以通过电脑桌面运用,然而早期的统计数据在范围上有限制,是由于硬件上的限制使得处理速度变慢。早期的另一个缺陷是大量数据组的统计过程需要的记忆功能大于当时的电脑。
但是,大多数电脑的内存和处理器都足够管理者去分析数据组和对数据做熟练的统计。在这本书最后,说到了大量的统计软件,包括Excel软件和spss软件。
小结
管理者用文字和统计数字与他们的员工,上级,组织外的人和组织进行交流。统计,表现为图表,表格而其他的文字说明确保对手边数据的共同理解。统计的运用主要出于下面两个原因:(1)就像描述性统计一样,它们用来汇总数据,称为数据组。(2)就像推断性统计一样,对小组数的估量——样本——由于假设运用到达样本中——总体。
统计中数据的数值都是用仪器来估计或度量的。这些估计值,在期望得数据估计水平下估计提供了不同的水平的信息。四种数据水平(也用来收集数据)从低水平到高水平依次是定类数据,定序数据,定距数据,定比数据数据。每个数据都有适合它的统计检验;低水平的统计检验是不适用高水平估计的数据。
运用统计,是指一个或多个具体数值描述一项事物。也可以用文字来表达为了分析并赋予其意义数据而产生的数学工具和方法。这种文字以后叫做统计分析。
统计分为参数统计和非参数统计,参数统计需要对总体进行一定的假设,如正态分布。非参数统计,是不需要假设。
参考文献:
Berenson,Mark L,and David M.Levine.1996 Basic Business Statistics:Concept and Application.6th ed.Upper Saddle River,NJ:Prentice Hall
Einspruch,Eric L.1998.An Introductory Guide to SPSS for Windows.Thousand Oaks.CA:Sage.
Green,Samuel B.,Neil J.Salkind.and Theresa M.Akey.2000.Using SPSS.Upper Saddle River,NJ:Prentice Hall.
Lapin,Lawrence,1993.Statistics for Modern Business Decision.New York:Harcourt Brace Jovanovich.
Neufeld,Iohn L.1997.Learning Buiness Statistics with Microsoft Excel. Upper Saddle River,NJ:Prentice Hall.
Phillips.John L.1996. How to Think About Statistics.5th ed.New York :Freeman.1996
石组干摘自中思网