欢迎来到速发表网!

关于我们 登录/注册 购物车(0)

期刊 科普 SCI期刊 投稿技巧 学术 出书

首页 > 优秀范文 > 统计学抽样方法

统计学抽样方法样例十一篇

时间:2023-07-24 09:24:10

序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇统计学抽样方法范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!

统计学抽样方法

篇1

笔者通过对一些高校统计学课程调查及知网搜集资料,发现很多讲授统计学的教师认为传统统计学教学内容、方法很难适应现代社会的需求。通过资料搜集和文献查找,如何更好的编排统计的教学内容和运用更好的教学方法主要体现在以下几方面:石秀丽(2011)学者认为根据经管类学生的特点应把统计方法、数量分析作为教学内容的重点,李慧敏(2016)等学者认为对经管类统计学的教学应激发学生的学习兴趣,大量的引入现实生活中的典型案例进行教学;宋继华(2013)等学者认为采用项目驱动方法教学能引导学生的思维,从而提高学生的积极性和应用能力。这些专家学者对统计学的教学内容都提出了创新性的研究,尤其是高职高专对经管类学生的统计学教学很多高校都采用了项目驱动的模式。

二、教学内容和教学方法创新

我国经济快速发展,很多决策都需要数据来支撑,统计方法及数据分析应用越来越广泛,并应用于管理、金融等领域,而今天又处于大数据时代,因此,掌握统计方法和数量分析的专业人才成为时下的新宠。所以,在经管类统计学教学中,我们必须大刀阔斧地改革传统统计学的教学内容、教学方法成为高校经管类统计学改革的重要课题。

1.教学内容编排上增加统计实务部分。统计学原理的内容主要包括总论、统计调查、统计整理、综合指标、动态数列分析、指数分析、抽样推断、相关分析等内容,这些内容主要是基本理论知识,针对当前社会需求和统计变化的特点,应该加大统计实务部分的内容,可以适当增加企业统计标准(常用统计标准)、主要统计指标(采购经理指数、消费信心指数等)、企业主要统计报表(生产活动统计)、国民经济核算体系、统计报告撰写(统计报告写作要求、原则、流程)等内容。

2.教学过程中引入实验教学。统计学教学过程中运用到大量的公式,主要是定量的分析,在传统教学中比较侧重这些公式的推导、计算。但在信息技术高速发达的今天,计算机统计软件的广泛应用,使计算变得更加简单、准确。因此,在统计教学过程中,统计计算技术已经不是教学的重点。由于大量复杂的计算可以交给计算机去完成,统计学教学应从数据技巧教学转向数据整理分析的训练,统计教学中适当增加实验教学,把统计方法与计算机的应用紧密结合,实现统计学教材的内容与EXCEL的应用全面结合。在一些章节可以专门增加一节内容,介绍如何用EXCEL实现本章数据处理问题,例如:在讲解统计整理、总量指标与相对指标、动态数列、统计指数、抽样调查、相关和回归分析时都可以借助于EXCEL来进行数据处理、分析。还可以利用计算机SPSS软件对回归分析和相关分析进行分析,利用计算机对平均数和标准差中等内容进行处理。通过实验教学可以在一定程度上改变学生统计思想,同时帮助其掌握一定的软件应用技能,如EXCEL、SPSS、SAS等。

3.引入综合案例教学法。案例教学在国外课程教学中运用较多,因为案例来源于生活,更能引起学生的学习兴趣,在传统统计学教学中也引入了一些案例,但这些案例大都是孤立的只是为了学习某个知识点而设定,这些案例并不是真实的案例,而且缺乏前后因果,与实际生活脱钩,学生学起来就没有深刻的记忆和兴趣。针对这种情况,在统计学课程教学中可以引入现实生活中实际发生的案例,将统计计算方法与数据分析方法用到解决实际管理问题中去,这样可以使教学效果事半功倍。例如:在综合指标这部分内容就可以设定某个企业的实际案例,通过这个案例可以解决总量指标、相对指标和平均指标的计算应用。

4.图表归纳教学法。统计学第一章内容是学习整个统计学的基础,只有把统计学的一些基本概念学懂了,才能更好的学习以后的内容,可是很多学生学了第一章以后对这些概念之间的关系还是模糊,为了解决这些问题设疑解惑,不断启疑思导,经过苦心孤诣,可以把这些基本概念编成如图1。

篇2

中图分类号:G80 文献标识码:A

近20年体育统计在我国已经成为十分重要和最常用的体育科研方法。但是,与此同时也有不少体育学术研究,误用统计方法,乃至以挂上统计公式作为“科学性”的幌子,使体育统计界同仁和体育科研工作者感到不自在。体育统计专业委员会也认为应该作一些有关体育统计和体育科研方法的诠释,以减少体育统计方法的误用,提高体育科研水平。

1中国体育统计现状概要

在80年代以前,包括体育统计在内,我国应用统计学科处于萎缩状态。改革开放后,统计方法的应用与统计教育重新得到重视。80年代初,教育部在武汉与襄阳两地举办体育统计教师培训,培养了改革开放后新一代的体育统计的师资与各地体育统计学术骨干。此后,体育院校、师范院校的体育系逐步开设了体育统计课程。1981年在研讨师范院校体育统计教学大纲的时候,成立了全国体育统计研究会。在中国体育科学学会的积极支持下,1984年成立了中国体育科学学会体育统计专业委员会。近20年间,许多统计方法在体育领域得到应用,如抽样理论、实验设计、估计理论、假设检验、决策理论、非参数统计、序贯分析、多元分析、时间数列等都已有研究成果的发表或报道。

然而,我国从80年代开始重新普及体育统计,与20世纪初已经发表因子分析应用研究的美国,或70年表《行动科学的因子分析》专著的日本相比,难免显得基础薄弱。正如著名社会学家教授所说,“一个学科,可以挥之即去,却不可能招之即来”。于是就出现了评析体育统计应用情况的论文,如杨震的《体育统计中应注意的问题》,梁荣辉的《体育科学研究中应用统计方法需注意的问题》,刘炜的《线性模型在体育科研中应用的常见误区》等等。要解决这些问题,不仅是统计知识的问题,也有科研方法的问题。因此必须从科学的发展,俯视体育科学研究方法,从统计学的发展端详体育统计现状。

2统计学的发展

要了解体育统计的发展趋势,有必要简要了解统计学的发展。

人类的统计活动有悠久的历史,古代已有统计整理描述的应用;13世纪欧洲有国势调查;17世纪英国的配第发表了《政治算术》;1790年美国第一次人口普查,同时农业普查;1853年由比利时政府邀请,在布鲁塞尔召开有26个国家150人参加的第一次国际统计会议;1857年,恩格尔根据家庭收入越多,则饮食支出的比例越小这一法则,引申出恩格尔系数,以饮食支出的比例作为度量生活水平升降的标准,它一直延用至今;1903年德国柏林的第九次国际统计会议上,抽样调查得到世界上多数统计学家的认同; 1930年前后美国举行盖洛普民意测验。19世纪中期奠定了概率论的理论基础。19世纪中叶起,数理经济学、生物计量学和应用数学促进了数理统计的形成和发展。社会统计学、社会经济统计学和数理统计学构成了现代统计学的枝叶。现代数理统计学可以分为两个侧面:一是理论数理统计学,它研究抽样理论、实验设计、估计理论、假设检验、决策理论、非参数统计、序贯分析、多元分析、时间数列与博弈论等;二是应用数理统计学,高尔顿、K・皮尔逊用于生物学,埃奇沃思、鲍利用于经济学,R.A.费希尔用于遗传学、农学。在宏观层次上,科学系统的发展主要表现为整体化、高度数学化和科学技术一体化。数学的应用已突破传统的范围而向人类一切知识领域渗透。二次大战以来,统计学的巨大进展已使它成为数学科学的重要而独特的组成部分。

21世纪,统计学将面临更大的挑战。统计作为由观察样本获得尽可能多的总体信息的方法,关系到信息的本质和数据处理。计算机与信息化的时代,爆炸式积累的信息与数据必须借助于统计学才能得到充分有效的利用。大规模的信息处理所遇到的信息压缩、特征检测、可靠性分析,以及数字、符号、图形乃至语言的加工等一系列问题,都要依靠统计方法与计算技术来解决。现实中的许多统计难题需要引进新的统计概念与方法甚至理论体系。当然对于体育统计的这些问题,就目前的研究力量与人才资源,是难以承担如此重任的。

计算机与商品化大型统计软件的出现,为统计学的发展提供了技术上的可行性,使更多的人有可能进行大样本数据处理和多元分析。可以预见,体育院校统计教学研究都将使用专业化的大型统计软件。即将改版的体育统计教材,已将spss的使用列入教学内容。科学、统计学的发展给体育统计和体育科研奠定了宽厚的基础,那么体育统计和体育科研的关系又如何呢?

3体育统计与体育科研方法

3.1体育科研的复杂性

虽然体育对于健康和社会的作用已被社会各界接受。然而,体育学科的复杂性还未被教育界乃至社会所理解。体育外在粗犷,却蕴含了众多的自然学科和社会学科,而使投身体育的研究者感到力不从心。谁也无法夸口能解决体育科学的众多难题。体育与健康的研究,涉及医学、生理学、心理学、人类学、健康社会学、抗衰老的研究等等;体育的动作技术分析会涉及理论力学、材料力学、流体力学、空气动力学和解剖学等等;运动训练理论会涉及技能学习、体能的提高和战术,它与生理、生化、心理、认知科学、博弈论以及教育科学的许多理论直接相关。许多体育科研,出身于相关学科的研究人员,会因为没有从事体育的感性知识而产生困难,竞技体育的研究会因为没有体验训练而难以深入。显然,在体育科研中狂妄、自负只能反照自己的浅薄。

3.2体育科研中统计方法应用的几类问题

3.2.1实验设计的基本原理

虽然研究有专业设计,但是无论你研究自然现象还是社会现象,大多需要实验或调查。

无论是实验设计还是调查设计都离不开统计。最基本的我们应该了解实验设计的三个基本原理:重复,随机化以及区组化。由重复使我们得到实验误差估计值与效应值更精确的估计;由试验对象、试验次序等随机化使观察值或误差为独立分布的随机变量,就可以使用各种统计方法;由相似试验对象的区组化使我们可能提高实验的精确度。如果不注意基本原理,你的研究难免出现方法错误。

3.2.2实验方法

体育的影响因素,如运动强度等,常常是难以控制的,实验对象经常是人,常难以齐同对比,不便重复试验,还不能对实验对象造成伤害等,这使许多主要源于农业试验的试验设计,很少能应用于体育。因此,需根据具体研究目的、研究对象等制约因素,慎重选择合适的试验方法。

3.2.3取样

无论是试验还是抽样调查都需要样本。由于经费、工作量或对抽样方法了解不够等原因,在体育科研论文的研究方法里,包括不少学位论文,对于抽样方法没有明确的交代,抽样方法有较大的随意性。如果精度要求不高,仅作探索性研究,而不是由样本推测估计总体,有时也可用非概率抽样。社会科学中的大样本研究,有时也用非概率抽样。但是,离开了概率抽样,许多统计方法就失去了应用的前提。概率抽样有多种方法,适用不同的情况。因此从研究方法的严密性看,需要在体育科研方面增补这方面的内容。

3.2.4统计分析方法

现代统计学可以借鉴的方法应该有不少,在体育统计基础相对薄弱,原创方法几乎没有的情况下,对于体育统计分析方法,首要的是开阔视野,学习、应用前人或相关学科已有的统计方法。在此基础上,研究前人已有方法不能解决的、有待建立的体育统计方法。当然,方法的建立相当困难,必须重视人才的培养和引进。按照前20年的进程,期望建立新的体育统计方法,形成较为完整的体育统计学科,都是十分困难的。

目前,体育统计应用中存在不少问题,这些问题的根源还是在于对统计基本理论的理解。如:

(1)推测性数理统计是由样本研究总体,由于样本信息是不完整的信息,必然有抽样误差存在,必然有出错的可能性。而在统计分析中却有人得出完全肯定或完全否定的结论。

(2)统计方法仅仅对试验的可靠性和有效性提供准则,但是并不证明变量间的因果关系。如均数比较的假设检验,可以给出比较对象来自同一总体的概率,但统计分析不可能给出它的原因,比如并不说明训练方法好坏等。

(3)实际的差别显著与统计显著性的差别。虽然统计上的显著性与差别大小有关,但是它的直接含义是来自同一总体的概率大小,而不是你误指的差别大小或差别显著。

(4)当训练强度与成绩提高相关,P

(5)统计方法为研究目的服务,要选择合适的方法,而不是选择复杂的方法。

(6)统计模型对于数据的测度水平,变量是连续型还是离散型,是计数资料还是计量资料,相关变量是对称还是不对称等等有不同的要求,所以在研究设计的时候就要考虑统计分析的方法。

(7)体育问卷调查有大量的名义(定类)测度与序次测度。不能不问数据资料的测度水平,一概用均数表示集中趋势,用标准差代表离散程度,用它们作线性回归、因子分析等等。

(8)不注意模型要求乱套统计公式。如不知变量的分布,作小样本的t检验;在自变量间关系过于密切的情况下作回归分析,在变量间关系不密切的情况下作因子分析。

4用好体育统计方法,提高体育科研水平的建议

(1)科学数学化特征及科学发展趋势。可以预见,体育科学必然向数学化方向发展,体育统计无论对于体育自然学科或体育社会学科都将成为重要的研究方法。体育高等学校应重视体育统计学科对于体育科学发展的重要作用。体育科研人员应从方法论高度学习科研方法,吸收相关学科的研究方法。

(2)体育统计要注重抽样研究本质的研讨。重视与概率相联系的思想方法,研究相关学科的统计方法,加强方法的移植研究,明确统计方法建立的条件,避免统计方法误用。

(3)体育科研应加强实验设计、抽样研究及社会科学常用统计方法的普及。提高体育科研人员应用国际通用统计软件包的能力。

(4)体育统计学科的纵深发展必须有跨学科人才的引进与培养。

参考文献

[1] 侯灿.医学科学研究入门[M].上海:上海科学技术出版社,2010

篇3

《统计学》是研究社会经济现象总体的数量表现和数量关系的方法论科学。

通过本课程的学习,使学生明确统计这个认识工具的特点、作用;掌握统计学的各种基本概念、基本原理和基本方法,尤其是各种定量分析的方法和技能,提高学生对社会经济现象数量研究时分析问题和解决问题的能力。

为更好地掌握《统计学》课程,除课堂教学应有的54课时外,要求学生做到课前预习、课后总结,重视本课程作业练习这一环节,以实现本课程的既定目标。

二、课程的教学目标及总的教学要求、重点、难点

教学目标及总的要求:

社会经济统计学是研究社会经济现象总体的数量表现和数量关系的方法论科学。

通过学习本课程,要求学生明确统计这个认识工具的特点、作用;掌握统计学的各种基本概念、基本原理和基本方法,尤其是各种定量分析的方法和技能,提高学生在对社会经济现象进行研究时的分析问题和解决问题的能力。

同时,为进一步学习各专业课程提供定性和定量分析的方法。

教学的重点:

统计学中的基本概念:统计总体、总体单位、标志、变量、统计指标和指标体系及其相互之间的区别和联系。

统计调查的意义,统计调查的分类。

统计调查方案的内容,调查对象、调查单位、填报单位和调查表、调查时间等概念。

统计报表制度的意义、作用和内容。

各种专门调查的概念、特点和作用。

统计整理的意义、步骤。

统计分组的概念、作用和形式。

分配数列的概念和种类。

分配数列中的名词概念,尤其是组中值的计算。

统计表的作用、结构和种类。

统计表的编制原则

总量指标的概念和作用。

总量指标的分类,尤其是时期指标与时点指标的区别。

相对指标的概念和作用及其表现形式。

各种相对指标的意义和计算方法。

正确运用相对指标的原则。

平均指标的概念和作用。

算术平均数、调和平均数、几何平均数、众数、中位数的意义和计算方法,注意算术平均数与强度相对指标的区别。

标志变异指标的意义和作用,各种标志变异指标的计算方法及特点,尤其是标准差的计算方法。

正确应用平均指标的原则。

动态数列的概念和作用。

动态数列的种类。

动态数列的编制原则。

各种动态水平分析指标和动态速度分析指标的意义和计算方法,这些指标相互之间的关系,如逐期增长量与累计增长量的关系、发展速度与增长速度的关系、环比发展速度与定基发展速度的关系、发展速度与平均发展速度的关系等。

序时平均数与一般平均数的异同点。

平均发展速度两种计算方法的侧重点。

动态数列的四种变动形态。

几种常用的测定长期趋势的方法:间隔扩大法、移动平均法,尤其是用最小平方法配合动态趋势方程。

季节变动的测定方法。

指数的概念、作用和种类。

综合指数的编制原理,数量指标指数、质量指标指数的计算。

平均数指数的编制原理,加权算术平均数指数、加权调和平均数指数的计算。

平均数指数与综合指数的关系,以及平均数指数在实际工作中的应用。

平均指标指数的编制和分析方法。

指数体系的概念和作用。

运用指数体系进行因素分析,以及根据指数体系进行指数间的推算。

抽样推断的概念、特点和作用。

抽样推断的基本概念。

抽样推断的理论依据。

抽样误差的概念和抽样平均误差的意义,抽样平均误差的计算方法。

抽样极限误差的意义及计算。

概率度的意义及其与抽样推断可靠程度的关系。

区间估计的方法与步骤。

抽样方案设计的内容以及抽样方案设计的原则。

主要的抽样调查组织形式。

简单随机抽样条件下必要抽样单位数目的确定。

相关关系的概念和种类,现象之间相互联系的两种类型:函数关系、相关关系。

相关关系的特点。

相关关系的测定方法,相关系数的概念、计算方法和性质。

回归分析的概念和一元线性回归分析的特点、方法。

相关系数与回归系数之间的数量关系。

估计标准误差的意义及计算方法。

相关系数与估计标准误差之间的数量关系。

国民经济统计核算的概念及国民经济核算体系的内容。

国民经济核算中三大产值指标的核算方法以及国内生产总值的三种核算方法。

国民经济统计核算中的五大平衡表及四大账户体系。

教学难点:

统计学中的基本概念。

调查单位与填报单位的区别。

普查、抽样调查、重点调查、典型调查的区别。

总量指标和相对指标的分类,相对指标的计算方法。

各种平均指标的应用条件及计算方法。

标志变异指标的意义及计算方法。

各种动态分析指标的意义和计算方法,以及指标之间的关系。

数量指标指数与质量指标指数的区分和编制。

算术平均数指数与调和平均数指数的区分和编制。

因素分析法。

抽抽样误差、抽样平均误差、抽样极限误差、概率度的意义。

概率度与概率的关系。

区间估计。

必要抽样单位数目的确定。

相关关系的种类。

相关系数的计算方法。

一元线性回归方程的建立及其与直线趋势方程的区别。

篇4

一、引言

数据对于当今天的商务活动具有重大的意义。数据是关于这个世界的事实,它能够说明问题、提示事实、隐含规律。一些商业机构正是通过“挖掘”数据来发现事物之间的关联性,并从中获取利润。如果人们躲避数据,就可能由于盲目接受他人对数据的概括总结而上当受骗,也可能完全依赖“感觉”来做决策,从而不利于做出正确的决策。因此,作为一门研究如何处理和分析数据的课程——统计学越来越受到各方重视。在高校中,绝大部分商科专业把统计学或商务统计作为专业必修课列入到人才培养方案中。如何学好、用好统计学成为当前许多人需要迫切解决的一个问题。美国著名的统计学家莱文(Levine)等在其撰写的统计学教科书中首次提出了DCOVA框架,用于指导学生或相关从业者如何有效学习和使用统计学。

二、基本术语

统计学是把数据转化为信息用于决策的方法或工具。例如,为了研究青年人喜欢网上购物的主要原因,可以通过调查来收集原始数据,再制作总结表来整理数据从中获得数据中隐藏的有用信息(最主要的原因是网上购物价格便宜),最后根据所获得的信息进行决策,即网店价格要比实体店便宜才能吸引青年消费者。从调查数据到总表结,就是把数据转化为信息的方法。统计方法是把数据转化信息的方法,包括统计描述方法和统计推断方法。统计描述方法主要包括收集、整理、可视化和概括数据;统计推断方法是指用样本数据得出总体结论,包括对总体参数的置信区间估计和假设检验。为了学习和使用统计学的方法,可以应用DCOVA框架。DCOVA框架包括定义数据(D)、收集数据(C)、整理数据(O)、可视化数据(V)和分析数据(A)等5个阶段(图1)。例如,为了研究一所高校学生的努力学习程度,根据DCOVA框架,首要定义数据,即找什么样的数据能够代表学生的努力学习程度,为此需要对努力学习程度开发一个可操作定义,比如用每天平均学习时长(小时)来代表一个学生的努力学习程度。其次要收集数据,可以通过问卷调查的形式收集数据。再次是整理和可视化数据,比如制作频数分布表来整理数据,从而可以查看学习时长的分布情况,制作直方图来可视化学习时长数据,从而直观形象地显现数据的分布特征,从中判断学习时长是否服从正态分布等。最后是分析数据,比如可以分析不同专业、不同性别、不同年级的学生每天学习时长均值的差异,或者估计全校学生每天平均学习时长等。DCOVA框架较好地囊括了统计学教学中主要的知识体系。

三、定义数据(D)

定义数据主要是解释收集什么数据的问题,它与一项研究的目的及其所涉及的变量相关。研究目标决定研究中所涉及的变量,相关变量决定需要收集的数据(图2)。在上述的例子中,研究目标是“研究一所高校学生的努力学习程度”,其中“努力学习程度”就是研究中需要涉及的变量。由于该变量没有直接的数据对应,需要开发一个相应的可操作定义——如每天平均学习时长,最后去收集学生每天平均学习时长的数据。

可操作定义指对所有与该分析相关的人而言很显明是普遍接受的定义,是对某个抽象变量的一种清晰、精确的表述,是对该变量意义的共同理解。努力学习程度是一个抽象变量,在收集數据时会遇到麻烦,因此需要一个可操作定义。每天平均学习时长可以作为努力学习程度的一个可操作定义,因为大家普遍认为一名学生在学习上花费的时间越多,说明该生学生越努力,并有每天平均学习时长是一种清晰、精确的表述,从而方便研究者收集相关的数据。

定义数据还包括确定所需数据的类型。数据是变量的取值,变量类型与其所对的数据类型一致。变量可以分为属性变量(如性别)和数值变量,数值变量又进一步区分为离散数值变量(如家庭人数)和连续数值变量(如身高)。相应的,数据可以分为属性数据(如男、女)和数值数据,数值数据又进一步区分为离散数值数据(如2人、3人)和连续数值数据(如1.75m、1.68m)。在SPSS中,变量的测量尺度(类型)分为名义(图标为三个小圈)和有序(图标为阶梯),这两类都属于属性数据;还有一类为标度(图标为尺子),这类属于数值数据。

四、收集数据(C)

在明确了需要什么数据的前提下,就需要进入收集数据阶段。收集数据(C)主要是解决数据的来源问题。数据的来源有原始数据来源和二手数据来源。原始数据来源主要通过调查、观察和实验获得数据;二手数据来源主要是指其他组织或个人已公布的数据。由于获得原始数据比较麻烦,所以二手数据是首选的数据来源。

在经济管理研究领域,原始数据来源主要依靠调查。由普查涉及面广、成本高、耗时长和难度大,所以一般不常用,对许多研究者来说,主要通过抽样调查来获得原始数据。因此,如何抽样就成了一个无法逃避的问题。调查数据的质量直接影响研究的价值,如果数据本身严重存在错误、偏见,不管采用什么数据分析方法,都很难得出可信的分析结果。为了从一种总体中找到一个样本,并对样本采集数据,首先要做的工作是抽样。不同的抽样方法生成不同的样本类型,如简单随机抽样方法生产简单随机样本,抽样方法与形成的样本类型一致。抽样方法分为非概率抽样和概率抽样两大类。非概率抽样包括便利抽样和判断抽样,其优点是便利、快速、低成本,可以用于前期或试探性分析,其缺点是样本的代表性一般较差,不能用于统计推断。概率抽样包括简单随机抽样、系统抽样、分层抽样和群抽样,其中简单随机抽样和系统抽样的优点是简单易行,但无法保证样本的代表性;分层抽样过程比较繁琐,但能够确保样本的代表性,并能对每个层进行分析,得出每层的结果;群抽样的优点是调查成本低,但有效性相对较差,需要增加样本容量才能达到其他抽样方法的效果。

五、整理数据(O)和可视化数据(V)

篇5

methods and applications of statistics in the atmospheric and earth sciences

2012,384p

hardcover

isbn9780470684443

n. balakrishnan著

篇6

(一)控制测试中样本规模的确定内部控制制度符合性测试,即属性抽样,是依据统计学中假设检验的原理设计的。审计属性抽样,是指只有两种可能结果(信赖和不信赖)的随机试验,其概率分布为二项分布。由于二项分布计算公式比较复杂,而泊松分布近似于总体很大的二项分布。统计学家编制了“累积泊松分布数值表”,这样按照统计学确定样本容量的思想,利用泊松分布确定过度信赖风险系数来体现统计抽样规模计算式中标准差及系数;用可容忍偏差率上限,体现统计学中由极限误差(Δρ)形成区间的上限。建立审计属性抽样样本容量计算公式:

样本容量=信赖过度风险系数÷可容忍偏差率

使用上列计算公式来计算样本容量,在事先并不知道样本容量为多少的情况下,样本可能发生的偏差数很难预计。就是有了样本预计偏差发生数,还要通过查表确定过度依赖风险系数,再用公式计算样本容量,比较麻烦。为了提高审计效果和效率,人们根据泊松分布和不重复抽样原理,编制了供实务应用的统计抽样样本规模确定表。我国准则指南中详细介绍了样本规模的确定,注册会计师根据可接受的信赖过度风险选择相应的抽样规模表,然后读取预计总体偏差率找到适当的比率。接下来注册会计师确定与可容忍偏差率对应的列。可容忍偏差率所在列与预计总体偏差率所在行的交点就是所需的样本规模。由此可见,在控制测试中,注册会计师主要关注抽样风险中的信赖过度风险。

(二)细节测试中样本规模的确定

(1)传统变量抽样。设计传统变量抽样所需的数学计算,包括样本规模的计算,对于手工应用来说显得复杂且困难。注册会计师在使用传统变量抽样时通常运用计算机程序确定样本规模,一般不需懂得这些方法所用的数学公式。根据指南中样本规模确定公式,

样本容量=[预先估计的标准差×(可接受的误受风险的置信系数+可接受的误拒风险的置信系数)×总体规模÷(总体可容忍错报-预计总体错报)]^2

通过分析可知,以上样本规模确定公式是在充分考虑了误受风险和误拒风险的基础上得出的。

(2)PPS抽样。样本规模确定公式主要有两种方法:一是公式法,样本规模=总体账面价值*风险系数/[可容忍错报-(预计总体错报*扩张系数)]其中,风险系数代表注册会计师愿意接受的误受风险。注册会计师通过估计预计总体错报而间接的控制误拒风险,不需要特别控制误拒风险。二是查表法,由于PPS抽样以属性抽样原理为基础,注册会计师可直接使用控制测试中的统计抽样样本量表。此法与前面讨论的属性抽样原理相同,在此不再赘述。

二、我国准则中关于样本规模确定存在的问题

审计人员在进行审计测试时,可能发生两种抽样风险:一种是Ⅰ类风险,指抽样结果使审计人员否定了真实原假设的可能性,又称a风险,弃真风险;信赖不足风险和误拒风险分别指符合性测试和实质性测试中的a风险。另外一种是II类风险,指抽样结果使审计人员错误地接受了非真原假设的可能性,又称β风险,存伪风险;信赖过度风险和误受风险分别指符合性测试和实质性测试过程中的β风险。

通过上述分析可知,我国准则规定的样本规模确定公式,除了细节测试中传统变量抽样考虑了a风险,其余均为考虑此类风险。

a风险,是影响审计效率的抽样风险,β风险,是影响审计效果的风险。考虑到审计的目标,为了发表正确的审计意见,注册会计师一般只关注β风险。但a风险影响审计效率,可能会增加不必要的实质性程序,增加审计成本,尤其是在细节测试中,如果在某类交易或账户余额的账面金额可能不存在重大错报时根据样本结果得出存在重大错报的结论,注册会计师采用替代方法可能花费的成本大得多。

由于上述公式中存在没考虑的风险因素,据以确定的样本量必然小于实际应抽取的样本量,因此样本数据显示的结果不能代表总体特征,使得审计风险增大。

三、样本规模确定公式的改进

依据统计学原理,a风险和β风险属于变动方向相反的风险,没有一种假设检验可以使这两类风险同时达到最小。若要同时控制两类风险,一般地,在进行假设检验时,先是根据问题的要求,预先给出显著性水平以控制犯a风险错误的概率,而后用选择适当的样本容量的方法,在某种意义上减少犯β风险错误的概率。在统计学中,通常会应用施行特征函数的方法求解。在此只简单的说明样本容量计算的原理,对于具体的计算公式的由来,由于涉及大量概率论与数理统计等方面的知识,与审计学本身关系不大,故不赘述。

如前所述,在审计抽样中,为降低审计风险,必须同时考虑a风险和β风险。属性抽样下,审计人员同时控制a、β两类风险的条件见图1:

图中P。表示预计总体偏差率,P1表示可容忍最大偏差率。假设H0:P=P0,H1:P>P1,P为实际总体偏差率。

由图可见,审计人员只要适当地确定n(与分布的标准差有关)和V(临界值),就同时控制了a风险和β风险。

从H。分布看,有:

V=P0+Z1-αx0=P0+Z1-α

从H1分布看,有:

V=P1-Z1-x1=P0-Z1-

联立上述两式解出(即属性抽样样本规模确定公式):

n=

最后得出的样本规模确定公式为:

n=()2

其中:N为总体规模;Z1-IR/2为正态标准差(IR:α风险、误拒风险);Z1-IA为正态标准差(IA:?茁风险、误拒风险);TM为可容忍误差;EM为预期总体误差;SD为估计标准差

上面公式(3)即为改进的属性抽样样本规模的确定公式,同时考虑了两类抽样风险,保证审计效果的同时,提高了审计效率。

注册会计师确定样本规模受到多种因素的影响,且在控制测试和细节测试中有所不同。目前我国审计准则中规定的样本规模确定公式基本考虑了影响样本规模确定的重要因素,只是对于审计抽样风险的第一类风险有所忽略。本文只是浅薄的应用相关统计学原理进行了简单的分析说明,希望可以为审计抽样理论与实务的发展提供点建议。

篇7

1《生物统计学》(第一版)

统计学是以概率论为基础的,因而生物统计学必然与抽象复杂的数学知识相联系。生物统计学的理论性和实践性均较强,而且涉及的内容、公式和抽象概念较多,需要一定的数学基础和较强的逻辑推理能力,但由于生物学科的特点,生物统计学相对应于概率论与数理统计是“拿来主义”,一般不过多讨论其数学原理,而是在简单介绍统计原理的基础上重点介绍具体分析方法的应用。教学组在多年教学实践工作的基础上,1997年在科学出版社出版的《生物统计学》[5]就充分体现了这个特点。书中内容主要侧重于各种统计方法的应用,在统计原理方面,一般只作概念上的介绍和公式的简单推导,对有些较复杂的统计公式则只给出公式,其目的主要是为让读者不但对统计学原理有较全面的了解,更重要的是结合实例了解和掌握各种常用统计方法。在内容的编排上,全书共分十二章,概括起来主要有五个方面:第一章至第三章介绍统计和概率的基础知识,包括生物统计学的概念和内容、数据的搜集与整理、平均数和变异数的计算、概率和概率分布等;第四章、第五章介绍统计推断,包括样本平均数的检验、样本频数的检验、方差同质性检验、非参数检验和检验;第六章至第九章介绍统计分析方法,主要内容有方差分析、直线回归与相关分析、可直线化的曲线回归分析、多元回归与相关分析、逐步回归分析、多项式回归、协方差分析;第十章、第十一章介绍抽样与试验设计,主要包括抽样误差估计、抽样方法、抽样方案制订及常见的试验设计如对比设计、随机区组设计、正交设计及其相应的统计分析方法;第十二章对多元统计分析进行了简单介绍。每章都附有一定数量的思考练习题,供读者参考。

2《生物统计学》(第二版)

根据教学安排和生物统计学应用的需要,在教材使用反馈意见的基础上《生物统计学》(第二版)[6]于2000年在科学出版社出版。与第一版相比,各章节做了大幅度调整,将全书分为十四章,补充了拉丁方设计和裂区设计两种试验设计方法,将抽样原理和方法、常用试验设计及其统计分析放在了可直线化的非线性回归分析之后进行介绍,使章节编排体系更符合读者学习的要求。第一章至第三章分是基础理论,包括概论、试验资料的整理与特征数的计算及概率与概率分布。第四章至第六章介绍了具体的统计分析方法,分别是统计推断、检验和方差分析。第七章、第八章主要介绍试验设计的相关内容,包括抽样原理与方法、常用试验设计及统计分析。前面所涉及的统计分析内容主要是针对一个变量而言,之后的章节则主要介绍两个及多个变量的分析方法,第九章、第十章是关于一元回归和相关的内容,分别是直线回归与相关分析、可直线化的非线性回归分析。第十一章至第十四章介绍了协方差分析、多元回归与多元相关分析、多项式回归分析和多元统计分析简介。书中增加了对全文关键词汇和术语的索引,并在书后附上了各章部分思考练习题的答案。在例题上进行了重新编排,以使所选例题更能反映本章的内容且便于读者的学习和理解。

3《生物统计学》(第三版)

为适应21世纪生命科学发展和生物学人才培养的要示,在第一版、第二版的基础上,对教材内容重新进行了编排、审核并增加了部分内容,于2005年在科学出版社出版《生物统计学》(第三版)[7],并被列为21世纪高等院校生物科学系列教材。与之前相比,此版教材突出了以下3个特点:(1)内容丰富:增加了平衡不完全区组设计、倒数函数曲线、通径分析等内容;(2)编排科学:全书分解为十六章,各章节的安排更加注重了内容的循序渐进,并在每章之首增加了本章提要,总结该章节的主要内容,并列出了难点和重点;(3)针对性强:内容突出了本教材主要作为生物学专业教材这个重点,所选例题均为均为生物学试验中的案例。另外,随着计算机统计软件的发展和应用,统计软件是在统计学研究中必不可少的应用工具。目前的统计学软件,相关的统计分析方法及术语多以英文形式给出,只有掌握了相关术语的英文表达,才能更好地应用软件,否则只会导致统计分析的误用。在此版的修订中,对主要概念和术语增加了英文标注,并重新编排了中英文对照索引,以便于学习和检索。此版还对统计分析中学生易引起歧义的内容进行了修订,例如,方差分析是统计学常用的分析方法之一,对方差分析基本原理的理解是正确运用方差分析的前提。在教学中,要求学生正确理解方差分析中的处理数和组内重复数的含义和统计学意义。原来的教材中,例题中的处理数k和每处理下的重复数n的数量值是一样的,这样学生学习起来容易产生混淆,在这次修订中对例题进行了更换,以使学生很容易掌握n、k的含义及特征。

4《生物统计学》(第四版)

为适应21世纪生命科学发展和生物学人才培养对生物统计学教材的要求,在本书前三版的基础上,按照“强化基础、突出重点、注重应用、通俗易懂”的原则对全书内容重新进行了精简和编排,于2008年出版《生物统计学》(第四版)[1],并被教育部列为普通高等教育“十一五”国家级规划教材。与前三版相比,本书具有以下特点:(1)突出以本科教学为重点,注重与多数高校生物类专业目前生物统计教学要求的适应,精简了多元统计分析等部分较深的内容和平衡不完全区组设计、拉丁方设计、非参数检验等不常用的内容,将全书缩编为十四章。教材内容更侧重于各种统计方法的应用,而对复杂的统计原理只做概念上的介绍和公式的简单推导,目的是让读者在全面了解统计学原理的基础上,结合实例了解和掌握各种常用统计方法。(2)根据生命科学研究的发展和要求不断进行补充和调整教材内容,在内容结构安排方面,对全书各章节进行了部分调整,将直线回归与相关分析、可直线性的非线性回归分析放在抽样原理与方法和试验设计的前面,以使本书更加系统,便于本课程基本内容的教学。生物统计学分为统计分析和试验设计两大部分内容。此版教材在介绍统计学的基本理论之后,全面介绍各种常用的统计分析方法,然后是试验设计的内容。各章节安排循序渐进,具有一定的深度和广度。(3)更换和调整了部分例题和习题,对部分表达不甚清晰的部分进行了修订。在选用例题时,选择生物学各个分支典型例子,并着重突出生物专业及相关专业教材的重点。同时在各章后附上重新编排思考练习题,教材最后附上中英对照索引,以便于学习和检索。(4)为了进一步帮助读者理解和学习此版教材的内容,提高学生自学能力,配合本书编写了《生物统计学学习指导》一书,以利于学生加强课后实践练习,实现《生物统计学》教材的立体化。

5《生物统计学学习指导》

篇8

1.1 不知统计学为何物,总以为是数学的延伸

由于在中国大学里面统计学过去一直被认为是数学的一部分,过去以及现在的很多统计教材和统计教学都有浓厚的数学味道,这使得目前我国统计教学过程中存在一些问题或误区。商务统计课程虽然加了“商务”二字,但重心仍是统计,所以对统计学的各种错误看法在商务统计教学中也经常出现,独立学院的学生经常会问到“商务统计和高数哪个更难”。这看起来只是一个非此即彼的简单问题,其实反映出来的是独立学院学生的一个特点:惧怕数学,惧怕与数学有关的课程。为此需要让学生明白:统计学不是数学,统计学是一种哲学,是一种指导行为的方法,商务统计则是将这种哲学思维应用到商务领域,所以更加不是数学。数学是以公理为基础,以归纳演绎为基本思想方法的逻辑体系,逻辑正确,则结果正确,逻辑错误,则结果也是错的;统计学的研究需要在各种假设的基础上来研究未知的对象,所以统计学的结论是不能证伪的,统计学里没有“对”和“错”,只有“好”和“坏”,这与数学差别很大。我们要做的只是在众多的可能中找出最可能,然后据此来进行各种推理,做出我们认为最正确的决策。

1.2 从实际问题出发,从具体数据入手

分析数据、提出对策是让学生理解统计、应用统计的必经之路,所以在商务统计的教学中也应多让学生做一些开放式的习题,让他们真正利用学到的统计知识去解决实际问题,而少要学生进行枯燥的公式推导,把统计知识的应用放到重要位置,这样才不会把统计课上成数学课。

让学生明白统计知识的应用领域是非常广泛的,可以在上课的相关章节插播一些与统计有关的影音资料。例如在讲解条件概率的时候,可以让学生观看世界德州扑克大赛决赛的视频,这个决赛视频的特点是牌面上每发出一张新的公共牌,后台就会根据对阵双方的手牌和当前的公共牌情况计算出当前情况下对阵双方获胜的概率各为多少,并且这个概率会一直更新,直到比赛结束。非常直观,且浅显易懂,能够很好地让学生明白条件概率的本质就是在当前已知的数据基础上对未知事件做出的概率判断,已知的信息有变化,由此得出的概率也会跟着变化。这既能让学生明白条件概率的本质,又能让学生明白条件概率的具体应用。这局比赛的过程跌宕起伏,在最后一张公共牌发出之前本场比赛对阵双方获胜的概率分别为90%和10%,但最后的结果却是获胜几率只有10%的选手取得了胜率,这就能让同学们更加明白统计学的结论没有绝对的“对”和“错”,只有相对的“好”和“坏”。

2 学生数学基础较弱,对统计学有畏难情绪

2.1 数学基础薄弱,畏惧公式定理

独立学院商务统计课程的开设对象都是非统计专业的学生,这些学生的特点是数学水平参差不齐,在独立学院里,学生们的数学基础本来就较为薄弱,较大一部分学生对数学类课程兴趣不大,直接导致他们大一的数学类基础课学得并不扎实,面对一门公式和数据遍布书本的商务统计课程,大家第一印象就是数学,第一反应就是畏惧,直接导致学习热情大减。目前有些独立学院所选的商务统计教材在理论方面过于偏重数学公式的推导,仍然有比较复杂的积分求导等运算,这也会让学生望而生畏。还有部分商务统计的教材只是把统计学教材里的例题换成了商务案例,,而对知识的实际应用却较少提及,这样的教材也不适合独立院校的学生。

2.2 简化数学推导,讲解定理内涵

首先,商务统计教材的选择应以应用为导向,学习难度上以应不需要很深奥的数学知识为标准,只需要具有一些代数方面的常识即可。笔者任职的独立学院经过长期的教学探索,最终在学科专家的建议下选择了辛辛那提大学戴维安德森等三位教授编著的《商务与经济统计(精要版)》的中译本作为教材,这本书最大的特点是简化了繁琐的公式推导与证明,紧密地将统计学与商务和经济实践相结合,既介绍了统计的方法,又介绍了统计学在商务与经济领域中的实际应用,真正以应用为导向,在每一章的开篇部分都有一个实践案例,学生能够一开始就对即将学习的概念或原理有一个感性认识,且这些案例又都新鲜有趣,大大提高了学生的学习兴趣。

其次,在教学过程中应尽量少出现数学推导,而应尽可能以浅显易懂的语言向学生讲授那些数学推导难度较大而又非常重要的公式、定理。例如中心极限定理,这个定理在统计推断中非常重要,但其证明过程较难,这时候可以向学生非常直白地阐述这个定理的思想,笔者常举的例子就是平均身高,如果随机选取班上30个同学,测量他们的身高然后求出平均值,那么这个平均身高是否有可能为180cm?是否有可能为150cm?显然是不太可能的。因为随机抽到的30个同学里面应该是有高有矮的,所以他们的平均身高也不应该是180cm或者150cm这种较为极端的情况,而更可能的是一些比较正常的数字,例如160cm~170cm,也就是说这个平均值取到极端值的可能性比较小,而取到正常值的可能性比较大,这不就是正态分布所描述的情况吗?这个时候学生就能很轻松地理解中心极限定理:从总体中抽取一个样本,当样本容量足够大时,样本均值的抽样分布就近似服从于正态分布。有了感性地认识后,再回过头来看这个定理就能更加有针对性地去理解定理里面的每一个专业术语和限制条件,这样就能更加有效地记忆和应用这个定理,然后再结合统计软件,用电脑逐步演示样本容量从小到大变化时的样本均值的抽样分布的曲线图,那效果就更好,这样,一个统计学里的重要定理就会深深植根在学生的脑海里了。

最后,独立院校商务统计课程里的“商务”二字不应只是体现在案例本身的商务属性,除此之外应更多体现在计算过程的简化和对实际结果的分析上。积分的计算应以均匀分布为主,其他的积分计算完全可以依靠附录表格或统计软件进行查询和计算,这样有以下三个好处:

第一,可以规避繁琐的积分计算,让学生明白数学不好也能学好商务统计这门课,这对独立院校的学生来说是一个重要的心理暗示。

第二,可以节约大量的演算时间,而将更多的精力放在统计知识的应用方面:分析数据和理解数据。

第三,可以让学生明白,现在的统计分析很多都是能用统计软件直接完成的,不需要纸笔演算,我们的学习目的是要能理解数据后面隐藏的深层信息,而不是拘泥于繁琐的公式推导,这样就能调动学生在统计实操课上的学习热情,因为熟练掌握一种统计软件就能在很大程度上弥补他们在数学计算上的不足,同时还能轻松地完成统计分析,这正是学生希望达到的效果。

3 独立学院商务统计教学实施策略

3.1 从简单的实际问题出发,启发式教学

兴趣是最好的老师,这点对独立学院的学生同样适用。我们可以多在教学环节中将统计知识加以应用。例如在独立学院学生较为关心的点名问题上,一次统计知识的小小应用很可能让他们对统计产生新的认识,笔者曾在“总体比例的点估计”这一小节课程中向学生展示了这个估计的实用性,当场做了个小实验:估计课上的缺勤人数,然后决定是否点名。这个实验方法非常简单,学生也很感兴趣。具体情况如下:114个人的班级在一个座位数为12排12列的教室上课,随机抽取其中三排座位,一共36个座位,然后清点这三排座位里面的空位,结果发现空位共有11个,由此可以得到这三排座位的上座率为:

篇9

统计学中几大影响比较大的学派是频率学派、贝叶斯学派和信念学派。在很长的时间内,频率学派或称经典学派的观点、理论占据了主流地位,其余两派并未得到足够的重视。但是在实际应用中,却早已应用贝叶斯学派的理念来处理问题。所以有必要在理解这几大学派思想的基础上,来了解不同思想的统计方法。

一、两大学派的特点和分歧

频率学派坚持对概率的看法是频率的稳定性,所以,凡是不能重复进行的试验的有关结果都不能应用概率作出判断。但是很多时候,人们都是根据已有的知识和逻辑推理能力来对统计问题作出判断。在实际经济环境中,情况总是比较复杂,很难具备可以进行重复试验的条件,这个时候频率学派的理论就很难运用上了。与之不同,贝叶斯学派认为,概率是反映事件发生可能性的一个度量,既可以是反映重复试验的频率稳定性,也可以反映人们的某一些类型的主观信念。只要可以接受到任何先验信息,就都能对特定问题进行逻辑推理。

频率学派和贝叶斯学派之间激烈的争论,促进了统计学的发展,使得统计学最为一门信息科学在学科体系上和思想上更完善。这两大学派争论的分歧:其一,对概率这个概念的认识。经典学派认为概率是纯客观的,是频率稳定性的内在依据。而贝叶斯学派则认为概率应包含客观概率与主观概率;其二,是对统计问题的看法。频率学派研究的重点是样本空间,认为样本是变化的,参数是固定不变的,并从中寻找规律来推断参数的性质。贝叶斯学派的重点是研究参数空间,认为样本就是已观测到的值,它已不再变动而参数则是随机变量。需要探讨的是,参数取值的变化规律;其三,利用信息的范围不同。贝叶斯学派既利用样本信息又利用先验信息,而经典学派只局限于从样本获取的信息。其四,推断的过程不同。贝叶斯学派是从参数的先验分布到后验分布。而频率学派却仅是根据样本的信息对参数作出推断。可以说,先验分布这是区分这两个学派的一个重要特征。

二、统计分析方法的基本思路

在参数估计的基本方法上,对于单一方程模型,最常用的有普通最小二乘法、广义矩估计和极大似然估计法等。对于联立方程模型有常用二段最小二乘法和三段最小二乘法等。基本的理论框架是对未知参数的模型建立,参数估计包括点估计、区间估计、假设检验和预测等内容。并以此来研究各种模型,如线性回归模型、非线性回归模型、联立方程组模型,面板数据模型、时间序列模型等。

而贝叶斯分析则采用不同的思路,来进行参数的估计,检验和模型的比较。一般有如下思路:在得到样本数据的基础上,建立模型,求出似然函数,同时先验信息得到先验分布,运用贝叶斯定理,推导出后验分布,分析得出的结论。

可以说,经典的统计分析方法与贝叶斯分析的方法,孰优孰劣,也不可以一概而论。经典的方法在发展体系上很严密,有严谨的数理基础,而贝叶斯方法则是提供了一种新的思维方式,是推进现代统计及相关学科理论发展的强大力量。

三、统计计算方法和软件的发展

随着现代电脑技术的发展,统计学也获得了飞快的发展,尤其是促进了统计的计算方法的发展,特别是在针对贝叶斯方法的计算得到了新的进展。这主要分为两类,一类是通过直接的抽样手段,得到后验均值的估计值,主要包括直接抽样、分层抽样、筛选抽样等;它们的缺陷在于只能用于比较简单、低维的后验分布。第二类为 MCMC(Markov chainMonte Carlo),近年发展迅速,在各个相关领域得到了广泛的应用。在实际研究工作中,经常遇到的是高维的复杂数据,这时运用传统的方法就遇到困难了。而MCMC方法为这一复杂的计算过程开辟了新的方向。它的基本思想是把一个复杂的抽样问题转化为一系列简单的抽样问题,而不是直接从复杂的总体中抽取样本,并利用电脑技术模拟这个过程。

篇10

当前是市场经济和信息经济的时代,社会各个方面的发展都需要对信息进行收集、分析和整理,这一系列的工作都依赖统计,统计工作已经渗透到社会发展的各个方面。作为一名从教工作者,我深知要培养出高素质的统计学人才,统计学教学显得尤为重要。

一、统计学的概述及其原理

1.统计学的概述

统计学[1]是应用数学的一个分支,主要通过利用概率论建立数学模型,搜集观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛地应用在各门学科之上,从物理和社会科学到人文科学,甚至被用在工商业和政府的情报决策之上。统计学主要分为描述统计学和推断统计学。

2.统计学的原理

统计学原理包括:统计学的研究对象和方法、统计学的基本范畴、统计组织和管理、统计调查的意义和种类、统计调查方案、统计调查方法、统计整理的意义和内容、统计分组、统计分布、统计表、总量指标、相对指标、平均指标、变异指标、综合指标的应用、抽样推断的意义和内容、抽样误差、抽样估计的方法、抽样组织的设计、假设检验的意义与假设命题、假设检验方法、符合检验与秩和检验、相关的意义和种类、相关图表和相关系数、回归分析、指数的意义和种类、综合指数和平均指数、因素分析、指数数列。

二、统计学教材的创新

教材是提供知识的载体,教材的质量直接影响着教学质量,当前的统计学教材由于更新不及时,教材内容往往注重理论,而且抽象难懂,缺少案例分析和对学生实践操作的培养[2]。因此,要对统计学教材重新编写,从而更加适合当前统计学的发展。统计学的目的旨在为学生通过学习统计理论知识,掌握数据资料的分析方法,对数据资料能够进行整理、分析,做出正确的决策。统计学教材必须在对统计理路知识掌握的前提下,穿插对实际案例的分析,使统计学教材更加科学、更加实用。统计学的内容应当与统计软件有机结合起来。在对实际问题进行分析时,手工操作已经不能适应当前社会统计的需要,运用统计软件不仅可以缩短计算时间,而且使统计出来的数据更加明了,更加准确。

三、以就业为导向

统计学是理论和实际相结合的学科,不仅要掌握统计理论知识、统计方法,而且要能够进行实际操作。在统计学的教学过程中,必须理论和实践相结合[3],充分展现统计学的实践性、应用性等特点,从而培养学生独立分析和解决实际问题的能力。教师应注重加强统计学教学和运用统计软件的有机结合。在教授学生理论知识的同时,必须加强对学生的上机操作,通过对实际数据资料进行搜集、整理、分析,从而得出结论,提高学生的动手能力和实际操作能力。在教学工作之余,还应当对学生进行就业指导,在就业的选择中,不要好高骛远,更不要急功近利,要正确认识自己的经验和能力,选择能体现自身价值和发挥自己特长的岗位,认清现实。社会处在不断地变化和发展之中,要想在竞争激烈的社会中有一席之地,就必须居安思危,不能盲目自大,不断加强自己的业务能力,从而使自己适应不断发展的经济社会。

四、教学方法的改革

1.案例教学法

案例教学法[4]就是指教师通过在教学的过程中,穿插一些实际案例进行分析,调动学生的积极性和主动性,让学生相互讨论,对案例进行分析。这样不仅能更好地掌握所学的理论知识,而且可以培养学生分析问题、解决问题的能力。在对案例的选择上:一要与当前所讲述的理论知识相关联;二要所选的案例必须是在现实社会中真实发生的,不能是虚构的事件,案例最好是最近发生的,这样更有说服力,产生的效果也更加明显。

2.多媒体教学

多媒体教学是指在教学过程中,根据教学目标和教学对象的特点,通过教学设计,合理选择和运用现代教学媒体,并与传统教学手段有机组合,共同参与教学全过程,以多种媒体信息作用于学生,形成合理的教学过程结构,达到最优化的教学效果。多媒体教学取代了传统的黑板教学模式,更加能调动学生的积极性,可以把过去在教学中不能展现的事物表现出来,对于统计学来说,可以更加深入理解和掌握统计方法在实际中的运用。在对课件的制作上,为了达到更好的教学效果,教师应当熟练运用PowerPoint,调动学生学习的积极性。由于采用多媒体教学,课程进度往往会比传统的黑板教学快,为避免学生不能很好地掌握的情况,可以让学生在课后拷贝课件,便于对所学的课程进行巩固和复习。

五、加强实践操作

统计学是需要理论和实践相结合的学科,由于统计学的理论性很强,学生觉得比较难学,主要在于统计学中的概念比较严谨、复杂、计算推导公式也比较繁多。在学习统计学的过程中,就必须理论联系实际,把有关的概念、方法原理和实际生活中联系起来,通过实例进行清晰、明确地诠释。可让学生参加一些实践活动,比如可以在校内开展一些调查,像学生每月生活费调查、业余活动调查等,让学生通过所学的理论知识对其进行设计、调查、分析、整理,最后写出报告,这样不但可以巩固所学的理论知识,做到学以致用,而且可以提高学生的实际操作技能。学校还可以联系一些实习单位,让学生真正体验在现实操作,把所学的知识和实际工作更好地融合,在实际操作中逐步提高自己的水平。

六、统计学在教学中的应用

统计学是对客观现象的数量方面进行搜集、整理、归纳和分析,以便从中作出正确推断的认识方法论科学。由于统计定量研究具有客观、精确和可检验的特点,因此统计方法就成为实验研究的最重要方法,广泛应用于自然、社会、经济、科学技术各个领域的研究。统计软件的开发和使用大大节省了统计成本,促进了统计学的发展和应用,使之应用的领域更加广泛。社会科学统计软件包(statistical package for the socialscience,SPSS)是世界著名的统计分析软件之一,自开发应用至今已有40余年,软件功能已能满足通信、医疗、银行、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。SPSS具有很强的数据管理和统计分析功能,又可进行图表分析和输出管理等。其过程包括描述性统计、均值比较、一般线形模型、相关分析、回归分析、对数线形模型、聚类分数据简化、时间序列分析、因子分析等,涉及统计学的所有过程。将SPSS引入统计学的教学,统计中的数据处理和数值计算会变得轻而易举,使得教师可以集中精力讲清概率统计问题的思想方法。

参考文献:

[1]http://baike.省略/view/1734428.htm.

篇11

    1.1不遵循或不重视随机化原则

    随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。

    1.2缺少对照研究或对照组设计不合理

    正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信[7]。

    1.3均衡性原则掌握不够

    均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。各组间越均衡,可比性越强。有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。具体表现在:有的文章对治疗组与对照组的相应统一指标没有设在均衡的水平上。对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察[7]。

    1.4重复的原则掌握不好

    所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。虽然随机化是增强非处理因素均衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组的方法,也难以保证非处理因素的均衡一致。在随机化分组的基础上,只有样本例数足够大,才能使非处理因素均衡一致,同时也才能使抽样误差减小,增强样本对总体的代表性。一般来说,在随机分组的前提下,样本例数越大,各组之间非处理因素的均衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。一般说来,计数指标每组样本不得少于20~30例,计量指标每组样本不得少于5~10例。在多因素分析时,一般认为样本例数至少为观察指标的5~10倍[8]。

    1.5样本的含量

    样本的含量的大小直接影响到结论的可靠性。样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。故应在保证研究结果精确可靠的前提下,确定最小的样本量。如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。显然,有限的病例数不能充分说明该药是否有效,作者贸然得出结论,容易给他人造成假象甚至误导[9]。

    2统计方法选择与使用不当

    在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。测定某个具体数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等许多物理诊断和化验检查的结果。目前,医学论文中计数资料最常用的统计方法为χ2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。均数与标准差分别是描述正态分布资料集中和离散趋势的指标。能否选用“均数±标准差”来描述某一资料的分布特征,关键看该资料是否符合正态分布。当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。有些作者在使用t检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算错误[10]。

    2.1统计指标应用不当

    2.1.1描述计量资料的统计指标描

    述计量资料的统计指标主要有平均数指标(算术均数、中位数M等)和变异指标(标准差s和四分位数间距Q等),在应用时一定要注意它们各自的适用范围。对于非对称分布资料,算术均数不能反映数据的平均水平,应采用中位数描述。一般地,正态资料或对称资料用描述,偏态资料用M和Q来描述。在不能确定数据的分布类型时,应选用M和Q进行统计描述。四分位数间距Q是75%分位数P75和25%分位数P25之差,即Q=P75-P25,所谓百分位数Px是将全部观察值分为两部分,理论上x%的观察值比它小,(100-x)%的观察值比它大,中位数M是50%分位数P50。、s、M、Px与Q可通过统计软件直接输出[9]。

    2.1.2描述计数资料的统计指标描

    述计数资料的统计指标有绝对数和相对数。绝对数是原始资料经汇总得到的小计或总计数。相对数是两个有关的绝对数之比,主要包括率和构成比(百分比)。医学论文中相对数应用的主要问题之一是分母较小。分母较小时,相对数的可靠性不能保证,在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。医学论文中相对数应用的主要问题之二是将构成比误用来说明事物发生的强度。构成比只能反映事物的内部构成,不能说明事物的发生强度。医学的研究对象主要是人以及与人体有关的各种因素。由于生物现象的变异较大,各种影响因素又错综复杂,研究常是抽样观察,使事物本质差异与抽样误差混杂,故需用统计方法透过偶然现象来探测其规律性。如果不能正确运用统计学方法,造成统计学上的偏差或失误,就很容易把本来成功的结果当成失败而放弃,或把失败的教训误认为成功的结论而加以宣传。在进行科研设计时要严格遵循科学的统计学分析方法,不能留下隐患,否则,再高明的统计学专家和统计学软件也无法弥补科研设计缺陷造成的损失。总之,统计学分析在医学研究和论文写作中意义重大。作者在撰写论文时,应注意识别、总结有代表性的、有借鉴意义的统计学领域的缺陷、失误或错误的多发点,特别留心易出现统计错误的险区,从而使论文中的统计学问题减到最低限度。认真检查、仔细核验,尽量避免上述错误,必要时还可以请统计学专家帮助把关[12]。

    2.2统计方法描述或选择不当

    统计方法选择非常重要,它直接影响结论的可靠性[12]。临床资料的结果变量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。如果是两组间的比较,则采用四格表χ2检验或其校正公式,如果是多组间率的比较,则采用行×列表资料χ2检验。计量资料指对某一个研究对象用定量的方法测定某项指标得到的资料,一般均有计量单位。通常资料呈正态分布时,两组间均数比较用t检验,多组间均数比较用方差分析和q检验。当资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法。

    2.2.1统计方法描述不清