时间:2023-07-19 09:29:32
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇统计学变量的定义范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
统计学是一门基于试验数据的搜集、整理,对研究目标的统计性质进行分析和推断的学科,更是一门综合运用数学科学、计算机科学、信息学等工具学科、并与自然科学、社会科学相结合的多学科相交叉的边缘学科。在我国,早期的统计学设置比较狭隘,多作为数学学科的概率统计和经济学科的经济统计等子学科。直到 1998年,国家教育部设立了统计学专业[1],2011年颁布的《普通高等学校本科专业目录》更把统计学提升为一级学科!由此可见,统计学的专业地位及其重要性得到了广泛的认可。
与之相反,关于统计学专业教学的研究还处于起步阶段。相比于其他大类专业的教学研究,关于统计专业教学的教学语言设计的研究还未得到深入发展。
教学语言是一类广义的语言,是教学者与教学对象的多种感官的交流;同时,也是一种人文文化的载体,是一种民族文化的展示。教学语言的设计,就是通过调动教学对象的听觉、视觉、感觉等多方面来实现教学目标。
统计学专业的教学语言主要包括:口语语言、文字语言、符号语言、图表语言和肢体语言,本文将从上述五个方面对统计学专业的教学语言设计展开讨论与研究。
一、充分运用口语语言阐述教学内容
口语语言,是教学内容阐述的主要载体之一,是师生之间思想、情感交流的主要工具。由于统计学是与自然科学、社会科学相结合的多学科相交叉的边缘学科,统计学专业教学的口语语言与一般教学的口语语言既有联系,又有区别,主要具有以下特点:
1.对于基础理论的教学,口语语言要准确、规范
由于统计学的基础理论主要是基于各种模型,通过逻辑推导来进行分析和推断,并以高等数学形式来描述,因此相关教学的口语语言应以标准的数学口语语言来准确、规范地阐述相应的数学理论,特别要注意相应的模型理论的提出和逻辑关系的表述、推导等,依此来帮助学生准确地理解、把握统计学的基础理论; 同时,对复杂的逻辑关系及符号含义,要做出准确的表述,帮助学生在有限的课堂教学时间内了解、体会相应的含义,并能进行熟练、独立的运用。
2.对于后续课程的具体教学内容,口语语言要亲切、生动
在针对特定的知识点的教学过程中,教师要通过口语设计,把抽象的数学理论转换为具体的形象感觉,并结合适当的现实案例加以说明。特别是抽象的概念,比如随机过程中“下鞅”、“上鞅”、“鞅”以及“遍历性”等概念,要努力避免平铺直叙、照本宣科地进行授课,而是把该概念与日常实例相结合。
该定理是其后重要结论的基础,具有重要意义,但其证明太过数学化,因此在课堂教学中,并不进行证明,而采用简明的语言来进行说明。对第一个不等式,可以强调为“在每个样本点上,取所有随机变量的最小值,做成一个新的随机变量,它的均值不会大于所有随机变量先做平均再取最小的那个值”,即“最小值的期望,小于等于期望的最小值”;从而整个定理叙述为“最小值的期望,小于等于期望的最小值,小于等于期望的最大值,小于等于最大值的期望”。
由此可见,在课堂教学过程中,通过语言设计来调动学生的积极性,再结合语音、语调、语速等变化来突出重点、强调难点、控制教学节奏,可以让学生更好地理解具体教学内容。
二、准确运用文字语言刻画基本内容
文字语言,是教学内容可视化的主要载体之一,是学生明确认知教学内容的主要途径。统计学专业教学的文字语言的“准确性”,应具有如下特点:
1.对于基础理论的教学,注重文字语言的“数学性”
由于统计学是以数学理论为基础的,因此,文字语言要符合数学描述的一般要求;同时,也要注重结合教学目的,进行适当的调整来强调重点。
比如,统计量的定义:“设x1,x2,…,xn为取自某总体的样本,若样本函数T=Tx1,x2,…,xn中不含有任何未知参数,则称T为统计量”。在该定义中,应当注意三个非常重要的细节:“x1,x2,…,xn”、“任何”和“未知”。如果在教学过程中,不强调这几个细节,就可能忽略了小标“n”这个已知参数,从而产生对统计量概念的混淆,影响对统计量“样本均值”的认识。
2.对于后续课程的案例教学,强调文字语言的“概括性”
统计学处理的是实际的、非数学的对象,特别是一些来自社会经济活动的、真实物理环境的或现实遗传学科的具体实例。此时的文字语言,不仅要具有抽象性,抛弃不必要、不相关的、过多的背景描述,还要朴实易懂,最大限度地概括试验的理论背景、数据的研究意义。其意义在于,既利于学生理解研究的问题,明确研究的目标,同时也为学生的思考留出相应的空间。
三、简明地运用符号语言,压缩复杂意义
符号,是一些基本概念、基本性质、运算法则的缩写;符号语言,就是利用基本符号,以简单、明确和形式化的方式来简化复杂关系及大量文字性描述。在形式上,符号语言可以简化计算和推理过程,明确其中的逻辑过程,展现其抽象性;在意义上,通过结合具体试验背景,符号语言精练了相关信息的描述,体现其简洁性。由此可见,符号语言对相应学科的发展、传播和普及都有重要的推动作用。
对统计学专业而言,其基础理论部分的符号语言基本与高等数学的符号语言是相似的,因此,在教学过程中,教师要有意识地训练学生对符号的灵活运用,并提及相应符号的意义。
对统计专业低年级学生,教师要通过符号语言的设计,消除学生对符号的陌生感,使学生牢固地掌握各类符号的意义,熟练地运用各类符号描述相对复杂的含义,并将复杂的文字性描述利用符号来进行简化描述,进而培养学生利用符号语言来压缩复杂意义的能力。
例如,在概率统计中,随机变量的期望EX是一个重要概念,通过不同的角度可以得到不同形式的符号描述。在符号语言下,概率空间记为Ω,F,P,随机变量记为X,对应的密度函数和分布函数分别记为px和Fx,从而随机变量的数学期望EX有如下表述记为
其中,EX是数学期望(expectation)的符号,第一个等式为实空间R中的数学期望描述,这是一般概率论中的结论;第二个等式为实空间中的一般随机变量的数学期望表达式;第三个等式则为在概率空间Ω,F,P中的描述形式,是Riemann-Stieltjes积分,这是在随机分析范围下常用的描述方式。因此,在教学过程中,教师应强调上述关系式的意义及使用范围。
再如Lindeberg-Levy中心极限定理:设{Xi}∞i=1是相互独立、同分布的随机变量序列,且EXi=μ,VarXi=σ2& gt;0都存在;若记Y*n = X1 + X2 + 上述定理中的符号沿袭了高等数学的符号方式,同时,将σn改写为nσ2,其目的在于强调正态分布关于参数μ和σ2的依赖关系。强调这种依赖关系,有利于学生对正态分布的掌握,进一步明确随机变量与其特征参数的关系,也为后续其他重要分布和统计量的学习奠定基础。
对统计学专业高年级的学生,教师要注意引导学生基于基本符号,在特定的实际问题中,创造性地定义一些新符号,并赋予明确的含义,从而把特定问题进行符号化描述,简化统计分析、推断过程。这里需要注意的是,所定义的新符号首先要遵循一般的符号原理与意义,不只是符号的数学意义,还有在特定问题下的符号意义;其次,满足问题分析的需要,充分利用特有名词的缩写、符号的上、下标等。
比如,在回归分析中,基于多变量的多项式回归模型中,因变量y关于自变量x1,x2的二元二次回归模型为:y = β0 + β1 x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1 x2 + ε。在该表达式中,β的小标1、2分别代表与变量x1,x2有关,而重复出现的次数则表征了相应变量的阶数。因此,建议在教学过程中,对该类下表可以进行改进,比如将β12改记为β1,2,即下标中的“12”改为“1,2”,通过添加“,”进一步明晰变量的交互关系。
四、合理运用图表语言,明晰基本关系
图表语言,是利用图像、表格等直观的形象来描述复杂的概念、关系以及抽象数据所具有的含义。与符号语言的简洁和抽象相比,图表语言更具形象、直观的特性,能记录数量变化趋势、表达变量之间的关系以及展现概念之间的相关关系,因此,在统计学专业教学中,图表语言具有非常重要的意义与作用。
1.数据图表,记录数量变化趋势
数据图表,主要是对试验结果所获得的数据的形象表达,比如某地区的生产总值、居民消费额、空气中污染物含量等具体数据的excel表格或柱状图,以及对抽象数据处理之后所形成的频数直方图、频率直方图、盒子图等。依据不同的目的,选用不同的数据图表来说明进行统计分析的依据,并掌握进行统计推断的方向。
2.分析图表,表达变量之间的关系
分析图表,主要是指基于概率论与统计分析所得到的分析结论的图表,目的在于展示分析结论,进而解释变量关系。主要包括:(1)教材所附的典型分布的分布表,如正态分布表、F分布表、t分布表等;(2)数据分析表,如回归分析中所得到的Model Summery、ANVOA、Coefficients等;(3)结论预测表,如变量拟合图、时间序列分析表等。
3.关系图表,展现概念之间的相关关系
关系图表,主要是指为了那些抽象描述多个概念之间的相关关系,是对各种概念、方法、思想等的总体描述。从大的角度上讲,借助于关系图表,学生对统计学的发展、不同统计思想与方法间的异同等方面,会形成整体认识,常见于导论一类课程。从小的角度上讲,通过建立关系图表,学生可以进一步区分具体的概念,深化知识点的理解和运用。
五、巧妙运用肢体语言,深化教学效果
肢体语言,主要是指教师在教学过程中通过动作、姿势、表情等肢体的动作和变化来传达教学内容、实现教学目的的行为。首先,肢体语言具有形象、生动、操作性强;其次,易于学生的模仿与体会,以形成对抽象概念的形象认识;再次,可以很好地控制教学进程,如加速新课程的引入、教学内容的转换等。同时,可以活跃课堂气氛,调动学生的积极性,传递教师对学生的关怀。
总之,教学设计是指为实现教学目标,教师依据学习原理和教学理论,对各个环节进行具体计划,进而形成完整、有效的教学方案的过程。为了充分、有效地利用课堂教学,教师应该运用多种方法和技巧来实现与学生的交流。因此,教学语言的设计就显得更为重要。通过不断地研究与实践,教师的教学语言设计能力将会得以丰富和提高,取得事半功倍的效果。
【Abstract】According to the characteristic and the teaching difficulty of Bayesian statistics, we introduce the definition of posterior distribution by comparing the Bayesian formula in classical statistical. Combining with case study and using mathematics software, students can understand the meaning deeply and calculate quickly. Through the importance of posterior distribution in Bayesian statistics, students could have deep experience in the future study. We should also cultivate students' autonomous learning interest and the ability of creative thinking to solve the problem.
【Keywords】Bayesian statistics;Posterior distribution;Comparison method
贝叶斯统计是统计学专业中唯一一门非经典统计学的学科。英国学者贝叶斯的遗作《论有关机遇问题的求解》,提出了著名的贝叶斯公式和一种归纳推理方法,成为了贝叶斯学派的奠基石。之后,在Jeffreys、Good、Savage、Berger等学者的不断努力下,把贝叶斯方法在观点和理论上不断完善,并在工业、经济、管理等领域获得了成功的应用[1]。目前,贝叶斯学派已发展成为一个有影响的统计学派,打破了经典统计学一统天下的局面,占据了统计学的半壁江山。
1 贝叶斯统计的特点和教学难点
贝叶斯统计是在与经典统计的争论中逐渐发展起来的。其基本思想和观点是:总体分布中的未知参数可以看作随机变量;事件的概率除了用频率解释外,还可用个人经验和历史资料来获得,即承认主观概率;在经典统计所用的总体信息和样本信息外,还充分利用了抽样之前的信息―先验信息,并可根据先验信息获得先验分布。而这些观点在经典统计学看来都是不合理的。实际上,人们在生活中都在不知不觉的运用贝叶斯的思想解决问题。比如,医生在做手术之前会根据病人的病情和自己的经验估计手术成功的概率;免检产品的鉴定需要利用该产品以往的不合格品率的历史资料,若多次在零附近,且每隔一段时间抽查,仍保持该结果,则认定该产品为免检产品。这些实例都是在运用了先验信息后才得到了更好的解决,因此,若能充分利用先验信息,对于解决很多统计问题,无疑是非常有利且有效的。
然而正是由于贝叶斯统计独有的思想和方法,学生在习惯于以往所学的经典统计的课程思路情况下,接受起来有一定的困难。因此,教师在教授过程中一定要深入浅出,运用实例,易于学生理解。将贝叶斯统计与经典统计比较讲授相关内容,让学生从熟悉的知识进入,循序渐进逐步认识贝叶斯方法和理论。
2 比较法引入后验分布定义,案例加深理解,数学软件辅助教学
后验分布的定义是贝叶斯统计中第一章课程的内容,学生刚刚接触,理解起来有一定的难度。可由经典统计中所熟悉的贝叶斯公式引入讲解,比较容易接受。另外通过实用案例,激发学生的学习兴趣,并能更好理解定义。
2.1 贝叶斯公式
这就是概率统计中著名的贝叶斯公式,也叫逆概率公式[2]。我们可将事件B看作是试验结果,A1,A2,…,An看作是导致结果B的原因。则该公式表明了结果B发生条件下由第i个原因导致的概率。即执果索因[3]。
案例1
已知5%的男人和0.25%的女人是色盲,现随机挑选一人,检验为色盲,若男人和女人各占人数的一半,问此人是男人的概率。
设B为随机抽取一人为色盲,A为随机抽取一人为男人,A为随机抽取一人为女人。则P(A)=0.5,P(A)=0.5,且P(B|A)=0.05,P(B|A)=0.0025。故根据贝叶斯公式,有:
在贝叶斯公式中,结果B可认为是已经出现的样本数据x,发生结果的原因Ai可认为是未知的随机变量θ的取值。于是将贝叶斯公式推广可得到后验分布的离散形式定义。
2.2 后验分布的离散形式
设总体x服从分布密度p(x|θ),其中θ为离散型随机变量,取值为有限个或可列个。即θ=θi,i=1,2,…。θ的先验分布为π(θi)=P(θ=θi),i=1,2,…。样本的观察值为x=(x1,x2,…,xn),样本联合分布密度为,则θ的后验分布为:
将离散形式推广得到连续形式的后验分布定义。
2.3 后验分布的连续形式
2.若总体x为离散型随机变量,则总体分布密度p(x|θ)改为分布列P(X=x|θ),后验分布的离散形式和连续形式就不难写出来了。
先验分布π(θ)反映了人们在抽样前对参数θ的认识,而后验分布π(θ|x)则是在获得了样本后,对参数θ的认识,是人们利用总体信息、样本信息(统称为抽样信息)对先验分布π(θ)的认识作调整的结果。
案例2
英国统计学家Savage(1961年)考察一个统计实验:一位常饮牛奶加茶的妇女声称,她能辨别先倒进杯子里的是茶还是牛奶。对此作了10次试验,结果她都说对了。
若不考虑该妇女的经验,则应认为每次她猜对的概率为0.5,则10次猜对的概率为0.510=0.0009766非常小,显然与实际不符,不合理。因此应该充分利用经验,即先验信息。对该妇女的了解,认为有可能她每次猜对的概率为0.95。设θ为她每次猜对的概率,则取值为0.95或者0.5。
可见,抽样前后,对于猜中的概率θ=0.95的可能性从先验概率0.6变为后验概率0.9989,提高了很多,这主要是由于考虑了样本(10次全部猜对)的缘故。后验分布正是在样本参与下对参数θ的认知的改变,这个案例生动形象的说明了后验分布的含义。在进行计算和分析过程中,如上述的后验概率计算,可以运用Matlab等数学软件辅助教学工具。适当安排数学实验课程,使得学生能够很好的掌握有关贝叶斯统计课程的数学软件的使用。
3 后验分布在贝叶斯统计中的地位及作用
后验分布是基于总体信息、样本信息和先验信息三种信息的综合结果,是一个非常重要的定义,在整个贝叶斯统计学中起着基石一样的作用。贝叶斯统计的点估计、区间估计、假设检验及预测等统计推断问题都是建立在后验分布基础之上进行的。而在后验分布引入损失函数之后,便构成了贝叶斯决策理论的基本框架。显然,后验分布在贝叶斯统计中占有举足轻重的地位,可以说任何贝叶斯统计问题都离不开后验分布。因此,在学习该定义之初应使学生能够理解好,并灵活运用定义。在后续其他贝叶斯理论的讲授中应逐步加深对该定义的认识和应用。
4 结束语
贝叶斯统计课程是在统计学花海中的一支独秀。通过对后验分布定义的教学研究探索,我们可以将其方法推而广之,运用到贝叶斯统计中的其他理论知识的讲授中。在教师教学和学生学习的过程中,贝叶斯方法和思维方式都是与其他统计学科非常不同的。因此,可以在与熟知的经典统计学的对照中比较学习,深入浅出,列举实际案例,易于理解。通过案列的讲解还能激发学生的学习兴趣,提高主动思考和解决实际问题的能力,培养学生的创新意识和应用能力。当学生遇到某个问题时,若能不仅局限于经典统计方法,还能考虑到使用贝叶斯方法结合解决,也就具备了贝叶斯思想,那么该课程的开设便达到了目的。若能有部分同学有兴趣进一步拓宽贝叶斯方法的应用领域,深入研究学习,那么我国的贝叶斯统计研究就后继有人了。
【参考文献】
2地质统计方法发展现状
地质统计学作为一个年轻的边缘学科,正处在蓬勃向前发展的阶段,目前地质统计方法的发展主要有以下几个方面:
2.1两大学派地质统计学发展至今,出现了两个学派。
一个是以A.G儒尔奈耳(A.GJourna1)为首的“斯坦福地质统计学派(非参数地质统计学派)”。这一学派研究了不需要对数据的分布做假设的快速条件模拟、概率克立格法和指示克立格法等方法,并且研究了软数据的使用问题。另一个学派以马特隆教授为首,他们开展了以正态的假设为基础的析取克立格法和条件模拟研究,把协同克立格法和主成分分析进行有效结合,形成简单克立格法、析取克立格法、泛克立格法和普通克立格法等一系列的方法和理论,这些方法都要用实际的样品数据为基础,所以也称“参数地质统计学”
2.2多学科的渗透形成新克立格法
目前,对于含有一些特异值,接近了高斯分布的具体数据,就要把稳健统计学思想应用到求变差函数当中,继而提出了稳健克立格法;把多元区域化的变量引到克立格法中,运用两个或两个以上有相关性的变量对某一个变量估值,继而产生了协同克立格法;把多元区域化的变量引到指示克立格法中,继而得到了协同指示克立格法。
2.3多领域应用地质统计学目前不断扩展其应用领域,深入到生活的各个方面。
3地质统计方法在地质工程中的重要作用
随着市场飞速发展,统计方法运用在地质工程是时代潮流发展的必然。以前我们在计算矿产资源的储量时,常用不同级别储量的工程密度,用稀密法得到相对误差来论证矿产资源储量的可靠程度,并将相对误差值作为衡量矿产资源储量精度的标准。然而,这种方法缺乏科学根据,被许多人置疑,地质统计方法的出现很好地解决了这类问题。地质统计工作是深化我国经济体制改革和加强经济发展的必然要求。地质统计不但可以整体估计,还能对局部进行估计,对原有的数学方法和理论进行选择创新,把更好地解决面临的地质问题作为目标。地质统计估计的克立格方差是一个很好的估计精度,其估计精度高较高。地质统计的随机模拟能很好的再现出地质变量变化,从而为定量研究地质体提供一个有利的基础和可靠的保障。
4一维变差函数
可以假设空间中一点只在一维数轴X上变化,把区域化变量z作者简介:常维(1990一),男,江苏泰兴人,本科生,研究方向为统计学。(x)在X,x+/两点处的数值的差的方差的一半定义成区域化变量z(x)在x方向上的变差函数,记为:‘P(x)=—1V(x)一Z(x+1)]=—1E[Z(x)一Z(x+/)】一{E[Z(x)卜E[Z(x+/)】}z公式中,‘P(x)表示变差函数;E表示期望值,V表示方差。变差函数的函数值仅依赖于x和Z两个自变量。在本假设条件下,变差函数仅依赖于分割它们的距离z和方向,因而变差函数可定义成:变差函数是在任一方向,相距f的两个区域化变量[z(x)和(x+/)的增量的方差的一半。变差函数是一个有关距离的函数,描述不同位置变量的相似性,‘p值越大,变量的相关性越差。通常情况下,‘p值随着距离矢量Z的增大而增大,直到到达一定值时‘p达到极大值,之后保持不变。
5统计方法在地质工程中的应用
1977年地质统计学正式引入我国,经过我国对地质统计方法的努力学习,地质统计方法在我国得到了飞快的发展,目前广泛应用于以下几个方面:
5.1用于储层的预测石油地质学研究中的一个重要的难点和热点,就是对储层的参数进行一个有效的科学的预测。我国原先利用的是传统数理统计的方法,这种方法是纯数学的方法,没有充分考虑到储层参数间相关性和空间连续性的问题,也不附带任何的地质意义,因此,对储层的参数预测有较大局限性。使用地质统计方法就可以有效解决这一问题,它以区域化的变量理论作为基础,对地质参数的空间变化方向性和趋势都有了充分的全面的考虑,再克里金方法的外推和插值的功能,算出了与地质规律吻合的统计方法和模型,继而表征储层参数的规律变化,利用这规律,针对渗透率和孔隙度等参数的空间展布开展有效又合理的预测。
5.2用于不确定性描述油藏的复杂变化,很难通过动态或静态的确定性模型来反映。只有运用地质统计方法,用不确定性的描述,才能反映出真实的复杂油藏模型。地质统计方法最大的一个优点就是可以很方便地把不同的资料有效整合应用,如生产、测井、地震、地质等方面信息,这些对于油藏;隹确的描述是非常关键的。这种不确定性的描述可以给油藏工程师一个可选择的参考,帮助他们全面分析,制定一个合理的科学的开发方案。
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)18-0247-02
生物统计学是数理统计方法在生物科学领域的应用,它主要是研究数据资料的收集、整理、分析和解释的科学[1]。生物统计学是我院动物科学、动物医学、动物药学、动植物检疫、水产饲草等专业的专业基础课,由于该课程理论抽象、公式繁多、内容枯燥,是学生们普遍认为难学的一门课程[2]。实验教学是培养学生理论联系实际,提高创新意识和实践能力的重要环节。在生物统计学的教学工作中充分认识并落实实验教学的地位,对于培养学生运用数理统计方法解决生物学领域问题的能力、增强创新意识、提高人才培养质量有着重要的作用[3]。可见实验教学在生物统计学中占有重要地位,因此我们应该注重实验教学环节并对其适时改革。
一、SPSS在生物统计学上机实验中的应用
目前,在生物统计学上机实验课中,可选用的软件有Excel、SPSS、SAS、Oringin和R软件等[4-7]。其中SPSS为专业统计软件,其统计分析功能较强,是复杂、大型统计分析中的常用工具[8]。SPSS即社会科学统计软件包是世界著名的统计分析软件之一,“易学、易用、易普及”是SPSS软件最大的竞争优势,也是广大数据分析人员对其偏爱有加的主要原因。SPSS主要具有以下优点:大量成熟的统计分析方法、完善的数据定义操作管理、开放的数据接口、灵活的统计表格和统计图形。因此我们在实验教学中首选SPSS软件作为上机用统计软件。由于SPSS软件版本多,而且多为英文版,对于初学者来说中文版本更为适合,因此我们专门购买了SPSS17中文多国语言版本。
SPSS软件运行时有多个窗口,各窗口有各自的作用,但是想快速入门,只需要熟悉两个基本窗口即可,他们是数据编辑窗口(SPSS Data Editor)和结果输出窗口(SPSS Viewer)。数据编辑窗口是SPSS的主要程序窗口(见图1),其功能主要是定义SPSS数据的结构、录入数据和管理数据。数据的录入一般分两种方法:(1)在数据编辑窗口里,新建数据,首先打开数据编辑窗口的左下方“变量视图”,在里面定义需要录入数据的变量名称以及其他选项,如图1中的“品种”、“血糖值”就是变量名,然后回到数据视图,可以在定义好的变量下录入相应的数据。(2)在数据编辑窗口里,可以直接打开已经存在的数据,如“.cav、.xls、.dbf、.txt”等形式的数据资料。SPSS结果输出窗口是SPSS的另一个主要窗口(见图2),它的主要功能是显示管理SPSS统计分析结果、报表及图形。SPSS结果输出窗口中显示的结果等信息可以保存起来,以后需要时候可以再打开查看结果。
二、数显互动系统在生物统计学上机实验中的应用
生物统计学的上机操作实验环节可以提高学生的动手能力,还可以提高其解决实际问题的能力。但是对于从未接触过SPSS统计软件的初学者来说,只是口述SPSS统计软件的各种操作是不够的,学生不容易接受,而且会手忙脚乱。因此我们使用的是Motic第二代数码显微互动系统,该系统由教师主控单元、学生终端单元和链接教师和学生间的网络系统三部分组成。该系统的优点在于可进行图像的实时数字传输,实现师生双向信息互动和文件传送[8]。
生物统计学的整个上机实验过程主要包括以下几个环节:(1)老师演示:学生上机操作前老师要以例题的形式进行讲解和操作,教师通过数码互动系统在主控单元计算机屏幕进行数据分析操作,每名学生坐在自己的电脑前就可以从电脑上看到教师分析数据时的每一个操作动作,这样可以使得学生很快就掌握了该次上机的详细操作步骤。(2)学生操作:学生针对本次实验内容自己上机运用SPSS软件进行相应的统计分析,在这个环节里如果学生遇到不会操作的地方,可以举手向老师请教,在老师的指导下能够顺利完成实验内容。(3)写电子版实验报告:只用SPSS分析完数据还不够,还要会分析最终结论(即统计推断)。因此学生要把实验的主要结果(图、表等)和最终结论填写到实验报告中。最终以Word的形式通过Email发送给老师。
三、生物统计学上机考核方式的改革
考核方式的改革是生物统计学实验教学改革的重要组成部分。合理的考核评价体系,对于客观、全面评价学生的学业水平和引导学生的学习方向上发挥着重要作用,能够达到调动学生积极性,提高学生学习效率的目的[3]。以往的上机考核多以上机实践总结和考勤作为评分标准,学生在写上机实践总结时往往存在抄袭,而且文笔好的学生写的总结内容丰富全面,可能得了高分,这样对于学生的动手能力和水平难以准确地给予评价。因为我们针对上机考核方式进行了一些改革。在上机考核中增加了电子实验报告和上机考试这两部分。电子实验报告是每次实验课上当堂完成实验操作结果那部分,既可以作为检验学生对每节实验课是否掌握的依据,还可以提高学生的电脑运动能力(Word)。上机考试主要是针对整个上机实验内容进行抽样考试,我们事先出各种类型的试卷,针对不同的班级随机抽取一个类型的试卷进行上机考试,因为班级多,而计算机机房的电脑有限,只能采用各个班级轮流上机考试。为了杜绝了不同班级考题一样及考题外漏等问题,我们分别出了A、B、C等多种类型试卷。最终,上机总分=考勤(10%)+电子实验报告(20%)+上机考试(70%)。
四、结语
通过以上SPSS软件的应用、数显互动系统的应用以及多元化评定上机考核等方面的改革与实践,使得学生对生物统计学的学习、理解、操作等情况能够及时反馈给老师,老师可以根据情况不断完善实验教学方法和手段,从而提高实验教学效果,同时增强了学生的动手能力和解决实际问题能力。学以致用是生物统计学最重要的特点之一,因此不仅要求学习者掌握知识,更要学会应用知识[9]。尤其是在做本科生或研究生毕业论文的时候,学生应该能够独立完成合理试验的设计,运用SPSS统计软件,针对不同数据进行分析,完成高质量的毕业论文。
参考文献:
[1]张勤.生物统计学[M].第2版.中国农业大学出版社,2008.
[2]白俊艳,贾小平,张小辉,等.生物统计学课程改革与实践[J].畜牧与饲料科学,2013,34(10):57-60.
[3]张强,张建平.生物统计学实验教学的探索与实践[J].实验室科学,2012,15(6):15-18.
[4]梅花,白乙尔图.SPSS统计软件在《生物统计学》教学中的实例应用[J].中国畜牧兽医文摘,20l2,(7):217.
[5]朱水平.生物统计学实验教程[M].云南科技出版社,2006.
[6]姜红霞.origin软件在生物统计学教学中的应用[J].陕西教育:高教版,2009,(3):82-83.
一、引言
莫迪利亚尼和米勒(1958)的资本结构定理出现以来的六十年中,一系列关于企业资本结构的新理论和实证研究得到提出,但仍有争议,回答了三个问题:
(1)资本结构的决定因素是什么?
(2)企业怎么选择资本结构?
(3)资本结构如何影响企业的价值?
以往的实证研究旨在解释资本结构的影响因素和寻找支持理论的证据,主要基于自发达国家与新兴经济的数据。最典型蒂特曼和韦塞尔斯(1988),拉詹和津加莱斯(1995)等。尤其,陈.J.J(2004),黄贵海和宋海(2006)都认为,似乎有中国彩色性的新啄食顺序假说,优先顺序是留存盈利、股本及最终为债务融资。关于越南企业,陈挺魁元,拉马钱德兰(2006)发现,企业规模与资本结构的各种测量之间具有统计学显著性正相关。
研究的目的对越南企业改革方案实施20年之后的越南企业资本结构进行更深入、更新的了解。研究中使用135家胡志明市证券交易所自2009至2012年非金融类上市公司的一部数据库以及一群的12个解释变量,包括国家所有权的哑变量。
二、越南的财经环境
1986年越共“六大”开始了“革新”路道。据此,高度集中的计划经济转换为社会主义定向的市场经济。革新后,越南国营企业占主导,多种所有制企业共同发展。国有企业转型的过程归结如下:自主化-市场化-公司化-股份化-集团化。
为排忧解难国有企业在于经济转型时期的早期阶段,政府已颁布1992年的国有企业改革方案,据此进行转换所有形式而具体就是国有企业的股份化。它正是将国有企业的部分或全部价值转让私人所有权。这使得企业逐步变得更加独立,而不是像此前那样依靠政府如今公司得自身解决其内部如资本、产品出路等问题,重要的是要维持如何合理的资本结构。
20年过去已显示在国民经济中私营部门和私人资本(私人所有权资)的作用日益重要和显着下降国有企业的。政府现在只控制关键与高公益性的行业,如电力、航空、石油和天热气以及电信。另一方面,越南股市的诞生和发展正是经济改革的必要成果。到目前为止股市已经有点成为一个筹集资金给704家企业的渠道以及市场资本值占2012年国内生产总值的26%。
然而,越南股市有时候已陷入“过热”期间,被认为很容易“蒸发”。一方面,是由于投资者的从众心理和信息不对称的问题。另一方面,是由于对企业和投资者参与股市时缺乏强有力及强大的制定。
事实上,国家所有权在于大多数上市公司之下不同限度。这表明了民营企业和合资企业参与股市不多。解释的理由很多,其中我们认为由不足“信心和力量”的原因。然而,逆境是股市尽管有非常“热闹”的活动时期,但许多公司仍然使用多债务为其营运提供资金,而主要为短期债务。因此,可以认为股市仍未事实有效的运作,也显示了越南的企业债券市场仍然有很大的限制。另一方面,也显示了该公司对与债权人仍不够信任,并银行对与长期贷款仍然使用一列安全的措施。这可能由于投资者与企业、企业与银行之间的信息不对称。
三、变量的描述和建设
(一)自变量
1、业务风险
业务风险是指未来公司的运营有关的风险。业务风险变量被定义为利息及税项前盈利的标准偏差。
2、有形性
公司以高有形资产期望具有有高资本结构并由低债务成本和负债的问题更少,因为高有形资产的公司可以提供更多的抵押品。本研究采用有形资产/总资产率作为有形性的代表。
3、自由现金流
詹森(1986)指出,自由现金流指的是超过了所有净现值项目的筹资需求的现金流。企业具有高自由现金流则预期具有较低的资本结构。自由现金流变量被定为税前利润加固定资产折旧减实际缴纳的所得税/总资产的帐面价值。
4、增长机会
高增长机会的公司将使用更少的债务减少问题。米勒(1977)立论,要是用短期债务代替长期债务,问题可得以减少。增长机会变量定义为总资产的变化比例。
5、折旧税盾
迪安吉罗和马苏里思(1980)认为,公司使用非利息账目为降低企业的实缴所得税,如折旧费用、税收信用及福利基金等账目。在越南的折旧税盾中,资产折旧是经常使用的最重要的账目。所以,折旧总资产率使用为本研究的折旧税盾变量的。
6、盈利能力
静态权衡理论认为,盈利能力的公司将更多借款为税收的好处。詹森(1986)提出,为了防止管理人员浪费自由现金流,有高盈利能力的公司将使用高债务。盈利能力变量被定义为利息及税项前盈利/总资产率。
7、企业规模
权衡理论认为,较大的公司拥有债务的成本代表较低、现金流的波动较少、接近信贷市场更容易和倾向于更多的债务为获得受惠自税务盾。啄食顺序理论则提出,较大的公司预期较少的信息不对称,所以导致其股本得更多的吸引力。企业规模被定义为总资产的自然对数作,因为资产的结构特点将确保其真实性高于销售收入的。
8、企业独特性
公司拥有独特的产品往往具有较低的财务杠杆,由于产品的独特性往往与破产成本较高。言下之意,如果公司倒闭了,企业的库存及制造设备的二级市场带着竞争性可能不存在。企业独特性变量被计量为销售成本/销售收入率。
9、流动性
詹森(1986)研究发现,多现金的公司将增加新贷款,以防止管理者擅自作出浪费自由现金流的决定。公司拥有高流动性似乎给债权人带来公司对实现短期债务义务的能力的好信号,应该让公司接近更好的贷款资金。流动性变量定义为短期资产/短期债务的比率。
10、经营时间
阿赫塔尔和奥利弗(2009)表明,老年的公司预期更高的债务由较低的长期债务的成本。这些公司也有较低的倒闭风险,应该有更高的可靠性,从而容易获得更高的债务。经营时间变量的计量是操作年数自成立日以来的自然对数。
11、实际税率
莫迪利亚尼和米勒(1963)的专题研究提供了税收有对企业资本结构的重要性。据静态权衡理论,实际税率与财务杠杆预期正相关。本研究中希望找到税对资本结构的影响的清晰证据,所以实际税率变量测量为实缴所得税/应税收入。
12、国家所有权
国家所有权的作用仍是一个有争议的话题。中越两国有许多相似之处如:都正在于将集中经济转换市场经济的时期;当今的许多企业都是从国有企业被私有化、股份化,而其中国家持有控股或部分股份;金融体系仍主要地依赖于银行,国有商业银行仍然占主导地位和给国民经济供应大部分的银行信贷。
本研究提供国有所有权变量在于一组更大的解释变量。国家所有作为一个虚拟变量,值为1如果是国有企业按2005年越南企业法(含国家控股比例的51%以上),其他为0。
(二)因变量
本研究采用三个因变量来计量资本结构,基于帐面价值。具体是:
(1)债务率,被计量为总债务对总资产。
(2)长期债务率,被计量为长期债务对总资产。
(3)短期债务率,被计量为短期债务对总资产。其中,短期债务是指可以在一年内偿还公司的债务,包括短期借款、银行信贷、应缴税款及其他负债。
四、研究方法和数据说明
(一)研究方法
本文使多元回归分析进行检验上面建成的解释变量与因变量。我们使用面板数据被收集于2009-2012年时间序列。回归模型如下:
Ylit=β0+∑βkXkit+uit
其中:Y为因变量,X为自变量
l为因变量的数目,l=1,2,3
k为解释变量的数目,k=1,2,...,12
i为观察企业数量,i=1,2,...,135
t为观察年数,t=1,2,3,4
β0为常数
βk为自变量系数
uit=μit+εi,εi是随机误差与ε~N(0,δ2)和μit板数据误差,
(二)数据说明
本文采用一部最新二级数据。本数据取自胡志明市证券交易所135家非金融类上市公司于2009-2012年期间的经审核财务报表,包括27家国有企业(国家所有权的51%以上)。
由越南股市的数据限制和“缓解蒸发性”,所以在本文中我们只能用帐面价值,而不是像其他国际问题研究同时使用上述两种。此外,由于商业信用仍然被使用如金融工具,所以我们以计量因变量提供商业信用。
五、研究结果与讨论
(一)描述统计
表1描述统计数据的结果和解释变量与因变量之间的关系。如此:
表1:统计描述
■
平均债务率为48.25%,并国有企业的债务率并不显着高于其他公司。平均长期债务率为15.44%,并国有企业的18.22%。平均短期债务率为36.71%,而国有企业的是30.68%。这些的表明,越南公司使用长期债务多于短期债务,无论国有企业还是非国有企业。这解释了由企业债券市场未发达,银行贷款仍是外部的主要资金。导致公司得主要依靠于股本及短期债务,该公司还展示了股本比债务更多地使用。
统计的结果显示,2009-2012年期间上市公司的平均增长机会率为8.68%和平均盈利能力率为18.06%高于2002-2003年期间的(对应的结果是7%和3%)。表明了资本市场(股市)的积极效应。
(二)实证结果
表2提出对检验解释变量和因变量运行回归模型的结果。其中,X1,X2,X4,X6,X7,X8,X9,X10,X12变量拥有1%和5%的统计学显着性。分析比较结果如下:
业务风险与债务率正相关,但无统计学显著性,同时与长期债务率有一个统计上显着正相关,但差0很少。言下之意,公司使用长期债务越高业务风险越大,与反之。
有形性是统计学显着性负相关与债务率和短期债务率,但与长期债务率正相关。含义,有高有形资产的公司会倾向使少用短期债务由于贷款时间与资产特性之间的符合性。
增长机会对三个财务杠杆测量为正相关,但只对债务率和长期负债率有统计学显著性。这含义,越南股市的发展仍然显着限制,虽然国内股市有时热闹的运营。然而,也表明,越高增长的公司使用越多的债务。换言之,也表达大公司仍然主要依赖于银行贷款。这些与啄食顺序理论和发达国家的研究结果是一致的。
盈利能力负相关与所有财务杠杆,但唯一对短期债务率的测量没有统计学显著性。像所有上述研究,这些结果支持啄食顺序理论。
企业规模与债务率和长期债务正相关,并与短期债务率负相关(所有统计学显著性)。像中国和一些新兴经济体,公司有短期债务率更高则有规模更小。与越大的公司更容易获得长期贷款,并同时显示较大的上市公司规模可以更容易地选择长期债务和短期债务之间。
企业独特性只与短期债务比率统计学显著着正相关。该企业独特性越清晰越多的地使用短期贷款。与此同时我们发现,该公司有日益高的独特性将少用长期债务,
原因可能公司破产时没有对库存及生产设备清理的高竞争性的二级市场,然而我们的研究结果非统计学显著性。
研究中的指出,流动性跟债率务和短期债务率具有正相关,并与长期债务率负相关(都于1%统计学显著性)。因此,因为越南企业主要以短期债务为筹资,所以可说,流动性总体上与资本结构为负相关。言下之意,高流动性的公司将使用较少的债务,因高度流动性的资产给该公司的业务用于资助。本研究的发现符合啄食顺序理论。
经营时间跟短期债务率有统计学显著性的正相关,并与短期债务率有非统计学显著性的负相关。表明了经营时间的企业越久则有越大的资本结构是符合与越南的背景之下,是筹资主要来自短期债务的地方。这也给各种类型公司作为确实,无论国有公司或非国有的,由于实际上越南的上市公司主要是从国有企业的股份化。
一些我们的发现差异越南的以往研究结果是国家所有权与债务率和长期债务率的正相关关系(都于1%统计学显著性),但跟短期债务率负相关(无统计学显著性)。越高国家所有权的公司越容易地获得信贷,特别是长期债务,由于公司与债权人之间的关系已经形成公司股份化之前。
三个回归模型的结果显示,所有的三个本研究中的财务杠杆拥有较高的统计性解释力。其F检验结果表达没有自相关的现象和多重相关性,也说明了其计量经济模式是合理的。
六、结束语
本文尽量检验135家非金融类越南股市上市公司自2009至2012年期间的最新面板数据,得了结论如下:
首先、资本结构的啄食顺序理论和静态权衡理论基本上解释越南公司的筹资决策。第二、发达国家及新兴经济体(特别中国)的资本结构影响因素可以采用与公司于越南,该国家正在将中经济向市场经济转换的过程中。第三、该公司在股市交易上使用更少的长期贷款,而主要是短期贷款。原因是,越南的企业债券市场尚未开发,从而该公司的资金主要地依靠于取决于权益资本、银行贷款及商业信用。最后,国家所有权率在公司的融资决策中起着重要的作用。本研究的发现是公司跟越高的国有资本比例,越容易地获得贷款一般和尤其是长期贷款。综上所述,一家公司的资本结构决策不但依靠于其自身的特点,而且被很大地影响了自其外部制度环境。
参考文献:
[1]阿赫塔尔和奥利弗.日本跨国与国内企业的资本结构决定因素[J]。国际财务回顾,2009年,第9期
1、相关系数越大,说明两个变量之间的关系就越强。当相关系数为1时,两个变量其实就是一次函数关系。
2、相关系数介于0与1之间,用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
3、相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
(来源:文章屋网 )
【关键词】 胃癌癌前病变; 幽门螺杆菌; 累积比数Logit模型; 单独的二分类Logit模型
有序分类资料最常用的分析方法是累积比数Logit模型[1],对多分类有序反应资料,如果采用一般的二分类Logit模型,而不是累积比数Logit模型,只能获得50%~70%的检验效能[2],说明在处理有序分类数据方面,累积比数Logit模型要优于二分类Logit模型。近几年累积比数Logit模型在国内应用领域有所增多,但不少忽略了模型的使用条件,盲目套用,以致影响所得结论的可靠性。本研究通过累积比数Logit模型在实际数据分析中的应用,说明了忽视模型应用条件所产生的后果,并介绍了如何选择恰当的分析方法。
1 资料与方法
1.1 资料来源
资料来源于1项茂名市某医院的队列研究数据,该研究选择了360名轻度慢性萎缩性胃炎(CAG)患者,根据他们的幽门螺杆菌(Hp)感染情况分为阴性组和阳性组两组人群,随访3年后重新进行病理学诊断,观察他们的病变情况。
1.2 胃黏膜病理诊断
用胃内窥镜观察胃黏膜病变,并在胃体大小弯、胃角、胃窦大小弯、前后壁各取胃黏膜活检组织1块。病理切片照全国胃、十二指肠活检、病理诊断标准进行诊断。每个受检对象以最严重病变为第一诊断。
1.2 统计分析方法
累积比数Logit模型的形式为[3]:Logit(P(Y≤k|X))=ln(P(Y≤k|x)1-P(Y≤k|x))=ak-pi=1βixi ,k=1,2,…,K-1。 (1)反应变量Y为K个等级的有序变量,第k(k=1,2,…,K)类的概率分别为{π1,π2,…,πk},且Kk=1πk=1 。影响因素xT=(x1,x2,…,xP)为解释变量,xi(i=1,2,…,p)可以是连续变量、无序或有序分类变量。则该模型实际上是将K个等级人为地分成{1,…,k }和{k+1,…,K}两类,在这两类基础上定义的Logit P表示属于前k个等级的累积概率(P(Y≤k|x))与后K-k个等级的累积概率(1-P(Y≤k|x))的比数之对数。故该模型称为累积比数模型,其应用有一个基本的假定条件,即比例优势假定(proportional odds assumption)。这一条件要求自变量的回归系数应与分割点k无关,换句话说,无论从哪一点分类,对所有的累积logit,变量xk都有一个相同的βk估计。
单独的二分类logit模型(separate binary logistic modes)主要是把反应变量按照不同分割点合并为不同的二类,然后分别进行二分类的Logistic回归分析[4]。本研究中的反应变量为随访5年后的病变,分为轻度CAG、重度CAG、肠上皮化生(IM)、不典型增生(DYS)共4类,有3个分割点,故定义为3个二分类Logit:一是将IM、重度CAG和轻度CAG合并,即{DYS}VS{IM,重度CAG,轻度CAG},表示至少进展到DYS;二是将DYS和IM合并,重度CAG和轻度CAG合并,即{DYS,IM}VS{重度CAG,轻度CAG},表示至少进展到IM;三是将DYS、IM和重度CAG合并,即{DYS,IM,重度CAG}VS{轻度CAG},表示至少进展到重度CAG。然后以上述分类分别作3次二分类的logistic回归分析。整个分析过程均由SAS 8.2(SAS Institute, Cary,N.C.)来完成[5]。
2 结果
经3年随访后,共67人因各种原因失访,293人具有可供分析的完整资料。其中,118人病变仍为轻度CAG,91人进展为重度CAG,49人进展为IM,35人进展为DYS。具体进展情况见表1。
累积比数Logit模型分析结果表明(表2),除性别因素外,其他因素对胃癌癌前病变的影响均无统计学意义。但从得分检验(score test)结果来看(表3),Hp不满足比例优势假定条件(χ2=24.100,P
为了核实结果的正确性,并充分利用该资料有序的特点,故采用单独的二分类Logit模型进一步分析(表4),可以看出,年龄、性别、吸烟、饮酒这四个变量在不同分割点的OR值相差不大,而Hp的OR值则差别很大。把DYS、IM和重度CAG合并为一类(即“至少进展为重度CAG”)时,Hp的影响有统计学意义(OR=2.334,95%CI:1.402~3.885)。而对“至少进展到DYS”和“至少进展到IM”的影响则无统计学意义。表4 单独二分类Logit模型分析结果
3 讨论
本次研究结果显示,年龄、性别、吸烟、饮酒对胃癌癌前病变的进展无影响。在校正上述因素的影响后,Hp感染主要作用于胃癌癌前病变的早期阶段,Hp阳性者至少进展到重度CAG的可能性是Hp阴性者的2.334倍(OR=2.334,95%CI:1.402~3.885),而对进展到更高级的病变如IM、DYS,则Hp阳性与阴性并无差别。这与有学者提出的Hp主要作用于胃癌癌前病变的早期阶段的结论是一致的[6,7]。
累积比数Logit模型是分析有序分类资料最常用的方法,但其应用需要满足一定的条件,其中一个基本条件就是比例优势假定条件,即自变量的回归系数应与分割点k无关。对于一个自变量xk而言,不同累积比数发生比的回归线相互平行,只是截距参数有所差别。以往有人认为,累积比数Logit模型对这一条件并不敏感,但在实际中,这一条件不满足往往容易导致错误的结论,本研究即证明了这一点。Ralf也曾对这一问题进行了探讨[8],并指出,如果不满足比例优势假定条件,最好采用单独的二分类Logit模型进行分析,否则做出的结论往往给人以误导甚至是毫无意义的。本研究发现资料不满足比例优势假定条件,因此采用了简单且易于理解的单独的二分类Logit模型进一步分析。结果表明,尽管Hp对进展到更高级的病变(IM、DYS)无影响,但对至少进展到重度CAG的影响有统计学意义,即Hp主要作用于胃癌癌前病变的早期阶段。如果忽略比例优势假定条件的检验,接受累积比数Logit模型的分析结果,便会得出相反的结论。
当有序分类资料不满足比例优势假定条件时,还有其它一些方法可供选择[9],如stereotype模型、偏比例优势模型(partial proportional odds models)等[10]。这些方法都是基于累积Logits计算的,因而可与单独的二分类Logit模型直接比较,但其计算过程繁琐,且结果的解释不如单独的二分类Logit模型易于理解。多项Logit模型(polytomous logits models)是基于广义Logits计算的,其计算过程和结果解释均与单独的二分类Logit模型不同,因而二者不可直接比较,一般也不作为比例优势假定条件不满足时的首选方法。
总之,对于有序分类资料的分析,应先看其是否满足模型的使用条件,如不满足,最好换用其它更为合适的方法。本次研究一开始采用累积比数Logit模型分析,结果显示Hp对胃癌癌前病变的影响无统计学意义,这实际上是由于Hp不满足比例优势假定条件所致。在利用单独的二分类Logit模型作进一步详细分析后,则可以发现,Hp阳性者至少进展到重度CAG的危险显著高于Hp阴性者。
【参考文献】
1 McCullagh P.Regression Models for Ordinal Data (with Discussion). J.R.Stat Soc,1980,42:109.
2 BG Amstrong,M Sloan.Ordinal Regression Models for Epidemiologic Data.Am J of Epidemiology,1989,129:191~204.
3 Ludwig Fahrmeir,Gerhard Tutz.Multivariate Statistical Modeling Based on Generalized Linear Models.Beijing:World Publishing Cooperation,1998,75~79.
4 Ralf Bender,Ulrich Grouven.Using Binary Logistic Regression Models for Ordinal Data with Non-proportional Odds.Journal of Clinical Epidemiol,1998,51:809~816.
5 Ralf Bender,Axel Bender.Calculating Ordinal Regression Models in SAS and SPlus.Biometrical Journal,2000,42:677~699.
6 Kunio Takeuchi, Yoshihiro Ohno, Yasushi Tsuzuki, etc. Helicobacter pylori Infection and Early Gastric Cancer.J Clin Gastroenterol, 2003,36:321~324.
7 夏志伟,林三仁.幽门螺杆菌与胃癌.幽门螺杆菌感染的基础与临床(修订版).北京:中国科学技术出版社, 2002, 172~178.
木瓜具有平肝和胃、去湿舒筋、护肝降酶、生血和抗菌等功效,在临床中多用于湿痹拘挛、腰膝关节酸重疼痛、吐泻转筋和脚气水肿等。在木瓜所含的各种化合物中,黄酮类化合物具有抗感染、抗病毒、解痉、抗癌和保肝等多种生物活性。本文主要介绍木瓜不同炮制品(生品、蒸制和炒制)中,黄酮含量比较的数据分析方法。
1 不同制品木瓜的黄酮含量
取皱皮、光皮木瓜各3份,其中2份分别进行蒸制和炒制处理,在不同的溶解时间分别测量生品、蒸制品和炒制品中黄酮含量[1],结果见表1。
从表1可以看出,不同品种间测量值有差异,同一时间在不同制品间测量值有差异,同一制品在不同时间测量值也有差异,因此对不同制品中黄酮含量的比较,应采用多因素方差分析。由于黄酮含量测量值随着溶解时间的增加而增加,在多因素方差分析中可以把时间作为协变量,使用协方差分析[2]来比较不同品种、不同制品间黄酮含量的差异。
协方差分析的基本思想是,在作多组均数Y1,Y2,…YK的比较前,用线性回归方法建立各组分析变量Y和协变量X间的数量关系,求得在假定变量X相等时各组分析变量的修正均数,然后用方差分析对各组修正均数进行分析。协方差分析要求:①各组分析变量和协变量的关系是线性关系;②各组分析变量Y的残差服从正态分布;③各组分析变量Y与协变量X的回归斜率相等。其中,第3点回归斜率相等(即回归直线平行)是最重要的,在进行协方差分析前,应先对各组回归直线的平行性进行检验。平行性的检验可以通过对协变量和分组变量的交互作用的分析来判断,若交互作用无统计学意义,则可认为满足平行性条件。本文中分组因素有“品种”和“方法”(炮制方法),平行性的检验可通过对“品种”、“方法”和“时间”的二级交互作用的检验来判断。下面是使用SPSS中General Linear Model[3](一般线性模式)过程中的Univariate(单因变量多因素方差分析)命令进行协方差分析的过程和方法。
首先建立分析变量名为“黄酮含量”、因素变量名为“品种”和“方法”、协变量名为“时间”的SPSS数据文件[3]。方差分析要求各组观察值残差服从正态分布,因此需要对变量“黄酮含量”作平方根反正弦转换。在SPSS的“Date View”(数据窗口)菜单中“Transform”子菜单中,可使用“Compute Variable”来转换[3](本文对数据的转换方法不作详细的介绍),转换后的变量“转换值”满足协方差分析要求的第2条。
2 各组回归直线平行性的检验
在打开的SPSS数据文件的Data View(数据窗口)中,单击菜单栏上的“Analyze”,在菜单中移动光标到“General Linear Mode”单击子菜单中“Univariate”,进入Univariate 分析对话框。在Univariate 分析的对话框中:
把变量“转换值”作为分析变量送入 Dependent Variable: 框中;把因素变量“品种”、“方法”送入 Fixed Factor(s) 框中;把协变量 “时间”送入 Covariate(s) 框中。
各选项完成后的对话框见图1。单击按钮“Model…”(模式)进入模式定义对话框。在模式对话框中,选择Custom(自定义)。在左边的Factors & Covariates列表框中:
依次把变量“品种”、“方法”、“时间”送入右边的Model文本框中;
选中“品种”和“方法”,把交互项“品种*方法”送入 Mode 框中;
选中“品种”、“方法”和“时间”,把交互项“品种*方法*时间”送入 Model 框中。
各选项完成后的对话框见图2。单击“ Continue”( 返回)返回主对话框,单击“OK”(确定)后,Univariate 分析的结果见表2。
从表2中的输出结果可以看到,交互项“品种*炮制方法*时间”的显著性概率 P = 0.884 ,远大于0.05,无统计学意义。可认为各组黄酮含量与溶解时间的回归斜率没有显著性差异,各回归直线满足平行的条件。
3 不同制品间黄酮含量差异的比较分析
本文中不同品种木瓜、不同炮制方法加工的制品黄酮含量的比较,是属于组中分组的实验,在分析中可以不考虑木瓜品种和溶解时间的交互作用。因此在不同品种、不同制品间黄酮含量差异的分析中,只需在前面Univariate 分析的定义模式(Model)对话框中:
在Model 框中,双击“品种*方法”,移出“品种*方法”;
在Model 框中,双击“品种*方法*时间”,移出“品种*方法*时间”;
单击“Continue”( 返回)返回主对话框,单击“OK”(确定)后,得黄酮含量差异分析的协方差分析结果(表3)。
从表3的输出结果中可以看到,不同品种间木瓜间的P=0.000
[参考文献]
[1]郭锡勇,唐修静,郭莉莉.木瓜不同炮制品中总黄酮含量测定[J].贵阳中医学院学报,2000,2000,22(4):61-62.
[2]张文彤.SPSS统计分析高级教材[M].北京:高等教育出版社,2004.
中图分类号:C829.2 文献标识码:A 文章编号:1001-828X(2014)06-0-02
一、引言
作为2011年新成立的一级学科,如今的统计学巧妙地借助数据这根纽带,将原先“藩镇割据”的数理统计、经济统计和医学统计等诸多学术领域融为一体,形成了多种分支协同发展,“大统计”格局初步形成的良好势头。然而,尽管不同的统计分支中采用的统计学方法论“殊途同归”,少数细小的概念似乎仍旧“水火不容”。
例如,在诸多种类的统计调查中,抽样调查以其经济性好、实用性强、适用面广和准确性高等特点独占鳌头,成为我国在1994年确立的新统计调查方法体系的主体。但直到今天,抽样调查理论中最重要的概念之一——“总体”,依旧面临着无法获得统一定义的尴尬局面。该现状的始作俑者是经济统计学和数理统计学之间“针锋相对”的学术较量,而这种较量如若继续进行下去,不仅将给今后的学习者带来有增无减的困扰与疑惑,也与当今统计学各分支“水融”之趋势格格不入。
基于此,本文通过阐述“总体”在数理统计和经济统计中定义的差异,初步地梳理出两大分支在研究方法和概念处理层面的内在联系与不同取向,最终针对这些分歧提出一种新的、两全其美的定义方式,以期尽可能多地消除统计学学习者在这类问题上产生的疑惑,为统计学学科体系的完善出一份绵薄之力。
二、经济统计中的总体
美国辛辛那提大学教授戴维·安德森等在其举世闻名的《商务与经济统计》(机械工业出版社,2012年11月原书第11版)中将总体定义为在一个特定研究中所有个体组成的集合,并用Norris电气公司的例子加深了读者对总体和样本概念的理解——在这一案例中,总体被假定为用新灯丝生产的所有灯泡,这些灯泡的平均使用寿命是未知的。该公司从中抽取了200只灯泡进行实验,而这200只灯泡便是与总体相对应的样本。有趣的是,作者在此将200只灯泡的使用寿命称之为“样本数据”,并从中计算出样本平均数,借以推断总体平均数。由此可见,在作者看来,“总体”并不是一群孤零零的数据,而是来源于生活、有实际意义,并包含着一系列需要用样本数据去推断的参数。
无独有偶,国内的经济统计教材对总体的定义方式也与《商务与经济统计》如出一辙。例如,袁卫、庞皓、曾五一和贾俊平主编的《统计学》(高等教育出版社,2009年7月第三版)认为,总体是人们研究的所有基本单位(通常是人、物体、交易或事件)。在这个定义之后,作者亦用电视机厂一例做出了说明:现假设人们要对某一月份该厂生产的电视机进行质量检查, 则该厂当月生产的全部电视机就是总体, 该厂当月生产的每台电视机即是一个总体单位。这就表明,在作者看来,全部电视机的某项指标(如使用寿命)仅仅是总体的一个数量特征,是总体的组成部分,是一个帮助人们认识总体的量化的工具。
一言以蔽之,经济统计中的总体包含一个或一个以上的数字特征,然而又不局限于数字本身,它在现实生活中有着具体而形象的存在,常常是看得见、摸得着的。这种思维方式能契合“联系实际、联系生活、联系经济运行”的宗旨,与经济统计学的基本理念遥相呼应。
三、数理统计中的总体
与经济统计截然不同的是,数理统计更倾向于把“总体”抽象为数量标志——也就是说,上文举出的“全体新灯泡”在数理统计学家看来并不能称之为总体,“全体新灯泡的使用寿命组成的集合”方可。数理统计的总体是抽象化的,而非具体化的。盛骤 、谢式千和潘承毅主编的《概率论与数理统计》(高等教育出版社,2008年6月第四版)在第六章将总体的获得过程描述为对一个研究对象的某项数量指标进行的实验和观察,而总体便是这些实验所有可能的观察值。在这本久负盛名的教材中,作者还举出男生身高和某种灯泡使用寿命等例证,认为在针对2000个大学一年级男生体检中,2000个身高观测值才是严格意义上的总体,2000个男生却不是;当人们研究全国范围内某型号灯泡的使用寿命时,不能将国内所有的该型号灯泡作为总体(这与《商务与经济统计》的观点出现了正面冲突),而应该采用它们的使用寿命。
茆诗松、程依明和濮晓龙主编的《概率论与数理统计教程》(高等教育出版社,2011年第二版)对这种冲突做了一个说明。该书首先定义总体为“研究对象的全体”,而后指出:对于多数实际问题,总体中的个体是一些实在的人或物。巧合的是,该书与浙大版《概率论》都使用了大学生身高一例来说明总体这一概念,但相比后者,茆诗松版《概率论》更详细地说明了在数理统计中,为什么总体只能取为大学生的身高:每个学生有许多特征,包括姓名、民族、身高、体重等。由于在这一问题中人们只对它们的身高感兴趣,对其他特征暂不考虑,故人们把每个学生都拥有的数量指标值(即身高)看成新的个体,这样所有身高的全体就自然成为总体。
通过以上两本主流教材的定义方式,我们不难发现,数理统计学的“总体”是抛开实际背景的“一堆数”,是一个给定但未知的分布。在这种定义下,“从总体中抽样”和“从某分布中抽样”其实是一件事情。结合数理统计学作为数学分支所发扬的量化、精准化和高效化的治学风格,产生此类定义也就不足为奇了。
四、一例不成熟的创新
即使是经济统计和数理统计属于相同一级学科的今天,上述两种定义方式依旧是各自为政,互不承认。经济统计学家指责数理统计的定义方式撇下了研究对象的实际意义,而数理统计学家常将经济统计的总体定义看作是“易产生争议的”、“不简洁的”甚至“错误的”。然而,随着“大统计”格局的初见雏形,经济统计和数理统计的相互渗透与影响不仅是大势所趋,也关系着新的统计学知识体系的建立与完善。在此背景下,对“总体”这一概念定下一个两全其美的、兼收并蓄的新定义,也就显得尤为重要。
这一方向的尝试并非前所未有,例如伍业锋在《关于统计总体的界定、分类及其特征探讨》一文中就提出,“总体”这一概念可分类为“具体总体”和“抽象总体”,其中具体总体是由现实中存在的具体物体所组成的总体,而抽象总体是由各个具体事物的概念抽象所组成的总体。
笔者认为,这种定义的方法存在明显的两面性:一方面,它形象地揭示出经济统计和数理统计在总体定义这一问题上的直观区别,并较为成功地将二者联系起来;但与此同时,这种定义方法的漏洞也可谓十分明显:一方面,“具体总体”是否一定得是现实中存在的具体物体?若果真如此,诸如对某地区闪电发生频率进行的研究(闪电不是物体),又应该把“具体总体”定义为何物呢?另一方面,对具体存在的事物进行抽象化的结果,可以是数,也可以是其他任何体现共同性和本质性的名词。假设我们要考察某地区红富士苹果的年产量,从哲学的角度来讲,将“红富士苹果”转换为“年产量”和“苹果”均属抽象,故作者对“抽象总体”的界定含混不清。
五、直接总体与间接总体
在此,笔者斗胆提出一对崭新的概念——“直接总体”和“间接总体”,其中直接总体是指在一个特定研究中全部的研究对象所构成的集合,它们共同包含一种或一种以上的数量指标;而间接总体是指在一个特定研究中全部研究对象共同包含的某种数量指标的取值所构成的集合。
读者不难发现,在这种定义方法中,“直接总体”呼应着经济统计的定义法,而“间接总体”与数理统计的现有概念类似。但必须指出的是,这种定义方法相对传统概念的改善也是不可小觑的,其优势有三:“直接”和“间接”两个名词在概念定义中运用相当广泛(如“直接引语”和“间接引语”、“直接成本”和“间接成本”),直白如话,通俗易懂,不会给学习者任何的陌生感或距离感。此为其一;“直接”二字意为不经过中间事物,它生动地代表着原始的、未经处理的研究对象。而“间接”二字则恰如其分地体现了从研究对象中筛去无关变量,保留数字特征这一道必备工序。二者相得益彰,相映成趣。此为其二;最为可贵的是,这种定义方法创造了一个严密的逻辑体系,即:间接总体来源于直接总体;间接总体是基于共有的数字特征对直接总体的高度抽象与浓缩;直接总体只有先转化为间接总体方可进行统计调查、统计分析与统计推断;来源于间接总体的统计结果服务于直接总体。此为其三。
回到电气公司一例,按照笔者刚刚给出的定义,该调查中的直接总体应为全部的新灯泡。而间接总体则为全部新灯泡的使用寿命所组成的集合。相对于“二选一”的传统定义,新的界定方法很好地体现着经济统计与数理统计的融通与交汇。对于全部的新灯泡而言,由于它们是原始的、未经处理的,所以对它们的界定可做到一步到位,直接高效。然而,我们在这项研究中只对灯泡的使用寿命感兴趣,而无心关注它的形状、亮度或是制造成本。因此,我们要对直接总体进行抽象与浓缩,只撷取一项数字特征,将无关变量统统筛去。完成这道工序后,由一系列使用寿命所构成的间接总体也就产生了。这个额外的步骤无疑是值得的:间接获得的总体以其精简、高效的特点保障了一系列统计工作的顺利进行。通过研究间接总体得出的结论,可以很好地服务于直接总体——也就是说,如果我们有充足的把握认为这些灯泡的使用寿命小于240小时(十天十夜),那么它们无疑是失败的新产品。
六、总结与展望
综上,笔者所提出的新定义使原先相互割裂的两个概念定义归入同一套体系,将原先的“分庭抗礼”转变为“分工合作”。与此同时,它所具有的简洁明了,准确精炼等特点,也使这一尝试具备了成为统计理论主流的潜力。该套定义的提出,不仅给为这一争论所困的学习者和研究者节约了宝贵的精力与时光,还体现着统计学“百川入海,分久必合”的大趋势、大未来,在经济统计和数理统计之间架起了又一道友谊之桥。
有事物的地方就有数据,有数据的地方就有统计。今日之中国正昂首踏入崭新的大数据时代,在国家经济发展和世界格局变化中,统计学所发挥的支撑作用正变得举足轻重。我们需要大量的高精尖统计人才,而一套日臻完善的学科建设与知识体系,对于培养此类国家栋梁尤为重要。现如今,经济统计和数理统计的融合为我国统计学专业的发展提供了前所未有的宝贵机会。在此历史关头,所有的统计人应摒弃成见,张开怀抱,以更为包容与合作的姿态着力学科间的交流共进,去迎接“大统计”梦想的最终实现,使统计之光广照天下。
参考文献:
[1]姜培耕.统计总体的哲学反思——兼论统计学是方法论科学[J].上海统计,2002(08).
[2]伍业锋.关于统计总体的界定、分类及其特征探讨[J].统计与决策,2011(16).
[3]王兢.《统计学》与《概率论和数理统计》中的概念衔接问题[J].统计教育,2007(03).
[4]郭松云.关于统计学中几个基本概念界定的探讨[J].知识丛林,2007(06).
二、概率论与数理统计教学的现状
概率论与数理统计课程是一门承前启后的课程,不同于高中所学的简单概率,只需要排列组合的初等方法就能计算,大学中的概率论与数理统计课程是以微积分为基础,需要重新定义概念与运算规则,而且,经管类专业课程《统计学》又以《概率论与数理统计》为基础的,所以,概率论与数理统计课程的学习与微积分的学习好坏有关,又决定了后续课程《统计学》的学习效果。在教学中发现,这样重要的一门课程在学习效果上并不好,每年东方科技学院的期末考试不及格率仅次于高等数学的不及格率。很多学生也是怨声载道,大吐苦水,不知道该如何学好这门课程,明明都尽力去学了就是学不会。作为每年都让这门课程的一线教师,经过多年的教学实践发现主要存在以下几个问题:
1、概念理解不到位。概率论数理统计的课程分两部分:概率论以及数理统计。概率论是以微积分为基础,通过分布函数来定义概率,一般包含概率的定义与性质、分布函数、二元分布函数、数学期望与方差、大数定律与中心极限定理;数理统计一般包含:数理统计的基本概念、参数估计、假设检验、方差分析、回归分析。从内容上来看有点多,一般也不会全部讲解,受到课时偏少的影响,教师在概念解释上就讲的偏少,主要还是以解题为主,但是概念没有解释清楚的后果就是学生根本无法理解随机变量、分布函数、统计分布的内涵是什么。尽管在课堂上一再强调随机变量与高等数学的变量不一样,随机变量仅仅表示事件,不同的数字变量可以表示为相同的事件,分布函数是以随机变量进行定义的,其含义就是随机变量所定义事件的可能性-概率。但很多学生还是以高等数学的变量与函数来理解随机变量与分布函数,特别是随机变量函数的分布时候,就更无法理解,教师讲的口干舌燥,学生听的一脸茫然,那求知若渴却又无法理解的眼神让教师无可奈何,不得不再次重复讲解。
2、微积分基础不牢固。概率论与数理统计是以分布函数为主线串联的,但是分布函数的问题就牵涉到高等数学的微积分知识,特别是二元分布函数需要用到二元微积分,这对很多学生是苦不堪言,原因就在于前修课程微积分没有学好。由于高等数学的知识量大,课时又相对较少,独立学院学生的数学基础本身就很薄弱,教师在讲微积分知识时就尽量简单化,二重积分的知识就变简单很多,这就导致W生学习概率论的时候,再次面对二重积分就有天然的畏惧感,不熟悉的分布函数概念以及难懂的二重积分的计算,使得很多学生就放弃概率论的学习。对数理统计也是如此,数理统计的知识是以总体样本为基础,通过抽样来估计总体参数并对总体参数进行检验的过程,而且,统计的规律就是随着样本的增大,总体就服从正态分布,就是通过一定的方法来估计正态总体的两个参数并进行检验。这样的知识点按理来说不难,但是学生的表现来看,不尽如人意。这反映出学生对新事物的接受能力不适应,经过高考对知识点反复强调讲解的习惯,学生对大学课程没有反复练习的行为不适应,而且其他课程也多,又处于没有人监管的状态,主观上就放弃了对难点的探索精神。因为数学的学习不同于其它课程,除课堂教学外,还需要有一定的时间做预习预备与复习巩固的。
3、不注重实践操作。概率论与数理统计的学习只是讲解一些基本的概率统计原理,理论上不需要过多详细讲解,而应该把重点放在学生的实践操作能力上。特别是数理统计方面的知识点如参数估计、假设检验、回归分析等这些知识,让学生指导基本的原理即可,学会在实际中会用到这些知识才是重中之重,理论与实践的结合,才会更直观的让学生明白理论的意义所在。经管类学生所需的统计知识在以后要用到的地方挺多的,工作上一些简单的excel表格就是有求和求平均,如果考上经管类研究生,那么学术上还需要学习《计量经济学》,得会用统计学的知识进行实证分析,统计软件如SPSS做模型分析,并对结果进行经济解释,进而来撰写相关的学术论文。因此,针对经管类学生的特殊性,教师应该在实际操作上下一番功夫。
三、概率论与数理统计课程教学的改进措施
针对概率论与数理统计课程一些教学的问题,提出一些改进措施。
1、重视概念的解释。教师在主观意识上应该认识到解释概念的重要性。受到应试教育的影响,教师在教学上轻概念重解题的思维一直没有改变,认为数学就是能够让学生解出题目来就是好效果,殊不知,这样的教学只能培养一批会机械计算的学生工人,根本无法培养学生的综合素质。况且,解释概念比解题重要的多,概念解释清楚了,学生就容易理解做题的含义,反而能促进解题的进展,磨刀不误砍柴工。学生应该注意甄别新旧知识的区别,建构主义认为,前面的知识学习会对后面知识的学习带来影响。很多学生在大学前已经习惯了数学当中的数字计算,数字变量的概念,对概率论当中的随机变量以及分布函数还是以原有思维进行思考,这样,就很难走出误区。教师即时在课堂上反复强调数字变量以及随机变量的不同,但如果学生的主观没有意识到,就很难达到效果。所以,对于新旧概念的区别,教师要详细解释,学生也应该主动认识。
2、加强微积分的练习。如果不会微积分,那么概率论与数理统计的学习也就无从谈起。微积分的学习是在高等数学中很重要的一个知识点,那么师生就应该在高等数学中把这个知识学好。如果还是未能学好,就应该采取开设选修课的方式,给予微积分基础不好的学生来补习,当然这个在实际操作当中有一定的难度,选修课是学生自愿选择的,那些微积分本来就不好的就不会去选修该课程,教师可以规定高等数学不及格的学生必须强制的选修微积分,至于会不会引起学生的反感而导致学生的逆反厌学情绪,这个得需要做一定的调查才行;此外可行的就是成立学习小组,让那些成绩优秀的学生来帮助后进学生,采取帮扶的方式来提高微积分的成绩。还有就是教师可以建立qq群、微信群等网络平台,通过网络答疑解惑的方式来解决对数学学习有难度的学生。
3、注重统计软件操作。数理统计方面的知识在后续课程如《统计学》、《计量经济学》用的很多,这些课程的目的是培养学生掌握基本统计软件的用法。因此,在讲解数理统计的时候,教师就可以穿插一些基本软件方面的知识,把理论用到实际操作上,就能让学生更加明白理论的含义,当然,这里要注意的是,由于课时不够,正式课堂上可能无法讲解太多。教师应该采取课后作业的形式进行,布置一些跟尽管专业有关的习题,如分析教育水平对收入的影响这类简单可行的统计练习,并把做题的批改当成平时成绩的一部分,以监督学生完成课后习题。
四、结束语
经管专业的特殊性,使得概率论与数理统计课程的学习显得较为重要,对后续课程有很大的影响,教师与学生应该充分意识到概率论当中一些概念的重要性,加强微积分的练习,在统计方面尽可能的讲解软件使用的知识,来提高概率论与数理统计的教学效果。
参考文献:
【中图分类号】R195 【文献标识码】A 【文章编号】1004-7484(2012)13-0449-02
1947 年世界卫生组织给健康下的定义为: “健康不仅仅是没有疾病和病痛, 而且还包括身体、心理和社会方面的完好状态[1] ”。1990 年WHO提出了“健康老龄化”,1993 年第15 届国际老年学会提出了“科学为健康老龄化服务”[2]的人口老龄化应对目标。国内外对老年人生命质量进行了大量研究,取得了较多的研究成果。本研究以SF-36量表为测量工具,在山东省选择70岁及以上老年人进行生命质量状况的调查,以了解其生命质量的总体状况及影响因素,为提高老年人生活质量,促进健康老龄化的制度安排提供参考。
1 对象与方法
1.1 研究对象 本次调查的对象是山东省居家养老和机构养老的70岁及以上老年人。采用分层方法把山东省的老年人划分为沿海、中部、西部3种地区类型,每个类型随机抽取3个地级市,在被抽取的地级市中以市(县)为单位进行随机抽样。
1.2 调查方法 调查问卷包括一般情况表(养老方式、性别、年龄、受教育程度、婚姻状况、过去从事的职业、目前的收入来源、生活状况等)和健康状况调查问卷(SF-36),分为居家养老卷与机构养老卷,调查者是通过专门培训的研究生及本科生采用统一导语入户对老年人进行调查,能独立填写问卷的由其独立填写,对于没有阅读能力或不能填写问卷的老年人,由调查人员朗读问卷内容,请其作答,由调查人员代为填写问卷。共发放问卷590份,回收有效问卷558份,回收率94.6%。
1.3 统计学方法 应用Epidata3.1数据库双机录入,SPSS16.0软件包进行数据处理,对一般人口学特征等进行统计描述;单因素分析应用?2检验,多因素分析应用有序分类变量的Logistic回归分析。
2 结果与分析
2.1 人口社会学特征的描述分析
居家养老老人324人,机构养老老人234人,共558人,其中男288人(51.6%),女270人(48.4%)。年龄70~79岁393人(70.4%),80岁及以上的高龄老人165人(29.6%)。婚姻状况:有配偶234人(41.9%),丧偶306人(54.8%),离异4人(0.8%),未婚14人(2.5%)。文化程度:未受过教育269人(48.2%),小学174人(31.2),初中48人(8.6%),高中、中专及技校36人(6.5%),大专及以上31人(5.5%)。居家养老老人和机构养老老人年龄、性别,受教育程度分布差异无统计学意义,过去从事的职业、婚姻状况、生活状况差异有统计学意义(P
2.2总体健康状况自评及相关因素差异性分析
本研究将老年人的总体健康状况分为5个等级,分别是“1=差、2=一般、3=好、4=很好、5=非常好”。总体健康状况自评的居家养老老人与机构养老老人差异无统计学意义(P>0.05)。“性别”在老年人总体健康状况之间的差异性无统计学意义(p>0.05),可以认为老年人总体健康状况在性别分布上无差异。“年龄”、“受教育程度”、“婚姻状况”与老年人总体健康状况之间的差异性有统计学意义(P
2.3总体健康状况自评影响因素的Logistic回归结果及分析
单因素分析仅对总体健康状况自评的差异性进行检验,而没有对影响因素进行归因分析,因此需要进一步做多因素分析。以总体健康状况自评为因变量,运用SPSS16.0统计软件中的有序分类变量回归方法进行分析,纳入模型中的自变量有年龄、性别、受教育程度、目前婚姻状况、职业、养老方式以及生活状况7个自变量。模型检验及回归结果如下。
2.3.1 模型检验
表2为对模型中是否所有自变量偏回归系数全为0进行似然比检验,结果P
2.3.2 方程中的有效变量及参数检验
在纳入模型的7个变量中有年龄、养老方式及生活状况3个自变量对总体健康状况自评的影响具有统计学意义(P
3 讨论
3.1 年龄与总体健康状况评价的程度呈负相关关系。“年龄”因素在老年人对生命质量总体满意度评价的回归分析中具有统计学意义。可以认为老人的年龄越大,对生命质量的总体满意度越低,本结论与景睿、刘晓东等[3]的研究结果一致。原因在于,年龄越高,身体机能越低,日常活动能力下降。同时对死亡的恐惧加大,故自我健康的评价较低。可见,年龄是健康状况的风险因素,不仅表现在日常活动能力,而且投射出心理状况的变化。
3.2 经济条件对总体健康状况评价具有积极作用。“生活状况与当地一般家庭的比较”对70岁及以上老人总体满意度影响因素的回归分析中,生活状况“很富裕”“比较富裕”“一般”的老年人,对生命质量的总体满意度更高。原因可能出于以下几个方面:一是生活状况水平高,老年人就可能有更大的选择空间和余地,不为经济所累,过自己想要的生活,生活比较自由[4]。二是生活状况较好的老年人有更好的条件享受医疗保健,更多地参加社交活动,在心理上能够获得更多的满足感,因此对生命质量的总体满意度会较高。
3.3 居家养老老人的健康自评好于机构养老老人。 “养老方式” 因素在老人对生命质量总体满意度评价的的回归分析中,居家养老模式下的老人对自我生命质量评价的总体满意度高于机构养老老人。首先,老年人观念相对保守,接受新事物的能力较弱。居家养老是我国传统的养老方式,在这种环境中老年人往往具有更高的归宿感。其次,老年人年龄大,易产生孤独感与陌生感。居家养老模式能使老年人更容易获得子女以及邻里生活照料、精神慰藉的家庭和社会支持,从而减少孤独感与陌生感[5],因此对生命质量的总体满意度高。
3.4 受教育程度与总体健康状况自评之间的差异性有待于进一步研究。在描述性分析的差异性检验中,受教育程度在总体健康状况自评的差异有统计学意义。受教育程度较高的老年人对生命质量的总体满意度高于教育程度较低的老年人。然而在“受教育程度”对总体满意度自评的影响因素的回归结果显示无统计学意义(见表3),可能的原因在于混杂因素的影响,此问题有待于进一步研究。
参考文献
[1] Velarde-Jurado E et al.Salud Publica Mex,2002,44:349-361.
[2] 李秀燕, 郭继志. 老年人生命质量评价的现状及展望[J]. 国外医学・社会医学分册, 2003,20(4):154-158.
[3] 景睿,刘晓冬等.山东省农村老年人生命质量评价及影响因素分析[J].中国农村卫生事业管理,2008-8 ,8(28)
[4] 林江,杨继峰,刘强. 健康状态认知理论的概述[R]. 广西中医学院院报 2010,13(1):74-75
[5] 王生锋,齐玉梅.中等城市社区人群生命质量评价及影响因素调查[J].山西医药杂志,2008-10,10(37).
作者简介: