时间:2023-07-11 09:21:01
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇统计学变量类型范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
一、数据统计分析的内涵
数据分析是指运用一定的分析方法对数据进行处理,从而获得解决管理决策或营销研究问题所需信息的过程。所谓的数据统计分析就是运用统计学的方法对数据进行处理。在实际的市场调研工作中,数据统计分析能使我们挖掘出数据中隐藏的信息,并以恰当的形式表现出来,并最终指导决策的制定。
二、数据统计分析的原则
(1)科学性。科学方法的显著特征是数据的收集、分析和解释的客观性,数据统计分析作为市场调研的重要组成部分也要具有同其他科学方法一样的客观标准。(2)系统性。市场调研是一个周密策划、精心组织、科学实施,并由一系列工作环节、步骤、活动和成果组成的过程,而不是单个资料的记录、整理或分析活动。(3)针对性。就不同的数据统计分析方法而言,无论是基础的分析方法还是高级的分析方法,都会有它的适用领域和局限性。(4)趋势性。市场所处的环境是在不断的变化过程中的,我们要以一种发展的眼光看待问题。(5)实用性。市场调研说到底是为企业决策服务的,而数据统计分析也同样服务于此,在保证其专业性和科学性的同时也不能忽略其现实意义。
三、推论性统计分析方法
(1)方差分析。方差分析是检验多个总体均值是否相等的一种统计方法,它可以看作是t检验的一种扩展。它所研究的是分类型自变量对数值型因变量的影响,比如它们之间有没有关联性、关联性的程度等,所采用的方法就是通过检验各个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。(2)回归分析。在数据统计分析中,存在着大量的一种变量随着另一种变量的变化而变化的情况,这种对应的因果变化往往无法用精确的数学公式来描述,只有通过大量观察数据的统计工作才能找到他们之间的关系和规律,解决这一问题的常用方法是回归分析。回归分析是从定量的角度对观察数据进行分析、计算和归纳。
一、引言
数据对于当今天的商务活动具有重大的意义。数据是关于这个世界的事实,它能够说明问题、提示事实、隐含规律。一些商业机构正是通过“挖掘”数据来发现事物之间的关联性,并从中获取利润。如果人们躲避数据,就可能由于盲目接受他人对数据的概括总结而上当受骗,也可能完全依赖“感觉”来做决策,从而不利于做出正确的决策。因此,作为一门研究如何处理和分析数据的课程——统计学越来越受到各方重视。在高校中,绝大部分商科专业把统计学或商务统计作为专业必修课列入到人才培养方案中。如何学好、用好统计学成为当前许多人需要迫切解决的一个问题。美国著名的统计学家莱文(Levine)等在其撰写的统计学教科书中首次提出了DCOVA框架,用于指导学生或相关从业者如何有效学习和使用统计学。
二、基本术语
统计学是把数据转化为信息用于决策的方法或工具。例如,为了研究青年人喜欢网上购物的主要原因,可以通过调查来收集原始数据,再制作总结表来整理数据从中获得数据中隐藏的有用信息(最主要的原因是网上购物价格便宜),最后根据所获得的信息进行决策,即网店价格要比实体店便宜才能吸引青年消费者。从调查数据到总表结,就是把数据转化为信息的方法。统计方法是把数据转化信息的方法,包括统计描述方法和统计推断方法。统计描述方法主要包括收集、整理、可视化和概括数据;统计推断方法是指用样本数据得出总体结论,包括对总体参数的置信区间估计和假设检验。为了学习和使用统计学的方法,可以应用DCOVA框架。DCOVA框架包括定义数据(D)、收集数据(C)、整理数据(O)、可视化数据(V)和分析数据(A)等5个阶段(图1)。例如,为了研究一所高校学生的努力学习程度,根据DCOVA框架,首要定义数据,即找什么样的数据能够代表学生的努力学习程度,为此需要对努力学习程度开发一个可操作定义,比如用每天平均学习时长(小时)来代表一个学生的努力学习程度。其次要收集数据,可以通过问卷调查的形式收集数据。再次是整理和可视化数据,比如制作频数分布表来整理数据,从而可以查看学习时长的分布情况,制作直方图来可视化学习时长数据,从而直观形象地显现数据的分布特征,从中判断学习时长是否服从正态分布等。最后是分析数据,比如可以分析不同专业、不同性别、不同年级的学生每天学习时长均值的差异,或者估计全校学生每天平均学习时长等。DCOVA框架较好地囊括了统计学教学中主要的知识体系。
三、定义数据(D)
定义数据主要是解释收集什么数据的问题,它与一项研究的目的及其所涉及的变量相关。研究目标决定研究中所涉及的变量,相关变量决定需要收集的数据(图2)。在上述的例子中,研究目标是“研究一所高校学生的努力学习程度”,其中“努力学习程度”就是研究中需要涉及的变量。由于该变量没有直接的数据对应,需要开发一个相应的可操作定义——如每天平均学习时长,最后去收集学生每天平均学习时长的数据。
可操作定义指对所有与该分析相关的人而言很显明是普遍接受的定义,是对某个抽象变量的一种清晰、精确的表述,是对该变量意义的共同理解。努力学习程度是一个抽象变量,在收集數据时会遇到麻烦,因此需要一个可操作定义。每天平均学习时长可以作为努力学习程度的一个可操作定义,因为大家普遍认为一名学生在学习上花费的时间越多,说明该生学生越努力,并有每天平均学习时长是一种清晰、精确的表述,从而方便研究者收集相关的数据。
定义数据还包括确定所需数据的类型。数据是变量的取值,变量类型与其所对的数据类型一致。变量可以分为属性变量(如性别)和数值变量,数值变量又进一步区分为离散数值变量(如家庭人数)和连续数值变量(如身高)。相应的,数据可以分为属性数据(如男、女)和数值数据,数值数据又进一步区分为离散数值数据(如2人、3人)和连续数值数据(如1.75m、1.68m)。在SPSS中,变量的测量尺度(类型)分为名义(图标为三个小圈)和有序(图标为阶梯),这两类都属于属性数据;还有一类为标度(图标为尺子),这类属于数值数据。
四、收集数据(C)
在明确了需要什么数据的前提下,就需要进入收集数据阶段。收集数据(C)主要是解决数据的来源问题。数据的来源有原始数据来源和二手数据来源。原始数据来源主要通过调查、观察和实验获得数据;二手数据来源主要是指其他组织或个人已公布的数据。由于获得原始数据比较麻烦,所以二手数据是首选的数据来源。
在经济管理研究领域,原始数据来源主要依靠调查。由普查涉及面广、成本高、耗时长和难度大,所以一般不常用,对许多研究者来说,主要通过抽样调查来获得原始数据。因此,如何抽样就成了一个无法逃避的问题。调查数据的质量直接影响研究的价值,如果数据本身严重存在错误、偏见,不管采用什么数据分析方法,都很难得出可信的分析结果。为了从一种总体中找到一个样本,并对样本采集数据,首先要做的工作是抽样。不同的抽样方法生成不同的样本类型,如简单随机抽样方法生产简单随机样本,抽样方法与形成的样本类型一致。抽样方法分为非概率抽样和概率抽样两大类。非概率抽样包括便利抽样和判断抽样,其优点是便利、快速、低成本,可以用于前期或试探性分析,其缺点是样本的代表性一般较差,不能用于统计推断。概率抽样包括简单随机抽样、系统抽样、分层抽样和群抽样,其中简单随机抽样和系统抽样的优点是简单易行,但无法保证样本的代表性;分层抽样过程比较繁琐,但能够确保样本的代表性,并能对每个层进行分析,得出每层的结果;群抽样的优点是调查成本低,但有效性相对较差,需要增加样本容量才能达到其他抽样方法的效果。
五、整理数据(O)和可视化数据(V)
【中图分类号】 R 179 R 395.6 【文献标识码】 A 【文章编号】 1000-9817(2010)02-0214-03
伯恩斯(Burns)[1]认为:个体如何理解自己是其内在一致性的关键部分,自我概念积极的学生成就动机与学习投入及成绩也明显优于自我概念消极的学生。他还认为一定的经验对个人具有怎样的意义是由个人的自我概念决定的。不同的人可能会获得完全相同的经验,但对这种经验的解释却可能是高度不同的[2]。当个人的既有自我概念消极时,每一种经验都会被与消极的自我评定联系到一起;反之则可能被赋予积极的含义。在各种不同的情境中,人们对事情发生的期待、对于情境中其他人行为的解释及自己在情境中如何行为,都受到自我概念极大的影响。恋爱是当代大学生生活的中心内容之一。恋爱关系可以对青少年的发展产生正面影响,也可以产生负面影响而导致问题的产生。在整个青少年期的发展过程中,恋爱经验是不断变化的。本研究旨在考察已具有恋爱经验大学生的依恋模式及亲密关系心理对恋爱持续时间及恋爱次数的影响,以及依恋模式及亲密关系心理对自我概念发展的影响。
1 对象与方法
1.1 对象 2008年10-12月,由研究者在某师范院校中招募已有恋爱经验的大学生进行问卷调查。共发放问卷220份,回收有效问卷209份,回收有效率为95%。其中男生107名,女生102名;恋情持续时间为3个月以下者32名,3~6个月42名,6~12个月28名,12个月以上105名,有2人未报告;恋爱次数为1次94名,2次64名,3次及以上45名,有6人未报告恋爱次数。年龄为21~24岁,平均21岁。
1.2 工具
1.2.1 成人依恋问卷 由关系问卷中文版(RQ)和亲密关系经历量表组成。关系问卷包括4段短文,分别描述4种依恋类型,要求被试者从中选出一种最符合自己的依恋类型。亲密关系经历量表包括36题,其中18道题测量依恋回避,18道题测量依恋焦虑,为Likert 7点量表,计算其平均分作为维度得分。该量表被证明有很好的信度和效度[3]。本研究中2个分量表的内部一致性系数分别为0.82和0.77。
1.2.2 田纳西自我概念量表(Tennessee Self-Concept Scale,简称TSCS) 该量表由美国田纳西心理治疗医生Williams于1965年编制,台湾心理学家林邦杰于1978年进行了修订。研究表明,量表的Cronbach系数α=0.869 4 ,Spearman-Brown分半信度系数为0.965 6,且证明有很高的效度[4]。量表共有70道题,形成生理自我、道德自我、心理自我、家庭自我、社会自我、自我批评、自我认同、自我满意、自我行动和自我总分。除了自我批评得分越高说明其自我概念越低外,其余各项得分越高表示他越喜欢自己、信任自己,认为自己是个有价值的人。
1.3 数据分析 采用SPSS 16.0统计软件包对数据进行整理和分析。
2 结果
2.1 成人依恋类型和亲密关系经历 成人依恋问卷调查结果显示,恋爱学生的依恋类型为安全型90人(43.1%),轻视型49人(23.4%),倾注型42人(20.1%),害怕型28人(13.4%);亲密关系经历量表测量结果显示,依恋回避(3.74±0.34)分,依恋焦虑(3.87±0.56)分。
2.2 不同依恋类型对恋爱持续时间及恋爱次数的影响 比较恋爱持续时间分别为3个月以下、3~6个月、6~12个月及12个月以上。大学生依恋类型差异无统计学意义(χ2=12.56,P>0.05)。比较恋爱次数分别为1次、2次、3次及以上者,大学生依恋类型差异也无统计学意义(χ2=4.73,P>0.05)。
2.3 亲密关系经历量表、田纳西自我概念量表测评结果
2.3.1 不同恋爱持续时间、恋爱次数亲密关系经历量表和田纳西自我概念量表得分比较 以恋爱持续时间为自变量,对亲密关系经历量表、自我概念的各个因素得分进行方差分析,结果显示,恋爱持续时间不同的大学生依恋回避和依恋焦虑得分差异无统计学意义;在自我概念各维度得分上,除道德自我、家庭自我、自我满意、自我行动及自我总分上得分差异均有统计学意义(F值分别为3.14,2.91,4.29,2.87,3.76,P值均
2.3.2 不同性别大学生亲密关系经历量表、田纳西自我概念量表得分比较 以性别为自变量对亲密关系经历量表、自我概念的各个指标进行t检验,结果见表1。在亲密关系体验上,女性依恋焦虑高于男性,差异有统计学意义(t=4.81,P
2.3.3 不同依恋类型个体自我概念得分比较 以依恋类型作为自变量,以田纳西自我概念量表的各个指标作为因变量,进行单因素方差分析,除道德自我和自我批评外,不同依恋类型个体在田纳西自我概念各维度上的得分差异均有统计学意义(P值均
2.3.4 成人依恋和自我概念的相关分析 从表3中可以看出,依恋焦虑除与自我批评呈正相关外,与自我概念其他各维度均呈负相关;依恋回避与自我概念各维度间均无相关。
2.3.5 依恋类型和自我概念的回归分析 见表4。
以性别、恋爱次数、恋爱持续时间、依恋焦虑、依恋回避等5个分指标预测自我概念总分,进行逐步回归分析,结果见表4。
3 讨论
调查表明,拥有恋爱经历的大学生的依恋类型,安全型高于40%,而矛盾型(即倾注型)占20%;男生在依恋焦虑上的得分显著低于女生,而在依恋回避上不存在性别差异,与
李同归等[5]对成人的研究结果不一致。自我概念的整体情况男大学生在各项因子上的得分均高于女大学生,说明具有恋爱经验的男大学生与女大学生相比,更敢于承认自己的优点和长处,能够更好地接纳自己。这与以往的研究结果[6]不一致。可能与本研究关注的群体与以往研究不同有关,也可能反映了社会期望对有恋爱经验的男女自我概念的影响。
方差分析结果显示,不同依恋类型的大学生在自我概念各维度上,除在道德自我和自我批评维度得分差异无统计学意义外,其他各维度得分差异均有统计学意义,安全型被试的得分均高于其他3种非安全型的被试。这说明安全型被试对自己各方面的感受均好于非安全型的被试,更能认识自己、接纳自己、肯定自己的价值,并能以此采取积极的行为。
调查结果表明,依恋焦虑与自我概念各维度相关均有统计学意义。相对于依恋回避而言,依恋焦虑对自我概念有较好的预测性。此外,恋爱持续时间也能预测自我概念,恋爱持续时间越长自我概念总分越高,个体越喜欢自己、信任自己并认为自己是个有价值的人。
4 参考文献
[1] BURNS RB. The self-concept: Theory measurement,development and behavior. New York:Longman, 1982:58-76.
[2] 刘岸英. 自我概念的理论回顾及发展走向. 心理科学, 2004, 27(10):248-249.
[3] 李同归,加藤和生. 成人依恋的测量:亲密关系经历量表(ECR)中文.心理学报,2006,38(3):399 -406.
[4] 林邦杰.田纳西自我概念量表之修订.中国测验年刊(台湾),1980,27:71-78.
[5] 李同归,李楠欣,李敏. 成人依恋与社会支持及主观幸福感的关系.中国临床康复,2006, 10(46):47-49.
正确运用统计方法的前提是良好的实验设计。如果试验前没有良好的设计, 或者设计存在缺陷, 那么, 即使使用高级的计算机和复杂的统计方法处理数据, 也只能得到错误的结论。对于生物(医学)研究者来说, 统计问题咨询应该在一个研究项目开始之前, 而不是在研究数据出来以后。没有系统学习过生物(医学)统计学的许多实际工作者常常错误地认为统计分析是在试验完成后才考虑的问题, 而且不考虑研究目的、 资料类型以及统计方法的前提条件等有关统计方法选择的问题。需强调的是,实验设计、 资料搜集与整理分析是科学研究的三个紧密联系的阶段, 而良好的设计是顺利地进行实验和收集数据、 分析数据的先决条件, 希望通过运用统计方法的计算来弥补设计上的错误是不可能的, 也是有害的[1]。
1 统计分析步骤
统计方法的选择依赖于研究方案中的统计学设计。统计学设计是要求研究工作者, 根据研究目的规定研究因素, 选择观察指标, 确定研究对象的样本含量, 拟定研究的实施方法及数据收集、 整理和分析的模式, 以达到用最少的人力、 物力和时间, 获得可靠的结论。在实际工作中, 必须根据医学研究目的、 设计类型、 资料性质、 样本大小和分析过程中所遇到的各种实际情况等, 并结合专业方面的知识来恰当地选择和运用统计分析方法, 才能做出正确的、 符合实际的结论。在区分了研究资料的反应变量和解释变量的基础上, 数据的统计分析主要回答两个问题: 一是反应变量的差异是否可归因于分组因素或对比因素? 二是多个反应变量之间是否存在某种联系? 因此, 医学科研数据统计分析大致分以下4个步骤。
1.1 数据整理 主要进行数据质量的核查、 异常值的处理, 考察数据分布及变量转换等, 以及看数据是否符合特定统计方法所要求的条件。如计算均数和标准差要求数据基本上呈正态分布, 方差分析要求各组方差的差别不宜过大等。
1.2 统计描述 按分组因素或控制因素分组计算反应变量的基本统计量, 如均数、 百分率、 标准差、 标准误等, 得出资料的大致轮廓和进一步分析方向。结果的表达方式主要是统计图或统计表[2, 3]。
1.3 统计推断 选择和运用恰当的统计方法(见统计方法选择)作详细分析, 如均数间的差异比较进行t检验或方差分析、 反应变量间的相互关系进行相关分析、 反应变量与解释变量的依存关系拟合各类回归模型等等。各种假设检验得到的P值是下结论的主要依据[2-4]。
1.4 结果表达 将各种分析结果简单明了地表达出来, 为专业上的分析讨论提供统计学背景[4]。有条件的话, 前3个步骤应在计算机上借助统计软件完成。另外, 以上4个步骤只是一种粗略地划分, 对有些资料,统计描述即可得出较为明确的结论。对于随机分组的实验设计资料或随机抽样的调查资料, 一般可根据资料性质和分析目的找到恰当的统计方法。但对于对比性资料的分析, 往往需要同时用多种统计方法进行处理或拟合复杂的统计模型。
2 统计方法选择
生物(医学)科学研究从研究设计开始到数据的收集、 整理、 分析的全过程中, 统计学知识始终贯穿其中, 而统计分析方法的正确选择在数据处理中至关重要。在研究方案制定时选择何种统计分析方法取决于实验的目的、 不同的设计类型、 观察指标组成的资料性质和样本大小等。
在研究设计时, 统计方法的选择需考虑以下6个方面的问题: (1)看反应变量是单变量、 双变量还是多变量; (2)看单变量资料属于3种资料类型(计量、 计数及等级资料)中的哪一种; (3)看影响因素是单因素还是多因素; (4)看单样本、 两样本或多样本; (5)看是否是配对或配伍设计; (6)看是否满足检验方法所需的前提条件, 必要时可进行变量变换, 应用参数方法进行假设检验往往要求数据满足某些前提条件, 如两个独立样本比较t检验或多个独立样本比较的方差分析, 均要求方差齐性, 因此需要做方差齐性检验。如果要用正态分布法估计参考值范围, 首先要检验资料是否服从正态分布。在建立各种多重回归方程时, 常需检验变量间的多重共线性和残差分布的正态性。
不同的统计分析方法都有其各自的应用条件和适用范围。实际应用时, 必须根据研究目的、 资料的性质以及所要分析的具体内容等选择适当的统计分析方法, 切忌只关心P值的大小(是否
3 统计方法综合运用实例
例 根据2001年进行的大规模调查, 已知某地健康青年男子身高均数为168.34 cm, 体重均数为57.20 kg, 同年在该地应征男性青年中随机抽取120名男子, 测得其身高、 体重资料见表1, 试对该资料进行统计分析[1]。表1 120名应征男性青年的身高与体重资料
3.1 资料的分布特征和数字特征的统计描述 本例属于单样本双变量计量资料。对该资料进行统计分析时, 首先应对每一个变量的分布类型及其特征进行统计描述, 编制直方图或频数表, 计算相应的统计描述指标, 然后在此基础上选择和运用恰当的统计方法进行统计推断, 最后作出明确结论。
本例的身高、 体重频数分布情况见图1~2。由图1可直观看出, 身高的频数分布特征为: 所有数据分布在155~182之间; 数据主要集中在164~173之间, 共有73人, 占总人数的60.8%; 各组段的频数基本以168.5为中心呈对称分布。因此, 可认为身高近似服从正态分布。而体重的频数最多组段58~不在所有组段的中间位置, 各组段的频数以61为中心呈不对称分布(图2), 故可认为体重呈偏态分布。图1 120名应征男性青年身高的频数分布图表2给出了资料分布的数字特征: 均数(x)、 标准差(s)、 中位数(Md)、 四分位数间距(QR)和全距(R)。为了进一步说明各变量是否服从正态分布, 表2也同时给出了偏度系数 由表2可见, 身高的|ug1|和|ug2|均小于1.65, 故可认为身高服从正态分布(矩法正态性检验), 此结论与上述的直观结果相同, 也与图3的图示法结论相同(散点几乎都在一条直线上)。同理, 体重的|ug1|和|ug2|均大于1.65, 故可认为体重不服从正态分布, 此结论亦与上述的直观结果相同, 显然与图4的图示法结论也相同(散点不在一条直线上)。
由于身高近似服从正态分布, 且是大样本数据, 故可用样本均数168.84 cm代表身高的平均水平, 用样本标准差5.19 cm代表身高的个体差异, 用x±1.96 s来描述身高的95%散布范围, 即168.84±1.96×5.19=158.67~179.01 cm。由于体重不服从正态分布, 用中位数58.00 kg代表体重的平均水平, 用四分位数间距8.75 kg代表体重的个体差异, 用百分位数P2.5~P97.5描述体质量的95%参考值范围, 即49.03~80.77 kg。
3.2 参数的点估计与区间估计 身高的均数: =X=168.84 cm, SX=0.47 cm, 95% CI=167.90~169.78 cm 。体重的均数: =X=57.67 kg, SX=0.63 kg, 95%CI=56.44~58.90 cm。体质瘦弱(体重≤50 kg )检出率: =p=17/120=14.17%, SP=3.18%, 95%CI=7.93%~10.41% 。身高与体重的相关系数: =r=0.4040, Sr=0.0842, 95%CI=0.2423~0.5435。本例n=120, 属于大样本数据, 由样本均数分布规律可知, 虽然体重不是正态分布, 但在大样本时, 其样本均数近似服从正态分布, 故仍可用正态分布法进行总体均数的点估计与区间估计。相关系数也不服从正态分布, 故在计算ρ的95%CI时要进行反双曲正切函数转换。
3.3 假设检验 根据历史资料, 已知10年前该地健康青年男子身高均数为166.50 cm, 体重均数为55.20 kg, 可通过假设检验回答: 本次调查结果所代表的该地健康青年男子的身高总体均数、 体重的总体均数、 是否比10年前提高了。
本例属于大样本资料, 可用样本标准差作为总体标准差的估计值, 即身高标准差的估计值=S=5.19, 体重标准差的估计值=S=6.89, 分别进行单样本u检验: 身高: u=4.98, P
同理, 还可以对体质瘦弱检出率、 身高与体重的相关系数等作假设检验。
参考文献
[1] 陈长生. 统计方法的综合运用与统计结果的表达[A]. 徐勇勇. 医学统计学[M]. 2版. 北京: 高等教育出版社, 2004.
中图分类号:F713.55文献标识码:A文章编号:1001-8409(2013)01-0074-06
“生态消费”作为可持续消费、绿色消费、适度消费等术语的同义语,其所倡导的理念及行动准则已成为包括我国在内的世界各国和地区的核心政策目标,而实现这一目标在实践上的具体要求就是提高居民的生态消费水平。寻找一个真正有效的提高生态消费水平的办法,首先要做的基础工作是将消费者进行识别分类,研究哪些消费者更趋向于进行生态消费,并对各类消费者的社会人口统计学特征、心理学特征、社会价值观和环境价值观、家庭内部生活习惯等各方面特征加以对比分析,找出其差异性,才能有针对性地提出对策建议,有效地提高居民生态消费的整体水平。
一、文献回顾
学术界对生态消费的关注源于对环境主义者消费模式的研究,这一领域的研究主要是从消费者的环境和社会价值观、社会人口统计学特征及心理学变量等方面因素对消费模式的影响展开的[1,2]。长期以来,国内外许多学者从社会人口统计学特征对生态消费行为做过大量的研究,包括年龄、性别、收入、教育、职业等变量[3~5]。尽管研究所得出的结论不同,但社会人口统计学特征却是研究并识别生态消费者的重要变量之一[6]。已有的研究多侧重于对消费者生态消费行为的影响因素进行实证研究,而鲜有对生态消费者的识别及其特征进行系统研究。本文研究的主题是城市居民生态消费者的识别。利用对哈尔滨市居民的问卷调查获得的数据,本文分3个步骤开展研究:第一步,通过因子分析确定生态消费行为识别的依据;第二步,通过聚类分析对消费者进行分类并识别生态消费者;第三步,分别从社会人口统计学特征、社会和环境价值观、心理学特征3个方面分析不同类型消费者的特征。
二、数据来源
Prediction of lymph node metastasis with binary logistic regression in renal cell carcinoma ZHANG Xiao-nong,SHEN Jun, CHEN Peng.Yuehua Hospital of Yueyang,Yueyang 414014, China
【Abstract】 Objective To study the risk factors of lymph node metastasis of renal cell Carcinoma(RCC) and to set up a Logistic regression model.Methods The clinical data of 163 patients with renal cell carcinoma who underwent radical nephrectomy from July 2000 to July 2008 in Affiliated Tumor Hospital of Xinjiang Medicial University, were analyzed by univariate and binary Logistic regression.Results The incidence of lymph node metastasis was 20.9%. Univariate logistic analysis revealed that the tumor size,clinical stage, Fuhrman nuclear grade and anemia were all correlated with lymph node metastasis of RCC(P
【Key words】 Renal cell carcinoma; Lymph node metastasis; Risk factors; Regression analysis
肾细胞癌(RCC)在成人泌尿生殖系统肿瘤中发病率仅次于膀胱癌居第二位,且对放化疗、生物治疗不敏感,预后较差。肾癌的生物学行为多变,发生机制复杂且受到与患者和肿瘤相关因素的影响,目前不太容易对根治性肾切除术后患者的生存率进行准确预测。淋巴结转移是影响肾细胞癌预后的重要因素,而准确的淋巴结分期对肾细胞癌的治疗和预后评价尤为重要。本研究回顾性分析本院近9年163例肾细胞癌根治性切除术后的病理及临床资料,探讨肾细胞癌淋巴结转移的危险因素,研究预测肾细胞癌淋巴结转移的较为合适的方法和指标,并建立Logistic 回归模型。
1 资料与方法
1.1 一般资料 2000年2月~2008年10月,本院共行肾癌根治性切除术163例,所有的病例经病理组织学确诊。其中男105例,女58例;年龄17~79岁,中位数年龄55岁;肿瘤最大直径(CT)1.3~19.0 cm,中位数6.0 cm;根据2002年AJCC肾细胞癌分期标准,Ⅰ期77例,Ⅱ期31例,Ⅲ期43例,Ⅳ期12例;根据1982年Fuhrman核分级标准,G1 81 例,G2 46例,G3 22例,G4 14例;病理类型:透明细胞癌135例,颗粒细胞癌7例,混合细胞癌12例,状细胞癌7例,肉瘤样癌2例;肿瘤侧别:左侧84例,右侧79例;其中淋巴结转移34例。
1.2 方法 查阅病历资料,收集11项可能与肾细胞癌淋巴结转移相关的临床病理因素,如性别、年龄、肿瘤最大径、ECOG-PS、肿瘤侧别、肿瘤分期、病理类型、肿瘤分级、贫血、碱性磷酸酶和乳酸脱氢酶。以34例淋巴结转移者为研究组,以129例无淋巴结转移者为对照组。
1.3 统计学处理 统计学分析采用Logistic回归分析,以淋巴结是否转移为应变量(Y:无0,有1),对各研究指标进行量化,各自变量(研究指标)赋值标准,见表1。将量化数据输入计算机,应用SPSS 13.0统计软件包,进行Logistic回归分析。采用相对危险度的近似估计值比值比(odds ratio,OR)来估计各变量与RCC转移的联系强度。先用Logistic回归模型做单因素分析(α0.05),利用单因素分析得出的结果对不同因素的作用大小进行排序,以α0.05为入选变量的检验水准,以α0.1为剔除变量的检验水准,基于偏最大似然估计的前进法向前逐步选择自变量,再用Logistic回归模型多因素逐步回归分析,并得出RCC淋巴结转移的概率模型。
表1 RCC淋巴结转移因素(自变量)赋值标准
2 结果
2.1 单因素分析 把与163例RCC患者淋巴结转移有关的临床病理因素应用单因素的Logistic回归模型做单因素分析,结果见表2。其中肿瘤大小、临床分期、Fuhrman核分级和贫血的OR值均大于1,与RCC淋巴结转移的风险有关(P0.05)。
表2 肾细胞癌淋巴结转移影响因素的Logistic回归单因素分析(n163,α0.05)
2.2 多因素分析 利用表2的结果,将P值<0.05的自变量和临床认为对肾细胞癌淋巴结转移有关的病理类型X7(病理类型)也入选Logistic回归模型,基于偏最大似然估计的前进法向前逐步选择自变量,进行多因素逐步回归分析,其中肿瘤大小、临床分期和Fuhrman核分级对RCC淋巴结转移有显著回归效果而选入回归方程,结果见表3。但由单因素回归分析亦可知,P值<0.05的自变量X9(贫血)未能选入回归方程并不说明其对肾细胞癌淋巴结转移无统计学意义,而可能是由于其作用被已选入的变量代替,从而使回归模型中的自变量均保证具有统计学意义。自变量X7(病理类型)也未能进入方程,不能因此认为其与肾细胞癌淋巴结转移一定无关,如果增加样本含量,可能会出现有统计学意义的结果。
表3 肾细胞癌淋巴结转移影响因素的Logistic回归多因素分析(n163, α0.10)
2.3 概率模型 由多因素逐步回归分析结果,可得出肾细胞癌临床病理因素与淋巴结转移关系的概率模型,LogitP-8.199+0.603X3+1.840X6+0.976X8, 其中P值越接近于1,患者发生转移的可能性越大;P值越接近于0,患者发生转移的可能性越小。整个模型经χ2检验有统计学意义(χ281.601,P0.000)。
2.4 应用概率模型的回代分析 为检验该模型的实用性,163例RCC对概率模型进行回代分析,以预测概率0.500为判别函数的分界点。结果显示此概率模型判断163例RCC淋巴结转移与病理诊断总符合率为87.7%[(122+21)/163],结果见表4。
表4 RCC淋巴结转移概率模型回代分析*
注:*判别函数的分界值为0.5000
3 讨论
肾细胞癌是肾脏最常见的恶性肿瘤,占成人肾恶性肿瘤的85%~90%和人类恶性肿瘤的1%~2%[1]。大约25%~30%的肾细胞癌在初始诊断时伴有远处转移,局限性肾癌在根治性手术后大约1/3的患者最终会发生远处转移,而30%~40%的患者会有淋巴结转移[2]。目前对肿瘤患者可能出现的淋巴结转移进行预测是一个大的挑战,淋巴结转移是癌症扩散的首要迹象,因此,详细的术前影像学和准确的淋巴结分期对外科治疗计划和策略及术后随访十分重要,同时还能为患者提供预后有关的准确信息。
癌细胞淋巴结转移是影响肾细胞癌疗效和预后的重要因素。Blute等[3]通过多因素分析总结了RCC淋巴结转移的高危因素:(1)肿瘤临床分期T3或T4;(2)肿瘤最大径>10 cm;(3)肿瘤细胞为低分化;(4)肿瘤组织中含有肉瘤样成分;(5)肿瘤组织中有坏死。如果具有2个或以上危险因素淋巴结转移的几率为10%,如果低于2个危险因素淋巴结转移的几率仅为0.6%,如果5个危险因素均满足者淋巴结转移率达到50%。此外,远处转移和下腔静脉癌栓阳性等也是淋巴结转移的高危因素[4]。
对肾细胞癌淋巴结转移的临床病理指标进行分析,试图找出RCC预后的独立的临床病理指标,可以为临床选择更好的治疗方案,从而提高患者的术后生存率。通过对影响RCC淋巴结转移的可能临床病理因素进行系列研究,可以在众多的有关因素中筛选出具有显著性影响的因素,将作用有显著性意义的影响因素挑选出来后建立较为合适的回归方程,便于检查和分析,从而可能对RCC的淋巴结转移的诊断和治疗带来帮助。笔者对163例RCC患者的临床病例因素进行单因素Logistic回归分析,结果表明肿瘤大小、临床分期,Fuhrman核分级、贫血与RCC的淋巴结转移有关(P
本研究表明,肿瘤大小、临床分期和Fuhrman核分级是肾细胞癌淋巴结转移的危险因素,与Blute等的研究结果基本一致。根据临床病理参数建立的Logistic回归模型对RCC患者淋巴结转移的风险提供非常重要的信息,对于判断预后、指导术后治疗及随访方案的制订具有重要的作用。因为存在研究方法和研究指标的多样性,笔者选取的研究方法和研究指标也有其自身的局限性,需要更多的病例和更多研究者的参与,相信随着研究的不断深入,这一问题将会得到解决。
参 考 文 献
[1] Jemal A, Murray T, Ward E, et al. Cancer statistics, 2005. CA Cancer J Clin, 2005, 55:10-30.
[2] Motzer RJ, Bander NH, Nanus DM. Renal-cell carcinoma. N Engl J Med, 1996, 335(12):865-875.
Einstein College of Medicine
Biostatistics and
Epidemiology
A Primer for Health and
Biomedical Professionals
Third Edition
2004, 243pp.
Softcover $ 33.20
ISBN 0-387-40292-6
本书是由美国Albert Einstein医学院流行病学和群体健康系流行病学室Sylvia Wassertheil Smoller教授编著的。第一版于1990年出版,第二版于1995年出版,现为第三版。本书的特点是根据流行病学和统计学的基本框架,使读者理解流行病学与生物统计学的基本原理,理解“为什么做”和“做什么?”学会“如何做、如何解释”。书中的内容都是临床试验和基础研究中最常用的、或是在文献中经常引用的。
全书共分9章。第1章讲述科研方法问题,包括逻辑推理、变异、研究设计、变量的量化、无效假设、假设检验、检验错误的类型、显著性水平等;第2章叙述概率的一些基本概念;第3章介绍常用的统计学检验方法;第4章介绍流行病学的基本概念,包括流行病学的应用、常用指标、流行病学研究类型、偏倚、混杂、交互、多变量分析等;第5章介绍筛检的基本概念;第6章是叙述随机对照临床试验;第7章介绍生活质量的评价,包括量表的结构、可靠性、真实性、敏感性(反应性)以及用量表评价生活质量的局限性;第8章介绍遗传流行病学的基本概念,包括双生子研究、连锁和联系分析、传递不平衡检验等;第9章阐述科研伦理学与统计学的关系。第8、9两章的内容在人类研究中十分重要,是第三版新增加的,是一般流行病学或统计学入门书籍中所没有的。
书后附有9项附录,介绍正文中各种统计学计算的实例,以使读者能够更顺利阅读本书、以及如何实际计算,包括卡方、Z值及t-值的临界值表、Fisher精确检验、几组比较的Kruskal-Wallis非参数检验、相关系数计算、率的年龄调整、比值比的可信性、两个变量的“J”或“U”型关系、量表记分改变的适宜性(敏感性)评价、以及遗传学基本原理和知识。书后还附有参考文献及建议阅读的书目,读者如需了解更深入的、超出本书范围的内容、或涉及高等数学方面的内容,可阅读这些推荐的教科书。书末附有主题索引,便于读者检索。
本书以科学的哲学和逻辑学原理,讨论统计学检验的基本原理,而不是让读者去做具体的统计学检验。全书各章节都是独立的,读者可不按顺序阅读,只阅读感兴趣的部分。本书特别适合那些没有或很少有数学背景的读者,使他们能够读得懂、用得上。
本书内容既简明,又适合范围较广的读者需要,所阐述原理和方法适合多种领域,包括医学、公共卫生、心理学、教育学。本书是一本简明的流行病学与生物统计学教科书,适合从事临床和基础研究的医生、医学专业本科生、研究生,或非医学专业学生参考,也可供程度较高的读者、以及对生物统计学与流行病学的逻辑学和方法学感兴趣的研究人员参阅。
乌正赉,教授
上海是我国老年人口比例最高,人口老龄化发展速度较快的城市,早在1978年就跨入了老年型结构城市,与此相应的老年性疾病的预防与控制越来越受到社会的重视。肺炎球菌是引发肺炎、脑膜炎和中耳炎的主要病因,由于肺炎球菌对抗菌药物的耐药性增加,以及耐药菌株在世界范围内的传播,除使用疫苗预防外,目前尚无其他有效的公共干预措施[1]。上海市从1998年开始使用23价肺炎球菌疫苗(肺炎疫苗),但至今老年人群的接种率仍然很低。为做好老年人群中肺炎疫苗的接种工作,我们对长宁区社区老年人接种肺炎疫苗的影响因素进行了调查分析。
1对象与方法
1.1对象
以2004年1月1日至2005年12月31日在长宁区9个免疫门诊接种过肺炎疫苗的≥60岁老年人为接种组调查对象。共登记接种肺炎疫苗的老年人122人,实际调查100人,失访的主要原因为已搬迁、地址有误等。
以长宁区社区未接种过肺炎疫苗的≥60岁老年人为未接种组调查对象。2005年长宁区辖196个居委,依据按容量比例概率抽样(PPS抽样)的方法,根据每个居委老年人数的比例,抽取20个居委,每个居委调查20名老年人,共计400名老年人。
1.2方法
根据知情同意原则,由统一培训的调查员采用自拟的《老年人群肺炎疫苗知晓及接种情况调查表》入户调查,调查内容包括老年人一般情况、健康状况、对肺炎疫苗的认知、态度和利用等。
1.3统计分析
用Epidata 3.1建立数据库录入调查表数据,用SPSS 11.5进行χ2检验、方差分析和多因素Logistic回归分析。
2结果
2.1基本情况
2.1.1性别年龄接种组100名老年人中,男41名(41.0%),女59名(59.0%);未接种组400名老年人中,男163名(40.8%),女237名(59.2%),两组性别之间差异无统计学意义(χ2=0.002,P>0.05)。
所有被调查的老年人年龄为60~92岁,接种组平均年龄为(72.62±7.97)岁,未接种组平均年龄为(72.53±6.90)岁,两组年龄之间差异无统计学意义(F=0.01,P>0.05)。
2.1.2文化程度接种组文化程度以大专及以上(42.0%)、高中(24.0%)和初中(16.0%)为主,未接种组文化程度以初中(23.8%)、文盲半文盲(23.3%)和高中(19.3%)为主,两组文化程度之间的差异有统计学意义(χ2=43.13,P
2.1.3目前或退休前职业接种组职业以工人(25.0%)、科技人员(16.0%)和教育(12.0%)为主,未接种组职业以工人(55.5%)、企业管理人员(11.3%)和教育(6.5%)为主,两组职业之间的差异有统计学意义(χ2=54.97,P
2.1.4家庭类型两组老年人的家庭类型均以“和老伴生活在一起”为主,其次为“和子女或儿孙生活在一起”,“独居”和“其他类型”的构成比最小,两组家庭类型之间的差异无统计学意义(2.1.5家庭人均月收入接种组老年人家庭人均月收入≥1 000元的占91.0%,而未接种组为46.8%,两组家庭人均月收入之间的差异有统计学意义(2.2肺炎疫苗接种影响因素的多因素Logistic回归分析
以是否接种肺炎疫苗为应变量,以问卷中设计的10个影响因素为自变量,进行多因素Logistic逐步回归(变量进入方程的概率α= 0.05,变量从方程中剔除的概率β= 0. 1) 。应变量赋值情况:未接种肺炎疫苗为0;接种肺炎疫苗为1,自变量设置取值为“0、1”的哑变量。
影响老年人肺炎疫苗接种的因素按影响大小依次为是否接种过流感疫苗、是否患过肺炎或老慢支等呼吸系统疾病、家庭人均月收入、3个有关肺炎疫苗认知的问题和是否患有其他慢性病(表1)。
2.3未接种组老年人肺炎疫苗未种原因分析
在被问及“肺炎疫苗未种原因”时,400名未接种组老年人未种原因及构成比(%)依次为:不知道有这种疫苗的192人次(40.9%),目前不需要接种疫苗的172人次(36.7%),认为疫苗价格太贵了,不能承受的73人次(15.6%),不知道在哪里接种疫苗的14人次(3.0%),有禁忌证不能接种的7人次(1.5%),其他原因11人次(2.3%)。
3讨论
长宁区生命统计数据显示,2002―2004年,本区60岁及以上老年人的死因中分别有14.3%、14.8%和17.8%与肺炎有关,但是我区及上海市老年人群每年肺炎疫苗的接种率都不到1%。国外有研究结果表明,医务人员是影响肺炎疫苗接种的重要因素。Tammy等[2]总结1981―2000年有关肺炎球菌多糖疫苗的文献后发现,对医生而言,难于确定这种疫苗的作用,也缺乏有关疫苗重复接种的知识,是影响疫苗使用的主要因素;对病人而言,不知道有这种疫苗,医生没有告知这种疫苗是主要的影响因素。Nichol等[3]对1 874名医师进行了肺炎球菌疫苗的应用知识和态度的调查,发现多数医师缺乏对该疫苗重要性的认识,青霉素能有效控制肺炎球菌性疾病的观念仍普遍存在,而且许多国家并没有把肺炎疫苗作为公费医疗报销范畴成为影响肺炎疫苗接种的主要因素。
本研究显示,社区老年人接种肺炎疫苗受多个因素的影响。接种过流感疫苗的老年人可能会更多地从医护人员处了解到肺炎疫苗或受到医护人员的推荐而接种肺炎疫苗。在本次调查中也发现,接种组老年人有50%是从医务人员的途径获知肺炎疫苗的,医务人员对老年人接种疫苗起着至关重要的作用。
患过肺炎、老慢支等呼吸系统疾病的老年人可能更关注呼吸道疾病的预防而倾向于接种肺炎疫苗,目前尚患有其他慢性病如高血压、糖尿病与接种肺炎疫苗呈负相关,这部分老年人可能更关注于对其他慢性病的预防,或更多的医疗费用投入到其他慢性病的控制而不愿意接种肺炎疫苗。
由于目前上海市提供的进口肺炎疫苗的价格是进口流感疫苗的近3倍,且未纳入医保范围,因此家庭收入水平成为影响肺炎疫苗接种的因素之一。
对肺炎及肺炎疫苗的认知情况也是影响肺炎疫苗接种的重要因素。那些认为肺炎是老年人的一种常见病或认为目前的抗生素并不能有效根治肺炎、老慢支等的反复发作的老年人更倾向于接种肺炎疫苗来预防呼吸系统疾病。认为“儿童才需要打疫苗,包括肺炎疫苗,年纪大的人不需要接种疫苗”的老年人也不愿意接种肺炎疫苗。
在用户研究的领域里,我们已经有了较为科学的方法来获得需求域中的各类信息数据,而如何将这些信息数据转换成为我们所需要的设计要素则成为研究的重点和难点。用户的需求来源于人,而产品的功能赋之予物,我们需要找到一种方法来发掘这主客体之间的联系,定性定量分析毫无疑问是解决这一问题的必要方法。
二、统计学:定量与定性研究结合
与其他产品设计的单一研究方法不同,在用户研究中,定性与定量分析一般而言是相辅相成的,这样做很好地结合了两种分析各自的长处。定量分析能够发现某个存在的现象,具有很好的说服力和可信性,是对事物“量”的分析,主要通过数据收集和分析来完成。定性研究则可以发掘隐藏在现象底下的规律及原因,具有能够抓住本质的深刻性和高效性,是对事物“质”的分析,主要通过常识、感觉、经验等主观因素来参与分析。
在用户研究中可以直接获取的数据很少,因此定量分析没有施展的空间,并且对于一些感性问题,例如用户的需求、用户的感觉等同样也无能为力。定性分析则受主观因素影响较大,具有不确定性的特点。如何能够很好地发挥定量分析的可信度与定性分析的深刻度是我们所要解决的下一个问题,这里引入统计学的分析方法,将定量与定性分析结合起来。
三、用户研究中的统计学
统计学广泛运用于生物、化学、心理学、社会学、经济学等诸多领域。它被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。而它的这些用途特点非常适合集心理学、社会学、人类学等多门学科交融的用户研究,因此,我们可以通过引入统计学的方法,来对用户研究中获取的信息进行定量和定性分析,从而完成需求域到功能域的转化。
根据统计学的研究特点,我们将其在用户研究中的运用步骤分为信息获取、信息处理、数据分析、数据校验四个步骤。
1.信息获取
用户研究方法有很多,现大多已趋于成熟。我们在确定研究目的与目标的前提下,有意识地选择用户研究的方法,并且明确其输出的数据及形式,为今后的分析做准备。在用户研究中我们可以通过背景资料收集、问卷调查、用户观察、用户访谈、用户角色和用户情境等方法获得大量的文字数据、图像数据、问卷数据、实验数据和语音数据,这些数据都可以通过进一步的处理,转换成统计学中可以运用的数据形式。为了更好地进行下一步的分析研究,要根据用户研究对象的特点将这些信息分为用户基本数据、用户行为数据和用户主观数据。
基本数据主要是指对用户的性别、年龄、职业、收入、教育、地区、家庭结构、生活方式等量化后的数据;行为数据是指用户与产品的交互,即对于产品的使用及体验通过观察测试等方法提取的数据;主观数据是指用户对于产品的满意度、情绪反应、审美反应、生活态度等通过问卷访谈等方式获得的数据。由此我们便获得了计算所需的数据。
2.信息处理
上面我们已经论述了信息获取的方法及信息的分类和特点,但是这些信息的形式如文字、图像、问卷大多都不能直接用于统计学的分析,因此我们要对信息进行处理,也就是信息的量化。
(1)用户基本数据量化
基本数据都属于某种“品质”或“属性”,它们的量化方法可以使用取值为“1”或“0”的人工变量来表示是否存在,也就是对质的因素的判断。如“1”表示已婚,“0”表示未婚。同样有时本身是“数量”因素也可以转化成“质”因素,如“1”表示年收入5万到10万,“0”表示年收入5万以下。
(2)用户行为数据量化
用户行为数据可以通过试验器械的辅助,有计划的观察与测试来获得。主要是行为过程中存在的与衡量目标完成情况相关的变量。这些具体数据的情况与目标有着直接关系,通常可以直接获得具体数值。如时间、频率、数量、周期、步骤等。
(3)用户主观数据量化
用户主观数据主要通过对用户的问卷与访谈得到,是从用户的主观因素出发对用户体验进行量化。在这里,我们可以用数值来表示主观因素的程度,通过这种方法来量化这些主观的、抽象的、感性的信息。如满意程度可以由-3,-2,-1,0,1,2,3这7个数值表示,-3为最不满意,3为最满意。同理抽象感性词汇可以选择一对反义词作为两极,由负值到正值表示符合的程度。如传统和现代、圆润和尖锐等。
此外,为了消除数据计量单位不同的影响,便于数据的直接比较,要对数据进行标准化——使数据矩阵式中每列数据的平均值为0,方差为1;或者规格化——将每列的最大数据变为1,最小数据变为0,其余数据取值在0~1之间。
3.数据分析
在对数据进行必要的处理以后我们就要开始进行统计分析。为了便于介绍统计方法,我们先将处理好的数据分类。在统计学中根据变量数学性质的由低到高可将其划分为:定类数据、定序数据、定距数据和定比数据。定比数据使用较少,此处略。定类数据是一个分类体系,通常将研究对象属性分类后编号,其只能测量类别差。如华中、华北、华东等。定序数据多了类别间顺序等级的信息,可以测量次序差。如幼年、少年、青年、中年、壮年、老年等。定距数据不仅可以测量差别,还可以测算距离,如10秒、20秒、30秒等。
下面介绍在设计领域常会遇到的变量类型之间的关系测量以及相对应的方法类别,具体公式与计算方法可以参看相关统计学书目。
(1)双变量统计
两个变量之间关系的探讨在用户研究中是重要的内容。相关分析是解决这个问题最为常用的统计学方法。判断两个变量之间的关系主要从它们的相关程度、相关正负、相关类型等方面来看,在通常情况下为线性相关,可从相关系数中看出两个变量之间的关系。
①两个定类变量以及定类与定序变量之间的关系可使用相关分析中的λ和τy测量法。λ测量法可以是不分变量与自变量的对称形式。如丈夫购车标准与妻子购车标准之间的关系。τy测量法要求具有自变量与因变量之别,如性别与购车标准之间的关系。定类与定序变量关系也可用此两种系数,如收入水平与购车标准之间的关系。
②两个定序变量之间的关系可以使用Gamma系数和dY系数来表示。例如同等收入水平年龄与购车价格之间的关系。
③定类与定距、定序与定距可采用相关比率测量法。如性别与某手机功能操作次数之间的关系或是年龄与后者之间的关系。除此之外,也可以使用单因素方差分析。
变量之间除相关关系还可以用函数关系来表示,线性回归分析可以测量变量之间的线性关系,它是在研究过程中将一些因素作为所控制的变量(自变量),而另一些随机变量作为它们的因变量来进行分析的。一元线性回归可以用来解决双变量统计问题。
(2)多变量统计
在设计领域中研究的问题影响因素往往较为复杂,在双变量统计不能满足要求的时候我们就要用到多变量统计方法,主要有多元线性回归分析,Logistic回归分析、聚类分析、主成分分析、因子分析等。
①多元线性回归分析。研究在线性相关条件下,两个和两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式称为多元线性回归模型。它解决的问题是通过抽样调查的数据,确定自变量和因变量之间关系的密切程度;确定多个自变量对应变量的共同影响,比较各个自变量对因变量影响的大小;确定因变量和自变量之间的关系表达式,即回归方程式。如台灯外形表现现代感程度分别与其灯罩、灯颈、灯座造型、材质、色彩的关系,这种方法在感性工学研究中经常使用。
②Logistic回归分析。线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量),而不能是定性变量(定序变量、定类变量)。但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况。Logistic回归分析就是用于处理分类因变量的统计分析方法。其因变量只取两个值,表示一种决策、一种结果的两种可能性。如消费者是否购买产品与产品性能、外观、价格、
品牌等因素之间的关系。
③聚类分析。聚类分析是研究“物以类聚”的一种多元统计分析方法。聚类分析的基本思想是根据对象间的相关程度进行类别的聚合。例如可以通过测试者对于较多产品的评价运用聚类分析将产品分别归类。又如通过对消费者生活形态的研究将其分类,有针对性地进行产品开发。聚类分析可用树艺术与设计ˉ形图来表示结果。
④主成分分析。把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。例如在评价一个产品设计时,往往有很多因素,通过主成分分析可以用少数几个综合因素对其进行评价,减少工作量。
⑤因子分析。因子分析可以看成是主成分分析的一种推广。它的基本目的是,找出隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量(爱好、态度、能力)去解释显在变量(设计成功与否、销售量、点击率)。例如从众多人们显在的生活习惯中找到人们选择使用购买生活用品的潜在因子。这种方法可以应用在用户研究中的生活方式研究之中。
4.数据检验
切口感染为所有外科术后最常见并发症之一,当今社会无菌技术飞速发展及多种广谱抗生素的应用可以降低其发生率,但尽管如此切口感染发病率仍比其他术后并发症的发生率要高得多。术后切口感染严重影响病人的预后,对病人的术后康复引起严重的后果,而且还会给病人家庭增加巨大不必要的经济负担[1]。因此为了降低术后切口发病率,笔者通过回顾研究我院623例肝胆外科并发切口感染的病例,通过对比分析法总结其发生的因素及相对应的防范措施,现将具体情况总结如下。
1、资料与方法
1.1 一般资料 通过研究我院在2008年1月至2012年1月期间肝胆外科病例623例,其中男性399例,女性224例,年龄最大75岁,最小18岁,平均年龄55岁。623例患者实施的手术类型具体总结如下:肝移植,肝叶切除术,胰腺肿瘤切除术,胰十二指肠切除术,肝肿瘤切除术,胆总管探查引流术等。
1.2 方法 通过回顾分析研究我院在2008至2012年期间的切口感染病例,包括病人的病例,档案记录的查房单,病程单,辅助检查结果,切口分泌物实验室检查结果,并将其按不同发病原因统一记录于统计调查表中。
1.3统计学方法 应用SPSSl5.0软件分析,计数资料采用百分比表示,数据对比采取X2校验,P>0.05,差异无统计学意义,P
2、结 果
通过统计分析623例肝胆外科病人,术后发生切口感染的病例为123例,发病率为19.7%。通过具体的统计学方法χ2检验,发现能影响患者切口感染的确切因素有6个,分别为白细胞计数,手术时间长短,手术出血量,切口类型,医用碘伏消毒程度,术中广谱抗生素用量及种类。
2.1单因素Logistic回归分析
以肝胆外科手术患者有无手术部位切口感染为因变量,以性别、年龄、职业、文化程度、生源地、居住所在地、婚姻状况、经济状况、费用类别、居住状况、工作压力、经济压力、体型、手术季节、术前空腹血糖、术前糖化血红蛋白、术前血红蛋白量、术前血钠水平、术前血清高敏C反应蛋白含量、术前白细胞升高程度、ASA麻醉评分、围术期高血糖、手术时间、术中出血量、胃肠道营养、手术性质(急诊或者择期)、手术方式、手术室各区域布局、切口类型、手术切口长度、切口抗生素冲洗、是否放置引流、术后引流量、术后抗生素使用情况和基础疾病自变量赋值后进行二分类Logistic回归分析,结果发现手术室各区域布局合理、放置引流和抗生素切口冲洗是肝胆外科手术患者手术切口感染的保护因素,高龄、急诊手术、手术时间长、手术切口长和Ⅲ类切口是肝胆外科手术患者手术切口感染的危险因素。
2.2 多因素Logistic回归分析
以肝胆外科手术患者有无手术部位切口感染为因变量,选择本研究进入肝胆外科手术患者手术切口感染单因素Logistic回归分析方程的8个自变量为自变量进行多因素Logistic回归分析,α入=0.05,α出=0.10,结果发现放置引流和抗生素切口冲洗是肝胆外科手术患者手术切口感染的保护因素,高龄、急诊手术、手术时间长和Ⅲ类切口是肝胆外科手术患者手术切口感染的危险因素。
3、讨 论
肝胆外科术后切口感染的危险因素与其他外科切口感染有许多共同点也有其特殊之处,主要特点是其感染的危险因素涉及患者本身与外科医生的操作[3],具体危险因素及防范对策总结如下:
3.1 切口类型 肝胆外科术后切口感染主要原因是受腹腔内肠源性细菌感染,由统计学资料显示,Ⅲ型切口的感染率高达59.4%,但由于肝胆外科的特殊性,常常需要涉及到胆道切开,上消化道分离,肝小叶切除等Ⅱ,Ⅲ类型切口,且统计学显示这两种类型切口感染率均显著高于Ⅰ型切口,所有增加了其术后发生切口感染的概率。因此为了降低其感染率,需要外科医生在术前术后要做好无菌操作;仔细消毒切口;关闭腹腔前仔细冲洗腹腔,用碘伏反复消毒切口;术后放置腹腔引流且时刻保持引流管的畅通;选用抗生素需按照患者的引流液细菌实验室检查做相应的改变。
3.2 手术切口缝合 通过本次研究笔者还发现,切口的缝合好坏直接影响切口是否感染。由主刀医师等经验丰富的医师缝合的切口感染率显著低于实习医生等非主刀医师的缝合感染率。因此肝胆外科的切口感染与医生的缝合经验有密不可分的关系。所以外科医生在缝合切口时因注意减少死腔,争取一次性缝合,打结时松紧度适宜,严密缝合皮缘。
3.3 切口消毒及冲洗 作为所有外科手术,切口消毒都是一种非常简单却行之有效的一种规避切口感染的手段,经过外科长时间的发展,已经被医学界广泛认同,这也是无菌术提高的重要原因。最常用的冲洗液是无菌性生理盐水,用其冲洗切口可以洗净切口的细碎脂肪组织,灰尘,坏死组织的碎片等,可以显著降低切口的带菌量。切口的消毒肝胆外科广泛使用碘伏。碘伏是单质碘与聚乙烯吡咯酮的不定性复合物,医用碘伏浓度较低,其起着光谱杀菌的作用,对大多数细菌有杀灭作用,但其对蛋白质等不起损害作用,所以在医学界被广泛应用。经统计学资料显示,切口经过碘伏消毒可以明显降低其感染发生率。所以将无菌生理盐水与碘伏联合使用,是有效规避切口感染的重要手段。
3.4 术中失血量 由于肝胆外科手术入路的特殊性,肝脏等器官又是人体主要供血器官,所以术中出血极为多见。由于肝胆外科手术时间均长且操作复杂,所以病人可能会长时间的出去,经过大量输注晶体补充液和人工血液,导致组织器官血供不足,组织缺氧,似的组织发生坏死等,降低切口的愈合力,及免疫力,所以迅速精准的操作,对外科医生提出了更高的要求。所以在术前仔细检查,做出正确的手术方案是必不可少的。
综上所述,对肝胆外科术后切口感染的危险因素是多方面的,从笔者此次观察发现的几点危险因素,感染的发生除了与患者本身有关,但更多方面是关于外科医生的操作,因此为了降低术后切口感染的发生概率,需要外科医生严格实施无菌操作,注意细节,操作熟练迅速,最大程度的降低切口感染的发生概率。
参考文献:
[中图分类号] G451 [文献标识码] A [文章编号] 2095-3437(2013)15-0027-03
教师职业倦怠是教育研究中值得关注的一个问题。“教师是一个高压力的职业,社会赋予教师的高度期望、繁重的工作量、学生行为问题、学生考试成绩和课程与教学改革等都是教师压力的主要来源。”[1]“过高的工作压力和职业倦怠会导致教师工作绩效下降、缺勤、离职,对教师的身心健康造成不利影响,并对学生产生直接、消极的影响,甚至波及整个社会。”[2]教师职业倦怠也因此成为教师专业发展的阻力和教师职业生涯中的危机。
一、职业倦怠的概念界定
对于职业倦怠的概念,不同学者从不同的角度提出了不同的看法,概括起来,不外乎两大类,即侧重揭示职业倦怠最终状态的静态定义和侧重描述职业倦怠动态发展过程的动态定义。
(一)职业倦怠的静态定义
Maslach认为,“职业倦怠是指那些需要连续不断地与他人互动的人际服务业者在经历长期压力下的一种行为反应,它由情感衰竭(emotional exhaustion)、非人性化(depersonalization)和低个人成就感(reduced personal accomplishment)三个成分组成”。[3]
在众多职业倦怠静态定义中,得到学术界广泛认同的当属Maslach对职业倦怠的界定。由于Maslach及其同事所编制的职业倦怠量表――MBI的普遍使用,使这一定义成为目前最常用的职业倦怠标准化操作性定义。
(二)职业倦怠的动态定义
与Maslach不同,Cherniss则从职业倦怠动态发展过程的角度界定职业倦怠,并给出了职业倦怠的定义,这一定义属于职业倦怠的动态定义。Cherniss认为,“职业倦怠是个体面对工作疲劳(strain)在态度和行为上消极变化的过程,可分为三个阶段:第一阶段为资源和需求的不平衡,即压力阶段;第二阶段为即刻、短时的情绪紧张、疲劳和耗尽,即疲劳阶段;第三阶段包括一系列态度和行为的改变(如以疏离、机械的方式对待工作对象),即防御性应对(defensive coping)阶段”。[4]
职业倦怠的静态定义和动态定义并不是相互排斥的,相反,在一定意义上,两类定义是互补关系,动态定义所描述的是静态定义的前一个阶段,静态定义所描述的是动态定义的最后阶段。
Schaufeli和Enzmann在研究了职业倦怠的诸多定义之后,最为全面地概括了职业倦怠现象的本质:“职业倦怠是一般个体所经验的、一种与工作有关的持续、消极的心理状态,它主要以精疲力竭为基本特征。职业倦怠表现为负性压力(distress)、低效能感、动机下降以及态度和行为的消极改变。这一心理状况是逐渐形成的,但却在很长一段时间内不被个体所觉知。它起因于工作中目的与现实的互不协调。职业倦怠因其实质上是一种不适当的应对策略,往往会持续存在”。[5]这一定义首先将职业倦怠的诸多症状概括为一个核心特征――精疲力竭和四种一般表现,即负性压力、低效能感、动机下降以及态度和行为的消极改变。其次,它强调未能实现的目标和不适当的应对策略是职业倦怠产生的前提条件。最后,它指出职业倦怠是一个逐步发展的过程。显然,这一概念和其他诸多概念相比,明显的优势在于不仅描述了职业倦怠的一般症状表现、产生原因及发生范围,而且具体指出了职业倦怠的核心特征和四个常见的伴随特征。此外,该定义还强调了职业倦怠是一个逐渐发展的过程,并指出应对策略,在职业倦怠形成过程中具有重要的作用。
二、教师职业倦怠的影响因素
影响教师职业倦怠的因素众多,概括起来主要分为人口统计学变量、个性变量和组织变量三大类。
(一)人口统计学变量
已有研究考察的人口统计学变量主要包括年龄与工作经验、性别、学生级别、教育程度和婚姻状况等。这些变量也与职业倦怠或多或少存在一定的相关。例如,多数研究表明,教师的年龄和工作经验与职业倦怠呈负相关,所以,在教师职业生涯初期,容易出现职业倦怠;就性别而言,较为一致的结论是男教师的非人性化程度明显高于女教师;从学生级别来看,多数研究显示中学教师的职业倦怠程度要高于小学教师;有关婚姻状况与职业倦怠关系的研究出现两种结果:一种结果表明,已婚教师的职业倦怠水平低于未婚教师,而另一种结果则显示,结婚与否和职业倦怠的相关性并不显著。其他一些人口统计学变量,如教师职称、任教科目、学校级别等与教师职业倦怠的关系,较难取得一致结论。
总之,人口统计学变量与教师职业倦怠的相关性较低,研究结果也不十分一致,有些研究并未发现显著的相关关系,甚至还得出与多数研究相反的结论。由此可以看出,人口统计学变量虽然是影响教师职业倦怠的因素,但并不是主要的因素。
(二)个性因素
影响教师职业倦怠的个性因素主要有心理控制源、A型人格、大五人格、工作期望、应对策略、自我概念、自尊和自信、自我效能、人生意义等。通过对这些因素的研究,可以解释为什么在相同或相似的工作环境和压力下,个体经验的职业倦怠程度会有所不同。
研究表明,心理控制源是职业倦怠的有效预测变量,外控教师因其将事件和成就归因于他人或机遇,因而其职业倦怠程度要高于内控教师;A型人格的人由于个性争强好胜,具有时间紧迫感和充满成功的理想等特点,通常认为更容易产生职业倦怠;研究表明,大五人格中的神经质与职业倦怠的关系最为显著;个体对组织、工作以及自身过高的期望也会影响其职业倦怠程度,过高的期望会增加职业倦怠的程度;研究表明,个体的自我概念、自尊和自信都与职业倦怠呈显著的负相关;Leiter认为,职业倦怠是由于自我效能感出现危机所致,实证研究也证明了这一点;职业倦怠的存在主义理论认为,职业倦怠是由于个体在生活和工作中寻求存在意义的需要未能实现所致,有关人生意义与职业倦怠关系的量化研究也充分支持了这一观点。
三、组织因素
组织因素成为影响教师职业倦怠的原因是职业倦怠是一个与工作有关的概念。工作压力源以及其他组织水平上的变量是产生职业倦怠的可能原因,因此,这应该是我们重点关注的因素。
(一)学生问题行为
学生是教师工作的对象,学生的行为表现是影响教师压力和职业倦怠的重要因素。很多实证研究均表明,学生在课堂的问题行为、不遵守纪律、态度冷漠是教师主要的压力源,学生问题行为与教师职业倦怠呈正相关。Hoerr和West将学生问题行为分为两类:一类是一般问题行为,即较常见的、可以被教师预知的、经常出现的行为;另一类是危机问题行为。他们发现,学生一般问题行为与情感衰竭、非人性化存在高相关,而学生的危机问题行为则只与非人性化维度相关。Friedman的研究结果表明,学生的不尊重(指学生不尊重老师和其他同学)和不用心(指学生学习考试不及格)等学生问题行为会增加教师的职业倦怠感。
(二)学校文化
教师的主要工作场所是学校,所以学校文化也是影响教师职业倦怠的因素之一。Leithwood、Menzies、Jantzi等人认为,如果学校的目标明确,学校给予教师一个不断学习的环境,学校文化是合作、团结的,教师的职业倦怠水平就低;相反,在组织僵硬的学校里,教师的职业倦怠水平就高。因此,学校应形成一个团结、合作、不断学习和相互支持的良好氛围,学校管理应该人性化。
(三)工作负担
大量研究表明,合理的工作量有利于降低教师的职业倦怠水平,相反,工作超负荷则会提高教师的职业倦怠水平。工作超负荷有质和量两方面的含义。从量的方面来看,工作超负荷是指有过多的工作要求,而用太少的时间去完成任务。如繁重的备课、批改任务,过多的学生数量等。从质的方面来看,工作超负荷是指工作的复杂和困难程度大,例如学校要求教师的教学成绩要在本地区排名第一。
(四)教师的自
以往的实证研究显示,教师参与的自也是影响教师职业倦怠的一个重要因素。当教师在教学和学校管理等事务中拥有更大的参与自,教师的职业倦怠水平就低,而缺乏参与自会使教师的士气、自尊和工作满意度下降,进而提高职业倦怠水平。
(五)角色冲突和角色模糊
角色冲突和角色模糊也是影响教师职业倦怠的重要组织变量。当个体面对两种冲突情境而又被期望做出角色行为时,角色冲突就会出现。当个体对其职业的权利、义务和责任缺乏明晰、一致的认识而感到无法胜任工作,或者面对不断增加的复杂工作和较大的组织变革时,角色模糊就会产生。
大量的实证研究表明,角色冲突与情感衰竭、非人性化呈正相关,与个人成就感呈负相关,其中,角色模糊与个人成就感的关系最为密切。总之,角色冲突和角色模糊与教师职业倦怠都有较高的相关,但比较而言,角色冲突对教师职业倦怠的解释能力相对较强。
(六)社会支持
社会支持通常从来源和类型两个方面进行划分。依据来源,社会支持可分为校内支持(包括同事支持、校长支持等)和校外支持(包括学生支持、朋友支持、配偶支持等)。依据类型,社会支持可分为信息支持、实际支持和情感支持三类。
一般而言,社会支持作为个体的一种应对方式,良好的社会支持能有效降低教师职业倦怠的程度,但因社会支持的结构较为复杂,不同类型的社会支持对教师职业倦怠的影响有所不同。例如,多数实证研究结果显示,校内支持与教师职业倦怠的关系比较密切,其对教师职业倦怠各成分均有负向预测作用,而校外支持与教师职业倦怠的相关性并不显著;情感支持能有效降低情感衰竭、非人性化;实际支持可以增强教师的个人成就感;教师的时间支持高,则情感衰竭和非人性化程度低。
个别学者的研究甚至得出相反的结论。例如Burke和Greenglass的一项研究结果显示,社会支持对教师职业倦怠的影响并不显著。Byrne认为,这可能是由社会支持理论结构的多维性和统计方法的多样性造成的。
除以上因素之外,工作需求、工作资源、工作控制以及付出与回报不成比例等也是影响教师职业倦怠的因素。而在以上各组织因素中,学生的行为问题、角色冲突与角色模糊、教师的自主性、工作负担是教师压力的主要来源。
综上所述,与教师职业倦怠有关的因素主要有人口统计学变量、个性变量和组织变量三类。其中,人口统计学变量相对比较稳定,它们与教师职业倦怠虽有相关关系,但不与教师职业倦怠有因果联系。个性变量则比较主观、多变,它们对教师职业倦怠的影响也比人口统计学变量要大。组织因素是属于微系统或中系统层面,其与教师职业倦怠的相关程度也最高。
[ 参 考 文 献 ]
[1] 周晓晔,秦巍.中学教师职业压力调查分析[J].辽宁师范大学学报(社会科学版),2004,(3):69-71.
[2] Farber,B.A.Stress and burnout in the American teacher[M].San Francisco,CA:Jossey?鄄Bass,1991.
[3] Maslach,C.Burnout: A social psychological analysis.In J.W.Jone(Ed.),The burnout syndrome:Current research,theory,investigations[M].Park Ridge,IL:London House Press,1982.
[4] Cherniss,C..Professional bournout in human service organiz?鄄
ations[M].New York:Praeger,1980.