时间:2023-03-16 17:17:37
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇军事医学论文范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2013) 05-0067-03
医学统计学是一门以统计学原理和方法为基础,探索医学科研工作中遇到的有关数据的收集、整理和分析方法的应用科学,又可被看成一个收集信息、处理信息、分析信息,进而从中提炼和总结分析出新的信息的过程[1]。随着医学科研水平和医疗技术水平的不断提高,医学科研和临床实际工作中,人们对待科学的态度逐渐从原来的“经验主义”转变为“论据先行原则”,无论是在一些医学相关学科的基础实验中,还是在一些临床疾病的诊治等工作中,人们遇到问题时不再“想当然”,而是首先考虑为什么,有何依据,而这些依据大多需要通过统计学中的信息收集、整理、分析来提供。因此,医学统计学在医学工作中的地位越来越重要,统计学应用的正确与否直接影响着医学科研结论的科学性、严谨性和可靠性,具体到医学期刊方面,就会出现因统计学应用不恰当而导致医学期刊不严谨、不科学、不可靠和不具有影响力[2]。鉴于医学统计学在医学期刊中的重要地位,作者结合《肿瘤基础与临床》杂志2011年的240篇文章中出现的统计学问题,对目前我国医学期刊中常见的统计学问题进行分析,同时提出一定的解决方案,为医学编辑工作能力的提高以及医学期刊整体水平的上升提供一定帮助。
1 医学期刊中常见统计学问题
统计学的误用、错用和不用问题广泛存在于许多医学期刊中,统计学错误率处于较高水平,有文献报道期刊论文统计学错误率为38%—80%,而且统计学问题的种类几乎涉及统计学的每个方面,包括实验设计不合理、未进行统计学处理、统计分析软件未介绍或介绍不清、统计学数据的描述方法不当、统计学方法的描述不清或错用、统计值或P值不全或描述不清、统计学结果分析或描述错误等[3-4]。王倩等[5]对5种“中华”系列杂志刊登的文章的统计学应用进行回顾性分析,发现1985年统计学方法应用的错误率占24%,1995年占36%。沈进等[6]选取8种医学期刊,分析发表于1998年至2005年的544篇论著文章的统计学方法应用情况,结果显示,136篇的统计学出现明显错误,错误率达到25%,其中以资料处理方法不当所占比例最高,达到61.76%,其次为图表错误、未作统计学处理等。我刊2011年刊登的240篇论文中,排除个案报道、教学论文、棕色行论文36篇,剩余的204篇论文中有126篇论文采用了统计学处理,占61.76%(126/204),现结合本刊统计学应用现状针对医学期刊中常见的统计学问题进行分类分析如下。
1.1 统计研究设计不合理问题
大多数非统计学专业的学者在进行统计研究设计(包括实验设计、调查设计、临床试验设计)时仅仅从本专业的角度考虑,根据主观想要得到的结果进行分组设计,而完全没有考虑该实验设计的可行性、组间数据是否具有可比性等问题,主要表现在实验设计时不遵循随机化原则、未设置对照或对照不合理、均衡性原则贯彻不彻底等[7]。常见的统计研究设计不合理问题包括缺少对照或对照不合理、单因素设计取代多因素设计、样本量选择不具有代表性或样本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鳞状细胞癌组织中的表达及意义》一文,在实验分组设计时未对各组间数据是否具有可比性进行统计学分析。
1.2 未进行统计学处理问题
许多医学期刊论文虽然也进行了分组设计、设立对照等,但是文中未说明采用何种统计方法,也未对这些数据进行统计学处理,仅仅通过对实验所得的实际数据的直观判断就得出结论[9]。例如,本刊《肺尖癌26例疗效分析》一文中,作者在分析不同治疗方法对肺尖癌的疗效时并未采用任何统计方法,而是直接得出了“综合治疗较单纯治疗更能延长肺尖癌患者生存期”的结论,这不符合现代医学科研的结论需有据而立的原则。
1.3 统计方法的描述不具体或错用问题
1.3.1 统计方法的描述不具体
一些医学期刊论文中列出的统计方法过于简单,甚至未列出,主要有以下几种情况[10-12]:在“材料与方法”部分中的“统计学处理”中未列出所用的统计学软件或仅列出所用软件而未说明所用软件的版本;对于何种数据采用何种统计方法仅笼统描述,未具体列出文中的那些数据应该用何统计方法;对于定量数据仅列出采取t检验或方差分析,而未列出是否进行正态性检验和方差齐性检验;对于两组定量数据无论是应该采用成组设计t检验还是配对设计t检验,均仅描述为“两组定量数据比较采用t检验”;对于两组或多组定性数据的比较,无论是仅需用 2检验,还是需要采用矫正 2检验或 2分割检验,均描述为“两组或多组定性数据的比较采用 2检验”;统计学符号书写不规范,例如,根据GB/T3358-82,F检验、P值、 2检验、t检验等中的字母应为斜体,不符合上述规定的书写均为错误情况,这在论文中非常普遍;未列出检验水准 ,检验水准 是事先设定的判断小概率实践的标准,实际意义是允许犯假阳性错误概率的最大值,需要根据不同的研究目的进行设定。例如,本刊《 -连环蛋白和层粘连蛋白的表达与垂体腺瘤侵袭性的关系》一文在“统计学处理”仅说明数据的比较采用t检验,而未说明t检验的类型。
1.3.2 统计方法的错用
一些医学期刊论文中的统计方法的应用存在明显的错误。对于所有定量数据,常见的错误有[13-14]:无论是否符合正态分布、是否方差齐,一律盲目应用t检验或单因素方差分析等参数检验方法进行比较分析;无论数据分为几组,一律采用t检验进行比较分析,把其当做定量数据比较的万能工具;无论各组数据是何关系,一律采用成组设计t检验或单因素方差分析。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,定量数据进行比较分析之前未说明是否进行了方差齐性检验和正态性检验。对于所有定性数据,常见的错误有:把 2检验当做所有定性数据的万能统计工具,忽略了其应用的前提条件是, 2检验适用于正态分布的定性数据,且样本量最好>40,列联表数据进行 2检验时不能有1/5以上的格子其理论频数
1.4 统计结果的描述及分析错误问题
许多医学期刊论文中均可见到统计结果的描述或分析错误,常见的有以下几种[15-17]:1)对于定量数据应当根据是否符合正态分布而采用不同的描述方法,符合者一般采用“均数±标准差”或“均数±标准误”表示,而不符合者则采用中位数和四分位间距来进行表示,不按上述规定进行描述者均属于错误描述;2)对于定性数据,常见的错误是构成比和百分率不分,计算率或构成比等相对数的样本量过小;3)解释有统计学意义时仅根据P值的大小得出相应结论,例如对于A、B组2组的疗效(假定A组疗效优于B组),其“P
1.5 统计值和(或)P值描述不清以及统计值缺失问题
许多医学期刊对统计结果进行描述时,通常不能完整清晰地描述出统计值和P值,常见的有以下几种情况[18-19]:统计结果仅用“P0.05”得出结论,缺少相应的统计值;统计结果包括统计值,但是P值仅写出“0.05”,未列出具体的P值;仅列出具体的P值,而统计值缺失,上述几种情况均不利于文献阅读者进行数据验证和meta分析。例如,本刊《同步放化疗治疗局部晚期食管癌临床观察》一文中,所有统计结果均仅列出了“P0.05”,未列出具体的统计值和P值。
2 针对医学期刊中常见统计学错误的解决对策
目前,医学期刊论文的统计学问题已经成为衡量论文质量高低的重要标准,统计学的错误可能会导致论文学术水平和学术质量的降低,甚至有可能导致严重的后果。近年来,随着广大医学科研工作者和医学期刊编辑及审稿专家对医学统计学应用的重视,医学期刊论文中的统计学问题已经明显减少,但仍然处于较高的水平,这可能与以下几点有关[20-22]:论文作者、编辑及审稿专家思想上不够重视论文统计学应用;期刊编辑的统计学应用知识匮乏;选择审稿专家只注重其专业领域内的影响力,而未关注其统计学应用水平。因此,要想提高医学期刊的统计学应用水平,从而更进一步提高期刊总体质量,需要做到以下几点:作为医学期刊编辑,必须不断进行统计学相关知识的学习,例如参加相关培训班、旁听医学院校的统计学课程及请教统计方面的专家等,以提高自身的统计学应用水平,并从思想上重视统计学应用的审查,在给新投稿件的作者的初步意见中就强调统计学应用的重要性,规定一旦统计学有问题,论文可随时退稿;聘请医学统计学专家进入期刊编委会,负责所有论文的统计学审稿;应通过各种途径,向广大科研工作者宣讲统计学在医学科研工作中的重要性,使其养成良好的正确应用统计学的习惯;在科研课题设计过程中要求有统计学相关专家的参与;科技期刊中增加统计学应用栏目,刊登与本刊论文关系密切的统计学方法,或者刊登一些常见的统计学错误,与作者或读者交流,提高其统计学应用能力。
注 释
[1]孙振球.医学统计学(第3版)[M].北京:人民卫生出版社,2010:1-8
[2]胡良平,郭秀花,刘惠刚.医学统计学是评价医学科技论文质量优劣的重要依据[J].中华口腔医学杂志,2011,36(3):229-232
[3][8]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003:4
[4] Garc韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13
[5]王倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现状[J].中华医学杂志,1998,78(3):230-233
[6]沈进,苟莉,汤洁,等.生物医学期刊中统计学方法应用情况分析[J].中国修复重建外科杂志,2007,21(5):541-543
[7] [15]王晓瑜,王雅琢.《山东医药》论文中统计学错误分析[J].中国科技信息,2010(16):193-194
[8][9][10][20]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5):116-118
[11] 冉明会,罗萍,邓丹.医学期刊编辑应注意的几个统计学处理问题[J].编辑学报,2009,21(6):503-505
[12][16][18]李霞,张印朋,闫苏平.医学期刊作者来稿统计学应用与表述常见问题分析[J].中国科技期刊研究,2011,22(1):88-89
[13] 王晓瑜,王雅琢,封艳辉,等.医学期刊投稿常见统计学问题分析[J].科技与出版,2011(11):42-44
[14] 金永勤,王维.医学期刊编辑应重视统计学中的几个问题[J].编辑学报,2009,21(1):33-34
[17]张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析[J].郑州大学学报(医学版),2002,37(3):338-340
[19]叶亮,李伟东,范欣生.医学论文中常见的统计学应用问题辨析[J].南京中医药大学学报(社会科学版),2011,12(4):247-248
[中图分类号] R193.2 [文献标识码]B [文章编号]1674-4721(2010)04(c)-145-02
是医学专业技术人员交流学术经验、传播医学知识、推广科研成果的主要方式,也是评审职称、取得学位的必备条件之一,但在非法期刊上发表的论文不被认可,评职称也无效。为防止在非法医学期刊上发表无效论文,笔者根据多年从事医学论文写作的经验,结合有关期刊出版法律、法规及政策,将合法期刊、非法期刊的特征进行总结,并简要阐述非法医学期刊的识别方法。
1 期刊的概念
期刊又称杂志,是指有固定名称,用卷、期或者年、季、月顺序编号,按照一定周期出版的成册连续出版物。根据发行范围不同,将期刊分为正式期刊和非正式期刊。正式期刊是指经国家新闻出版总署批准,领取期刊出版许可证,持有国内统一连续出版物号,由期刊出版单位(期刊社,不设期刊社的为编辑部)出版、公开发行的期刊。非正式期刊(又称内部期刊)是指经所在地、省级新闻出版局审批,领取内部报刊准印证后印刷供内部交流用的连续性内部资料出版物。正式期刊和非正式期刊都是合法期刊[1]。
2 正式期刊的特征
正式期刊装帧精致,编排规范,字迹清楚,谬误极少,其论文质量也相对较高。在封底或版权页上刊载有期刊名称、主管单位、主办单位、出版单位、印刷单位、发行单位、出版日期、总编辑(主编)姓名、发行范围、定价、国内刊号、广告经营许可证号等记录,通过邮局发行的还印有邮发代号,国内外公开发行的期刊同时印有国际刊号。期刊出版单位和主办单位必须在同一行政区域[2]。
3 正式期刊的刊号
正式期刊的刊号即中国标准连续出版物号(简称中国标准刊号)包括国内统一连续出版物号(简称国内刊号即CN号)和国际标准连续出版物号(International Standard Serial Number-ISSN,简称国际刊号即ISSN号),前者可以单独使用,后者则不能[3]。
国内刊号是新闻出版行政部门分配给连续出版物的代号,由前缀“CN”和6位数字及分类号组成,CN与数字之间空一个字距,6位数字的前2位与后4位之间用连字符“-”隔开,其结构格式为CN XX-YYYY/ZZ。其中“CN”为中国的国名代码,前2位数字为地区代码,后4位数字为地区期刊的序号。各省、自治区、直辖市期刊的顺序号从1 000~5 999。分类号用以说明期刊所属的主要学科范畴,用“/”与顺序号隔开。分类号按《中国图书馆分类法(第4版)》的基本大类给出[4],医药卫生分类号为R,生物科学为Q。
获得国内刊号的期刊,向ISSN中国国家中心申请可以得到一个国际刊号,其结构格式为ISSN XXXX-XXXX。一个国际刊号是由以“ISSN”为前缀的8位阿拉伯数字组成,ISSN与8位阿拉伯数字之间空一个字距,8位数字平均分成两段,两段之间以一个连字符号“-”隔开。其中前7位为单纯的数字序号,无特殊意义,最后一位为计算机校验码,前7位数字依次以8~2为加权之和除以模11,再以模11减去余数所得差值就是第8位校验码。如余数为10,则校验码以大写字母“X”表示,如余数为0,则校验码以“0”表示[5]。
4 非法医学期刊的特征
非法医学期刊刊名常常冠以“世界”、“中国”、“中华”、“当代”、“现代”等响亮的牌子,主办单位尽是“中国XX研究院”、“中国XX研究中心”、“世界XX学会”、“中国XX学会”等一些很“权威”的单位,有的还在封面上印有“国际XX核心期刊”、“中国XX核心期刊”、“XX统计源期刊”,往往自称是国家级、中央级刊物,但没有明确的主管单位,出版单位、主办单位、编辑部和承印单位常常不在一个行政区域,一般都没有准确详细的通信地址,所刊文章质量不高,错谬较多,编排格式也不符合正规期刊的规范化和标准化要求。
5 非法医学期刊的主要表现形式
5.1 杜撰中国标准刊号
如《中国当代医学》杂志[6],国际刊号是ISSN 1810-8755,国内刊号是CN 43-8232/R。按照前文所述方法计算出来的校验码为10,以大写字母“X”表示,而不是“5”,显然国际刊号为杜撰。国内刊号CN 43-8232中的序号8232也不在1 000~5 999之间,也属杜撰。这类期刊以杜撰国内刊号为多见,主要是在香港、澳门地区登记,擅自拿到大陆进行出版发行的境外期刊。
5.2 境外期刊在境内非法出版
香港、澳门地区可以直接向ISSN国际中心注册获得国际刊号。一些出版业者在港、澳地区虚设公司或出版机构,冒充该地区出版物,向ISSN国际中心骗取国际刊号,然后杜撰一个国内刊号就拿到大陆出版发行。如《中华现代全科医学杂志》国际刊号ISSN 1680-6344没有问题,但国内刊号CN 29-3227/R中的地区号“29”不存在,显然是杜撰的[7]。
5.3 假冒正式期刊的非法期刊
假冒的非法期刊刊名与被假冒的正式期刊相同,装帧也相似,但与同名的正式期刊相对照,可以看出假冒期刊的刊号、主办单位、编辑部、主编、联系方式、地址等信息与被假冒的正式期刊不同。例如《中国医药》(ISSN 1608-3776)就是假冒中华医学会主办的《中国医药》(ISSN 1673-4777)。
5.4 内部期刊“越位”
内部期刊只能在境内按照指定的范围发行,不得在社会上发行、陈列,不得标明定价或工本费进行销售。如果内部期刊打着公开发行的旗号搞有偿发表,向作者收取版面费,就由合法期刊嬗变成非法期刊了。
5.5 用ISBN号冒充ISSN号
ISBN(International Standard Book Number)是国际标准书号,而非期刊号。例如:《儿科继续教育》就是由于没有申请到ISSN号和CN号,而临时用书号(ISBN)出版的试刊号。所以《儿科继续教育》目前只是一本书而已,还不是真正意义上的期刊,也只能出一期试刊号,以后想继续出版,就必须等申请到ISSN和CN号[8]。
5.6 一个刊号出版不同版本的期刊
这类非法期刊主要是一些科普期刊另外办的学术版。例如《健康大视野》就用同一刊号办了“医药学术版”、“医学分册”、“医药保健”、“医疗卫生版”、“医术人生”、“医药卫生”多个学术版。在这些科普期刊的学术版上发表的论文当然不被认可。一个国内刊号只能对应出版一种期刊,不得用同一国内刊号出版不同版本的期刊。出版不同版本的期刊,须按创办新期刊办理审批手续[9]。
5.7 正式期刊制造的非法期刊
正式期刊经省级新闻出版行政部门审批取得一次性增刊许可证后1年可出版两期“增刊”。 增刊内容必须符合正刊的业务范围,开本、发行范围必须与正刊一致,除在封底或版权页上刊载与正刊相同的版本记录外还必须刊印增刊许可证编号,并在封面刊印正刊名称和注明“增刊”。未经批准擅自编发的增刊、专刊、论文集以及一年超过两期的增刊和擅自增加页码的增刊都属于非法期刊。
6 非法医学期刊的识别
6.1 直观判断
根据前文所述的非法医学期刊特征就可以初步判断。
6.2 通过中国标准刊号识别
①先看国际刊号结构格式是否正确,再计算出第8位校验码,只要格式或校验码错误就可以判断是非法期刊。如果格式和校验码都正确就只有通过上网进入ISSN中国国家中心查询,能在该中心查到国际刊号的可以肯定是合法期刊。②根据国内刊号可以把大部分非法期刊识别出来。先看有无国内刊号、国内刊号是否唯一、结构格式是否正确;再看地区号是否存在:凡地区号65,以及在16~20、38~40、47~49、55~60之间的都不存在;再看序号是否在规定的范围内:期刊的序号除北京地区在1 000~5 999之间外,其他地区一律在1 000~1 999之间,序号不在此规定范围的期刊肯定是非法期刊;最后看分类号是否正确:医药卫生类期刊的分类号为R,否则就是非法医学期刊。
6.3 通过期刊目录查询
如中国科技信息研究所从公开发行的科技期刊中遴选出的“中国科技论文统计源期刊(中国科技核心期刊概览)”;北京大学图书馆与北京地区高校图书馆期刊工作研究会共同主持编制的“中文核心期刊要目总览”;国家新闻出版总署从全国8135种正式出版的期刊中评选出1 500多种期刊组成的“期刊方阵”。能从以上3种主要期刊目录里查到的期刊可以肯定是正式期刊,但查不到的需要用其他方法进一步识别[10]。
6.4 通过数据库查询
目前国内主要有六大学术期刊数据库:①清华大学中国知网的《中国学术期刊(光盘版)》中国期刊全文数据库;②中国医学科学院医学信息研究所开发研制的中国生物医学文献数据库(CBMDISC);③中国人民医学图书馆数据库研究部研制开发的中文生物医学期刊数据库(CMCC);④科技部中国科技信息研究所建立的中国科技论文统计源期刊(中国科技核心期刊)与中国科技论文与引文数据库;⑤万方数据股份有限公司研制的万方数据-数字化期刊全文数据库;⑥维普资讯网的中文科技期刊数据库。值得注意的是,有的数据库仍有收录非法医学期刊的现象,如中文科技期刊数据库就收录有《中国当代医学》杂志,中国期刊全文数据库和数字化期刊全文数据库均收录了用《中外健康文摘》同一刊号(ISSN 1672-5085,CN 11-5062/R)出版的多个“学术版”。
6.5 通过有关网站查询
①中国邮政报刊订阅网(网址为bk.省略/)。登陆该网站后,可以根据期刊名称、出版单位、邮发代号、刊号进行检索。能检索出来的,肯定是正式期刊,但自办发行的正式期刊检索不出。②国家新闻出版总署网站(网址为gapp.省略/)。登录该网站后在网页右边“新闻机构查询”栏目中媒体名称处输入想要查询的期刊全名,媒体类别选择“期刊”,点击“搜索”按钮进行查询,凡是能查到国内刊号的都是正式期刊。③中国记者网(网址:press.gapp.省略/)。在该网站页面左中上部“媒体查询”栏目中媒体名称处输入想要查询的期刊全名,类别选择“期刊”,点击“确定”即可。
6.6 向新闻出版部门电话查询
用以上5种方法应该可以把绝大部分非法医学期刊识别出来,最后仍不能识别的期刊再向国家新闻出版总署或当地新闻出版部门电话询问核实。新闻出版总署报刊出版管理司的电话是010-65212787或65212785。
[参考文献]
[1]杨颖.期刊、合法期刊、非法期刊的概念[N].中国新闻出版报,2007-02-12(2).
[2]新闻出版总署.期刊出版管理规定[N].中国新闻出版报,2005-10-17(3).
[3]中华人民共和国国家质量监督检验检疫总局,中国标准连续出版物号[S].2001.
[4]邢春怡, 高艳艳, 邢伟娜.中国标准刊号的识别与应用[J].医学情报工作,2005,26(1):68.
[5]中国图书馆分类法编辑委员会.中国图书馆分类法[M].北京:北京图书馆出版社,1999.
[6]陈图文.非法期刊的主要特征及其判断方法[J].科技情报开发与经济,2005, 15(7):86.
[7]安秀敏.“另类期刊”调查[J].出版经济,2004,5(11):78 .
[8]李贵存,江澜,杨锡强. 期刊刊号的标识及其真伪辨[J].中华儿科杂志,2006,44(1):6.
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。