时间:2023-04-03 10:01:11
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇测算方法论文范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
计算机软件安全检测主要是进行计算机软件漏洞的检测,计算机软件漏洞的检测主要针对软件可能存在的缺陷且该缺陷有可能导致软件在应用中存在一定的风险。由于软件安全检测对于软件开发工作是极为重要的过程,对软件安全检测工作也是需要相应地高度重视。
1 计算机软件安全检测
计算机软件安全检测是利用运行程序的方式来发现软件编写过程中存在的一些漏洞并对漏洞进行修改的过程,从而对计算机软件本身可能存在的风险进行有效地避免和改正,软件安全检测是软件开发中及其重要的一环。软件安全检测所需要达到的目标是用更少的测试过程来实现更大的软件安全覆盖面,达到高效快速地发现软件漏洞。目前网络中存在很多种对计算机软件安全检查的方法,但从本质上看,进行计算机软件安全测试的方法主要两大类。大部分检测方案都是基于静态检测和动态监测两大类检测方法。
2 进行软件安全检测的意义
计算机软件的安全检测过程是整个软件开发中极为重要的一个步骤,越早发现软件中可能存在的一些故障问题,就意味着越早解决问题,就能将软件出现问题的概率降到最低,有效地预防软件崩溃。而计算机软件的安全检测则主要是对软件中可能留存的一些漏洞进行测试,以免该漏洞在今后的日常使用中致使软件出现故障,因此,对计算机软件的安全进行检测是很有必要性的。
3 软件安全检测存在的问题
3.1 软件安全检测人员涉及广泛
由于计算机软件的相关特性,软件安全检测工作涉及的方面广泛,所需要的检测人员及技术的要求也就对应地提高,需要各方面的技术人才。对于检测人员的多元化问题就极为重要,不仅人员要齐,各方面的合作也要密切。只有多部门的密切合作以及与软件开发相关部门的密切沟通,才能高效的解决软件检测中出现的各种疑难问题。如果没有密切的合作,在软件安全检测中,各自为战,没有有效的沟通,不能从实际出发,软件安全检测将无法顺利进行下去,即使发现问题也没有有效的办法解决问题。
3.2 软件安全检测工作量巨大
计算机检测是一个系统的复杂的过程,有时候检测工作量巨大。在进行对于系统级软件或者代码级工程的分析工作时,进行软件安全相关检测必须需要进行大量的工作的。不仅如此,在所需检测的软件的规模较大的时候,还要对软件的结构设计方面进行必要的分析。而且在对所需检测的软件的各个方面进行分析的过程中一般采用仿真环境和相应的分析工具来进行相关的检测工作,因为这两种分析比较切合实际工作,较为合理,所以这些分析工作都是必须进行的,这些必须进行的工作会大大增加软件安全检测过程的工作量。
4 软件检测问题解决方法
4.1 在对软件进行综合分析的基础上进行检测
检测人员在进行软件安全检测的工作时,必须考虑到每个软件都有其独一性,每个软件都有不同的侧重点,只有在对软件进行系统化的综合分析的基础上,才能高效的制定符合该软件的有效检测方案,只有合适的才是最好的,在进行综合分析时还应考虑到符合用户需求,这样实行的检测程序才是最为可靠的。
4.2 大力推广检测人员多元化
由于软件安全检测工作涉及范围大,需要的检测人员的技术方面也不尽相同。所以需要推广人员多元化需要在进行软件安全检测时注意安排相近但不完全相同的人员在一起。大力推广检测人员的多元化,对于软件可能存在的安全问题能够更可能的发现,并且由于检测人员的多元化,对于出现的问题得以解决的可能性也会增加。在推广多元化的同时,也需要注意各部门之间的合作问题,集中优势技术人才,加以密切的合作,将专业技术人才的潜力发挥到极致。多元化的人员和密切化的合作能够到达检测工作的事半功倍,提高软件安全检测效率。
4.3 选择合理的安全检测方法
对于大量种类不同;用户需求也不同的软件,检测人员需要选择合理的检测方法。对于有些系统级软件和代码级工程,如果采用了不符合要求的检测方法,有可能造成工作白费,耗费大量人工精力和大量资源及时间,最后所得的结果有可能不符人意。没有一个能够符合所有软件检测工作要求的安全检测方法,只有选择合适的检测方法,才能达到预定的目标。
总体来说,合理地利用安全检测方法,在最短时间内有效的找出漏洞,及时进行修改。以下对于三种方案进行简要地介绍:
4.3.1 模糊检测
当今采用的模糊检测是在传统检测技术上进行改进的检测技术,其主要是在白盒技术上发展改进的检测技术,有效地继承了模糊测试和动态测试的优点,具有准确高效的特点。
4.3.2 基于故障注入的安全性测试
故障树的建立工作是该安全检测方法的基本。此方法将系统发生故障几率最小的时间作为顶事件,在此基础上在进行中间事件、底事件的寻找工作,利用逻辑门符号再将顶事件、中间事件与底事件进行连接,完成形成故障树的工作。在保证精度的条件下,此方法可以实现故障检测的自动化,实现检测的高效性。
4.3.3 基于属性的测试
基于属性的检测工作首先要完成确定软件的安全编程规则工作,再进行检测待测程序的代码是否都遵守其确定的规则编码,采用这种方法能够有效地分析安全漏洞。另外,近年大量分布式软件快速发展就是基于web服务的快速发展,如何利用好web服务的优势,将很大程度上取决于如何合理完成这些软件的安全检测工作。而基于web服务的软件的安全检测也将是适用于基于属性的测试方法中的一项重要部分,高效的完成确定软件的安全编程规则工作,也就将检测工作完成了一大步。
5 结束语
软件安全检测是重要的一环软件开发工作,合理利用安全检测,做到软件潜在漏洞的早发现、早修正、早解决,有效地避免软件出现故障的恶性后果。随着计算机技术的发展,对于软件安全的重要性也在增加,进行软件安全检测的必要性也在增加。对于研究软件安全检测的方法具有重要意义和广阔前景。
参考文献
[1]朱岩.浅析计算机软件安全检测存在问题及方法[J].科技创新与应用,2012(14).
[2]张开.计算机软件安全检测问题研究及检测实现方法[J].软件,2012(07).
[3]潘博.浅谈计算机软件安全检测方法[J].电脑知识与技术,2013(13).
[4]刘锋.计算机软件安全检测方法研究[J].信息通信,2013(06).
随着市场经济在我国的逐步完善,新的会计制度、会计准则不断,对于房地产开发企业来说,目前适用的会计制度和会计准则主要有《企业会计准则》、《房地产企业会计制度》和《企业会计制度》等,如何在门类众多的制度、准则、规定之下,结合企业自身特点,改进现有会计核算方法,更好地发挥会计职能,是会计人员的职责。笔者从以下几个方面论述目前房地产企业会计核算中存在的问题及其改进方法。
1 房地产开发企业会计核算存在的问题
1.1 房地产开发企业收入确认的复杂性
房地产商品的销售包括两种,一种是自行开发并销售,另一种是事先与买方签订合同,按合同要求进行开发。对于后者,应按照建造合同的标准进行收入的确认。而对于企业自行开发的房地产商品,由于其开发的周期较长,耗资巨大,其商品具有较高的价值性。这些特点决定了房地产商品销售往往采用预售、分期收款销售等多种销售方式。房地产商品销售的前提是首先取得预售许可证和销售许可证,在此基础上,一般要经过签订预售合同并预收房款、签订正式销售合同、工程竣工验收合格并交付买方验收确认、收取房款、办理产权过户等销售环节。因此,房地产收入的确认同其它的生产收入相比具有一定特殊性。《房地产开发企业会计制度》中规定以结算账单提交买方并得到认可作为房地产开发企业收入确认标准,该规定比较简单,宜于实际工作中的操作,但没有反映销售的实质,理论上不够合理;《企业会计制度》和《企业会计准则——收入》中规定以风险和报酬的实质转移作为收入确认的标准,理论上具有合理性,但要求会计人员具有较高的职业判断能力。在会计实务中如何运用这一标准则比较混乱,核心问题在于应在哪一环节确认为收入,其分歧的焦点集中在:商品房所有权上的重要风险和报酬是否已经转移。
1.2 房地产开发企业商品成本与售价的不配比性
首先,房地产开发企业的生产周期较长,开发项目从获得土地并开发完成到确认收入短则1~2年,长则4~5年,必然使得企业投入产出比例呈阶段性不合理;在项目建设期内大量投入资金,并发生大量费用计入当期;由于项目尚未完工,即使开发产品已预售完毕,其预售款项也无法确认为收入,其结果是为配比原则的应用造成了困难。
其次,房地产开发商品的成本载体是整个建设工程,而销售则是按楼层或户型为单位,这样就造成单个楼层或户型的售价明显与其成本不配比。如同一结构的房屋,低层建筑施工成本低于高层建筑施工成本,但销售时低层售价却高于高层售价;又如“丁字形”楼房虽然同楼层成本一样,由于朝向不同,其售价相差也很大。
通常房地产开发企业的成本结转方法是:按当期竣工后的核算对象的总成本除以总开发建筑面积,得出每平米建筑面积成本,然后再乘以销售面积得出本期销售成本。这样均摊计算的结果没有考虑房屋楼层、朝向的因素,得出的经营成果不具有真实性。
1.3 收益评价指标不能真实反映企业业绩
房地产企业投入产出周期具有较强的特殊性,表现在会计年报中往往是业绩波动较大——项目建设期内业绩不佳,验收售出后,大量预收款确认为收入,期间间隔在一个会计期内还好,但一个项目往往要跨4、5个会计期,故不适用一般的公司业绩评价指标,如净利润指标就不能正确、客观、全面地反映其真实经营情况,尤其是上市公司,极可能误导投资者。一个经营情况很好的开发公司,其净利润可能很小甚至是负数,但有大量的在建工程和很好的预售情况,现金流状况极佳,有很强的盈利能力。同理一个盈利的公司也可能正危机四伏:面临着因施工质量导致的巨额赔偿,大笔银行贷款到期而无力偿还,尚未结清的担保金,由于市政规划调整,地价变化导致的土地风险等等;故此,评价一个房地产开发企业的业绩,千万不要以指标论好坏,应透过指标看实质,看其资质信誉、实力、现金流量、资产质量,还有更重要的表外风险等等。当然,这有赖于我们会计界同仁对会计信息的真实反映与充分披露。
2 完善房地产开发企业会计核算规范的对策
2.1 正确确定和应用收入确认标准
房地产商品销售收入的确认应符合两个标准,即法律标准和专业标淮。
(1)法律标准。法律标淮是指我国相关法规中规定的房地产销售必须符合的条件或标淮:如对于以出让方式取得土地使用权的,未按照出让合同规定支付全部土地使用权出让金,未取得土地使用权证书,或未按照出让合同规定进行投资开发的,以及权属有争议的、未依法登记领取权属证书的房地产不得买卖。凡是不符合上述标准的,即使房地产商品已经开发完毕,甚至取得了相关报酬,并转移了风险,也不能作为收入予以确认。法律标淮是专业标准的前提条件。
(2)专业标准。专业标准是指会计准则、会计制度中规定的商品销售收入确认标淮,即收入确认的4个必要条件:企业已将商品所有权上的主要风险和报酬转移给购买方;企业没有对已售出的商品实施控制;与交易相关的经济利益能够流入企业;相关的收入和成本能够可靠地计量。上述规定中,收入确认以风险和报酬实质的转移为标准,理论上比较合理,但由于房地产业销售方式的多样性和复杂性,为实际工作中收入确认带来了困难。
笔者认为,房地产销售合同是在房屋尚未建成竣工前的预先销售行为,不论是否收取了款项,均不属于实际发生的销售业务。因此,签订预售合同并收取预收货款不符合收入确认条件,不能作为销售实现依据;签订正式房屋销售合同则如同一般工商企业产品销售合同一样,从法律意义上讲也只是一种合约,房屋未经买方验收认可,商品所有权上的主要风险和报酬尚未转移给买方,不符《企业会计准则——收入》的有关规定,故也不能确认收入;购买方取得商品房产权证的环节较为特殊,尽管房地产商品最终是以产权证上权利人主体的更替为所有权变更的主要标志,但由于房地产开发企业在项目开发前根据规定需要支付土地出让金,取得土地使用证,并办理领取预售许可证、在工程获得有关部门竣工验收领取销售许可证、签订正式房屋销售合同,并向客户收取房款、交付买主办理入住手续的情况后才办理产权过户手续,且产权证的办理涉及到房地产管理、土地管理等政府有关部门,办妥产权证书的时间并非开发企业所能控制。如果此时确认收入,会导致收入滞后,同样不符合收入确认原则。所以,尽管房屋产权证书是房屋所有权的标志,但并非是确认收入的必要条件。
2.2 引入计划销售价格的概念,使销售收入与成本配比
建议引入计划销售价格的概念,解决销售成本结转错位,与销售收入不配比这一特殊问题。即当开发的房屋达到可销售状态时,企业根据成本、市场、地段、楼层、朝向等因素制定一个计划销售价格,作为成本分配标准。
(1)实际售价成本率法,是在季度前两个月按实际售价乘以计划销售成本等于季末销售成木的方法调整。具体操作顺序是:分类明细账按开、竣工时间相同或相近且一并办理决算的项目设置账户,在此分类明细账基础上,再按计划价格相同的房屋分类设户,价格不同的分别设置。季度前两个月可按分类明细账结转成本,即按分类明细账记载的当月实际销售额乘以计划销售成本率得出当期成本结转数,对销售房屋只登记数量,待季末将未销售房的计划售价乘以计划销售成本率得出月末留存成本,用倒挤的方法结出销售成本。这种方法适用于开发规模较大的房地产企业,优点是可以减少工作量,缺点是季度前两个月受房价影响会产生一定误差,且不能及时、准确提供较详细的成本资料。
(2)计划售价成本率法,就是始终按计划售价乘以计划销售成本率进行结转。只要是开发建设工程已办理了竣工决算手续,就可以把商品房成本按楼栋、楼层、单元予以确定,甚至可以计算出每平米建筑面积成本。因此可以按单元设置账户,也可以把每平米建筑面积成本相同的商品房归类计入同一账户。销售成本按单元设置账户的房号直接对号入座结转,按每平米建筑面积成本归类设户的,可按销售面积乘以每平米建筑面积成本得出销售成本。这种方法的缺点是结转工作量较大,但遵循了一贯性原则,提供信息可靠及时,并能将结转成本工作量分散在日常工作中,适用于一般房地产开发企业。
2.3 扩大信息披露内容,提高房地产开发企业信息披露中的信息含量
关键词:练习设计;形成性作业;障碍诊断;“减负增效”科学化
文章编号:1005–6629(2014)2–0003–04 中图分类号:G633.8 文献标识码:B
作业这个词在我国教育教学领域广为使用始于上世纪50年代“学习苏联”之后。在俄语词汇中,作业(задание)还有功课、任务的意思,它的同词根词задача则是任务、习题的意思。упражнение也有作业的意思,但主要指练习作业和习题。在苏联教育学中,学生的实验室作业和实习作业是作业的重要类型。由此,通常认为作业是指要求学生在一定时限内完成的学习性的活动任务,它包括练习以及以解决问题为主的设计及实践活动。可见,作业不仅仅是练习,两者之间是有些区别的。但是,时至今日,作业一词在我国似乎成了练习的代名词,加上基础教育的特点和教学时间等条件的限制,中学化学教学中的作业是以练习为主的,大量的是练习,通常所说作业设计实际上是指练习设计,实验室作业和实习作业大多用实验(活动)和实践活动来分别指称。本文在讨论作业设计时,相应地以练习设计为主,用意在于突出对练习设计改进的研究。
2005年,笔者曾经概括化学新教材中练习设计和练习教学的主要问题,并就存在问题的解决提出了一些意见[1]。然而8年之后,就总体情况而言,教材练习设计与教学实际“两张皮”,各搞一套,形成巨大落差的现象依然存在。而且,应试压力越来越大,许多教师在练习教学中追求“一步到位”,达到新的程度;“题海恶浪”使学生苦不堪言,许多教师也无可奈何;少数人对“造海”和编造难题颇为得意,却没有重视练习异化的严重威胁日益临近:学生摔书、弃学事件频发,“读书无用论”重新泛起,“取消化学学科升学考试”的趋势日益明确……“物极必反”,先人总结的这个规律,应该唤起我们的警醒。不错,考试还是要的,恰当的应试教学是需要的,改革有关制度也不是教师所能决定的,但这并不意味着教师可以因循守旧,维持现状,无所作为,依然按旧认识、旧经验办事。我们都希望化学教育搞得更好,都不希望化学教育受到影响,因此,每一个教师都必须深入地思考和探索如何消除痼疾,如何在教师职责范围内改革应试和练习教学,努力实现“减负增效”。
笔者认为,要实现练习教学减负增效,除了要坚持整体规划,系统设计,逐步提高,积极创新之外,当前应着重解决好下列问题:
1 合理定位,注意跟课文融合
总的来看,目前教材的编写仍存在重“学”轻“习”、“学”“习”分离现象,对课文编写比较重视,练习编写有时只是起点缀作用,缺乏深入、有效的练习指导,助推了实践中各行其是。
实际上,练习属于问题之列,跟教材或者课堂教学中设置的问题没有本质的区别。有计划的、恰当编制的跟课文融合的练习不但能巩固、拓展、深化学生的知识技能,培养学生的能力,也能使学生在情感态度价值观方面得到发展,具有促进学生发展的功能。通过练习还可以获得教学反馈信息,利于教学调控,促进预定教学目标的实现。练习过程也是学生继续学习的过程,是学习过程的一个重要环节。
由此可以将练习合理地定位为:它不仅是“习”,也是“学”的重要方式和组成部分;要重视教材中练习的编写,加强练习指导,使它跟课文有机地融合,做到“学”中有“习”,“习”中有“学”。在教材中练习的编写尚未得到改善时,教师在教学设计中可以做出适当的补充和调整。
2 有的放矢,重视练习的“形成”本性
在应试需要的驱使下,不少教师把练习变成了“做卷子”的过程,仿照终结性考试的编制方法来编制平常的教学练习,使练习丧失了应有的基本属性——形成性。久而久之,一些教师甚至不知道如何有效地编制形成性练习了。因此,重视和体现练习的形成本性,针对学生的薄弱环节,有的放矢地促进“形成”是十分重要的。
2.1 前提:准确诊断
最有效的“形成”,是有的放矢的“形成”。为此,除了要研究和遵循学生学习各具体内容的一般规律外,还需要做好学习困难和障碍的诊断。
思维的过程就是解决问题的过程,学习困难大多出现在解决问题的过程之中,它们的主要类型有:基础较差型(包括知识缺失型、程序缺陷型等);能力较弱型(包括策略无效型、经验贫乏型、思维缓慢型、不太熟练型等);元认知失衡型(包括元认知缺乏型、注意不当型、缺乏反思型等);以及情意问题型(包括信心不足型、害怕困难型、心不在焉型、易受干扰型)等。
进行学习困难和障碍诊断的方法主要有:基于任务分析的个别谈话、概念图表达、思维路线陈述、出声思维、行为观察以及诊断性作业等等。
2.2 关键:对“症”处理
在明确学习困难和障碍类型之后,可以用不同类型的作业配合其他方面的措施,作对“症”处理。例如:
对于知识缺失型,可以通过补救型作业、拓展型作业、应用型作业进行知识“补课”;通过分解型作业促进理解;通过对比型作业突出条件、特点;通过变式型作业促进对核心、本质、重点的掌握;通过强化型作业促进知识巩固。
对于程序缺陷型,可以通过矫正型作业、补救型作业纠正程序错误;通过诱错型作业消除错误定势、引起警惕。
对于策略无效型,可以通过分解型作业和综合型作业结合,促进对策略的理解;通过观念的方法论内涵演绎与样例示范促进策略的思考和累积;丰富题型知识,注意题型体验。
对于经验贫乏型,可以通过变化型作业、拓展型作业、应用型作业来充实、丰富经验。
对于思维缓慢型和不太熟练型,通过归纳型作业,以及有序和适当地增加练习量,以促进形成“图式*”,有利于思维提速和熟练解题过程。
对于元认知缺乏型,可以通过解说型作业,要求学生解说解题依据及过程,学习反思和换位换向思考,强化其元认知意识、知识和体验。
对于情意问题型,应以心理矫正方法为主,也可以应用激趣型作业、应用型作业、动手型作业来配合。
对于注意不当型,可以通过强化策略意识,改善情意心理来提高注意品质。
上述各种类型的作业都是针对学生薄弱环节的“形成性练习”,广义地说,这种“形成性练习”也包括诊断性作业在内。除此之外,还有不具有特定目的、旨在进行常规教学训练的“形成性练习”,下面讨论中的举例即可归属于此类。
3 划分层次,逐步“到位”
教学中的练习应该是由若干习题构成的有机整体,而不是若干习题的随意拼凑,应该根据预期功能赋予适当的层次结构:或者是变式重复,以求巩固、强化;或者逐步拓展,以求发展;或者是逐步深入,以求提高。
课时练习跟单元练习、学段练习以及升学应试练习要注意拉开档次,明确分工,不能“一步到位”。为此,需要先做好整体计划,并注意有计划地覆盖基本的题型。
对于学习基础不同、学习速度各异的不同类型学生,应该通过练习选择指导,分类提供适合他们的练习,使他们都能逐步发展、提高。
恰当地划分习题的层次是按照上述内容搞好练习教学的重要前提。怎样合理地给习题划分层次呢?通常可采用的方法主要是:
3.1 参照布鲁姆教育目标分类体系划分习题层次
在B. S.布鲁姆提出教育目标分类法之后,曾任美国《Journal of Chemical Education》总主编的列品考特(W. T. Lippincott)教授等人就用来对化学试(习)题进行过分类。1987年,笔者曾经借鉴布鲁姆的分类思想、指导原则和编制方法,根据解答问题时需要涉及的认知操作,将中学化学试(习)题分为知道、领会或学会、应用、综合运用和创新等层次,测量它们的实际难度,发现这个认知序列跟难度增长有着很明显的相关性[2]。据此,可以参照布鲁姆的教育目标分类体系把习题区分为不同的层次(见表1)。
3.2 利用SOLO分类体系划分习题层次
SOLO(Structure of the Observed Learning Outcome,意为可观察的学习成果的结构)分类评价理论是由比格斯(J. B. Biggs)及其同事提出的。其基本观点是:儿童的心理发展在不同的学科中有不同的表现,具有阶段性的特征,同一个学生甚至在同一个学科的不同知识点上都会处于不同思维阶段。教学不仅要关心学生的认知发展阶段,更要关注学生的真实学习情况,寻找学生学习质量出现差异的原因,以便“因材施教”促进学生的发展。他们把学生在学习新知识过程中表现出来的可以观察到的思维阶段称为“可观察的学习成果结构”,根据学生解答具体问题时表现出的思维结构在性质和抽象水平上的复杂变化,假设学生在学习时存在由感觉运动的、形象的、具体符号的、形式的、后形式的5种方式依次组成的普遍发展顺序,并进而描述了每种方式下的反应水平,把学生的学习结果由低到高划分为前结构的、单一结构的、多元结构的、关联结构的和拓展抽象结构的5个层次[3]:
(1)前结构水平(Prestructural):学生被情境中无关的方面及以前所学的无关知识所困扰或误导,没有真正理解问题,不了解相关知识,或使用过于简单的方法去解决问题,表现为任务没有得到合理地处理,回答问题时逻辑混乱,给出错误的或不相关的答案。这是最低级的水平,可认为学习者不具有回答该问题的能力。
(2)单一结构水平(Unistructural):学习者只能联系与该问题相关的单一事件,找到一个线索或资料就立即得出结论,忽视了可能的内在矛盾,或者仅仅是靠记忆回答,而不是真正理解。
(3)多元结构水平(Multistructural):学生回答问题时,能联系多个孤立事件,使用两个或多个线索或资料,但未能觉察到这些线索或资料之间的联系,未能对线索或资料进行有机整合。常常给出一些支离破碎的信息,未形成相关问题的知识网络。
(4)关联结构水平(Relational):学习者能够把握问题线索和相关素材及它们之间的联系,进行概括归纳,将它们联结在总体的联系框架中成为一个有机整体,能解决较为复杂的问题,并将解答的各部分内容整合起来,使之具有统一的结构和意义。这表明学习者已对这个主题有充分的理解。
(5)拓展、抽象结构水平(Extended abstract):学习者能概括一些抽象特征,把前面得到的整体概念转化到更高的抽象水平,或者拓展问题本身的意义,推广这个结构到一个新的主题或领域,表现出较高的创新能力。
以这个5层次发展序列为标准,可以把习题划分为不同水平(见表2),根据学生在解答问题时的表现来判断他所处的思维发展阶段。这就是说,SOLO法可用于形成性的学生学业评价。
4 探索负荷测算方法,实现“减负增效”科学化
要科学地“减负增效”,需要对负荷进行测算,而不是只凭主观感觉“毛估估”。
澳大利亚心理学家约翰·斯威勒(John Sweller)在1988年提出认知负荷理论[5]。他认为,学习过程中的各种认知活动都需要消耗认知资源,如果所需要的认知资源总量超过了个体所具有的认知资源总量,存在认知资源分配不足的问题,会出现超负荷现象,从而影响学习效率和质量。认知负荷包括内在认知负荷、外在认知负荷和关联认知负荷。内在认知负荷与学习材料的性质关联,是由所学材料本身的复杂程度决定的,在信息要素高度交互作用以及学习者还没有有效掌握合适图式时,会产生高度的内在认知负荷。外在认知负荷是由信息的呈现方式和学习者需要的学习活动所引起的,它主要是由设计不当引起。关联认知负荷是指与促进图式构建和图式自动化过程相关的认知负荷,它也受控于设计者。外在和内在认知负荷不利于学习,而关联认知负荷有利于学习。认知负荷理论在20世纪90年展成为研究认知过程和教学设计框架的一个重要理论,但学者们对其涵义的理解始终没有统一[6]。
目前在管理研究领域,国际上有关脑力负荷的研究方法主要有:主任务度量法、次任务度量法、生理度量法和主观度量法。其中,主任务度量法是通过对操作者在工作中的表现来推算这一工作强加于操作者的脑力负荷,有很明显的缺陷;次任务度量法通过对操作者完成次要任务时的表现来推算,受到的质疑更多;生理度量法目前的可靠性不强而且依赖于多种特殊仪器、难于广泛应用;主观度量法则永远无法完全消除其主观性[7]。
笔者认为,在练习设计中对习题的主任务进行结构分析,有可能表征其复杂性,由此可以确定习题的静态难度(或称绝对难度)和推测学生的认知负荷极限,并进一步确定习题的层次。
试(习)题难度的标定方法大致可以分为采用客观指标的事后标定和主要采用主观指标的事前标定两大类型。事后标定大多以通过率或者得分率作为试(习)题的难度,在测验评价和试卷分析中已经广泛应用。对于试(习)题编制及其难度调控来说,事前标定难度比事后标定难度似乎更有直接意义,但是事前标定实际难度的困难要比事后标定大,其主观性也比事后标定大。目前,国内外都有不少学者在探索如何更好地进行试(习)题难度的事前标定,尝试根据影响因素来标定问题的绝对难度;提出了各种绝对难度标定方法,如多维度分析系统、任务加工信息数量评估法、认知复杂性评估法、认知任务分析法和关系-表征复杂性模型等等[8,9,10,11,12]。
一般说来,试(习)题的难度与其复杂性有关,对其复杂性系统地作具体分析,有助于确定影响试(习)题难度的主要内在因素并进而测算其量值。问题是由基质(或称预设、主题、已知等)、疑项和解3部分组成的,并且往往在一定的背景下产生,用适当的语言表述,在一定的情境中呈现。由此可以推测影响试(习)题难度的各种因素包括下列各方面:
(1)问题表述的准确性和鲜明性;阅读量大小。
(2)情境的复杂性;情境与问题以及学生认知经验的贴近程度,对建模以解决问题的启发性、便利性。
(3)基质(已知条件)中包括模块和图式在内的知识点的多少、隐蔽性、充分必要性;各知识点的关联复杂性。
(4)疑项和解的多少;已知条件与解之间的障碍与干扰的多少;中间任务或中间目标的多少(任务的复杂性)。
(5)解的开放性、指向性(搜索空间大小)。
(6)问题结构的多元性、关联性、拓展性以及要求的抽象-具体跨度大小。
(7)问题解决过程必须的策略及程序的复杂程度和熟悉程度,认知操作水平、逻辑操作数量,等等。
情境越复杂;试(习)题涉及的知识点(或知识组块)越多,知识的学习(应用)水平要求越高;任务复杂性越大、中间任务(阶段任务)越多;条件的隐蔽性和结论的开放性越大,障碍与干扰越多,问题的结构越复杂;解的指向性越弱,可采取的策略(图式)和程序越复杂,都会使试(习)题的难度越大。
不过,上述推测不一定可靠,需要经过实践检验和修正,只能作为研究过程中的一个假设。例如,一般推测知识内容模块个数会影响试(习)题难度,然而有人在实证研究中发现:知识内容模块个数对试(习)题难度并没有显著的影响,达不到统计检验的显著性水平[13]。
确定影响试(习)题难度的主要因素不是一件容易的事,由这些因素来建立模型准确地测算难度数值也不轻松。
5 需要解决的其他问题
除了合理定位,跟课文融合;有的放矢,重视练习的“形成”本性;划分层次,逐步“到位”;探索负荷测算方法,实现“减负增效”科学化之外,心怀精品意识,努力把练习和习题设计成精品,绝不苟且应付,对于搞好作业设计非常重要、非常关键!
还有一些问题也需要注意和解决。例如,一些教师总感觉到课本中的习题“不给力”,其原因在于大多数仍停留在表面,运用知识分析解决实际问题少,导致学生兴趣低下、缺乏主动性、对练习持应付态度、抄袭作业现象严重;随手拼凑练习多、重复多,选择题数量过度,造成“题海”高耗低效;注重学科特点不够,胡乱编造的“实际”题时有出现……在练习教学方面,教师讲评枯燥、狭隘,重结果轻过程,忽视知识构建,忽视思维培养,缺乏方法、策略训练,不注意透过现象看本质,难以达到举一反三效果;忽视个别指导,缺少有效的矫正和补救措施,加剧了学习分化……实践表明,文化内涵贫乏、人文精神缺失,会严重地牵制练习和练习教学水平的提高。
“减负”只是努力的一个方面,另一方面,还要从指导思想、教学原则以及练习的内容、形式和教学实施、批改、讲评等环节努力“增效”。限于篇幅,这里就姑且从略了。
参考文献:
[1]吴俊明,李艳灵.关于高中化学新教材练习设计和练习教学的思考.载于:课程改革的探索之旅——《课程·教材·教法》创刊30周年百篇精粹[M].北京:人民教育出版社,2011:561~565.
[2]吴俊明,王槐.试论中学化学教学目标的分类[J].扬州师院学报自然科学版,1987,(4):99~104.
[3] John B. Biggs,Kevin F. Collis.Evaluating the Quality of Learning——The SOLO Taxonomy [M]. NY: Academic Press,l982.
[4]薛春兰. SOLO分类评价理论在高一化学教学中的应用[J].化学教学,2012,(12):28~30.
[5] Jobn Sweller. Cognitive Load During Problem Solving: Effects on Learning [J]. Cognitive science, 1988,(12):257~285.
[6]赵俊峰.解密学业负担 学习过程中的认知负荷研究[M].北京:科学出版社,2011.
[7]崔凯,孙林岩,冯泰文,邢星.脑力负荷度量方法的新进展述评[J].工业工程,2008,11(5):1~5.
[8][13]杜明荣.高中物理试题难度的影响因素研究[D].重庆:西南大学硕士学位论文,2008.
[9]邵志芳,余岚.试题难度的事前认知任务分析[J].心理科学,2008,31(3):696~698.
随着市场竞争硝烟的愈加激烈,现代企业的人力资源正以它特有的价值性,稀缺性和难以模仿性等经济资源的典型特征成为现代企业核心竞争力的重要组成部分,对现代企业的可持续性发展具有决定性的重要意义。
企业的人力资源是企业形成核心竞争力和推动企业快速成长的关键。在21世纪,我国企业的人力资源管理将面临全球化、新技术、成本控制、管理方法等多方面的挑战,人力资源管理也将随之呈现出职能的分化、管理的强化等新趋势。
1 核心竞争力的定义
正如麦肯锡公司所说:“核心能力像座海市蜃楼,从远处看五光十色、充满希望,但一接近,它就成了沙砾一堆。”那么,核心竞争力到底是什么?
我们将其定义为:企业具有的长期形成并融入企业内质中的支撑企业竞争优势,使企业在竞争中取得可持续生成与发展的核心性竞争力。
企业的一个能力之所以会成为核心能力必须具备四个必要条件:价值创造,稀缺性,难以模仿性和学习性。价值创造性是从用户角度,为客户提供根本好处的能力;稀缺性是从企业未来成长的角度,企业实现不断持续发展的能力;难以模仿性则从竞争者角度,其关系到企业隐含知识;而学习性是从企业过去考察,是积累性学习的结果。
企业核心竞争力的核心是企业拥有的知识资本。而在知识资本中处于核心地位的是人力资本。因此,可以说企业核心竞争力的根基在于企业人力资源的开发。离开了企业人力资源的开发,企业核心竞争力便会成为无本之木,无源之水。
2 企业核心竞争力的根本——人力资本
由于企业核心竞争力是一个以企业技术创新能力为核心,包括企业的反应能力、生产制造能力、市场营销能力、服务能力和组织管理能力等在内的复杂系统,而技术创新能力等各项能力的状况与增强又取决于人力资源的状况与开发。因此,可以说企业核心竞争力的根基在于企业人力资源的开发。
所谓“企业人力资源”,是指包含在企业员工身体内的一种工作能力,它是表现在员工身上的、以员工的数量和质量表示的资源,是企业的一种特殊资源。
2.1人力资源要成为核心竞争力之源,人力资源必须为公司提供价值
人力资本理论根植于人所拥有的价值创造潜力,bamey(1995)认为组织资源的价值来源于它开发新的生产机会和抵御威胁的活动中,而人作为一切组织活动的主体,其价值性贯穿于整个企业价值链中(milier,1999),人力资本的价值最直接的表现为其收益与成本的比值(v=b/c),人力资本的价值是体现在员工用其知识技能以更低的成本为顾客提供更高的收益,即价值的增值和成本的降低两个方面。steffy,manrer从劳动力需求和劳动力供给的异质性的实践事实出发,认为个人对公司的价值贡献是有差异的,这证明人力资本能够为公司创造价值。boudreau(1992)用效用分析方法论证了人力资本增加公司价值的途径的理论基础和测算这种价值增加的技术,并从人力资本运营的角度对企业价值的作用进行了分析,提供了以人员甄选程序衡量人力资本对企业财务价值贡献的效用模型,并通过实践中员工之间工作调换后所带来的组织财务价值的差异而得以证实。
由schnidt提出、并由boudreau近来修订的效用方程,提供了人力资本对公司财务价值贡献的估算方法。schmidt等在cronbach和cleser工作的基础上,推出下列测算挑选程序价值的公式:
utility=[(n)(t)(r)(z)(sdy)]一c
这里,n表示雇佣人数;t表示雇佣的平均任期;r表示挑选测试和工作绩效的相关系数;z表示这些雇佣的平均标准得分;sdy表示用市场价值计的工作绩效标准差;c表示工作挑选系统的成本。
效用模型的三个成分(数量、质量和成本)是效用分析的基本框架,人力资源效用模型是以预测指标和效标之间的关联性为基础的,它的重点在效标关联性分析和参数估计。应用人力资源效用分析模型的最大困难是模型的参数估计方法一直没有得到很好解决。影响人力资源效用分析应用的关键因素是模型的绩效标准差(sdy)参数估计。绩效标准差估计的精确度对效用模型分析结果影响很大,因此参数估计方法和方法之间的比较研究一直是文献上研究的焦点。文献上先后提出多种绩效标准差估计方法,可以归纳为四大类:成本核算法、整体估计法、个别估计法和比率法。成本核算法运用财务分析原理,从实际的绩效数据计算中得到标准差值,这种方法在概念上很简单,但是在操作上易导致随意性或主观性,因此不常使用。在最近的研究中比较常用的方法是:整体估计法、4o%法和crepid法整体估计法是一种比较实用的方法,具有较好的精确度。该方法的基本假设是:绩效数据呈正态分布,然后从分布数据中可以估计出绩效标准差。最常用的策略是,让管理人员评定绩效数据分布中处于15%、50%和85%位置的绩效值,然后计算l5%与50%的绩效差和85%与50%的绩效差,两个绩效差的平均数作为绩效标准差的估计值,同时用两个绩效差是否相等检验正态分布假设。crepid方法属于个别估计方法,类似于成本核算方法,但是比成本核算法更为精细和复杂,是三种方法中最为复杂的一种,它的精确度最高。40%方法属于比率法,用某个工作岗位的平均工资乘以一个百分数作为该工作群体的工作绩效标准差估计值,该百分数通常界于40—70%之间,40%只是一个经常采用的数值。
2.2一种资源如果要成为核心竞争力之源的话,它必须是稀缺的
由于到处都有失业者存在,这个世界显然是劳动力过剩。所以,人们能够轻易地认为人力资源是不稀缺的。但是由于认识能力在人力资源中是正态分布的,因此,高能力水平的人力资源是稀缺的。其次,个体人力资本的形成是一个独特的知识积累过程,具有先天禀赋和后天学习的双重差异性,决定了个体能力的差异和难以模仿,也导致了一定程度上人力资本的稀缺性。
2.3为成为核心竞争力之源,资源必须是不可模仿的
一个资源能够被模仿首先需要竞争者必须能准确地确认竞争优势之源;其次,竞争者必须能够准确地复制人力资本资源集合的相关因素和这些资源作用的环境。根据以资源为基础的观点,公司获得和利用其独特资源的能力依赖于其独特的历史。当公司资源和竞争优势之间的联系是不能完全理解时,就存在因果关系模糊。如果其他公司不能够识别公司资源实现竞争优势的特别途径,其事实上也就不可能模仿这些重要的资源。最后,来源于公司相互作用的社会复杂性的竞争优势不可能被模仿。因为人力资源可能具有独特的能力产生或影响于独一无二的历史条件。
2.4人力资源要成为核心竞争力,企业必须有很强的学习能力
伴随着知识经济时代的到来,知识更新的速度越来越快,知识逐渐成为经济增长的源动力.作为知识产品直接创造者和受益者的企业如何应对日益激烈的市场竞争和不断变化的生存环境,唯一的选择便是重视知识、学习知识,以学习求创新,以创新求发展。21世纪最成功的企业将会是“学习型企业”,因为未来唯一持久的优势,是有能力比竞争对手学习得更快。而人才是企业生存和发展的基础资源,知识只有被具备学习能力的人才应用到实际工作中创造出价值时,才能成为一种资产。员工具有一定知识含量和较强学习能力、创新能力和应用转化能力,持续发展的人才带给企业更新的创造力、更高的绩效以及企业应对竞争时代有能力保持的更广阔视野。
3 实施人力资源战略提升企业核心竞争力
3.1更新观念
要深刻认识到当前国内市场由卖方市场向买方市场过渡,世界经济正逐步由工业经济向知识经济过渡,由传统经济向新经济转变。这个转变对企业的生存和发展提出了更高要求,其中主要的就是企业是否具有较强的创新能力,而企业创新的关键是靠人才,因而人才管理制度的创新尤为重要。树立以人为本、以人才为本、知人善任的观念,真正树立尊重知识、尊重人才的科学用人观念,正确理解并运用“人力资源是第一资源”的现代观念。
在当前美国企业的董事会中,不带有财力资本的独立董事已占到了60%以上,其他发达国家亦如此,这是一个明显的例证。从人力资本发展的角度,西方经济学家把这个转化过程概括为从“物本”到“人本”再到“能本”。
用好人才比选择人才更为关键。很多企业选人时求贤若渴,到处招聘人才,到头来却是招而不用,或者是把人才放错了位置。所以采取一切手段,把好人才选进来,感情留人、待遇留人、事业留人,最重要的是最大限度地发挥人的才能,“舒心”留人,用人比选人更为关键。
3.2企业文化管理是构筑企业人力资源竞争力的关键.
3.2.1人力资源管理的最高层次是文化管理
技术和制度本身是相对稳定的,一经形成就可能僵化。人力资源的文化管理,特别应该强调以人为本,企业的一切经营管理活动都围绕如何充分发挥人的能力展开。
优秀的企业,要求每个员工自觉地把能力最大限度地正常发挥作为自己价值追求的主导目标,并积极为此而努力。与此同时,企业也会对职工的奉献给予恰当的承认和合理的报酬。在这种环境下,企业经营理念得以落实,公司使命得以完成,进而保证个人价值和企业价值的共同实现。
3.2.2建立组织与个人的共同目标
个人目标是人们心中真正的渴望,是对未来的向往和追求,它促使人不畏艰难,不断进取。组织如果考虑到员工的个人目标,把员工的奋斗目标整合到企业发展的方向上来,就可以激发员工无穷的激情和创造力,使之对组织的目标全心投入、义无返顾。很多处于创业期的企业,待遇很差,但员工的干劲却出奇地足,原因就在于此。企业应该让员工明白企业的目标,并在工作中不断地加以整合和调整,消除目标方向不一致的地方,确保员工的努力对企业的有效性。
3.2.3培养员工忠诚度
越来越多的企业开始意识到高忠诚度员工的重要性。如何保证企业的人力资源有效长期地为企业的发展服务,而不至于随着企业的变动成长而发生人心离散,这是企业人力资源管理的重要目标。
但在很多企业,忠诚却被限制在制度层。比如说,不少企业对从刚从大学毕业的员工要求一定的服务期,但在服务期内,给予不好的待遇,而且在服务期满前,员工要想离开会受到重重阻拦。这样做能在一定程度上遏止人才流失,但弊端也是明显的,一方面进来的优秀者先行流失,而相对不优秀的人却被沉淀下来,使企业的人才结构不断恶化。
另一方面,由于过高的人才流动率,加大了人才在选择时的预期成本,使得许多优秀的人才不愿意进来。企业与员工达成并维持一份动态平衡的“心理契约”,有助于改变上述被动局面。这就要求企业管理者清楚每个员工的发展期望,使员工的个人前景与企业发展紧密结合;每一位员工也为企业的发展作出全力奉献,因为他们相信企业能实现他们的期望。
3.3开展知识管理,建立知识分享体系
企业要说眼员工把自己的知识贡献出来让大家分享是非常困难的一件事情。但建立知识分享体系对现在企业,尤其对企业的长期发展很重要。企业可采取相关的措施:(1)个人得到认可的方式。如果一个企业希望鼓励员工把他们的知识和专长进行分享,就要确保他们由于分享了知识专长而受到认可。如果分享者成了组织的英雄,那么知识的价值不仅在企业层次上,而且在每个员工个人层次上得到了认可。(2)同关键业务流程相结合。知识一般会在特定的业务流程中产生,销售人员在销售过程中获得新知识,售后服务人员在进行服务时也可能得到新知识,项目经理在进行项目管理时获得了新经验。(3)培训员工的it知识。局域网,文件管理系统,电子留言板等都是可以使用的技术。(4)组织知识库要设计合理,使每个人知识转变为组织知识资本的方法迅速和便捷。
3.4建立有活力的人力资源激励机制
哈佛大学的心理学家威廉·詹姆土在对人的激励研究中发现:缺乏激励的职工仅能发挥其实际工作能力的20%——30%。因为只要做到这一点,就足以使自己保住饭碗,但是受到充分激励的职工,其潜力则可以发挥到80%——90%,可见激励对人潜能的挖掘和利用是多么重要。
文章编号:1003-4625(2010)02-0010-04 中图分类号:F820.5 文献标识码:A
此次金融危机爆发表明,市场上交易的很多信用结构衍生产品既带有信用风险的特征,又带有市场风险特征,在可能的将来人们甚至还能看到由操作风险外包手段引起的带有三大风险特征的产品。这无疑对我们旧有的风险划分、计量和管理无疑是个严重的挑战。鉴于此,厘清对新增风险的认识,以及如何计量新增风险,对于当前业界和监管当局更为科学地认识和应对市场风险,其重要性不言而喻。
一、新增风险在市场风险中的重要性
最近,巴塞尔委员会公布了交易账户的定量影响测算结果。该定量影响测算基于10个国家43个银行的交易账户的实际测算。测算的关键结果如下:
(一)定量影响测算结果表明,平均而言,按现行方法测算出来的交易账户资本要求将使得总体资本要求至少增加11.5%,市场风险资本要求要增加223.7%。这不包括标准法或综合风险资本要求法(comprehensive risk capital charge)下未进行再资产证券化的证券化暴露的资本要求。这一平均水平,尚不包括银行对某些修改调整没有报告数据的情况。在这些情况下,资本变化假定为零。考虑到这一种情况,最低资本要求的实际变化将更高。
(二)平均而言,新增风险资本要求将使总体资本要求上升6.2%,使得市场风险资本要求上升102.7%。相比较特殊风险资本要求而言,新增风险资本要求平均为其九倍之高。这一结果与第二次定量影响测算结果一致。
(三)压力下VaR(stressed VaR)方法的引人,使得总体资本要求平均上升4.6%,市场风险资本要求上升110.8%。平均而言,压力VaR是非压力VaR的2.6倍。没有证据表明,压力VaR的分散效应低于非压力VaR。
(四)对于再证券化风险暴露,新标准化的特殊风险资本要求的引入使得总体资本要求平均增加5.4%,使得市场风险资本要求平均上升92.7%。
(五)标准法下,证券的特殊风险资本要求使得总体资本要求平均上升0.2%,使得市场资本要求上升了4.9%。
从上述结果来看,使得现行方法下交易账户资本要求增加的要素由大到小依次排列为:新增风险资本要求、压力下VaR、再资产证券化风险暴露、证券的特殊风险。
上述结果导致市场风险资本要求剧增主要是因为现行(新)方法与先前(老)方法的不一致。老方法下,市场风险的资本要求=未使用内部模型而采取标准法的资本要求(包括:一般和特殊利率风险、一般和特殊证券头寸风险、外汇风险、商品风险)+内部模型法下的资本要求(为前一日VaR与前60个营业日日均VaR均值*乘数因子中的较大值)。
新方法下,市场风险资本要求=未使用内部模型而采取标准法的资本要求(包括:一般和特殊利率风险、一般和特殊证券头寸风险、外汇风险、商品风险)+内部模型法下的资本要求(前一日VaR与前60个营业日日均VaR均值*乘数因子中的较大值+最新可得的压力VaR值与前60个营业日压力VaR均值*乘数因子中的较大值+新增/综合风险资本要求)。
二、新增风险定义、演变和特征
根据巴塞尔委员会2009年7月的《交易账户新增风险资本计算指引》,新增风险主要为金融机构面临的违约风险和信用迁移风险。新增风险的提出主要是为了弥补风险价值(VaR,99%,10天)模型存在的缺陷。据此,新增风险资本要求(IRC)代表了对资本计划期为一年、置信区间为99.9%的非证券化信用产品的违约和信用迁移风险的估计,并同时考虑了个别头寸和组合头寸的流动性计划期。
根据新增风险的定义及其历史演变,我们可以发现与一般市场风险和特殊风险比较起来,新增风险具有以下特征(参见下表2):一是风险覆盖的范围不一样,一般市场风险是由金融产品的市场价格波动造成的,特殊风险主要针对历史价格变异、集中度风险、名目基差(name-related basis)风险以及事件风险;而新增风险是覆盖交易对手违约风险与信用迁移风险。二是流动性差异。一般市场风险和特定市场风险的VaR模型忽视了交易账户头寸中潜在的流动性差异,无法完全反映出每年发生不到两三次的单日大规模损失,也不能反映出几个星期或几个月的期间内大规模累积价格浮动的潜在可能。而新增风险主要针对这种交易频率较低,流动性较弱的资产组合带来的风险。三是置信水平和时间周期不一样。一般市场风险和特定市场风险的VaR模型置信区间为99%、时间周期为一天的风险价值,最多可以扩展到10天。而新增风险考虑的是资本计划期为一年、置信区间为99.9%,时间周期更长的情况下的风险。
表2交易账户最新定量影响测算中对特殊风
三、新增风险资本计量方法比较
由于当前业界对新增风险的关注刚刚兴起,目前还没有就潜在流动性差的交易头寸的风险计量达成一致,所以巴塞尔委员会没有规定新增风险资本计量的具体方法,但是在其资本计量指引中规定了基本原则和必须考虑的基本要素。
(一)基本要素
第一个基本要素为稳健性标准。即,巴塞尔委员会规定新增风险的计量必须反映出资本计划期为一年、置信区间为99.9%的稳健性标准,且同时考虑单个或组合交易头寸的流动性计划期。
第二个基本要素是资本计划期为一年的稳定的风险水平。这一假设表明银行在为期一年的资本计划期内以一种维持其初始风险水平的方式再平衡或叙做其交易头寸。这意味着考虑那些在流动性计划期开始时与原始头寸具有相同风险特征、但在流动性计划期内其信用特征改善或变差的替代头寸的影响。
第三个基本要素是流动性计划期。流动性计划期是指在压力市场条件下销售头寸或对冲IRC模型中涵盖的所有实质风险所需要的时间。单一头寸或头寸组合的流动性计划期至少为三个月。一般而言,在设置流动性计划时期时,一个非投资级的头寸通常比一个投资级的头寸具有一个更长的流动性计划期;银行可以头寸或一个集合为基础(“桶”)来评估流动性,但应能够有效反映出流动性之间的差别;对于集中度高的头寸,流动性计划期通常会更大;一个证券化仓库的流动性计划期应反映出在压力市场条件下建立、销售和证券化资产或对冲重要风险因子的时间。
第四个基本要素是要考虑相关性和多样化。一
是违约和迁移之间的相关性,包括在债务人中违约和迁移事件的相关性的影响,以及群体违约和迁移事件的影响。二是违约或迁移风险和其他市场因素的相关性。由于在交易账户中违约或迁移风险与交易账户中其他风险多样化带来的影响目前还尚未被很好地理解;因此,在目前阶段,违约或迁移风险与其他市场变量多样化的影响不会被反映在新增风险的资本计算方面。
第五个基本要素是集中度。必须恰当地反映发行人和市场集中度。一个高集中度的资产组合应比那些较分散化的组合计提更高的资本。压力状况下,产品类别内部和产品类别之间可能产生的集中度也应得到体现。
第六个基本要素是风险缓释和多元化效果。在IRC模型内部,风险暴露金额只有在多头和空头头寸指的是同一金融工具时才可以进行净扣处理。否则,风险暴露金额则必须以一种总量的方式(例如:非净扣)来计人。产品的主要基础风险、在资本结构中的排位、内部或外部评级、期限、冲销头寸的期限以及冲销工具手段之间的差异(如:不同的支出触发和程序等)都应反映在IRC模型中。如果一种工具的期限比流动性计划期更短或没有合同确保期限比流动性计划期长,则IRC必须包括在工具期限和流动性计划期的间隔时间可能发生的潜在风险带来的影响。
对于通常是以动态对冲策略对冲的交易账户风险头寸,还需要识别被对冲头寸的流动性计划期内对冲的再平衡。这种识别只有在下述情况下才会被接受,即银行:1、在相关的交易账户风险头寸中都选择一致的再平衡对冲建模;2、证明引入再平衡能够改善风险计量;3、证明对冲工具的市场即使在压力情况下也有足够的流动性容纳这种再平衡。任何动态对冲策略所产生的剩余风险都应在资本计提中得到体现。银行需验证他们计算剩余风险的方法,力争让监管当局感到满意。
第七个基本要素是期权性。银行的IRC模型应该包括期权的非线性影响和针对价格变化有显著非线性表现的其他头寸。银行还应当关注和这些产品相关的估值以及价格风险评估中所固有的模型风险的额度。
(二)方法比较
根据现有国际金融机构对新增风险资本计算的基本原理和实践,对新增风险监管资本要求的计算大致可以分为两个思路来进行(可参见Avantagecapita有关材料):一是构造一个统一模型,模型包括三大块,即评级迁徙模块,交易对手违约事件模块,及评级迁徙、交易对手违约事件之间以及与其他风险要素之间的相关性矩阵模块等。同时考虑资本计划期和流动性计划期之间的错配约束条件,在此条件下根据相关历史数据得出相关系数,然后形成完整的模型,根据构造类数据或当前数据,进行相关的IRC的VaR值计算。二是对评级迁徙和交易对手违约事件单独建模,在此基础上考虑相关性和多元化以及期权性等要素,求得相关系数矩阵,然后在资本计划期和流动性计划期之间的错配约束条件下,考虑上述三大块,即评级迁徙和交易对手违约事件以及相关性和多元化等,最后根据历史数据拟合出来的相关数据形成完整模型,再进行相应的VaR值计算。
根据Nykredit银行的Johannes Rebel的相关论文,计算IRC的步骤大致可分为:定义IRC模型的所有头寸-II0;设定流动性期限结构;对于t=ti时都先从t=t0时开始,然后对整个债务人集合模拟(预先定义的)随机过程,直到t=ti+1,在现有时间和评级情况下将所有头寸映射到模型当中来,计算损益表,然后根据交易策略重新促使资产负债表平衡(即风险水平不变),反复执行这些步骤直到t=T,重复前述第三个步骤“10000”次;计算损益分布中的99.9%分位下数值。
现阶段对于评级迁徙如何计量的模型已有不少,同时对于交易对手违约风险如何计量的模型也不少。其中,对于评级迁徙的经典模型有多重要素的merton模型、布朗桥模型以及creditmetrics相关模型,也可参见Jones和Cynthia McNuhy等人的论著。
根据附件,我们发现,2007年9月份金融危机爆发前,使用IDRC模型计算新增违约风险监管资本要求的六大国际金融机构中,已经有两家不复存在,一家已经转型,其余三家深度重创。但是其IDRC模型仍旧可以为我国银行业提供很多的经验和教训,使得我们可以少走一点弯路。
就模型本身而言,六家机构利用的IDRC模型都是建立在IRB模型之上,其中前三家模型(CS公司的汤姆模型、摩根斯坦利的查尔斯模型和花旗的依云模型)更为类似,后三家(RBS的简和理查德模型、德累斯顿银行的马克思F和马克思S模型、雷曼的依德雷多模型)在很多地方有相似之处。具体而言,前三家机构的IDRC模型中对违约事件、跃阶和完全不流动资产的要求基本是一致的;后三家更多考虑了评级迁移问题,但都剔除了完全不流动资产的考虑,具体的做法基本是建立在Moody的KMV模型基础上。
就关键变量而言,六家机构都考虑了违约时间以及违约下的PD和违约跃阶,但这些参数具体的算法,每家机构都有些不同。其中,摩根斯坦利更多考虑的是取决于评级、规模、指数容量、活跃交易数量;而RBS考虑的是1-(1-PD)T算法,而德累斯顿银行考虑的是转换矩阵等。
就关键假设而言,六家机构都考虑了99.9%下的系统变量VaR。其中,CS、摩根斯坦利和RBS还考虑了最差情形,以及资本覆盖时不同头寸还是每个敞口。而摩根斯坦利和德累斯顿银行明确表示其资本覆盖不同头寸时,属同一发行人时可进行轧平之后再算。
就集中度附加资本要求而言,除了CS公司认为这一问题是政策事宜,其他五家机构都认为其IDRC模型反映了或可计算集中度风险的资本要求,其中,花旗、RBS和雷曼认为其模型反映了这一风险,而摩根斯坦利和德累斯顿银行认为可计算这一风险。
就监管意见而言,由于不同的监管当局在金融危机爆发前对这一风险关注的不够,对模型的审查和验证也没有完全进行,只有两家机构的模型相关监管当局给出了监管意见。其中,就CS公司的模型而言,美国监管当局Gordy给出了监管当局开发了类似模型的意见,但对其违约跃阶的独立性表示质疑。对于雷曼的模型,给出了在相应条件下,其模型可能趋于银行账户模型的判断。
四、启示
作者简介:李金昌,男,50岁,浙江义乌人。浙江财经大学校长,统计学教授,博士生导师。研究方向为经济统计学,统计理论与方法,抽样技术,政府统计等。
最近两年,统计学界对大数据问题所进行的理论探讨逐渐增多,视角也各有千秋,引起了一些共鸣。围绕大数据问题,由统计学、计算机科学、人工智能、数学等学科共同支撑的数据科学开始形成。但大数据毕竟是一个新课题,因此远未达到对其有一个系统完整的认识,仍然需要从不同的方面加以研究,其中有一个重要但又容易被忽视的问题,即统计测度问题,值得去探讨。
一、什么是统计测度
汉语上,测度是指猜测、揣度、估计。数学上,测度是一个函数,它对一个给定集合的某些子集指定一个数,这个数可以比作大小、体积、概率等等。通俗地说,测度把每个集合映射到非负实数来规定这个集合的大小:空集的测度是0;集合变大时测度至少不会减小(因为要加上变大的部分的测度,而它是非负的)。
除了数学角度的测度论,查阅国内文献资料,带有测度这个词汇的文献不少,但专门针对统计测度(或测度)内涵的讨论几乎没有。一些对社会经济现象进行分析测度的文献,例如新型工业化进程测度、货币流动性测度、全面小康社会发展进程测度、收入分配公平性测度、技术效率测度、人力资本测度、金融风险测度、产业关联测度等等,所做的测度都是再测度,均不对测度本身进行讨论。查阅国外文献资料(关键词:measurement),也同样存在这样的问题,只能收集到一些比较零散的表述。LudwikFinkelstein(1975)[1]认为,在我们对事物或现象进行描述时,测度可以被定义为对现实世界中某一现象的个体属性或特征进行量化的过程。JamesT.Townsend和F.GregoryAshby(1984)[2]认为,如果按照极端的观点,那么统计分析中的基本测度理论的含义仍然是存在争议的。LudwikFinkelstein(2003)[3]指出,测度在那些原来尚未得到卓有成效或广泛应用的领域,也已取得了明显的进步,社会、政治、经济和行为科学正在更大程度地利用定量技术;测度是现代思维的一种实际有效的工具,是我们借以描述世界的一种方法。GiovanniBattistaRossi(2007)[4]认为,用以表示测度结果的,是数字或者数字符号。LucaMari(2013)[5]认为,测度的基础特征是被公认为世界上获取并正式表达信息的基本方法,这让它成为一种跨学科的工具。LudwikFinkelstein(2014)[6]指出,在自然科学技术中,测度的重要性不可否认,它是科学调查和发现必不可少的工具,它可将宇宙中的复杂现象用精确、简洁和普遍的数学语言来描述。
那么,到底什么是统计测度呢?目前没有一个统一的定义。本文认为,统计测度具有不同于测度的意义,并且大大超越数学上的界定,即它具有数学定义的一般属性,但又不受制于函数表现形式,因为统计测度所要面对的是现实世界,实际问题要比理论上可以定义的问题复杂得多。按照我们的理解,统计测度就是用一定的符号和数字,用一定的形式和载体,对所研究的现象或事物的特征进行量化反映,表现为可用于统计分析的数据的过程。它应该具有这样一些属性:以实际现象为测度对象,测度结果具有实际意义;以量化为目的,把信息转化为数量,提供人们容易理解的定量结论;个体特征的测度符合形成总体定量结论的要求,同时能够体现个体差异。可以发现,统计测度需要借用数学工具,但更重要的是对具体测度现象本质特征的认识和掌握。
统计测度可以从若干不同角度进行分类。邱东教授(2012)[7]曾在“宏观测度的边界悖律及其意义”一文中,从边界的角度对宏观测度进行了分类:一是因事物本身可测度性而形成的边界,即本体论意义上的测度边界;再一是由人的认知能力而形成的边界,即认识论意义上的测度边界;第三则是由统计相关性偏好和投入约束而形成的边界,即操作意义上的测度边界。这三条测度边界,应该以本体论意义的测度边界最大,认识论意义的测度边界次之,而操作意义的测度边界最小。这样的分类,对于我们正确理解统计测度的内涵很有帮助。受此启发,笔者认为统计测度还可以有如下分类:
1.从测度的实现形式看,可以分为原始测度和再测度。原始测度也可以称为直接测度,它通过对测度对象进行直接测度来获取数据,例如清点库存物品数量、丈量作物播种面积、观察培育细菌数目、检测药物成分等获得的数据,以及各种登记、记录的原始数据等等。再测度也称为间接测度,它以其他已知的测度数据为基础去计算、推算或预测所需的未知数据,例如根据GDP和人口数测度人均GDP、根据人口普查分年龄人口数据测度老龄化系数和社会负担系数、根据相关指标数据测度CPI的变化等等。复杂的再测度则需要借助相应的统计模型作为工具,因为它实际上是对相关变量之间的关系进行定量反映。从两者关系上看,原始测度是基础,是根本,没有科学的原始测度就不会有可靠的再测度;再测度则是测度功能提升的必然要求,以解决原始测度不能解决的问题。
2.从测度的计量方式看,可以分为自然测度、物理测度、化学测度、时间测度和价值测度。自然测度是利用现象的自然属性所进行的一种统计测度,例如人口规模、企业数量等的测度,采用自然计量单位;物理测度是利用现象的物理属性所进行的一种统计测度,例如公路长度、作物播种面积、天然气产量等的测度,采用物理计量单位;化学测度是利用现象的化学属性所进行的一种统计测度,例如医学、生物学中化学合成物的成分结构测度,采用百分数、千分数或特定标识为计量单位;时间测度是利用现象的时间属性所进行的一种统计测度,例如劳动用工、闲暇时间等测度,采用时间计量单位;价值测度是利用现象的价值属性所进行的一种统计测度,例如劳动报酬、经济活动成果等测度,采用货币计量单位。在这些测度计量方式中,价值测度因最具有综合功能而应用最为广泛。
3.从测度的方法看,可以分为计数测度、测量测度、实验测度、定义测度和模型测度。计数测度是一种通过观测计数来获得数据的方法,最为简单,一般用于自然测度或时间测度;测量测度是一种根据物理或化学规制对现象进行测量、测算来获得数据的方法,一般用于物理测度或化学测度;实验测度是一种按照科学实验原理、通过观察实验对象在既定条件下的反应来获得数据的方法,一般与测量测度相结合,用于获取科学研究数据;定义测度也可以称之为指标测度,是一种通过探究现象的本质特征和活动规律、归纳出表现其数量特征的范畴、给出统计指标定义(包括内容、口径、计算方法和表现形式等)来获取数据的方法,最常用于价值测度,也用于其他形式的测度。可以说,定义测度方法应用最为广泛,但也最为困难。模型测度是一种根据现象与现象之间的内在联系关系、或者现象自身的发展变化规律,通过建立一定的方程模型来获取数据的方法。前面三种统计测度方法基本上都属于直接测度,定义测度既可能是直接测度、也可能是间接测度,而模型测度都属于间接测度方法。
4.从测度的维度看,可以分为单一测度与多维测度。单一测度是指采用单一的方式方法对所研究现象或事物进行单一角度的测度,获得单一的数据。多维测度是指对所研究现象或事物进行多角度的测度,测度过程中可能需要采用多种测度方法和计量方式,例如多指标综合评价就需要借助统计指标体系对评价对象进行多角度的测度。显然,单一测度是多维测度的基础。
二、统计测度是统计学的立足之本
首先,从统计学的发展历史看,是统计测度使统计学破茧而出。为什么主流观点认为政治算术是统计学的起源而不是国势学?正是因为威廉·配第首次采用统计测度的方式进行了国家实力的统计分析和有关推算,得出了令人信服的结论。威廉·配第在1693年出版的《政治算术》[8]中写道“因为和只使用比较级或最高级的词汇以及单纯作思维的论证相反,我却采用了这样的方法(作为我很久以来就想建立的政治算术的一个范例),即用数字、重量和尺度的词汇来表达我自己想说的问题,只进行能诉诸人们的感官的论证和考察在性质上有可见的根据的原因”,这一观点在统计学的发展过程中产生了非常重要的影响。他的这段话虽然没有出现测度一词,但却道出了测度的本质,即让事物变得明白、变得有根据,因为“数字、重量和尺度”就是测度、就是根据,用“数字、重量和尺度的词汇来表达想说的问题”就是一种测度的思想,尽管测度的方式方法还很简单。相反,国势学虽然提出了归纳法这一统计学的基本方法并首创了统计学一词,但由于没有采用统计测度的方式进行国势问题的研究而难以修成正果。正如邱东教授[7]所说:“在配第之前,统计学的研究对象虽然是国家的态势,但它在方法论上只是定性言说。一个国家的财富总量在本体论意义上是可以测度的。然而只是到了配第时期,人类才想到了要测度它,并发明了如何测度的基本方法。政治算术,即开创期的经济统计学,实现了从无到有的转变,大大扩展了宏观测度的认识论边界,因而才具有了统计学范式创新的革命性意义。”同样,格朗特的《关于死亡表的自然观察和政治观察》也是人口统计测度方面的经典之作,无论是原始测度还是再测度,都给后人留下了宝贵的财富。之后,统计学就是沿着如何更加科学、准确测度世界这一主线而发展的。笔者曾在“从政治算术到大数据分析”一文[9],对数据的变化与统计分析方法的发展进行了粗浅的归纳,其主题实际上就是统计测度问题。
其次,从统计学的研究对象上看,统计测度是体现统计学数量性特征的前提条件。统计学的研究对象是现象的数量方面,或者说统计学是关于如何收集和分析数据的科学。统计数据从何而来?从统计测度中来。数据不同于数字,数字是统计测度的符号,数据是统计测度的结果,这也正是统计学区别于数学之处。所以说,数据的本质问题就是统计测度问题,故此统计测度是统计学的基本问题。这里重点讨论两个问题:一是统计测度与统计指标的关系,二是统计测度面临的新问题。关于第一个问题,本文认为统计测度与统计指标是一个事物的两个方面,这个事物就是数据。统计指标法是统计学的基本方法之一,尽管前面对统计测度从方式方法上进行了分类,但从广义上说所有统计测度都是定义测度,都表现为指标。也就是说,任何统计测度———不论是直接测度还是间接测度,最终目的是获得能够让人明白的数据,而表现数据的最主要形式就是统计指标,其他表现数据的形式都是派生出来的。所以,统计测度就是根据所设定的统计指标去获得所需的数据。关于第二个问题,与后文所要论及的大数据有关,就是定性测度问题。在统计学中,数据可以分为两类———定性数据与定量数据,其中定性数据又包括定类数据与定序数据两种,它们属于非结构化或半结构化数据。相应地,统计测度也可分为定性测度与定量测度。很显然,只有定性测度与定量测度方法得到同步发展,统计学才能更加完善。总体上看,定量数据的统计测度已经比较完善,但定性数据的统计测度还有很多问题尚待解决,难点就在于测度的切入点———如何提取有效的信息、如何最终转化为统计指标。尽管关于定性数据分析的论著已经不少,但还没有从理论方法上建立起定性数据统计测度的体系,因此统计学在这方面的任务依然很重。
第三,从统计学的永恒主题看,通过科学的数据分析、得出有效的结论是其不变的追求,而数据分析过程就是综合的统计测度过程。获得数据的目的是为了发现隐含其中的有价值的信息,即发现数据背后的数据,让数据再生数据,从而满足人们认识事物、掌握规律、科学决策的需要。除了总量、结构等基本信息外,更重要的是通过数据分析来呈现现象的变化规律与相互关系。不难发现,这种数据分析的过程,就是不断进行各种统计测度的过程,所以最终的统计分析结果实际上就是各环节、各方面的各种类型的统计测度的叠加结果,或者说是统计测度不断放大的过程。大量针对社会经济现象进行分析研究的文献(不论是否冠以“测度”两字),只要有数据分析,都是如此。可以说,统计测度贯穿于统计数据分析的全过程。但是,为什么很多统计数据分析并没有得出有效的结论呢?本文认为原因就出在统计测度上,尤其是没有首先解决好原始统计测度问题。应该说,围绕数据分析已经建立起一整套比较完整的统计方法体系,很多方法也都身经百战、行之有效,但一旦原始统计测度有问题、数据不准确或不真实,那么任何方法都只是摆设。仔细研读很多所谓的实证分析文献,其重点均在于构建什么样的模型或运用什么样的方法,虽然有的文献也必须要讨论选择什么样的变量(指标)这个问题,但并不是系统地从测度的角度进行阐述,因此所用的模型越来越复杂,但所得的结论却离实际情况越来越远。学界总是有这样一种观念:变量越多、符号越新奇、模型越复杂的文章才越有水平,似乎这样分析所得的结论才越可靠。殊不知,不以科学可靠的原始统计测度为基础,任何数据分析都会成为无源之水、无本之木,所得的结论也只是更精确的错误而已。本文认为,任何脱离科学统计测度的统计分析都是毫无意义的,充其量是一种数字游戏而已。应该树立这样一种观念:科学的统计数据分析首先取决于科学的统计测度,而不是首先取决于什么样的分析模型,虽然模型也很重要。这也再一次证明,统计测度问题是统计学的根本问题。其实,归根结底看,在统计数据分析过程中,每一步分析都以前一步的测度为原始测度,每一步所用的方法都是统计测度方法,因此所有的统计分析方法都是统计测度方法。甚至可以说,统计学方法体系就是统计测度方法体系。
当然,在实际的统计分析中,统计测度往往遇到一些困难,即有些指标数据由于各种原因无法获得,这就不得不采用替代这种途径。例如,绿色GDP核算的概念已经提出很多年,但为什么还没有哪个国家真正公布绿色GDP数据,原因就是自然资源价值、生态环境价值等的统计测度目前还面临着很大的困难,其背后存在着一系列有待进一步研究和解决的理论与实践问题,因此不少学者进行了替代测度的探讨。这一方面说明统计测度的重要性,另一方面说明统计测度替代的无奈性。但是,替代测度必须遵守相应的规则与逻辑,要经得起推敲。有的文献明明知道有关变量无法测度、有关数据无法获得,却随意地、不符合逻辑地进行所谓的替代,结果是最后的结论不知替代成什么样了,很难理解它的意义。关于替代测度的有效性问题,邱东教授[7]已有精辟的论述,在此不再展开讨论。
三、统计测度是数据科学的基础
笼统地讲,数据科学就是以大数据为研究对象的科学,需要多学科交叉融合、共同支撑。由于大数据是快速增长的复杂数据,因此大数据分析仅有统计思维与统计分析方法是不够的,还需要强大的数据处理能力与计算能力。只有把统计思维、统计方法与计算技术结合起来,才有可能真正挖掘出大数据中的有价值信息。本文认为统计思维、统计方法与计算技术相结合的基础就是科学的统计测度。
首先,大数据技术不能自行解决其计算和分析应从何处着手的问题。现代信息技术与互联网、物联网技术的快速发展,使人类进入大数据时代,也有人说进入到数联网时代,这意味着我们一方面被各种越来越多、越来越复杂的数据所包围,另一方面又被数据中巨大的信息价值所吸引,想从中挖掘出可供决策之用的信息。如何挖掘大数据?人们已经进行了艰苦的探索,发展了很多专门的方法技术,并已尝到了不少甜头,但远未达到充分利用大数据中有效信息的目的,因为已有的大数据分析研究主要集中于计算机科学与技术、软件工程、计算数学等领域,重点是计算能力与算法研究,而很少从统计学的角度进行有针对的探讨,还没有真正进入数据分析的深层。这里面实际上忽略了最基础的统计测度问题。如果说,计算技术的发展能够解决数据储存与计算的能力问题,算法模型的改进能够解决大数据分析的综合能力问题,那么它们仍然不能解决对谁进行计算与分析的问题,也即从何处着手的问题。无论是传统的结构型数据,还是现在的包含大量非结构型数据的大数据,要对它们进行分析都必须找到正确的切入口,即分析的基本元素是什么,或者说需要测度什么。当然,还有如何测度的问题。然后,才能进行分组、综合和构建模型,否则大数据分析不会达到人们的预期。
其次,大数据之所以催生数据科学,就是为了通过多学科交叉融合来共同解决大数据分析中存在的问题,其中包括统计测度问题,这一点对于非结构化数据尤为突出。实际上,大数据的本质就是非结构化数据,一是体量大、比重高(超过95%),二是变化快、形式多,三是内容杂、不确定。通过各种社交网络、自媒体、富媒体,以及人机对话和机器感应记录等产生的各种非结构化数据,例如各种文字、各种表情符号、各种声音、各种图像,到底表示什么?综合在一起能体现什么规律?如何综合各种信息?存在着大量有待研究的问题。其实,文字的长短、用词、表达形式(叙述式、议论式、散文式、诗歌式,等)甚至字体大小与颜色,表情类型与偏好,声音高低、频率与情绪,图像颜色等等,都是有特定意义的,即在特定环境条件下的反应。所以,一句话或一段声音的意义并非文字本身的意思,一个表情符号的意义并非符号表征的意思,一个图像的意义并非图像内容与色彩本身的意思,因为背后有太多的未知。人们浏览检索各种信息的习惯、收看与回复邮件等信息的习惯、参与信息网络的习惯、购物习惯与支付习惯等等,也是如此。更何况,同样的网络词汇在不同的时间代表着不同的语义。这背后隐藏着的是人们的行为与社会关系,既具有个性又具有共性,极其复杂。所以对这样的数据进行分析,首先绝非是计算问题,也不是用什么模型问题,而首先是从何处着手、如何选取关键词、如何选定关联词、可以用什么样的指标来综合、可以用什么样的表式来表现等问题,一句话就是统计测度问题。非结构化数据的统计测度将主要是定义测度,这些问题不解决,分析模型也是难以构建的,或者难以得出令人信服的结论。
例如,关于《红楼梦》前80回与后40回是否同一作者的争论,韦博成[10]进行了综合性的比较研究并提出了自己的观点,他指出已有美国威斯康辛大学华裔学者陈炳藻教授(1980)[11]、我国华东师范大学陈大康教授(1987年)[12]和复旦大学李贤平教授(1987年)[13]等学者从统计学的角度进行过专门的研究,但却得出了不同的结论:陈炳藻教授认为前80回与后40回均是曹雪芹所著;陈大康教授认为前80回与后40回为不同人所著;李贤平教授认为前80回是曹雪芹根据《石头记》增删而成,后40回是曹雪芹亲友搜集整理原稿加工补写而成。此外,还有其他一些学者进行过类似的研究,也有一些不同的结论。为什么都通过提取关联词和统计的方法却得出不同的结论?原因就在于用以分析的关联词不同,即统计测度的切入点不同,当然也有统计方法上的差异,但前者是根本。至少存在几个统计测度上的问题:提取单一维度的关联词还是多维度的关联词?提取什么类型的关联词(例如:关联词是名词、形容词还是动词;是花卉、树木、饮食、医药还是诗词)?这些关联词可以综合为什么样的指标?等等。由此可见,原始统计测度代表着数据分析的方向。
相比《红楼梦》,大数据分析要复杂得多、困难得多。所以,数据科学除了需要数学、统计学、计算机科学与技术、人工智能等学科的交叉融合外,还需要与行为科学、语言学、社会学、经济学等学科相结合,以便能很好地解决作为数据分析之前提的统计测度问题。
第三,数据科学将进一步拓展统计测度的边界,并提出更高的要求。伴随着人类认识世界的范围的不断拓展,统计测度的范围也不断扩大,从自然现象统计测度到人口现象、经济现象统计测度,再到社会现象、环境现象、政治现象等统计测度,几乎已经渗透到了所有可以想象到的领域。相应地,统计数据分析也从少量数据的分析进入到了大数据分析。大数据的复杂性、不确定性和涌现性(王元卓等,2013)[14],意味着统计测度的内容大大增加,原来一些不能测度的数据被纳入到了统计测度的范围,按照邱东教授的说法就是统计测度的边界大大扩展了。统计测度边界的扩大,必须以统计测度能力的提升为前提,即要求统计学借助现代信息技术进一步提升处理和分析数据的能力———对大数据“化繁为简”、“变厚为薄”的能力,这就必须以科学准确的大数据统计测度为前提,既改变统计思维,又创新统计分析方法,其中就包括统计测度思维、统计测度方法与统计测度标准。面对大量繁杂的数据,如果没有更好的统计测度思路与方法,包括个体标志定义方法、最小数据细胞分组与聚类方法、关联词含义的时间影响计量方法、定性测度指标筛选方法、再测度路径与方法、大数据统计测度评价标准等,那么统计学在数据科学发展过程中就难以发挥应有的作用,数据科学也将裹足不前。这就是统计学迈向数据科学的重要挑战之一。
综上所述,统计测度的基础性问题从统计学延伸到了数据科学,是两者的共同基础,并且对于数据科学而言显得更为重要。大数据的复杂性、不确定性和涌现性导致了统计测度的难度猛增,亟需建立面向大数据分析的统计测度理论与方法。要通过研究大数据的复杂性、不确定性和涌现性特征的基本因素,以及这些因素之间的内在联系、外在指标和测度方法,进而研究基于先进计算技术的大数据度量模型,构建寻找面向计算的数据内核或者数据边界的基本方法。总之,建立有效易行的数据表示方法,即科学的统计测度方法,是数据科学必须解决的基础问题之一。
四、创新与完善大数据统计测度方法
如前所述,统计学研究对象已经从结构化数据延伸到了包括非结构化数据在内的一切数据,统计测度边界得到了大大的扩展。按照邱东教授[7]曾经引用过的海德格尔的话:“界限并不表示某一事物的发展到此为止,而是像希腊人所认知的那样,界限是某种事物开始展现的地方”,预示着统计学在数据科学发展阶段的新起点已经展现在我们面前。新的统计测度边界催生统计测度方法的创新,统计测度方法的创新促进统计测度边界的拓展,两者相辅相成,共同推动统计学与数据科学的发展。为此,我们要系统梳理统计测度方法的发展历程,面对大数据提出的新挑战,大胆探索统计测度的新思路、新理论和新方法,为数据科学奠定坚实的统计学基础。为此提出如下几点建议:
首先,要紧密结合现象的本质去探求更科学的统计测度方法。本质决定一切,既然统计测度的目的是获得客观反映现象本质的数据,那么深入到现象本质、认识和掌握现象的本质,是科学统计测度的关键,也是探求新的统计方法的出发点。换句话说,科学的统计测度方法能够体现出数据的真正意义。例如,要探求社交网络数据的统计分析和测度方法,就必须了解社交网络的产生背景、构成要素、表现形式与基本特征,既要研究它的共性问题,又要研究它的个性问题与差异性,同时还要研究它的变化趋势。只有这样,才能掌握社交网络数据的构成要件或元素,才能建立起科学的、能有效体现社交网络数据意义的统计测度方法。再如,要分析研究电子商务数据,也必须先弄清楚什么是电子商务,尤其是弄清楚它与传统的商业模式有什么不同(包括物流、资金流与信息流)、有哪些新生事物(包括时空特征、法律监管)等等,否则统计测度无从下手或者抓不住要害。同时,作为一个新的研究领域,数据科学的理论基础将与计算机科学、统计学、人工智能、数学、社会科学等有关,离不开对相关学科领域知识与研究方法的借鉴,因此对相关领域的知识与研究方法的学习十分重要。否则,就会严重扭曲统计测度方法,胡乱设置测度标志,这需要引起高度关注。
其次,要紧密结合大数据的特点去创新统计测度方法。大数据的特点是复杂性、不确定性和涌现性并存,构成了多维的数据空间,里面蕴藏着丰富的信息资源,这是传统的统计数据不可比拟的。那么该从何处进入这样的数据空间?怎么进去?又怎么出来?这归根结底还是统计测度方法问题。因此,在开展大数据分析之前,首先要研究大数据的基础性问题,包括大数据的内在机理(包括大数据的演化与传播机制、生命周期),数据科学与社会学、经济学、行为科学等之间的互动机制,以及大数据的结构与效能的规律性等等,为创新统计测度方法提供导向。本文认为,再复杂的数据也有共性,再不确定的数据也有规律,再涌现的数据也有轨迹。网络大数据背后的网络平均路径长度、度分布、聚集系数、核数、介数等具有共性的特征与参数,是开展复杂网络数据分析的基础(李国杰、程学旗,2012)[15];大数据在时空维度上的分布形式、内在结构、动态变化和相关联的规律,是找到大数据分析切入口、进而简化大数据表征的前提;大数据的涌现性轨迹(包括模式涌现性、行为涌现性和智慧涌现性),是研究更多的社会网络模型和理解网络瓦解失效原因,理解人们网络行为涌现特征(例如人们发邮件数量的时间分布特征),以及探求大量自发个体语义融合连接形成有特定意义的通用语义之过程的路径(靳小龙等,2013)[16]。也就是说,这些共性、规律和轨迹就是统计测度的主要依据,也是重点内容。发展和创新能够准确发现大数据的共性、规律和轨迹的定量方法,其实就是发展和创新大数据统计测度方法。