时间:2023-03-22 17:43:21
序论:速发表网结合其深厚的文秘经验,特别为您筛选了11篇自动识别技术论文范文。如果您需要更多原创资料,欢迎随时与我们的客服老师联系,希望您能从中汲取灵感和知识!
关键词 :介词短语 条件随机场 识别
一、引言
专利文献在国家经济发展和科技交流中发挥着十分重要的作用。近年来,中国专利的申请数量涨速飞快。面向专利领域的文本信息处理(如专利文本机器翻译)逐渐成为自然语言处理的重要应用领域之一,并引起了学术界和业界的广泛关注。
为了满足专利文本特定的表述需要,介词短语作为一种重要的短语类型,在汉语专利文本中分布广泛。据统计,在随机抽取的500句汉语专利语料中,包含介词短语的句子有226句,占到了样本总量的45.2%。[1]可见介词短语的出现比例非常高。汉语介词短语的自动识别具有较大的难度,主要表现在以下几点:
1.介词短语的内部构成相当复杂。介词短语可以由介词与其他词语和短语(动宾短语、名词短语、方位短语、时间短语等)构成,甚至可以由整个句子构成。复杂的内部结构很容易形成远距离的搭配关系。
2.兼类介词的存在。在一定的语境下,介词还可以兼做名词、量词、形容词、连词和动词等,必须结合上下文语境才能判断具体词性。
3.在同一个句子中经常会出现多个并列的介词短语,或者会出现复杂的嵌套介词短语。
下面是一个包含介词短语的真实专利语句示例:
(1)本发明【在条件允许的情况下】【通过[为一个宏块中的不同区域]提供不同的预测信息】而提出了许多更加准确的结果。
从例句可以明显地看出,专利文本中的介词短语通常具有更多的字数和更为复杂的结构。例句中用括号标示出了两个并列的介词短语结构,其中一个的内部还有另外一个介词短语,属于嵌套结构的介词短语。正确识别这些短语就比较困难了。
在句子S=W1,W2,W3……Wn中,假设字符串Wi,Wi+1……Wj为待识别的介词短语,介词短语识别的主要任务就是分别将Wi和Wj识别为该介词短语的左右边界。由于左边界就是介词本身,因此关键问题在于确定右边界位置。介词Wi通常称为前界,右边界Wj称为后界,紧邻右边界的词语Wj+1一般称为后词。
考虑到介词短语分布的广泛性和对专利文本处理的影响,本文尝试利用条件随机场模型(Conditional Random Field,即CRF),主要对大规模专利语料中位于同一分句内部的介词短语进行自动识别研究,希望能做出一些有益的探索。
二、相关研究
针对汉语介词短语识别的难点,国内外学者做了大量研究工作,提出了一些有效的方法,主要包括规则方法,统计方法和将二者相结合的混合方法。梁猛杰等(2013)通过考察介词规则库的处理特点,依据规则的覆盖程度从低到高进行分类,重新调整了规则的前后排序方案,同时对排序的规则进行优选,在保证时间复杂度较低的情况下提高了介词用法自动识别的准确率[2](P152~155)。朱筠(2013)、胡韧奋(2015)等在概念层次网络理论(Hierarchical Network of Concepts,HNC)[3]的指导下,面向汉语专利领域的文本,专门构建了较大规模的汉语专利语料知识库,在利用规则方法开展汉英专利机器翻译研究的过程中探索了介词短语的识别方法和思想[4][5]。于俊涛(2006)釆用基于最大熵模型的方法,通过获取有效的特征集合完成了介词短语识别的任务。奚建清(2007)引入机器学习方法,提出了基于隐马尔可夫模型(HMM)的汉语介词短语边界确定方法。首先基于HMM自动识别介词短语,然后利用依存语法错误校正方法对识别结果进行修正,取得了不错的识别准确率[7](P172~182)。胡思磊(2008)、宋贵哲(2011)、张杰(2013)利用CRF模型对介词短语进行识别,取得了较好的效果。于俊伟(2005)采用了规则和统计相结合的介词短语识别方法,提出了利用搭配模板获取可信搭配关系以及基于词性的三元统计模型和规则相结合的方法识别介词短语[11](P17~23)。昝红英等(2013)在已有工作的基础上,提出了一种规则与CRF模型相结合的介词用法自动识别算法。通过将人工书写的规则与CRF在宏观层面和微观层面进行有机的结合,根据介词的具体特点,选择合适的识别方法,使最终的识别准确率达到了80%左右[12](P2152~2157)。
三、CRF模型介绍
作为一种基于统计的判别式学习模型,CRF模型最早由Lafferty等人在2001年提出。该模型来源于最大熵模型。CRF通过计算和统计已知元素推理计算未知元素的条件概率。与隐马尔可夫模型不同,CRF可以利用上下文信息,而不需要严格的独立性假设,因此在序列标注问题中表现出很好的性能。此外,CRFs还解决了最大熵马尔可夫模型(MEMM)中的标注偏置问题。CRFs被广泛应用于自然语言处理领域的句法分析、命名实体识、词性标注等方面,并取得了很好的效果。CRFs是一种以给定的输入序列X为条件来预测输出序列Y概率的无向图(undirected graphical)结构模型。(X,Y)就是一个以观察序列为条件的随机域。概率计算可以通过如下公式得到:
四、基于CRF的介词短语识别
国外学者已经开发了完整的CRF模型工具包,利用工具包可以快速地训练模型并得到相应的结果。在本文中,将使用CRF++0.53版本的工具包①对中国专利信息中心提供的专利语料进行训练。
(一)序列标注
很多基于CRF模型的语块识别任务通常可以转化为序列标注问题。在识别介词短语的过程中,首先对包含介词短语的句子进行分词处理,然后对每个词语进行标注,确定介词短语的边界。我们采用{B, I, E, O}标记集进行标记。其中B表示介词短语的前界,I表示介词短语的内部成分,E表示介词短语的后界,O表示不属于介词短语的部分。
(2)本发明通过采用有效的方法提高汽车产量。
对于这个例句,可以做出如下标记:
本发明O通过B采用I有效的I方法E提高O汽车O产量O。O
将其反映到序列标注问题上,则可以认为:
输入序列X={本发明 通过 采用 有效的 方法 提高 汽车 产量 。}
相应地,输出标注序列Y={O B I I E O O O O }
(二)特征选择
特征是训练CRF模型必需的。在CRF中,特征选择是一个非常重要的问题,选择合适的特征对模型训练和测试都将十分有益。尽管可以不加限制地定义标记序列的特征,但不代表特征越多就越好。通过考察大规模语料中介词短语的特点,初步确定了以下五个特征及其属性值:
1.词特征。词作为句子的基本构成单元,是最基本的特征,模型可以通过词之间的差异性来寻找词本身的内部特征。
2.词性特征。通过分析发现,词性特征对边界的识别具有很大的提示作用。因此需要标记序列中词语的词性。本文采用北京大学《现代汉语语法信息词典》中的词性标记集进行标记。
3.候选前界特征。从当前词位置开始向前查找,查找位于同一分句中的介词。如果该介词存在,则该特征值为介词本身;否则特征值为“N”。
4.候选后界特征。如果认为当前词语可以作为介词短语的后界,则特征值记为“Y”,否则记为“N”。
5.候选后词特征。后词对介词短语的正确识别也起到了很大的提示作用,判断当前词是否是候选后词也能减小后界的选择范围。如果认为当前词语可以作为介词短语的后词,则特征值记为“Y”,否则记为“N”。
下表是例句2的标注实例:
将以上五个特征分为五列,对分词处理后含有介词短语的每一句语料进行标注,同时在最后一列加入{B, I, E, O}标记集,以确定介词短语的边界,以此形成训练语料和测试语料。
(三)特征模板
对于CRFs模型而言,根据选择的特征设计出不同的特征模板,根据特征模板系统生成不同的特征函数,会影响系统的性能。因此,特征模板选择的好坏将直接影响CRFs模型的效果。所以,特征模板的选择也是CRFs模型在介词短语识别中的重要问题之一。
CRFs模型的特征模板一般包括原子特征模板和复合特征模板。单独使用原子特征模板,只能表现出单个位置的特征信息,容易造成期望值和实际结果的偏差较大,导致参数的估计不准确。可以对原子特征进行组合,构成复合特征模板,通过定义各特征的窗口来描述标注单元和上下文之间的关系。本文将窗口大小定义为2。即分别考虑当前词、当前词前面两个词及后面两个词的五项特征。
当完成了序列特征标注任务,就可以利用CRF工具包对模型进行训练并识别介词短语了。
五、实验及分析
(一)实验结果
在这一部分,设计实验测试CRF模型识别介词短语的效果。从中国专利信息中心提供的专利语料中随机选择了1000句含有介词短语的句子作为测试集进行序列标注。实验采用四倍交叉验证方法,即将测试集按照数量均分为4等份,其中的3份语料作为训练语料,另一份作为测试语料,共进行四次实验,分别计算实验的三个评价指标:准确率(P)、召回率(R)和F1值,并将实验的平均值作为最终的参考结果。评价指标计算公式如下:
其中,“N”代表每次实验的测试集(250句)中介词短语的数量,“N1”代表模型识别介词短语的数量,“N2”代表正确识别的数量。
(二)实验分析
从上表可以看出,实验的整体评价指标都达到了90%以上,表明CRF模型对于识别介词短语的有效性。
通过分析识别错误的结果,初步认为分析错误的原因可能有以下几点:
1.有的介词在训练集中出现次数很少或者几乎没有出现,因此CRF模型无法有效学习到这些介词的特征,当它们出现在测试集中,模型就难以正确识别。
2.有些介词短语具有歧义,模型不容易判断短语的右边界位置。例如:通过墨水着色剂可以有效地使染布上色。这句话中,两个名词“墨水”和“着色剂”挨在一起,不确定二者是否可以组成复合名词,不容易判断到底哪个名词才是介词短语真正的右边界。
3.CRF模型对于序列的标注特征比较敏感。在人工标注的过程中一些难以避免的标注失误或错误也会导致识别错误的现象。
六、结语
本文利用条件随机场模型尝试对汉语专利语料中的介词短语进行了识别研究。在分析大规模语料的基础上,选择了合适的特征,对语料进行序列标注,同时利用CRF工具包训练了识别短语的模型,最后设计了实验检验识别效果。实验整体的准确率达到了90%以上,表明提出的方法对于识别介词短语是有效的。
未来将加强对歧义介词短语的研究,考察更多语料,争取发现更多有效的特征,同时扩大测试规模,希望进一步提高识别的效果与性能。
(本文得到了“国家高技术研究发展计划”[863课题,项目编号2012AA011104],中央高校基本科研业务专项资金以及中国博士后科学基金资助项目的资助,特此表示感谢!)
注释:
①http://crfpp.googlecode.com/
参考文献:
[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering
Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.
[2]梁猛杰,宋玉,韩英杰等.基于规则排序的介词用法自动识别研
究[J].河南师范大学学报(自然科学版),2013,41(3).
[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版
社,1998.
[4]朱筠.基本句群处理及其在汉英专利机器翻译中的应用[D].北
京:北京师范大学汉语文化学院博士学位论文,2013.
[5]胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].
语言文字应用,2015,1.
[6]于浚涛.基于最大熵的汉语介词短语自动识别[D].大连:大连理
工大学硕士学位论文,2006.
[7]奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算
机工程,2007,33(2).
[8]胡思磊.基于CRF模型的汉语介词短语识别[D].大连:大连理工大
学硕士学位论文,2008.
[9]宋贵哲.汉语介词短语识别研究[D].大连:大连理工大学硕士学
位论文,2011.
[10]张杰.基于多层CRFs的汉语介词短语识别研究[D].大连:大连
理工大学硕士学位论文,2013.
[11]干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学
报,2005,(4).
[12]昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动
识别研究[J].计算机工程与设计,2013,(6).
中图分类号:TP311.52文献标识码:A文章编号:1007-9599 (2010) 10-0000-01
RFID-based File Management System
Zheng Fu’e Shang Deji
(Zhengzhou Radio&TV University,Zhengzhou450000,China)
Abstract:The paper firstly analyzes the current situation of the current archives management,then designs a management system based on RFID technology to improve the status of records management.And describes the functional design and business process.
Keywords:File Management;RFID technology;Process design
一、档案管理的现状[1][2]
近年来随着信息技术的发展,我国档案事业取得了较大的发展,档案的种类日益多样化,信息量迅速膨胀。但是传统档案管理手段与技术所导致的问题日益突显:档案编目流程繁琐低效、整理时间冗长;档案存放次序较易被打乱;档案查阅耗时长;档案的盘点操作不科学;对失效档案的管理滞后等等。
RFID(无线射频识别)技术作为新一代物流跟踪与信息识别的技术,可以促进档案管理的自动化、智能化。
二、RFID技术简介
RFID(Radio Frequency Identification),即无线射频识别,是兴起于20世纪90年代的一项自动识别技术。RFID射频识别是一种非接触式的自动识别技术,它通过射频信号自动识别目标对象并获取相关数据。一个典型的RFID系统由射频电子标签、读写器或阅读器以及天线三部分构成。实际应用中,读写器把关于物品的数据写入RFID标签,然后将标签贴在待识别物体的表面。读写器可无接触地读取并识别电子标签中所保存的数据,从而可以实现对物体识别信息的远距离、无接触式采集、无线传输等功能,并且同时能识别多个RFID标签。[3]
RFID技术应用于档案管理可以促进档案管理的自动化、智能化,具有较多优点,比如:远距离快速扫描、安全性高。[4]
三、基于RFID的档案管理设计
本文设计的基于RFID技术的档案管理系统,其主要由RFID数据管理模块和档案管理信息模块两部分组成,如图1所示。
(一)RFID数据管理模块
该模块由信息采集和终端管理器组成,是系统的数据存取中心与信息输入输出终端。终端管理器包括读写器或阅读器,是中心数据库获取信息与输出信息的重要端口。读写器的作用是负责将数据库中的信息写入标签或是将标签中的信息导入数据库。[3]
信息采集部分包括物品、物品电子标签、读写器等,主要完成物品的识别和物品EPC码的采集和处理。存储有EPC码的电子标签在经过读写器的感应区域时,档案的EPC码会自动被读写器捕获,从而实现自动化EPC信息采集,采集的数据将交由上位机信息采集软件进行进一步的处理,如数据校对、数据过滤、数据完整性检查等,这些经过整理的数据可以为档案信息管理模块所使用。
(二)档案信息管理模块
档案信息管理模块可以在档案信息管理系统的基础上改进增加与RFID数据管理模块交换数据的接口。
RFID数据管理模块与档案信息管理模块通过系统接口实现模块间的对接,由RFID数据管理模块实现档案数据的收集、储存、读写电子标签;档案信息管理模块实现对档案信息的应用与管理。同时,可对系统用户设置不同权限,以实现对用户的安全性管理。
四、系统流程设计[1]
该系统流程主要有档案入库、日常管理、查找和盘点、防盗管理和销毁等,下面将分别介绍几个重要流程。
(一)档案入库
新的档案入库前,首先要对新档案进行编目,并把该档案信息写入RFID标签,同时标签数据会被传送到中心数据库里,以备系统其他模块调用和查询。
(二)档案日常管理
对于档案的日常管理,均需要通过读写器对标签进行读写操作完成,在数据库中存储工作记录,同时在档案RFID芯片中写入借出和归还记录。同时,每次借出和归还操作产生时,必须通过手持机对存储该档案的档案架标签进行写操作,更新档案架标签中的存放记录。
(三)档案查找和盘点
在查询相关档案时,管理员通过系统按编号提取中心数据库里所储存的数据信息,核对无误后发出出库指令,档案自动识别部分将根据编目号找出该档案存放的档案架编号即其物理位置。
(四)档案防盗管理
在档案室出入口安装有读写器,并与该管理系统连接。当档案经过出入口时,读写器自动读取档案数据,若判断档案未经办理领用操作,则装置发出异常警报。
(五)销毁
当档案在入馆时,将档案保管期限写入RFID标签并存储于中心数据库中。当有档案达到保管期限前,系统将提示该档案将于何时失效,由管理员做出销毁或继续保管处理,以减少对档案室资源的占用。
五、结束语
RFID技术应用于档案管理中可以解决现有档案管理中的一些问题,它使档案管理自动化,可以提高档案管理的效率,减少人员的使用,免去了计算机档案管理和人工档案管理的繁琐。
参考文献
[1]严林.电子档案管理―计算机技术在档案管理中的应用[J].机电兵船档案,2010,(03):81-82
传统的标签防碰撞算法可分为ALOHA算法[2-3]和树形算法[4-5]2类。ALOHA算法是1种完全随机接入的多址接入协议算法,比如:PALOHA算法(随机推迟算法)、时隙ALOHA算法(SA算法)、帧时隙ALOHA算法(FSA算法)、动态帧时隙ALOHA算法(DFSA算法)和分组ALOHA算法等。该类算法在标签试图发送数据时,并不考虑信道当前的忙闲状态,一旦产生数据,就立刻决定将其发送至信道,这种发送控制策略有严重的盲目性。随着用户数量或发送信息量的增加,这种完全随机接入的算法将使信道重叠现象加剧,碰撞概率增大,传输性能下降。
近几年,有学者提出了采用CDMA技术进行防碰撞的方法,其性能有明显改善。文献[6]提出在标签识别过程中,使用码分多址技术,实现一个时隙可以同时传输多个标签。文献[7]提出了一种基于码分多址思想的时隙ALOHA算法,来解决射频识别中的防碰撞问题,此算法的系统稳定范围要大于时隙ALOHA系统,并且当选用的扩频码组阶数为N时,此算法的最大吞吐量可达原时隙ALOHA的N倍。上述2个文献所提到的算法,当标签数量很多时,数据碰撞的概率明显增加,使系统的吞吐量急剧下降,影响了系统的整体性能。基于以上原因,本论文提出了1种改进的基于CDMA技术的防碰撞算法,能够适应大量标签的识别应用,减少了识别碰撞的发生,使系统吞吐量得到明显改善。
1基于CDMA技术的新型防碰撞算法
n×1-1Nn-1(2)由于传统的基于ALOHA的防碰撞算法中一个时隙最多只能正确识别一个标签的信息,所以当标签数目过大时,系统的吞吐率,即正确识别标签数目所占的百分比将会大幅度的降低,所以对于过量的标签,本算法将会采取对所有标签进行分组识别,当标签需要分成2组时(系统识别帧最大时隙数N为256):nN×1-1Nn-1=n2N×1-1Nn2-1 (3)用上述公式可知n=354,所以当标签数量大于354时,系统将会对标签分组识别。
本文提出的新型算法如下:依据分组帧时隙ALOHA算法,通过此算法的分组规则,完成识别的所有标签的分组。分组帧时隙ALOHA算法的分组规则如下:当标签数量≤354时,无论帧长选择8个时隙还是256个时隙,标签都不分组,按照一个大组来进行识别;当标签数量>354时,帧长选择256个时隙比较适合读写器的识别;当标签数量在355707时,标签分为2组;当标签数量在708~1 416时,标签分成4组更适合信息的传输识别。当标签数量更多时,按照这个规律分成合适的组数再进行识别,详细过程如图1所示。标签分组工作完成后,在每个分组中分别采用码分多址技术,利用其技术的保密性、抗干扰性和多址通信能力,对标签中的数据进行扩频处理并传输。然后读写器端利用码组的自相关特性对不同标签所发的数据进行解调,从而达到防碰撞的目的,进而完成对全部标签的识别,也实现了同一时隙可以传输多个信息的情况。本论文中提到的新型防碰撞算法需要预先在待识别的标签中植入扩频性良好的正交码组,以防止接收端没有办法正确解扩接收,本文选用Walsh序列。该算法可以有效减少图1算法执行过程示意图标签识别过程中的碰撞次数,从而减少了识别时间并且降低了功耗。本论文将分组帧时隙ALOHA算法和码分多址技术相结合,实现在每个分组内可以有多个标签同时进行扩频传输,并且在接收端采用并行接收技术进行多个标签的同时接收。本发明在识别标签过程中,每个组内均为一个独立的识别过程,在分组帧长不改变的前提下,提高了标签数量庞大时的系统性能。有效地减小标签之间的碰撞概率,缩短读写器操作时间,提高吞吐率, 很适合应用于具有较大数量标签的RFID系统中。
2仿真结果
本论文提出了采用码分多址技术的新型防碰撞算法,并仿真了固定时隙数下ALOHA算法的系统吞吐率和本文所提出的算法改进后的系统吞吐量。
RFID系统中时隙ALOHA算法的帧长取值从16个时隙到256个时隙变化,根据公式2,系统吞吐率如图2所示。其中,系统仿真设定的信息帧长F即时隙数设定按2的幂次方递增,即F取值从16个时隙变化到256个时隙,横坐标为标签数N从1变化到500,纵坐标为吞吐率。当帧长设定为256个时隙,标签数量少于256个时,系统吞吐量随着标签数量的增加而增加,直到标签数量达到256时系统的吞吐量达到最大值。随着标签数量的逐渐增多,系统的吞吐量又呈现下降趋势。从图2可以得出2点结论:一、当标签个数接近信息帧长时,系统的吞吐率比较高;二、随着帧长取值的增加,系统对标签的识别性能有明显改善。
本论文提出的基于码分多址技术的新型防碰撞算法选用Walsh序列码,其在对标签的ID号进行扩频处理后,即可实现在同一时刻有2个以上的标签同时进入读写器的识别区域,它们同时发送各自的ID号后,读写器在接收到这些在空间叠加后的信号时也能完整地分离出不同标签的ID号,突破了时隙ALOHA算法在同一时刻不能有2个以上标签到达的限制。此时,系统的吞吐量为(Walsh序列的阶数为r)esucc=∑t=2rt=1N×P(N,n,t)(4)固定时隙数的ALOHA算法的系统吞吐量仿真图和其与基于码分多址技术的新型防碰撞算法的比较仿真结果如图3所示。仿真条件为标签的到达情况符合泊松过程。仿真图3给出了RFID系统的读写器阅读100个标签的识别结果,其中新型算法选用的是Walsh序列,其阶数r取值从2变化到3,固定时隙数的ALOHA算法的信息帧长F取值从32变化到64,横坐标为标签数N从1变化到100,纵坐标为吞吐量。从仿真结果看,在同样的到达率的条件下,阶数越大,算法的吞吐量越高,系统的识别性能有明显改善。并且随着到达率的增加,新型 算法的吞吐量也随着增加,当标签到达量与阶数相等时,系统吞吐量达到最大,但到达量大于阶数时,吞吐量随着到达率的增加而呈下降趋势。这是由于当在同一时隙内到达的标签数量增加到一定程度后,基于Walsh序列阶数r的有限性,选用相同的Walsh序列作为扩频码的标签数量将会增加,此时必然导致碰撞的增加。当选用的Walsh序列阶数为3时,基于码分多址技术的新型防碰撞算法的系统吞吐量可高达3.2,远高于时隙ALOHA的0.368。而且随着Walsh序列阶数的提高,吞吐量的最大值还可以提高,但这会以增加读写器和标签的硬件复杂度为代价,在实际使用中必须根据需求在吞吐量和Walsh序列阶数中作出折中选择。
3结束语
本论文在标签的到达情况符合泊松过程的情况下,利用码分多址技术的多址通信能力,结合分组帧时隙ALOHA算法的优势,创新地提出了一种RFID系统中基于码分多址技术的新型防碰撞算法。理论和仿真实验表明:同已有的标签防碰撞算法相比,本论文提出的新型算法提高了标签数量庞大时的系统性能,能有效地减小标签之间的碰撞概率,缩短读写器操作时间,提高吞吐率, 很适合应用于具有较大数量标签的RFID系统中。
中图分类号TN29 文献标识码A 文章编号 1674-6708(2013)95-0073-03
0 引言
目前对轮胎X射线检测系统的图像识别都是由人来主观判断的。X光机对轮胎进行扫描成像,将图像传输到计算机中在显示屏上显示,工作人员通过对轮胎X射线图像的识别来判断轮胎是否有缺陷并对其缺陷进行分类,由人工来进行轮胎缺陷图像识别受到外界的干扰较大,并且具有工作量和工作强度大的特点,这些都容易给轮胎缺陷图像的识别带来较大不利影响。采用计算机图形识别技术对轮胎X射线图像进行识别,不仅能提高工作效率,有效解决人工识别过程中带来的问题,使识别的过程客观化,更加科学和规范。轮胎X射线缺陷检测系统能对其图像进行自动处理和归类,通过对轮胎缺陷图像的统计,还可以建立轮胎缺陷图像的数据库,提高企业在轮胎生产过程中的经济效益[1]。
国内厂商大都是用国外生产的X射线检测产品,比较常见的品牌有德国的Collmann和YXLON等[2]。YXLON是国际上轮胎内部缺陷检测设备的最大生产厂家,其产品具有可靠的检测结果、快速的检测时间、维护简单、结构紧凑、操作简单直观等特点[3]。相比较国外,国内对轮胎用X光机图像处理技术的研究不多,对于国内的轮胎制造厂商,如果想要运用轮胎缺陷图像自动识别技术,只能向国外购买,但是价格昂贵。因此,现在国内的大部分厂商还是采用人工肉眼对轮胎X射线图像检测的方法进行质量判断[4]。
1 轮胎X射线检测装置和结构分析
我们采用的轮胎X射线检测图像采集装置为YXLON公司生产的LX-1500型轮胎X射线检测系统,YXLON的轮胎X射线检测系统由X射线管、U型传感器、数字图像转换器、图像处理工作站和显示器等部分组成,该系统具有机械结构设计良好和图像识别系统分辨率高的特点。采用该系统对轮胎进行X射线检测时,轮胎首先通过起重机被装载到检测的支架上,系统操作工使用控制面板输入合适的参数,按照设定好的参数,径向X射线管伸进到轮胎的中部,马鞍型的轮胎线阵列检测器也移动相应的位置,轮胎在支架上保持匀速的转动,从而确保了轮胎X射线检测过程的连续性。
2轮胎X射线检测图像分析
由于轮胎的规格型号极其繁杂,轮胎的内部结构也是千差万别,导致表述轮胎缺陷时没有统一的标准,这里依据对轮胎生产质量的控制要求,结合轮胎缺陷数据分析和文献资料参考的基础上,将轮胎内部钢丝帘线的缺陷特征概括为以下四类:
2.1 帘线的形状
对于质量正常的轮胎而言,其内部的胎体钢丝帘线分布应该是与图像横向平行排列的直线序列,如图1(a)所示。当帘线弯曲时,其检测图像如图1(b)所示。
2.3帘线的细节
轮胎内部钢丝帘线的细节主要表现为钢丝帘线上的不连续点、交叉点或者断点。图3(a)是帘线交叉的X射线检测图像,图3(b)是帘线断开的X射线检测图像。对于胎体异物而言,由于X射线投影成像的关系,异物的影像会与钢丝帘线的影像发生重叠,如图3(c)所示,所以胎体异物也可以归纳为帘线上的细节问题。
4 结论
本文首先介绍了轮胎X射线检测装置,然后对轮胎X射线检测的图像进行了详细分析,并对图像中轮胎的缺陷种类进行了分类,最后介绍了自己设计的轮胎X射线检测缺陷识别算法,针对形状、尺度、细节、排列四种轮胎缺陷,分别设计了相应的轮胎缺陷识别算法。
参考文献
[1]冯霞,郝振平.X射线在轮胎边缘检测中的应用[J].CT理论与应用研究,2010,19(3):61-66.
[2]徐啟蕾.轮胎X光图像自动识别系统算法研究[D].青岛:青岛科技大学硕士学位论文,2006.
中图分类号:TP311.52
1 引言
随着社会科技的进步和经济的迅猛发展,医院的业务也日渐增多,如何为医院提供一种安全、舒适、方便、快捷和开放的信息化生活空间,是本文重点讨论的问题。下文中,依托先进的科学技术,实现医院内部管理的高效、互动和快捷。对医院的出入口进行实时智能监控,达到维护治安和防止破坏的作用,及时的把一切可能发生的或即将发生的案件制止,以及对进出医院的可疑人物及车辆进行信息采集,把安全隐患降低到最小,对确保医院安全具有十分重要的作用。本论文工作,是基于VC++和openCV设计开发了一款实用的医院车辆及人员进出管理系统。能够对来访车辆进行自动车牌识别,根据车辆的数据库信息查询,实现门禁系统的自动控制;同时系统还包含人脸检测模块,能够对每天来访的人员进行人数统计。
2 系统总体设计
本系统功能主要分为两大模块:监控管理和数据库信息管理。具体功能图如下所示:
3 系统详细设计
打开和关闭摄像头:通过调用opencv中的函数cvCaptureFromCAM();初始化从摄像头中获取视频,获得每一帧的图像,并显示在窗口的图片控件上。通过调用opencv中的函数cvReleaseCapture();释放资源,并将视频窗口销毁,实现关闭摄像头的功能。
实时信息采集:通过函数cvSaveImage();将图片保存,并进行命名,可将当前摄像头所捕捉到的状况进行采集,可对进出医院的可疑人员和车辆进行抓拍。
人脸检测:在opencv中含有根据人脸模板训练的人脸分类haarcascade_frontalface_alt2.xml。通过加载分类器,可以对当前帧的图像中出现的人脸进行识别,并通过cvCircle()将人脸圈出,实现人脸检测功能。通过检测出来的人脸可以知道今天目前为止该医院共进出了多少人次,并将信息通过定时器定时刷新信息,反馈给保安人员。
车牌识别:车辆检测可以采用埋地线圈检测、红外检测、雷达检测技术、视频检测等多种方式。采用视频检测可以避免破坏路面、不必附加外部检测设备、不需矫正触发位置、节省开支,而且更适合移动式、便携式应用的要求。
系统进行视频车辆检测,需要具备很高的处理速度并采用优秀的算法,在基本不丢帧的情况下实现图像采集、处理。若处理速度慢,则导致丢帧,使系统无法检测到行驶速度较快的车辆,同时也难以保证在有利于识别的位置开始识别处理,影响系统识别率。因此,将视频车辆检测与牌照自动识别相结合具备一定的技术难度。
车牌识别流程如图2所示:
图2 车牌识别流程
车牌图像处理:对于车牌图像,由实时监控录像进行实时保存,在进入车牌识别过程时打开。用dlg.GetPathName()得到图片的路径,将图片打开。因为保存的图片是倒着的,所以将图片显示在图片控件前需要将图片进行旋转。利用函数cvCreateImage()将图片转化为二值化时的大小,用函数cvCvtColor()转化为灰度图,并用cvSmooth()进行高斯滤波,为图片二值化做准备。
图片二值化:所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。程序中没有用opencv函数库中的cvAdaptiveThreshold()和cvThreshold()进行二值化,而是通过调用AdaptiveThreshold()获得第一个阈值,将最大像素的*0.7作为第二个阈值,进行图片二值化,并将这两个阈值用来做边缘检测函数cvCanny()的参数。
牌照定位:本程序中通过对二值化的图像进行边缘检测后,在对得到的图片进行垂直和水平扫描,在对水平方向从左往右扫描的过程中,对最大信息量的区域圈出,然后进行垂直分割,将得到的区域即为车牌区域,之后再用cvResize()将得到的图片变为统一的大小。也就是车牌定位的过程为:水平分割、垂直分割、二值化牌照字符分割。完成牌照区域的定位后,再将牌照区域分割成单个字符,然后进行识别。字符分割一般采用垂直投影法。由于字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,并且这个位置应满足牌照的字符书写格式、字符、尺寸限制和一些其他条件。利用垂直投影法对复杂环境下的汽车图像中的字符分割有较好的效果。
牌照字符识别:字符识别方法主要有基于模板匹配算法和基于人工神经网络算法。基于模板匹配算法首先将分割后的字符二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,选择最佳匹配作为结果。基于人工神经网络的算法有两种:一种是先对字符进行特征提取,然后用所获得特征来训练神经网络分配器;另一种方法是直接把图像输入网络,由网络自动实现特征提取直至识别出结果。
是否放行:在识别车牌号之后,将得到的车牌号的字符串与数据库中的车牌号的字符串进行对比,如果数据库中有该车牌则是医院的车,放行,否则不放行。
4 论文下一步的工作
本系统基本实现了医院车辆进出的自动化管理,以及进出人员的人次统计。但是目前系统只实现了一个摄像头的视频监控,这还不能满足目前医院多个监控摄像头同时工作的现状。因此,论文下一步的改进工作,是实现医院内多个监控摄像头的同时调取与管理。
参考文献:
[1]钟志光,卢君,刘伟荣.Visual C++.NET 数字图象处理实例与解析[M].北京:清华大学出版社,2003,6.
[2]何斌,马天予,王运坚,朱红莲.Visual C++ 数字图象处理第二版[M].北京:人民邮电出版社,2002.
[3]夏良正.数字图象处理[M].南京:东南大学出版社,1999,9.
[4]葛亮.Visual C++从入门到实践[M].北京:清华大学出版社,2009.
[关键词]快速公交;射频识别;电子站牌;准确停靠
中图分类号:TU98.4 191 文献标识码:A 文章编号:1009-914X(2014)29-0292-01
1.研究背景
随着我国城市社会经济高速发展,城市交通堵塞、群众出行不方便问题日益突出,尤其大中城市的交通问题已经逐渐影响到社会正常运营。为改善交通拥挤状况各城市都在大兴土木,道路越修越宽,交通设施占用的城市土地资源越来越多,终有一天会超过城市所允许的最大容量。为避免城市交通陷入拥挤―修路―再拥挤―再修路的恶性循环,2005年10月总理、曾培炎副总理先后作出重要批示,要求各地优先发展城市公交。一时间,“城市公交优先”成为了社会各界关注的焦点。但是,随着城市居民生活水平逐年提高,人们对出行的质量要求也越来越高,经济、安全、舒适、快捷的出行已经成为现代城市居民追求的目标。但从目前的状况来看,我国大部分的常规交通并不能满足人们对出行的要求,公交服务水平普遍偏低。主要表现在运力不足,运行速度不高,准点率低,公交车型陈旧,公交线路不合理,公交吸引力低等。所以,在这种大背景的推动以及世界诸多城市建设快速公交系统的大力影响下,我国各大城市开始把快速公交系统推到了缓解城市交通压力的前台,北京、杭州、天津等地已相继建成,合肥的快速公交已经投入使用,而且在不断的完善中。
射频识别(Radio Frequency Identification,RFID)技术是一种非接触式的自动识别技术,它通过射频信号自动识别目标对象并获取相关数据,识别距离从几厘米到几十米远,而且依据读写的方式不同,可以输入说千字节的数字信息,具有极高的保密性。识别工作无须人工干预,可工作于各种恶劣环境。此外,由于射频识别技术受外界的干扰较小,其识别准确率也比传统的基于视频图像处理技术要高。因此,FRID技术已在世界各地得到广泛的应用,以美国、日本和欧洲为首的发达国家对FRID技术的应用研究已达到相当高的水平,而基于射频识别技术的车辆自动识别系统在我国的研究和应用尚处在起步阶段。
2.设计原理
2.1 设计思路
系统结构:本系统主要由录放系统,LED显示以及射频信号的发射与处理组成。(图1)
首先将准备放音的内容预先录存储到语音芯片中,当站台接收到从公交车发送来的数据后,单片机1根据收到的有效公交车名数据,然后向语音芯片发送对应的语音播放地址,启动语音芯片送出音频信号,语音芯片将音频数据滤波后经功率放大器驱动扬声器播放语音,完成语音播放。同时与单片机2通信,驱动数码管显示相关车辆及停靠信息,从而实现车辆自动识别与乘客引导。
2.2 RF无线通信
典型的RFID系统可分成两个部分。一部分是安装在公交车的发射端,另外一部分就是安装在BRT站台的接受端。有源标识卡不断主动向外发出无线电信号(1秒钟发送3次),并且能够传输较远距离,该无线信号是有编码的,每个标识卡的编码是唯一的。标识卡发出的无线信号如果是在读卡器的有效测量距离内,则该无线信号通过读卡器上的天线被读卡器接收并解码,然后可以通过 TTL232接口将信息发送给单片机进行处理。
2.3 语音录放模块
语音自动播报电路如图,由于需要预录取相关的公交车信息及提醒语句,电路中必须加入语音功放电路。语音功放电路包括:语音芯片、音频功率放大器、扬声器等。本论文选用ISD4002语音芯片和自带功率放大的音响,语音电路接口设计原理图如图2所示。
2.4 LED屏显示电路
单片机驱动LED数码管有很多方法,按显示方式可分静态显示和动态显示,按译码方式可分硬件译码和软件译码。静态显示就是显示驱动电路具有输出锁存功能,单片机将所要显示的数据送出后就不再管,直到下一次显示数据需要更新时再传送一次新数据,显示数据稳定,占用很少的CPU时间。动态显示需要CPU时刻对显示器件进行数据刷新,显示数据有闪烁感,占用的CPU时间多。这两种显示方式各有利弊:静态显示虽然数据稳定,占用很少的CPU时间,但每个显示单元都需要单独的显示驱动电路,使用的硬件较多;动态显示虽然有闪烁感,占用的CPU时间多,但使用的硬件少,能节省线路板空间,本设计采用动态扫描的方式驱动三个级联数码管。对各部分电路进行焊接调试,系统能够很好的识别无线射频的信息,并且LED和语音模块都能正常工作,达到的预期的目标。
3.创新特色
智能公交系统目前正处于迅猛发展时期,市场前景广阔。智能公交系统包含众多子系统,也涉及到很多交叉技术,是一个复杂的大系统。而在所有子系统及其所需功能中,公交车定位和报站系统又是整个公交系统的基础。本设计通过对无线射频技术特点和应用现状的研究,结合我国目前城市快速公交现状以及公交系统智能化的要求,提出一种新型智能化公交自动识别方案。在应用领域,如果一个设计的移植性差就意味着失败,这些可扩展性都是由数字电路系统的特点来决定的,特别是射频接口发射功率、发射频率和MCU 控制程序可以修改,对应不同的系统可以设置不同的程序和参数;系统硬件模块也可以针对不同的系统做相应的修改。
4.应用前景
在世界诸多城市BRT建设的影响下,特别是国务院出台81号文后,国内许多城市开始把发展大容量快速公交系统推到了缓解城市交通拥堵的前台,纷纷开始规划和建设BRT线路和系统。北京市编制了中心城公共汽(电)车线网规划,并首次把BRT作为公共汽(电)车线网的一个功能层次,融入公交线网整体结构中,与常规公共汽车线网以及城市轨道交通线路有很好的衔接换乘关系。杭州开通了首条全长28公里贯穿城市东西走向的BRT线路,并计划2~3年构筑起2至3条快速公交(BRT)线路以形成体系规模。此外,上海、广州、西安、南京、成都、重庆、济南也都在积极筹备建设BRT,有些城市目前已处于可行性研究阶段。
总的来说,国内BRT的建设还处于起步阶段,本设计所提出的BRT公交车准确停靠及乘客上车自动引导系统能够有效解决BRT公交的准确停靠及引导乘客有序让车等问题,大大提高了市民乘车效率,减小了交通隐患。市场前景广阔。
基金项目:2013年国家级大学生创新创业训练计划项目(201310364012)
参考文献
[1] 雷思孝,冯育长.单片机系统设计及应用[M].西安:西安电子科技大学出版社,2005.5.
[2] 李伯成,喉伯亨,张毅坤.微型计算机原理及应用[M].西安:西安电子科技大学出版社,2006.
[3] 赫建国,郑燕,薛延侠.单片机在电子电路设计中的应用[M].北京:清华大学出版社,2006.5.
[4] 阎石.数字电子技术基础[M].高等教育出版社.
[5] 窦建华.电子设计自动化―电路仿真与PCB设计[M].北京:国防工业出版社,2006.
[6] 张辉宜,陶永.智能公交系统的设计与实现[J].中国仪器仪表,2007,11:46~48.
冶金工业企业生产过程指从原材料的入厂开始,到半成品的流动、产成品的存储和交付、废弃物的处理等全过程,整个生产过程实际上就是系列化的物流活动。八钢是有50多年历史的老企业,通过艰苦奋斗,不断积累,形成了现在的发展格局。从目前的视角看,为使八钢整体生产物流顺畅,在物流布局及技术手段等方面都需要优化。以八钢物流道路运输为例,进行探讨。
在八钢的生产过程中,运输是生产的直接组成部分,八钢各生产单元通过运输使其空间状态联接在一起。在物流过程中很大一部分责任是由运输担任的,运输是物流的基础和主要组成部分.八钢本部的大宗原燃料的运输形式主要是道路运输和皮带运输,相对而言道路运输的不可控因素更多,主要探讨道路运输的两种方式:公路运输和铁路运输。
1公路运输可视化分析
可视化公路运输主要内容包括:车辆动态识别和定位技术应用、电子地图技术应用、车辆导航技术应用、交通管理、协作运输管理等。
1.1车辆识别
为了实时掌握公路运输的状况,对公路运输的基本单元的状态即车辆状态必须知道,这就涉及到车辆识别。基于空间信息技术的移动式车辆侦测自动识别技术在公路运输方面具有无可比拟的优势。
1.2电子地图
电子地图是公路运输实现可视化必需的人机界面(interface),它具备了地理信息系统(gis)的大多数功能。公路运输可视化的大部分信息都需要通过电子地图来表示。电子地图能够把数字信号(包括对数字地图、遥感数字图象及自行数字化采集的数据进行可视化处理后形成的数字信号)和模拟信号显示在计算机屏幕上。
电子地图主要有两方面作用:一是多维地图的静态显示和动态显示作用;二是动态环境下空间数据库与物流信息管理系统数据库的交流作用。总之电子地图要完成gis中空间数据视觉化的任务。
电子地图主要通过点状要素(出入口、道口、交通灯等)、线状要素(公路、铁路等)、面状要素(停车场、料场等)来反映交通详细信息,满通运输服务的要求。
1.3车辆导航
车辆导航是指为具体的在厂内道路上的运输车辆提供导航,它是车辆驾乘人员重要的辅助工具,使之能在正常情况先按照预定的线路行驶,异常情况下按照指定的线路移动。
为实现车辆导航,必须将gp导航系统与电子地图、无线电通信网络及交通管理信息系统结合起来,最终通过车载gp设备为驾乘人员传递相关的图像和声音信息。
1. 4交通管理
随着八钢产能的不断扩大,厂内运输的车流量将进一步增加,为使道路交通完全处于受控状态,制定相关规则并监督执行非常必要(尤其对大型运输车辆的控制)。交通管理具体内容包括:车辆行进线路规划、车辆监控(路线、速度等)、停车位管理、交通道口监控、车辆指挥、故障处理和紧急救援等。
首先对所有进出八钢的大型运输车辆的行进线路按物品(对应相应的物资编码)做好规划,线路规’划本着线路最简捷的原则进行,同时要考虑出入口、道口、回车场地、道路状况、车流量、其它公路运输等因素,尽可能避免迂回运输和重复运输。线路规划是动态的,可根据需要适时调整。线路规划在大型运输车辆进入门禁的时候,以声、光和图像的形式通过车载gps设备传递给驾乘人员,为其提供导航。
大型运输车辆进入八钢厂区的导航是强制的,为此需要实时跟踪和监控,确保其按照指定的线路、速度行驶,发现错误及时纠正。
随着车流量的增加,靠车辆自律管理厂内交通将不能满足要求,为此需要在重要道口建立交通信号控制系统和视频监控系统。交通信号系统主要用于管理道口现场交通;视频监控系统主要是将被监控点实时采集的交通视频图像传输给监控中心,以便监督和及时调整控制流量。
八钢有必要建立类似于城市交通指挥系统的交通管理系统,可以作为勺又钢物流信息管理系统”的一个独立的子系统。交通管理系统以电子地图和gps数据库为工作平台,运用计算机网络,集成交通信号控制系统、电视监控系统、交通诱导系统、电子警察系统、通信系统和车辆导航等系统,实现各种交通管理信息集成整合,深化处理和增值服务,便于驾乘人员了解相应信息和交通状况,使指挥人员能够迅速决断、快速反应、及时修正交通计划,保证交通的安全与畅通。
1.5协作运输管理
从实现物流可视化的角度来探讨协作运输管理。
将来八钢的大宗原燃料的公路运输主要通过社会协作的方式进行,为使公路运输能够按照八钢的要求和意愿进行管理,在商谈协作的时候,必须要求协作方按照八钢的要求做一些必要的工作。
由于公路运输处于买方市场,在商谈协作运输时掌握一定的主动权。
首先,要考虑软硬件配备,主要包括:必须配备承担运输所需的车辆,车辆应装备符合实现八钢可视化物流所必须的gps车载设备和车辆自动识别装置,具备车辆实时监控系统(主要监控八钢外部运输),具备与八钢联网的信息系统等。
其次是运输管理,主要包括:为了避免集中到达,要求公路运输商(可能是多家)按八钢的交通容量编制运输计划,尽可能减小每批次的车辆数量;为充分利用社会资源,要求公路运输商能实时控制在途车辆(必要时能提交八钢共享),按照预定的计划时间到达,同时要保证“运输的一致性”;在途车辆出现意外,有应急预案应对;对进入八钢厂区的车辆能够服从八钢交通管理的要求;按照八钢统一的电子结算方式进行运杂费结算等。
2铁路运输可视化分析
铁路运输占道路运输的比重在今后几年会逐步增加(大宗原燃料运输里程一般在200km以上),铁路运输需要高度关注。可视化铁路运输主要内容包括:车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换、车辆动态调度等。
2. 1车辆识别和定位技术应用
着重从机车跟踪的角度探讨车辆识别和定位。
为实现铁路运输可视化,需要知道机车行进方向、车辆数、车辆顺序、车厢数、车辆标签、所对应车辆的物品编码(含品名、规格、产地等信息)、计量信息、列检信息、装卸信息、运行时间和运行位置等信息。这些都需要依靠车辆识别和定位技术来实现。
铁路区域计算机连锁系统(rcis)、动态自动识别称量系统、全球定位系统(g ps )、电视监控系统是进行车辆识别和定位的技术基础,它们各有侧重。
gps在车辆定位方面有无可比拟的优势,是实现车辆定位的重要手段,在gps基础上结合rcis获取的各节点信息,可实现车辆全过程精确定位和车辆动态跟踪。
铁路区域计算机连锁系统和电视监控系统相结合,借助模拟运算工具,也可实现车辆定位和跟踪的功能。
用于车辆识别的技术手段包括图像自动识别技术、射频识别技术和移动式车辆侦测自动识别技术(cps技术),由于车厢经常倒换,采用图像自动识别技术、射频识别技术进行识别更经济适用,尤其是射频识别技术在我国铁路运输管理中已得到广泛使用,也有相应的技术规范支撑。采用gps用于机车识别无疑是最佳选择。将机车信息、车箱信息、编组信息等有效结合,即可得到完整的车列信息。
2.2电子地图技术应用
电子地图是铁路运输可视化重要的视觉平台,作用同公路运输,通过它可直接、快捷地了解到机车运行状况。
电子地图是实现可视化动态车辆调度十分重要的工具。电子地图有两类:一是基于地理信息系统(g is)的电子地图,与实际地形相符,真实感强,但受幅面限制,一些信息不能直接反映在地图上;二是模拟的示意性的电子地图,可能与实际相差很大,但它幅面利用率高,可清晰显示更多信息。以前更多的选择后者,“鹰眼”技术使得前者的应用领域和范围越来愈多。通过“鹰眼”技术可以详细了解到每个区域的细部信息,通过链接甚至可以获取包括某个信号灯的状态、某个道岔的位置、某个摄像机获取的车辆和行人图像等信息。
2.3远程监控系统
在调度中心实现对道口、车站、铁路沿线环境和现场的远程监控,一是可大大减轻日常人员巡视的工作量;二是便于及时发现危险隐患,保障安全生产。
远程监控系统的主要功能包括:实时视频监控、信息存储、报警联动、远程遥控和校验等。
远程监控系统由现场设备(可变焦红外线数字摄像机、活动云台)、传输通道(有线或无线)、主站设备(服务器、存储装置、软件)、监控终端等组成。
远程监控系统已成为铁路运输管理不可缺失的一个重要组成部分,随着信息技术的发展,运用多媒体技术、基于web服务器的远程监视系统,可以为有权限的局域网用户提供实时的信息服务。
2.4铁路信号系统数据交换
八钢内部的铁路运输系统与公共铁路运输系统关联度很高,随着八钢产能不断提高,与外部公共铁路运输系统建立实时数字信息交换制度对双方都有必要。可通过约定数据交换范围、方式和格式,在双方的数据服务器之间设置防火墙,实现信息共享并融入各自的管理系统。
内部可视化的相关信息需要集成在电子地图上,这样就需要在“八钢物流信息管理系统铁路运输子系统”和现有的区域计算机连锁系统(rcls)、拟建的车辆识别和定位系统、远程电视监控系统等之间实现信息无缝链接.由于现有的区域计算机连锁系统(rbi)建设时未考虑与其它系统信息交换,相应的软硬件不一定能满足要求,届时需要对服务器部分做相应的改动或升级。新建系统要充分考虑今后的拓展需求。
2.5车辆动态调度
车辆动态调度是“八钢物流信息管理系统铁路运输子系统”重要组成部分,结合物流管制中心的建设就可视化的铁路运输管理和车辆动态调度的功能和内容展开描述。
车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换等都是为可视化的铁路运输管理和车辆动态调度服务的。铁路运输管理系统主要功能包括铁路运输计划的管理、车辆运行信息显示、车辆追踪、物流信息显示、调车作业图表管理、列车运行图的管理、运行数据统计分析、系统自诊断等。
冶金工业企业生产过程指从原材料的入厂开始,到半成品的流动、产成品的存储和交付、废弃物的处理等全过程,整个生产过程实际上就是系列化的物流活动。八钢是有50多年历史的老企业,通过艰苦奋斗,不断积累,形成了现在的发展格局。从目前的视角看,为使八钢整体生产物流顺畅,在物流布局及技术手段等方面都需要优化。以八钢物流道路运输为例,进行探讨。
在八钢的生产过程中,运输是生产的直接组成部分,八钢各生产单元通过运输使其空间状态联接在一起。在物流过程中很大一部分责任是由运输担任的,运输是物流的基础和主要组成部分.八钢本部的大宗原燃料的运输形式主要是道路运输和皮带运输,相对而言道路运输的不可控因素更多,主要探讨道路运输的两种方式:公路运输和铁路运输。
1公路运输可视化分析
可视化公路运输主要内容包括:车辆动态识别和定位技术应用、电子地图技术应用、车辆导航技术应用、交通管理、协作运输管理等。
1.1车辆识别
为了实时掌握公路运输的状况,对公路运输的基本单元的状态即车辆状态必须知道,这就涉及到车辆识别。基于空间信息技术的移动式车辆侦测自动识别技术在公路运输方面具有无可比拟的优势。
1.2电子地图
电子地图是公路运输实现可视化必需的人机界面(Interface),它具备了地理信息系统(GIS)的大多数功能。公路运输可视化的大部分信息都需要通过电子地图来表示。电子地图能够把数字信号(包括对数字地图、遥感数字图象及自行数字化采集的数据进行可视化处理后形成的数字信号)和模拟信号显示在计算机屏幕上。
电子地图主要有两方面作用:一是多维地图的静态显示和动态显示作用;二是动态环境下空间数据库与物流信息管理系统数据库的交流作用。总之电子地图要完成GIS中空间数据视觉化的任务。
电子地图主要通过点状要素(出入口、道口、交通灯等)、线状要素(公路、铁路等)、面状要素(停车场、料场等)来反映交通详细信息,满通运输服务的要求。
1.3车辆导航
车辆导航是指为具体的在厂内道路上的运输车辆提供导航,它是车辆驾乘人员重要的辅助工具,使之能在正常情况先按照预定的线路行驶,异常情况下按照指定的线路移动。
为实现车辆导航,必须将GP导航系统与电子地图、无线电通信网络及交通管理信息系统结合起来,最终通过车载GP设备为驾乘人员传递相关的图像和声音信息。
1. 4交通管理
随着八钢产能的不断扩大,厂内运输的车流量将进一步增加,为使道路交通完全处于受控状态,制定相关规则并监督执行非常必要(尤其对大型运输车辆的控制)。交通管理具体内容包括:车辆行进线路规划、车辆监控(路线、速度等)、停车位管理、交通道口监控、车辆指挥、故障处理和紧急救援等。
首先对所有进出八钢的大型运输车辆的行进线路按物品(对应相应的物资编码)做好规划,线路规’划本着线路最简捷的原则进行,同时要考虑出入口、道口、回车场地、道路状况、车流量、其它公路运输等因素,尽可能避免迂回运输和重复运输。线路规划是动态的,可根据需要适时调整。线路规划在大型运输车辆进入门禁的时候,以声、光和图像的形式通过车载GPS设备传递给驾乘人员,为其提供导航。
大型运输车辆进入八钢厂区的导航是强制的,为此需要实时跟踪和监控,确保其按照指定的线路、速度行驶,发现错误及时纠正。
随着车流量的增加,靠车辆自律管理厂内交通将不能满足要求,为此需要在重要道口建立交通信号控制系统和视频监控系统。交通信号系统主要用于管理道口现场交通;视频监控系统主要是将被监控点实时采集的交通视频图像传输给监控中心,以便监督和及时调整控制流量。
八钢有必要建立类似于城市交通指挥系统的交通管理系统,可以作为勺又钢物流信息管理系统”的一个独立的子系统。交通管理系统以电子地图和GPS数据库为工作平台,运用计算机网络,集成交通信号控制系统、电视监控系统、交通诱导系统、电子警察系统、通信系统和车辆导航等系统,实现各种交通管理信息集成整合,深化处理和增值服务,便于驾乘人员了解相应信息和交通状况,使指挥人员能够迅速决断、快速反应、及时修正交通计划,保证交通的安全与畅通。
1.5协作运输管理
从实现物流可视化的角度来探讨协作运输管理。
将来八钢的大宗原燃料的公路运输主要通过社会协作的方式进行,为使公路运输能够按照八钢的要求和意愿进行管理,在商谈协作的时候,必须要求协作方按照八钢的要求做一些必要的工作。
由于公路运输处于买方市场,在商谈协作运输时掌握一定的主动权。
首先,要考虑软硬件配备,主要包括:必须配备承担运输所需的车辆,车辆应装备符合实现八钢可视化物流所必须的GPS车载设备和车辆自动识别装置,具备车辆实时监控系统(主要监控八钢外部运输),具备与八钢联网的信息系统等。
其次是运输管理,主要包括:为了避免集中到达,要求公路运输商(可能是多家)按八钢的交通容量编制运输计划,尽可能减小每批次的车辆数量;为充分利用社会资源,要求公路运输商能实时控制在途车辆(必要时能提交八钢共享),按照预定的计划时间到达,同时要保证“运输的一致性”;在途车辆出现意外,有应急预案应对;对进入八钢厂区的车辆能够服从八钢交通管理的要求;按照八钢统一的电子结算方式进行运杂费结算等。
2铁路运输可视化分析
铁路运输占道路运输的比重在今后几年会逐步增加(大宗原燃料运输里程一般在200km以上),铁路运输需要高度关注。可视化铁路运输主要内容包括:车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换、车辆动态调度等。
2. 1车辆识别和定位技术应用
着重从机车跟踪的角度探讨车辆识别和定位。
为实现铁路运输可视化,需要知道机车行进方向、车辆数、车辆顺序、车厢数、车辆标签、所对应车辆的物品编码(含品名、规格、产地等信息)、计量信息、列检信息、装卸信息、运行时间和运行位置等信息。这些都需要依靠车辆识别和定位技术来实现。
铁路区域计算机连锁系统(RCIS)、动态自动识别称量系统、全球定位系统(G PS )、电视监控系统是进行车辆识别和定位的技术基础,它们各有侧重。
GPS在车辆定位方面有无可比拟的优势,是实现车辆定位的重要手段,在GPS基础上结合RCIS获取的各节点信息,可实现车辆全过程精确定位和车辆动态跟踪。
铁路区域计算机连锁系统和电视监控系统相结合,借助模拟运算工具,也可实现车辆定位和跟踪的功能。
用于车辆识别的技术手段包括图像自动识别技术、射频识别技术和移动式车辆侦测自动识别技术(CPS技术),由于车厢经常倒换,采用图像自动识别技术、射频识别技术进行识别更经济适用,尤其是射频识别技术在我国铁路运输管理中已得到广泛使用,也有相应的技术规范支撑。采用GPS用于机车识别无疑是最佳选择。将机车信息、车箱信息、编组信息等有效结合,即可得到完整的车列信息。
2.2电子地图技术应用
电子地图是铁路运输可视化重要的视觉平台,作用同公路运输,通过它可直接、快捷地了解到机车运行状况。
电子地图是实现可视化动态车辆调度十分重要的工具。电子地图有两类:一是基于地理信息系统(G IS)的电子地图,与实际地形相符,真实感强,但受幅面限制,一些信息不能直接反映在地图上;二是模拟的示意性的电子地图,可能与实际相差很大,但它幅面利用率高,可清晰显示更多信息。以前更多的选择后者,“鹰眼”技术使得前者的应用领域和范围越来愈多。通过“鹰眼”技术可以详细了解到每个区域的细部信息,通过链接甚至可以获取包括某个信号灯的状态、某个道岔的位置、某个摄像机获取的车辆和行人图像等信息。
2.3远程监控系统
在调度中心实现对道口、车站、铁路沿线环境和现场的远程监控,一是可大大减轻日常人员巡视的工作量;二是便于及时发现危险隐患,保障安全生产。
远程监控系统的主要功能包括:实时视频监控、信息存储、报警联动、远程遥控和校验等。
远程监控系统由现场设备(可变焦红外线数字摄像机、活动云台)、传输通道(有线或无线)、主站设备(服务器、存储装置、软件)、监控终端等组成。
远程监控系统已成为铁路运输管理不可缺失的一个重要组成部分,随着信息技术的发展,运用多媒体技术、基于wEB服务器的远程监视系统,可以为有权限的局域网用户提供实时的信息服务。
2.4铁路信号系统数据交换
八钢内部的铁路运输系统与公共铁路运输系统关联度很高,随着八钢产能不断提高,与外部公共铁路运输系统建立实时数字信息交换制度对双方都有必要。可通过约定数据交换范围、方式和格式,在双方的数据服务器之间设置防火墙,实现信息共享并融入各自的管理系统。
内部可视化的相关信息需要集成在电子地图上,这样就需要在“八钢物流信息管理系统铁路运输子系统”和现有的区域计算机连锁系统(Rcls)、拟建的车辆识别和定位系统、远程电视监控系统等之间实现信息无缝链接.由于现有的区域计算机连锁系统(RBI)建设时未考虑与其它系统信息交换,相应的软硬件不一定能满足要求,届时需要对服务器部分做相应的改动或升级。新建系统要充分考虑今后的拓展需求。
2.5车辆动态调度
车辆动态调度是“八钢物流信息管理系统铁路运输子系统”重要组成部分,结合物流管制中心的建设就可视化的铁路运输管理和车辆动态调度的功能和内容展开描述。
车辆识别和定位技术应用、电子地图技术应用、铁路信号系统数据交换等都是为可视化的铁路运输管理和车辆动态调度服务的。铁路运输管理系统主要功能包括铁路运输计划的管理、车辆运行信息显示、车辆追踪、物流信息显示、调车作业图表管理、列车运行图的管理、运行数据统计分析、系统自诊断等。
铁路车辆动态调度需要一个可视化的信息平台,其主界面就是集合各种相关信息的铁路运输电子地图(或称之为八钢铁路地理信息系统图)。铁路车辆动态调度是计划管理体系的一个重要组成部分,以计划为驱动,实现产供销运的紧密衔接,对采购、销售、生产物流实施跟踪管理。通过车辆调度模块生成、调整和发送车辆运行计划、维护和调整调度作业图表、发送调度指令;铁路运输过程中的物流管理作业过程(如列检、计量、装卸等)也需要依靠车辆调度模块来动态的实现控制;为使运输过程处于可控状态,车辆调度模块还要对车辆的动态跟踪;实时(或定时)对铁路运输计划的预测统计分析是车辆调度的重要工具和手段,通过它可获得与铁路运输相关的信息(如库存、消耗、待运、在途等信息),以便提前判断和制定相应的措施。
中图分类号:F252 文献标志码:A 文章编号:1000-8772(2012)01-0085-04
收稿日期:2012-01-08
作者简介:邹广宇(1983-),男,天津人,计算机管理员,从事信息系统研究。
一、引言
1.论文研究的背景和意义
到目前为止,随着现代信息的不断发展,智能化和信息化已经被广泛应用到各个领域。目前的自动识别技术主要包括两个种类:条码技术和无线射频(RFID)技术。随着这两种技术的不断发展,自动识别技术已经在全世界具有了一定的发展规模。由于信息量和人们需求的不断扩大,现代的物流行业涉及的种类是很烦琐的供应链结构也相应地变得很复杂,很多时候都是要求远距离的传输,在这种传输中传统的物流方式就存在很大的弊端。RFID技术,最早出现在第二次世界大战的战场上为飞机的一种敌我目标识别出现的。但是由于成本和技术限制等诸多原因,一直没有得到广泛的应用。
2.研究现状
(1)物流信息的研究现状。物流信息管理的发展已有很长一段时间,并且各个地区和国家的发展情况都不尽相同。我们可以在线地对车辆和货物进行信息的追踪和查找,但是这种方式对网站的信息和其他的链接都没有可靠的保障。这种系统可以利用全球卫星定位系统和智能的交通管理系统来对运输货物的车辆进行位置的追踪,从而掌握货物的运输情况,以这种动态的管理方式使得车辆的管理效率得到提高。(2)RFID技术的研究现状。条形码技术可以说最早是由沃尔玛公司开始应用的,从此成为了各个物流行业中的重要识别技术。而现在沃尔玛公司否定了条码技术开始使用电子标签,这充分地说明了RFID技术明显优于传统的条码技术。也预示着RFID技术在商业物流行业中的应用会得到普及,最终取代条码技术。RFID技术在中国作为一种新型的自动非接触式识别技术的发展历史还不是很久,所以是处于刚刚起步的阶段。但是作为一种新型的技术手段,RFID技术还是具有很大的发展前景和空间的。
3.论文研究的主要内容
本文主要是把RFID技术应用到物流信息管理系统中,从而实现对物流全过程的调度优化和控制的动态性。
二、物流信息系统概述
1.物流管理系统的概念及功能
(1)物流系统的定义。物流信息是一个非常广泛的概念,涉及到我们社会经济的任何一个方面,是一个错综复杂的社会系统。从大的材料供应商、批发商到零售商和消费者,几乎都有物流信息系统的身影。现在的物流信息管理系统的主要任务有以下三方面:商品的流动,也就是我们所说的商流;信息的流动,也就是我们所说的信息流;资金的流动,也就是我们所说的资金流。物流信息管理系统的英文名称是 Logistics Information System,以下简称为LIS。LIS的主要组成:计算机软硬件、通信网络的主要设备和人组成的智能人际交互界面系统。(2)物流信息管理系统的主要功能概述。通过计算机技术对数据进行处理,可以向运营商和客户提供相应的共享数据,并且可以加强企业和企业之间的合作关系,形成一种更加优越和完善的供应链网络。
2.物流管理系统的主要结构及类型
一个完善的物流信息管理系完成的主要功能包括:首先对信息进行采集整理存储,然后对有用的信息进行相应的传输和利用。与此同时也涉及到了活动中的每个要素。
3.物流信息管理识别中主要的采集技术
物流信息管理系统主要是将各个环节的物流信息联合到一起,表现出了物流管理系统强大的整合能力。(1)条码技术简介。这种识别技术主要是被应用在计算机的数据的输入与输出。具有很多的优点:可靠性高、成本低并且采集和输入输出的速度非常快。由于这些优点的存在,条码技术目前被广泛应用在国内外的物流行业中。条形码识别技术由于具有非常优越的优点,准确可靠快速的传输,使得它的应用价值非常大。其中条形码的设备主要分为条形码的印刷设备和条形码的扫描设备。(2)RFID识别。射频识别技术,即RFID技术是一种非接触式的自动识别的技术。一个标准的射频识别系统是由三部分构成的:电子标签、读写器和天线。但是由于实际中存在的问题,这种RFID系统好使需要软硬件之间的良好配合才能完成它的功能。
三、RFID技术简介
由于射频的数据保密性非常好,所以目前被广泛地应用在防伪行业中。RFID的主要优点是:具有唯一的UID号码。
1.RFID系统的组成和特点
一个最基本的RFID系统如图1所示,一般包括:标签、阅读器、天线和数据的读写系统。
标签的作用:RFID的电子标签是由耦合元件组成的。上述每个电子标签都具有唯一的UID编码。是标签唯一识别的标识。读写器:读写器是电子标签的读写设备。主要控制数据的读写。天线:主要完成读写器和标签之间射频信号的传递。
如图1所示,一个完整的RFID系统还包括一个中心处理的电脑和应用软件系统。这个系统主要是将读写器上的信息和数据传递到电脑上的数据处理中心进行处理和应用。这也是RFID技术的基本原理。
2.RFID组成部分简介
(1)电子标签。RFID系统中的电子标签是整个系统的数据的载体。通常情况下,一个完整的电子标签主要是由标签元件和天线组成。电子标签与条形码不同的是电子标签可以自动地把自身存储的信息发送出去,它是可编程的,可以适当地改写编程的程序来满足不同情况下的电子标签的需求。(2)读写器。在RFID系统中,负责数据的读写的设备主要是读写器设备。读写器的功能非常强大,通常在系统中它都是独立存在的,也就是说读写器可以单独地对数据进行读写、处理并且显示等。(3)数据的管理系统。完整的RFID系统除了包括最基本的标签、天线、阅读器外,还应该具有一整套完整的数据管理系统。数据管理系统的主要功能是完成数据信息的处理和存储共享。
3.RFID技术的优点
RFID技术的出现,使人们认为RFID技术是条形码的高级形式,但是这种说法是没有什么理论依据的。RFID作为一种新型的非接触式自动识别技术,它在很多方面都优于条形码技术。RFID技术的优点很明显,它不需要光源,并且更加安全。
4.RFID技术目前面临的问题
RFID技术是一种新型的识别技术,它与条形码识别技术相比,发展的历史比较短。所以技术还不是很成熟,目前还存在着许多发展的问题。
四、物流管理系统的需求分析
1.RFID技术的主要应用
随着信息技术的发展,RFID技术也有一定的发展,被应用在许多不同的领域,最主要的应用范围包括:零售、仓储、生产和运输行业。
2.目前物流公司的现状
经济需求的不断增长,市面上有越来越多的物流公司来满足人们对物流的需求。但是很多物流公司的规模都比较小,存在着一些缺点。
3.需求问题的解决
目前的物流企业的规模比较小,标准和网络化都不完善,存在着各种各样的问题。针对这些问题,我们对物流公司有了新的需求问题的解决方案。每个公司都可以发挥它的长处取长补短,互相帮助赢取共同的利益。这种集中管理和共享的方式不仅可以帮助物流公司来提高他们的运输速度,而且还大大地降低了物流中货物运输的成本,减少了不必要的浪费,有助于管理者的经营。
4.RFID系统结构的选择
本文主要用到的数据库是SQL。采用的主要构架是B/S模式。下面分别对这两种技术进行简单的介绍。(1)SQL简介。SQL(Structured Query Language), 它的意思是结构化查询的语言。SQL这种语言最主要的功能是它可以很好地与各个数据库建立相应的联系并且可以进行很好的沟通。(2)浏览器/服务器(B/S)构架。目前来说管理信息系统主要的构架类型主要包括:主机/终端型、客户机/服务器即所谓的C/S模式、文件/服务型、三层的B/S和多层分布的形式。
这种技术是www技术和数据库技术相结合的结果,是未来数据库发展的主要方向。
B/S模式的主要结构如图2所示:
5.系统成本的分析
我们知道RFID系统主要是由标签、天线和阅读器构成的,所以它的主要硬件成本也是由这三部分构成,这主要是从RFID系统的市场需求来看的。对于物流管理行业来说,这三部分也是主要的硬件投资方式。虽然目前RFID系统的成本略高,但是它带给我们的优点远远胜过了糨的这个不足。
五、系统的总体设计研究
1.基于RFID的物流管理系统的总体目标
物流信息系统主要解决的问题是:(1) 缩短从接受订货到发货的时间;(2) 库存适量化(压缩库存并防止脱销);(3)提高搬运作业效率;(4)提高运输效率;(5)使接受订货和发出订货更为省力;(6)提高接受订货和发出订货精度;(7)防止发货配送出现差错;(8)调整需求和供给回答信息咨询等。一个好的完善的物流信息管理系统会很好的解决上述的问题。我们最终的目的都是为了提高服务水平并且降低物流运输的总成本。
2.系统硬件产品介绍
本系统设计的是一个基于RFID硬件产品已有的物流管理系统,所以首先对RFID不同用途的读写设备和它们的应用场合作了一下简单的介绍,例如,下面这款电子标签:
本系统选用的电子标签是TI2048,这款电子标签是TI公司新出的一款粘贴式的电子标签。如图3所示:
3.流程分析
(1)物流公司工作的流程分析。每个服务行业的宗旨都是客户至上。对于物流公司来说,也是这样。物流公司的终极目的就是让客户的邮件及时准确并且完整地到达目的地,而且要确保邮件在终点是有顾客签收的。图4所示的是一个顾客返送邮件到收件人的全过程。
4.软件平台和功能设计
Java EE开发平台目前被广泛应用在各种各样的信息化平台的开发中。在目前实际应用的Java EE开发平台中,它主要由两部分构成:第一种是以Spring, Hibernate两个框架为基础核心来构建的,这种类型的应用一般都不要应用服务器的支持,一般在Jetty,Tomcat等Web服务器上就可以很好的运行,这类Java EE应用被称为轻量级的Java EE应用;另一种类型的Java EE则以EJB3. 0为核心来构建,这种类型的应用需要EJB容器支持,一般情况是需要在JBoss,WebLogic,WebSphere服务器中来运行,这类Java EE应用是sun公司官方推荐的Java EE平台,所以它一般情况下称为重量级的Java EE应用。
5.RFID物流管理系统的设计原则
首先,要确保系统具有一定的先进性。这里所说的先进性主要指的是RFID技术所特有的优点。包括它硬件和软件上的优点。利用这些优点可以提高物流管理系统的运行质量。其次,是RFID系统的安全性和可靠性。这里指的是要确保寄件人寄出邮件信息的安全性。邮件属于寄件人、客户的财产,保证客户财产的安全,是物流公司的首要职责。所以安全性和可靠性是很重要的。如果公司没有对安全性和可靠性做出一定的保护,那么出现问题后不仅是客户的财产丢失,更大的损失是物流公司,公司失去了在客户心中的信誉。这种损失有时是无法弥补的。最后是系统通用性和扩展性的设计。通用性和扩展性是各个环节的枢纽,相当于是系统之间的接口。如果企业之间的系统不具通用性,合作起来就会有很多的问题。所以通用性的提高,可以加强企业和企业之间的合作和沟通关系。
6.系统模块设计
本设计中的管理系统软件主要由8个模块构成:系统的设置模块、运单的管理模块、专线管理模块、车辆的管理模块、办公环境管理模块、报价管理模块、客户资料管理模块、射频卡片管理模块。
六、总结与展望
1.总结。本文设计是基于RFID技术的物流信息管理系统。硬件设备包括电子标签和阅读器设备。软件部分主要是由web服务器和基于Java EE 和SQL Server软件平台来实现的管理系统。本系统的最大的创新点是:将RFID技术与物流管理系统相结合。这个创意的最大优点是增强了企业和企业之间的合作关系,确保货物运输过程中的准确性和安全性,降低了物流行业的运输和管理成本,不仅给客户提供了良好的服务,而且还在很大程度上提高了物流行业的经济效益。
2.展望。目前中国的RFID技术还处于刚刚起步的状态,RFID技术的应用还不够完善, RFID技术的物流管理系统的成本较高,造成了RFID技术物流管理系统普及的困难。条形码技术还会在很长一段时间内占据着识别技术的主要市场份额。但是RFID技术作为一项新技术,具有巨大的发展空间和非常广阔的前景。由于时间和实验的条件有限,本文的设计还存在着很多不足的地方,还有很多物流管理系统的方面没有涉及到,需要在今后对此系统进行不断的完善。主要包括:
一是可以将GPS模块应用导系统中。GPS目前已经在很多国家中被使用,但在中国还是很少使用的。利用GPS的定位系统,我们可以对丢失的邮件进行定位,然后搜查。这样可以大大的减少不必要的损失,提高系统的安全性。
二是物流管理手机平台的应用。随着技术的发展,目前有很多系统都支持手机平台。时代的需求,人人都有手机,手机成了必备品,所以把物流管理系统应用在手机平台,这样方便客户对物流行业运输的需求。提高了管理和查询的效率。
三是RFID技术在邮件分拣中的应用。RFID是一种非接触式的自动识别技术。所以我们可以利用这个优点来对邮件进行快速的分拣。这样,手持分拣设备,就可以对邮件进行识别和信息的显示。
参考文献:
[1] K. Finkenzeller. RFID Handbook: Radio-Frequency Identification
Fundamentals and Applications.John Wiley & Sons,2000.
[2] EPCglobal Tag Data Standards Version 1.3.1,E.P.Cglobal Inc,2006.
[3] Twist,David C.The impact of radio frequency identification on supply
chain facilities.Journal of Facilities Management,2005,(3):226-239.
[4] 李进东,范琴秀.射频识别技术的发展与应用[J].科技信息:学
术版,2006,(1):46-47.
2011年,大众报业集团确立了“《大众日报》历史报数字化项目”,并成立了专门的项目组具体负责实施,围绕集团历史报刊数字化的相关问题进行了一系列调研。本文对历史报刊数字化的最新技术进行了研究和探讨,主要内容包括纸质报刊及胶片扫描、OCR识别和校对、元数据抽取与标引、PDF构建技术等方面。
历史报刊数字化流程概述
历史报刊数字化技术与最近十多年普通的报刊数字化技术不尽相同。自从报业实现数字化工作流程以来,报纸的采编发排都采用计算机技术,其信息已经实现了数字化,而历史报刊由于早期使用铅字印刷或者石印、油印等,没有对应的数字信息,因此需要通过相应的技术手段将纸质信息数字化提取到计算机当中。
历史报刊特别是早期报纸是历史文档的重要资料,虽然人们对报纸的格式十分熟悉和认可,但从数字化处理的角度来看,报纸的格式是相当复杂的:文章长短不一,早期报纸有竖排版面、繁体字等,字体也不是当代的标准化字库里的字体,有照片图表,长篇的文字分布在不同的版面或页面中。另外,早期报纸的印刷质量和纸张质量不是很好,随着时间推移,有的字体可能会模糊,纸质会变得非常脆、易碎,难于处理,还有一些报纸只能在缩微胶片上找到。所有这些因素都使历史报刊的数字化面临很多困难,需要进行一些特殊处理。
目前,历史报刊数字化有比较标准的制作流程和技术工艺,不同的厂商可能会有自己的特点,不过制作流程一般会包括以下几个步骤:
1.报刊的清点。按照日期、版面清点数量,确认其完整性、可识别性、可扫描性。由于报刊一般都有一定的发行量,不止一个复本,应尽可能寻找最佳的一份,如果现实中找不到可用的报刊实体,可以用缩微胶片替代。
2.扫描和修图。利用大幅面扫描仪扫描纸质报刊,用胶片扫描仪扫描缩微胶片。对扫描得到的TIF图片进行修正,去除污渍、裂纹等。
3.OCR文字识别与校对。OCR(光学字符识别)是一种通过计算机自动识别图片上文字的技术,标准印刷汉字的OCR识别正确率可达到99%以上。由于早期报刊印刷技术简单和保存环境的原因,识别率可能稍低一些,需要进行多次校对以保证最终的质量。校对包括人工校对和智能化自动校对。
4.版面分析和划分。将修正后的版面扫描图片按照主题文章进行区域划分和标识。
5.制作版式文件。根据步骤2、3、4得到的信息制作可检索的数字版式文件,比如PDF等。
6.数字数据验收。对上述步骤得到的文字、图片、版式文件等数字数据进行再检验,以确保完整性和正确性。
7.数据入库。文字入全文数据库,图片入图片数据库,版式文件入版面数据库,三种数据库是相关联的,可以联合检索。
8.建立双平台检索系统。一般采用B/S架构,用户通过浏览器即可检索上述三种数据库。
经过上述步骤的处理加工后,最终的产品是一个完整的系统,其中包括:包含全部报刊文字和元数据的全文数据库、包含报纸照片和版面扫描图片的图片、可检索的PDF版式文件、基于B/S架构的双平台检索系统等。此外,为了支持高质量的再印刷,也包括修正后的版面扫描TIF图片。
历史报刊数字化关键技术研究
历史报刊数字化的关键技术包括:
1.图像获取:主要通过扫描,包括纸质扫描和胶片扫描等。
2.OCR文字识别与校对、版面分析和划分等:将修正后的版面扫描图片按照主题文章进行区域划分,目前有自动识别主题文章区域的技术。
3.元数据抽取和分类标引:文章的元数据抽取包括对文章主题、副题、引题、作者、来源、关键词、摘要、引文、外部特征等信息的自动识别和自动抽取;分标引类是按照国家新闻标准分类法对文章进行分类标识。
4.全文数据库和图片数据库:全文数据库是实现全文检索的数据库系统,为按关键字检索整篇文章带来很大便利;图片数据库一般按照文件存储、按照标引检索。
5.数字版式文件的制作、检索技术:制作数字化版式文件是为了能够展现历史报刊的原始风貌,使读者能直观地感受到是在阅读一份早期的报刊,更具有视觉震撼力。目前报刊的数字版式文件一般采用Adobe的PDF格式,根据扫描图像制作成可检索PDF一般采用双层和重构技术。
下面进行更详细的阐述。
1.扫描技术
扫描是历史报刊数字化制作流程中的关键,因为后续工作完全基于扫描后得到的TIF图片,其扫描质量、分辨率的选择、所使用的设备和参数设定都对后期制作有重要影响。特别是分辨率的选择,需要考虑到当代印刷术和近代的印刷术,当代彩色报刊的印刷一般要求彩色图片在200~300dpi即可,既不宜过低也不宜过高,而近代的印刷主要是以铅印、油印等为主,历史报刊的扫描精度一般采用300~600dpi,其目的是为了保存更多的细节,更具参考和研究价值。扫描精度越高,所得到扫描图片的容量也越大,因此,在选择扫描精度的时候也需要考虑硬件方面的存储容量。
由于报刊在印刷时是靠细小点阵来显示图像,并不是连续的色彩,高精度扫描会扫描出网状条纹,这种情况可能会降低OCR软件的处理速度。现在许多扫描仪有去除网纹的功能,可以解决此类问题。对于没有去除网纹功能的扫描仪,如对图像要求不高的话,可用降低扫描分辨率的办法。因此,如果考虑到下一步的文字识别率, 5号以上字体使用300dpi扫描,6号、7号字体使用400~600dpi扫描。综合考虑上述因素,可以统一使用400dpi左右的扫描精度。
纸质报纸和缩微胶片扫描所使用的设备和参数设定也有所差别,纸质报纸一般使用大幅面的快速扫描设备,而缩微胶片扫描仪在扫描前需要进行预先光学处理,目的是为了达到和纸质扫描相同的分辨率。
OCR技术原理是对光学仪器产生的影像(比如扫描图片)进行处理,消除一些影响识别的可忽略因素(自动或者手工),将影像进行区域分割,使之成为可以独立识别的单元,然后从这些影响单元中提取形态特征,再与标准特征库中的数据进行对比,根据对比的结果决定该单元的识别结果。由于不确定因素较多,比如扫描设备的质量、扫描资料的质量、扫描精度、识别软件、学习和测试样本等都会影响到识别的准确率。
文字识别之前的影像预处理是该过程中需要处理问题最多的阶段,其中包括影像的正规化、除噪声、图像矫正、图文分析、文字行与字分离等步骤。举例说明,对于历史报刊而言,如果其扫描图片出现倾斜,超出计算机自动识别的误差范围,就需要就行图像旋转矫正;如果原始报刊本身由于存放时间过长,出现污点裂痕较多,影响到正常文字的识别,那么就需要将扫描图片上的这些污点裂痕去除、背景化;此外,早期报纸有竖排版,在行、字分离上需要进行特殊处理。
从识别技术的难度角度来看,印刷体识别相对要容易、正确率更高一些,因此对于历史报刊而言,只要预处理做得比较完善,其自动识别不会产生过多的错误。为了保证更高的文字正确率(比如差错率在万分之一以下),需要进行校对。校对包括软件自动校对和人工校对,自动校对是根据自然语言处理技术对识别出的文字语句的正确性进行判断和标注,然后进行纠错;人工校对是完全依赖校对员的判断。OCR的校对一般都是结合自动和人工两种方式进行反复多遍的排查纠错。
3.元数据抽取和标引技术
在建立全文数据库、图片数据库和版式文件数据库之前,需要对文章进行元数据抽取和标引,其目的是从多角度对文章、图片和版面文件进行标注说明,以完善检索系统。文章的元数据主要包括题名信息、作者信息、来源信息、关键词信息、摘要信息、引文信息、外部特征信息等。对于报刊而言,题名信息、作者信息、来源信息一般都在版面上明确标出,在OCR识别的版面区域划分过程中获得相应的信息;而对于其他元数据,比如关键词信息、摘要信息、引文信息等,因为没有明确标出,需要从报刊正文中提取,由于历史报刊数字化需要在短时间内处理海量的报刊文章,依靠人工无法完成,所以必须要进行元数据的自动抽取,需要结合自然语言处理、机器学习等技术。
在文本中抽取元数据标引,可分为全关键词标引和主关键词标引。自动标引过程与人工标引过程相似,其特点是标引速度快,标引的前后一致性好,在随机存储介质容量允许、软件检索功能具备的情况下,可以实现文摘、甚至全文的无人工标引自动检索。目前自动标引系统抽出的表述文献主题的主关键词准确性较差,还不能完全代替人工标引。
4.版式文件制作技术
版式文件是一种具有版权保护、加密、防止非法复制、防止屏幕拷贝、能够全面展示版面多媒体内容和样式、并且能够精确输出到打印设备的文件格式,目前比较流行的版式文件是Adobe公司的PDF,国内北大方正采用了CEB,另外还有epub等。报刊的版式文件一般采用PDF格式。
制作版式文件是历史报刊数字化的一项重要工作,其意义有以下几个方面:(1)首先通过版式文件能够直观地展示历史报刊的外观,包括版面布局、文字样式和图片等。(2)支持版面检索,在双平台检索平台通过关键字检索就能找到包含关键字的版面。(3)支持再印刷,矢量字体的版式文件能够进行更大幅面的印刷输出,不会有字体的变形。(4)标准化的文件格式便于存储和交换。
目前历史报刊数字化的PDF版式文件制作有两种技术:双层和重构。对于前期历史报刊而言,因为没有对应的电子版面文件,所以需要制作双层或者重构PDF。制作双层PDF的重点在于扫描图片处理成合适清晰度的压缩图片用于双层PDF的上层图片层,并将文本按照原始版面结构重排并与图片层对应,形成隐藏的下层文字层;重构PDF则是利用图片和文本数据按照原始版面结构进行整版的图文混合重排,是单层结构。这两种PDF的主要区别有以下几方面:
(1)在PDF文件结构方面:双层PDF,顾名思义,该PDF逻辑上具有两层(一层纯图片层、一层纯文本层),上层是用于浏览的可视图片层(为了避免文件体积过大,该图片层一般使用高清扫描图片的压缩格式),能够浏览版面扫描原貌;下层是用于文字检索的隐藏文本层(浏览时不可见),文本层中的文字就是版式图片经OCR识别校正后的文本,它与上层图片层版式图片中的文字是一一对应的,一个是图片化文字、一个是文本化的文字。这样形成的双层PDF既可以100%保留原始版面效果,又可以通过下层的文字信息支持选择、复制、文字检索等功能。重构PDF,是当代流行的单层图文混排结构。
(2)在PDF版式重排方面:对于历史报刊而言,双层和重构PDF都要进行相应的版面重排,但是双层PDF仅对其文字层的文字按照原始版面位置进行重排和对应;而重构PDF则要按照当今的图文混排方式重现原始版面的样貌,所以制作方面工作量要大一些。对于组版出版数字化之后的近期历史报刊而言,由于已经存在可印刷的数字PS版面文件和对应的数字矢量字库,而且这些PS版面文件可以精确地批量生成当今流行的图文混排的PDF版,不必再进行版面重排,就没有制作双层或者重构PDF之说了。
(3)在视觉浏览方面:双层PDF是100%保留扫描版面视觉效果,但受图片层的精度所限,其中的文字缩至较小时会产生字体变形,而放大到一定程度字体会产生马赛克模糊;重构PDF中的文字是矢量字体,可对字体进行任意缩放,保持字体边缘依然光滑,字体色素不会丢失,因此不会变形和模糊。但是,重构PDF中的文字字体可能与原始字体有所差别。特别是早期铅字或者油印的报刊,由于没有对应的数字矢量字库,所以无法100%保留原始效果。但数字化以后的历史版面,就不存在这个问题。
(4)在用于印刷方面:同视觉浏览方面相类似,双层PDF是100%保留扫描版面视觉效果(原汁原味),但受图片层的精度所限,不能进行大幅的放大印刷,字体会产生马赛克模糊。对此可以直接使用修正后的高清TIF扫描图片进行大幅面的印刷。重构PDF支持任意放大的印刷,字体边缘光滑清晰,不会产生变形和模糊,印刷质量好于双层PDF。
(5)在版式文字检索和定位方面:双层和重构PDF都支持版面文字检索和定位,在检索速度上,双层的速度慢于重构,因为双层PDF的文件较大。
(6)在存储容量方面:重构PDF文件的存储容量比双层PDF文件小得多,一般是其1/4至1/6左右。因此重构PDF文件的打开和网络传输都要比双层PDF快,更适合于网络浏览。
(7)在文字差错率方面:理论上,历史报刊数字化的文字差错率和PDF采用双层和重构并无关系,差错率只和OCR识别准确率和人工校正等有关。在这方面,双层和重构的差别在于:对于双层PDF来说,即使文字层有错字,由于其本身是隐藏的(上层是可视图片),也不会被看见,但会在文本检索和复制过程中体现出来;对于重构PDF来说,文字如果有错误,则直接能看到。出错率的产生,很大程度上取决于原始扫描图的修正、文字识别准确率、校改人员的责任心、新闻常识、历史经验和承接公司的项目管理经验等。
(8)在渠道方面:双层PDF适合在本地电脑和局域网上浏览,重构PDF除本地电脑和局域网上之外,也适合在互联网上、手机、平板电脑、户外大屏上浏览。
(9)在专辑出品方面:这两种技术都能够满足个性化专辑出品的需求。
(10)费用方面:由于重构PDF的制作工作量相对大一些,所以制作重构PDF的费用比双层PDF高15%~20%左右。
总的来说,实施历史报刊数字化项目,如果仅从保护、存档的角度考虑,那么扫描历史报版面建立图片数据库,进而进行文字识别、校正、标引、入库、建立全文数据库和检索网站即可;如果进一步从满足版式检索和PDF浏览功能考虑,可采用双层PDF技术;如果考虑未来媒体终端的应用(例如苹果的iPhone手机、iPad平板电脑)、开发更多的衍生产品,那么可采用重构PDF的技术方案。
总 结
国内从事这一领域的厂商采用不同的解决方案。在选择解决方案的时候,首先要以保证质量为最基础的条件,然后再考虑技术方案、价格、知识产权保护、再开发再利用等因素。历史报刊数字化是一项尊重历史、保护历史资料、挖掘资料价值的工程,让尘封的珍贵报刊通过现代信息技术以一种崭新的面貌呈现在读者面前,体现了社会责任和文化创新精神,保护与开发并存,让历史报刊重新面对公众,为了解和研究中国近现代新闻发展历史提供丰富的信息源泉。
中图分类号:TP393.08 文献标识码:A 文章编号:1009-914X(2016)01-0280-01
1.引言
1.1 研究背景及意义
射频识别技术,即RFID技术,是一种非接触式自动识别技术,它利用射频信号和空间耦合传输特性对被识别物品自动检测,相比于其他识别技术,射频识别技术读写速度快,操作简单,可重复使用,体积小等特点。
基于射频识别的物品管理是利用电子标签与RFID读写器构成,RFID读写器读取电子标签中场频电子码并将信息传输至后台终端进行处理。电子标签储存物品电子代码并将其粘贴在物品上。RFID读写器与电脑相连用于读取标签中的信息,电子标签与RFID读写器之间利用利用无线方式进行信息交换,是物联网中的重要主要组成部分。
1.2 本设计的目的
通过射频识别技术以及单片机设计一套物品管理系统,该系统通过并行串口与电脑连接起来实现射频识别模块对物品的管理。通过本设计可以帮助我们了解射频识别技术,物联网的相关知识,培养物联网系统研发与设计能力。
2.系统硬件部分
硬件电路包括:
(1)射频识别模块:用于接收卡片信息,模块频率为13.56MHz
(2)串行外设接口:用于接收射频识别模块中的信号进而单片机进行分析解码操作
(3)单片机90C51:用于控制FM1702并进行数据的处理
(4)UART单片机通信接口:该端口为单片机与电脑连接的桥梁,波特率为9600bps
3.系统结构与系统软件
3.1 系统结构
系统实现功能是利用90c51实现FM1702模块与电脑的通信,通过串行外设接口实现两个模块之间的通信,UART单片机接口实现单片机与电脑的通信,实现物品的管理。
系统框图如图2所示。
3.2 软件流程图
下位机软件流程图如图3所示。
此流程图实现射频识别模块接收数据通过串口传输给电脑并且电脑可进行一系列操作的功能。开始运行,首先要进行初始化,初始化各串口中各种变量,然后打开定时器和时钟中断进入执行循环,接收串口指令,判断标志位数值,依次执行下去,0为联机命令,1为接收卡片序列号,2为选择功能,3为写卡,4为读卡,如有错误或执行结束便返回A处重新执行。
4 总结
随着经济的发展与科技的进步,射频识别技术有着广阔的发展空间,不仅在物品管理中发挥作用,也会在更广泛的领域体现它的价值,如GPS,生物识别技术,由单一的识别向多功能识别发展。射频识别技术一定会在今后的生活中发挥更大的作用。
致谢
本论文由2015年北京市大学生科学研究与创业行动计划资助。