信息检索报告范文

2023-09-19

信息检索报告范文第1篇

《信息检索课》综合检索实习报告

检索课题名称 建筑工程质量管理与控制

13

学生姓名 *** 学 号 ************ 学院(系) 建筑工程学院 专业班级 建能 ** 报告完成日期 2016.12.13 成 绩 90

注意:实习报告要进行文档编辑、不要出现网页格式

检索题目:

(1)煤矿绿色开采技术研究(地质、采矿专业) (2)我国矿山安全监管体系研究(安全专业)

(3)当代社会慈善行为的道德价值研究(人文社科学院各专业) (4)电子商务时代的企业管理(管理学院各专业) (5)新能源汽车政策探究(机电工程学院专业)

(6)我国体育产业发展现状及问题研究(社会体育专业) (7)英语教育的创新与发展(外国语学院各专业)

(8)物联网的RFID信息安全研究(计算机学院各专业) (9)城市环境污染及治理对策(环境工程学院各专业) (10)建筑工程质量管理与控制(建筑工程学院各专业) (11)大学生心理健康测评与干预(电信工程学院各专业) (12)贫困人口最低生活保障问题研究(其他专业)

作业提交:

提交截止日期:12月8日

邮箱:124114850@qq.com

说 明

检索报告内容包括:课题分析、制定检索策略(确定检索词、检索途径、编制检索表达式)、检索过程(拷贝检索界面)、选择并记录检索结果、文献阅读总结和检索体会(至少800字)

1、检索年限取近十年。

2、本报告中的文献记录格式书写要求:作者、文献标题、文献出处(刊名、年、卷期): a.期刊 „序号‟ 作者 . 题名 [J]. 刊名,年,卷(期).

例如: 厉兵.说说起止号和连接号的分合[J].编辑学报,1996,6(1) b.图书

„序号‟ 著者 . 书名 [M]. 出版地:出版者,出版年 例如:刘国钧.图书馆目录[M].北京:高等教育出版社,1957 c.学位论文

„序号‟ 作者 . 题名 [D]. 授予学位地:授予学位单位,出版年 . 例如:陶建人.动接触减振法及其应用[D].大连:大连理工大学,1988. d.会议文献

[序号‟ 作者 . 题名. 会议名称.会议地点.举办时间. 3 、检索式包括检索词、字段限定、检索方式(简单或高级检索等) 如:用CNKI中国知网查找矿井水利用的有关方面的文章,要求检索近十年的期刊论文,且检索词出现在文章的标题中。采用高级检索方式。

4 、检出篇数指按检索词或检索式实际检出的篇数,而非经人工筛选的切题篇数。

5、在CNKI中国知网、万方数据知识服务平台、超星数字图书馆、百度分别进行检索,要求每个检索系统至少列出2-3个检结果。

1.分析研究课题

工程项目建设涉及到国家经济和社会的各方面,搞好工程项目的质量管理,是项目管理者对国家和社会应尽的义务。工程质量的好坏,在一定程度上体现了我们工程项目管理质量的水平,它直接影响到投资者的综合效益。—个优质的工程项目,是严格按照质量保证体系对工程建设过程实施管理的结果。因此搞好工程质量管理至关重要。

本课题的学科分类主要属于建筑工程质量管理与控制方面,涉及的知识学科门类比较专指,可以采用限定性关键词结合分类浏览的方式进行检索。

该课题属自然科学领域的一般层次的应用型研究,通常情况下需要首先检索时间跨度为5年左右的文献,再视具体情况回溯5年~10年。信息类型涉及中外文期刊论文、学位论文、会议论文、专利、标准文献等。

2 选择检索数据库

根据检索课题的学科范围和研究的方向性质,结合图书馆资源情况,选用检索数据库:

(1)CNKI中国知网(期刊、博硕)

(2)万方数据知识服务平台(学术期刊、学位论文、会议论文、专利技术、外文文献)

(3)超新数字图书馆 (4)百度 3 确定检索词

建筑;建筑物;建造;工程;项目;施工;质量;安全系数;品质;管理;处理;治理;解决;控制;管制;限定;限制。

4 制定检索表达式(仅列举部分)

(建筑工程or建筑项目)and质量and(控制or管理) 5 检索结果

利用上述数据库,选用主题(关键词)途径,必要时结合分类途径,根据不同检索系统的语法规则,适当调整检索式,并选择合适的检索字段进行检索,如有必要可利用网络搜索引擎google、baidu等进行补充查找,时间跨度定为10年,对检索结果进行判断,列举筛选出的切题文献记录如下:

1)CNKI中国知网(期刊、博硕) (1)期刊 检索过程

检索结果

采用高级检索方式,得到137条记录,经筛选,摘录其中2条 ①刘宗林。建筑工程项目中的质量控制与管理措施[J],河南建材,2016年02期

摘要: 结合某住宅楼实例,根据其施工管理经验,提出如何加强工程项目施工质量控制,给出一些有效的管理措施和建议。

关键词: 工程项目; 工程管理; 质量控制; 管理措施; ②胥吉江,浅析建筑工程房屋施工质量管理及控制措施[J],中国高新技术企业,2016年17期

摘要:房屋工程是我国土木工程事业中的重要内容,其施工质量与人们在居住过程中的舒适度及生命安全有着紧密联系,因此保障房屋工程施工质量有着重要作用。文章对建筑工程房屋施工质量管理及控制措施进行了分析。

关键词: 建筑工程; 房屋工程; 施工质量管理; 施工控制措施; 土木工程

(2)博硕 检索过程

检索结果

采用高级检索方式,得到279条记录,经筛选,摘录其中2条。 ①宋丹, 建筑工程质量管理与控制研究[D],重庆:西南大学,2010 摘要:随着我国经济的不断发展,建筑业也得到了飞速的发展,在国民经济中起到了越来越重要的作用。不管建筑怎么发展,对质量的要求始终是放在第一位的。建筑工程质量的好坏直接关系到国家财产与人民生命安全,关系到建筑企业的长久发展,关系到工程的适用性和社会效益性。我国加入WTO后,日趋激烈的国际竞争和挑战,对工程建设的能力和工程项目的质量水平提出了更高的要求。本文对质量、工程质量及质量管理的概念进行了系统阐述。通过对国内外质量管理理论发展的研究,结合我国建筑工程质量管理存在的问题,对我国建筑工程项目质量管理与控制展开了深入的研究。本文的主要内容如下:首先,本文对建筑工程质量进行了多方位的研究,阐述了建筑工程质量及质量问题的特点,建筑工程质量的各个形成阶段,分析了影响建筑工程质量的主要因素。其次,研究了我国建筑工程质量管理制度与管理体制,阐述了质量管理的过程,明确了质量控制是质量管理的重要内容,是保证工程质量的重要环节。介绍了建筑工程质量管理的方法——全面质量管理,进一步提出了建筑工程质量控制方法。最后,结合工程实例的运用,将理论联系实际,探讨了工程施工过程中的质量控制方法,旨在提高建筑施工企业质量管理水平,优化质量管理,改善建筑产品质量。

关键词: 建筑工程; 管理; 控制

②胡鑫,黄圈码头建筑工程质量管理与控制研究[D],大连:大连理工大学,2012 摘要:在经济不断发展的今天,国家对于基本建设的投资规模日益加大,从而带动了建筑业的迅速发展。工程建筑产品的质量好坏,影响建筑产品的使用功能,甚至人身、财产安全。加强工程建设施工的质量管理,使人民生命财产的安全和建筑成品的质量得到保障,是项目建设的头等大事。本文以庄河电厂黄圈码头工程项目为例,从工程监理的角度,对工程项目建设的质量管理与控制进行了探讨。实践是以理论指导为前提,因此本文在第二章阐述了质量管理等基本概念和特点特性,介绍了质量管理的发展历程和相关的常用术语,介绍了工程建设项目质量管理的基本理论,包括理论依据和法律法规依据、影响项目质量的4M1E因素、以及工程项目质量管理的三个阶段。第

三、

四、五章以庄河电厂黄圈码头工程项目为例进行了工程建设项目质量管控的研究,首先介绍了庄河电厂黄圈码头工程项目的基本情况和主要内容。然后以影响工程质量的4MIE因素为基础,从监理角度,阐述了按照事前控制、事中控制、事后控制这三个阶段对该工程项目实施有效管控的具体实施过程。最后对全篇进行总结,提出了系统科学的理论对指导实践中的质量管理意义重大,可有效控制工程施工乃至建筑成品的质量的好坏。通过本文的研究,丰富了我公司的质量管理经验,提高了质量管理水平,对日后同类型工程的质量管理,有积极的意义。

关键词: 码头; 建筑工程; 质量; 管理; 控制

2)万方数据知识服务平台(学术期刊、学位论文、会议论文、专利技术、外文文献) (1)学术期刊 检索过程

检索结果

采用专业检索方式,得到1559条记录,经筛选,摘录其中2条。 ①渠啸啸, 优化建筑施工管理提高建筑工程质量[J], 科技创新与应用,2014,(36) 摘要:从建筑施工定标初期到竣工阶段的管理工作,取决于建筑施工管理,如何提高企业效益,优化管理则起到重要作用,也是保证建筑施工工作开展顺利的前提,文章阐述了我国建筑施工企业在建筑施工管理中存在的一般问题,同时提出对策,为施工单位优化建筑施工管理,进一步提升建筑施工质量提供思路。

关键词: 建筑工程质量 建筑施工管理 存在问题 解决策略

②谭怀刚,优化建筑施工管理提高建筑工程质量[J],商品与质量,2016,(1)

摘要:建筑施工管理工作具有一定的复杂性,执行难度较大,各个环节需紧密配合,相关人员需共同努力,只有这样,才能提高施工管理水平,保证工程质量。因此,施工单位应重视施工管理工作,根据施工管理存在的问题,提出解决措施,优化施工管理,加大施工管理力度,落实施工管理工作,大胆借鉴新的管理方法和管理模式,提高管理能力,做好施工质量管理工作。

关键词:建筑施工管理 建筑工程质量 (2)学位论文 检索过程

检索结果

采用高级检索方式,得到2277条记录,经筛选,摘录其中2条 ①黄志挺,建筑工程前期阶段造价的控制与管理[D],浙江:浙江大学,2013 摘要:改革开放以来,我国国民经济取得快速发展,人民的生活水平有了很大的改善。特别是居住条件的提升,让群众生活发生了日新月异的变化。如今国家逐渐加大了对于城市化建设的投入力度,房地产业的发展突飞猛进,各级政府对城市人居环境的投入可谓规模空前,各种类型的居住项目建设纷纷提上日程,各类建筑工程项目如雨后春笋般在全国各地不断涌现。

作为建筑工程领域核心环节的建筑工程项目造价控制与管理越来越受到大型建筑工程项目管理人员的重视。建筑工程项目一般都投入了巨额的资金,工程周期也比较长,项目涉及到政府、投资商、建筑商等多方利益,无论是对经济发展还是社会稳定都有着巨大影响,所以,加强这一类型的建筑工程领域的工程造价控制管理意义重大。在建筑工程造价的控制与管理中,最为关键的是建设项目的前期阶段。这一阶段所涉及到的投资决策,会对建筑项目所收获的经济利益及社会效益造成决定性的影响。一个工程项目前期阶段的决策,以及工程方案的选择会对工程的整体造价带来极大的影响。根据调查数据工程前期阶段造价控制不当是导致项目投资效益较低以及“三超”现象频繁发生的根本性原因。前期阶段的造价管理工作的疏忽往往成为制约工程顺利开展的关键性因素,因此只有对前期阶段的造价管理投入足够的重视,健全项目设计方案的评定体系,精确项目投资估算才可以有效的防止“三超”现象。

对于怎样做好新形势下的建筑工程前期阶段的造价管理工作,避免“三超”问题的出现,本文从建筑工程项目的整体出发,对建筑项目造价控制与管理的对象和具体内容、项目管理方法、建筑质量与造价控制进行了深入的研究,通过调查研究,笔者进一步认识到了建筑工程前期阶段造价管理的必要性。这次调研针对建筑工程项目本身和项目涉及到的决策评估、设计工作、招标工作、合同审核、造价管理等重要环节,具体可以总结为两个大的方面:

第一,对项目造价控制管理的阶段性研究。笔者将其分为三个阶段,即前期阶段、施工阶段和竣工后结算阶段。

第二,针对最为关键的前期阶段,又细分为决策阶段、设计阶段、招标阶段。

关键词:建筑工程 建筑质量

②黄春蕾,房屋建筑工程施工质量控制内容及方法研究[D],重庆:重庆大学,2008 摘要:房屋建筑工程与人们的生产生活密切相关,工程质量的好坏不仅关系到项目投资能否成功,更为重要的是,建成后的项目直接参与到人们的日常生产和生活中,关系到国家和人民的生命、财产安全。施工阶段质量控制是工程项目全过程质量控制的关键环节,施工阶段质量管理是否有效,关系到整个工程项目的最终质量能否达到国家规范和业主的要求,影响到整个工程项目的顺利完成和成本控制。因此,必须重视和加强施工阶段质量管理工作,工程质量很大程度上决定于施工阶段质量控制。其中心任务是通过建立健全有效的质量监督工作体系来确保工程质量达到合同规定的标准 关键词:房屋建筑工程 质量控制体系 控制内容 质量检测 (3)会议论文 检索过程

利用与检索学位论文同样的高级检索限定,检索会议论文。 检索结果

得到50条记录,经筛选,摘录其中2条。

①高晓旺,积极推进建筑工程质量保险,发挥保险业在建筑工程安全管理中的作用,中国工程院第70场工程科技论坛暨学术研讨会[C],北京,2008年4月19日。 摘要:本文介绍了建筑工程质量保险体系是由建筑工程质量内在缺陷保险和勘察、设计、施工、监理、质量检查机构等专业机构质量责任保险等构成的,介绍了国外开展建筑工程质量保险的情况和在我国推进建筑工程质量保险的意义及我国有关城市的试点情况,探讨了在我国推行建筑工程质量保险试点需要解决的问题和有关建议. 关键词:建筑工程质量 质量缺陷 质量检查

②许红寨,《建筑工程质量与安全管理》课程教学实践研究,2009中国工程管理论坛 [C],成都,2009年11月1日

摘要:《建筑工程质量与安全管理》是湖南农业大学工程管理专业的一门主要必修专业课。该课程主要为学生讲述质量管理、质量责任、安全管理相关理念和管理规律,以及在实践中如何预防和治理质量缺陷、质量与安全事故。拟从该课程开设背景、教材建设、教学内容、教学方法、考核手段等方面探讨《建筑工程质量与安全管理》课程教学实践,并结合多年教学实践经验,时该课程建设提出了参考建议。

关键词:建筑工程 质量管理 安全管理 实践教学 (4)专利技术 检索过程

利用与检索学位论文同样的高级检索限定,检索专利技术。 检索结果

得到27条记录,经筛选,摘录其中2条。

①上海建科工程咨询有限公司,一种建筑工程质量安全信息采集方法,CN201610029117.1,2016年1月15日

摘要:本发明一种建筑工程质量安全信息采集方法,具体指一种用于建筑工程质量验收和安全验收等的信息即时采集方法,涉及信息采集技术领域。所述方法包括:a.携带移动终端质检员到验收现场,登陆个人账户,选择所需验收的

②中博建设集团有限公司,武汉理工大学,用于建筑工程质量管理普适服务系统中的服务定位方法,CN200910063975.8,2009年9月15日 3)超星数字图书馆(汇雅电子图书) 检索过程

检索结果

采用高级检索方式,得到7条记录,经筛选,摘录其中2条 ① 周连起,建筑工程质量与安全管理[M], 北京:北京大学出版社,2010. ② 李峰,建筑工程质量控制[M],北京:中国建筑工业出版社2006. 4)百度 检索过程

检索结果

采用高级检索方式,得到5080条记录,经筛选,摘录其中2条。 ①张玉梅,牛栓梅,浅析建筑工程质量管理与控制《城市建设理论研究:电子版》, 2015(21),

摘要:建筑工程质量问题的产生,有诸多因素,为了消除工程质量问题,就 必须了解这些质量问题的来源,确定关键因素,因为往往关键因素的小波动,会对项目质量产生巨大的影响。因此,本文分析研究建筑工程质量问题的关键影响因 素,为有效解决建筑工程质量问题制定切实可行的对策和方法提供较为科学依据。

关键词:建筑工程 / 质量管理 / 质量控制

②蔡久强, 建筑工程质量管理控制, 《城市建设理论研究:电子版》, 2014(21) 摘要:如何确保工程产品的质量做一介绍,分析了建筑工程施工质量管理的实施状况,从施工技术方面和施工管理方面探讨了建筑施工企业质量控制的具体措施,通过对建筑工程项目施工质量的科学管理,提高了企业自身的管理水平,增强了企业的市场竞争力。

关键词:建筑工程 / 施工质量 / 监督 6 综述

建筑行业属于我国的基础产业,建筑业良好发展和进步在一定层面上能够推动我国国民经济健康有序的发展。随着科学技术的快速进步,当前我国的市场经济在某种程度实现较大的突破和发展。特别表现在建筑行业上,迅速得到了空前的发展,但是在具体的阶段中发生了非常多的问题。建筑工程质量,尤其是住宅工程质量问题已经成为了广大人民群众所关注的焦点。

1 建筑工程的质量特点

在建筑工程中由于施工过程项目较多影响因素也会随着增多,一些工程项目具有较强的隐蔽性,工程竣工检验时受到较大的局限性,建筑施工对社会环境影响较大而且工程项目周期较长等特点[1].

1. 1 影响因素

建筑工程质量管理中影响质量因素较多,建筑工程项目从筹建开始决策、建筑设计、建筑材料的选购、使用的建筑机械、施工环境、管理制度、施工人员的技术水平等多方面因素直接或者间接的影响建筑施工工程质量。

1. 2 隐蔽性较强

建筑工程中所发现的质量问题,一般在建筑表面上很难发现质量问题,质量问题有可能出现在混凝土强度,钢筋锈蚀程度上等,较多的建筑工程质量问题在工程检验时使用肉眼是无法判断出来的,即使使用了专门的仪器进行检验也很难发现质量上的问题。

1. 3 对社会环境影响大

建筑工程规划、设计、施工质量是否合格不仅仅影响到使用者,还关系到整个社会。

2 工程质量控制管理

工程质量控制管理是对工程前期的准备阶段做好质量控制,工程施工之前就要有完整的策划,对所发生的质量问题要有提前的预控,还有要按照质量计划对质量活动前的准备工作进行管理。施工之前的质量管理主要有下面几点:(1) 工程建设过程中的勘查、设计、质量审查管理; (2) 工程参与者的全面质量行为的管理; (3) 对工程建设所需要的建材质量管理; (4)工程中使用的机械设备管理; (5) 施工方法、方案、施工工艺审查; (6)检查质量控制环境和过程准备工作的情况; (7) 施工交底、图纸审查、项目质量标准; (8) 监督管理。

管理工作需要所有参与者共同协商配合才能完成。在施工过程中解决施工质量的最好办法就是提高工作人员的综合素质和技术水平,第一要加强对相关人员的培训,提高施工人员的知识水平,强化施工团队的质量安全意识,提高每一个施工人员的专业技术水平,建立一个具有高素质高水平的施工团队,第二对管理人员也要进行专业教育,在管理过程中要多与施工人员沟通了解施工人员的施工工艺和工作状态,这样才能有效的提高土建工程中的质量安全问题。第三要有相应的责制度,施工过程中要分给每一个施工人员相应的责任,并且要能落实到实际施工中,在施工过程中要能调动每个人的积极性,确保工程施工的质量。

2. 1 工程建设中的控制管理

工程在建设过程中控制管理是对施工过程中的质量活动进行行为约束,主要是质量生产过程中各项技术的施工项目操作者,在相关制度控制管理下所完成预先设计的质量标准。在工程建设过程中管理还包括者自控管理和监控管理两个方面,但是最主要的还是企业人员的质量意识要得到增强,在建设过程中建立实施质量体系,发挥施工人员或者操作者的自我约束、自我控制等,把质量标准作作为根本,最终实现质量管理的标准。在工程项目中质量上的控制管理还包括以下几点:

(1) 工序的质量管理。建设工程施工项目之间是有一系列相互关联、相互制约的过程所构成的,建设过程中质量管理的重点就是施工过程中的施工质量。在施工过程中每一道施工工序开始之前或者是施工过程中都要对影响施工质量因素的条件进行控制,每一道施工工序完成之后都要使用专门的检测方法对本次的施工分项进行检测,让施工标准能达到预期。

(2) 建立质量控制点强化工程质量控制。在工程建设过程建立质量控制点的主要目的就是为了能够更好的发现影响工程质量的因素,从工程项目自身的特点入手,对施工过程中的重要环节和薄弱环节事先预防措施,对质量事故进行预先控制,严格管理。在施工中建立质量控制点,在一定程度让质量管理的目标和工作重点就会变得清晰明了,工程质量预防目标也比较明确。

(3) 材料质量上的管理和控制。在工程施工中所用的施工材料的质量也是非常重要的,为了保证建筑施工的质量,不单单要满足材料充足不断供应,同时还要注意的是材料的质量是否满足施工的要求和是否符合设计要求。但是,根据实际材料的管理过程中发现,由于建筑材料数量较多品种不一样,在一定程度上给材料的控制上加大了难度。我在工程中发现目前给材料进行质量检查所用的方法都是给使用抽样检测法,这样的方式简单快捷,但是没能给建筑材料进行精确的质量控制,使用了一部分质量不合格的建筑材料,导致工程出现较多的质量问题。除此之外,施工材料的存放也比较关键。存放位臵不当容易使建筑材料变质如水泥、钢筋之类的容易产生不良后果。材料的随意放臵会导致用料错误,产生质量问题。所以,对建筑材料的放臵管理也比较重要.

2. 2 施工管理中的质量检查

在施工过程中质量检查主要有目测法、仪器测量法、实验法等。在施工中主要对以下项目进行检查:

(1) 施工员的操作质量检查,对于违章操作和不符合要求的都要及时修改(2) 工序质量的交接检查,在完成上到工序之后进行检查验收合格,就可以交接给下个班组负责人。在工程施工过程中,还能提高质量监督水平,发挥出监督人员的管理职能,主要对影响施工质量因素实施有效控制,严格审查施工过程中的每一道工序,等到验收合格符合标准后,才能进行下一分项的施工,对于隐蔽工程的质量要特别注意,要求技术人员时刻跟班监督施工,控制安全质量的检查,到质量检查验收合格后,才能进行下一道工序,保证建筑施工的整体质量。

(3) 隐蔽工程的检查与验收,对于一些隐蔽工程要特别的注意,大部分质量原因都是来自隐蔽工程。

(4) 施工过程中的监控,对重要施工项目要进行严格预检和复查。

(5) 成品的保护和质量检查,对已经完工的工程部位要使用合理的方式给予保护,防止损坏,影响工程的总体质量。

在施工过程中如果出现工程质量问题要及时解决,要确保工程质量和工期的要求,要是发生严重的质量问题,要责令停工,分析质量原因报告说明质量情况,找出发生质量问题的原因,需求解决办法预防此类问题的发生。为了实现在土建中质量的有效管理,要建立全面的土建施工质量管理制度,让施工过程变得规范、合理、有效,提高相关管理人员的管理能力,比如材料上的管理、施工人员的安排管理、施工图纸会审等提供科学、合理的方案。特别是人员管理方面要合理的分配任务,确定每一个施工人员的工作目标,保证土建施工管理工作者的有效性。

3 结束语

信息检索报告范文第2篇

摘要:该文对当前Web信息检索技术进行分析和研究。分别介绍了三种经典检索模型和基于潜在语义分析的检索技术,以及基于超级链接分析研究的搜索算法,并进行了比较和分析,最后,指出当前信息检索的智能化发展方向。

关键字:Web信息检索;潜在语义分析;LSA;链接分析

文献标识码:A

信息检索报告范文第3篇

关键词:标准文献 检索 GOST ABNT SABS BIS

Contrastive Analysis of the Retrieval Information of BRICS Standard

Lin Bin

( Zhejiang Institute of Standardization )

Dong Zhihui, Wang Lili, Chen Xixi

( Zhejiang Fangda Standards Information Co. Ltd )

Key words: standard document, retrieval, GOST, ABNT, SABS, BIS

1 引言

标准文献是指记录标准化活动、知识、成果的各种载体[1]。标准信息检索平台是标准信息用户最常用的标准文献信息源,也是国际标准组织依托自身的资源优势和技术优势构建的标准检索平台,使得标准信息和数据的解释上更加全面、真实。金砖国家(BRICS)包括中国、俄罗斯、印度、巴西以及南非5个国家,国家之间遵循开放透明、团结互助、深化合作、共谋发展原则和“开放、包容、合作、共赢”的金砖国家精神。本文选取“金砖国家”的俄罗斯、印度、巴西和南非4个国家的标准检索平台进行分析、比较和评价,方便用户在标准检索时选择使用,也为我国标准文献检索平台的建设提供参考,并且以国外标准组织的检索平台作为标杆,对国内文献检索平台的建设给出相关建议。

2 金砖国家标准文献的检索平台

2.1 GOST

1993年6月10日,俄罗斯联邦《标准化法》的发布标志着俄罗斯标准化工作从此步入了法制化轨道。2003年,俄罗斯联邦国家标准化与计量委员会通过第63号决议,“现行的全国标准仍保留国家标准原来规定代号GOST R和跨国标准原来规定代号GOST。”俄罗斯联邦现在执行的标准化规范文件主要有以下几种:独联体跨国标准GOST;独联体跨国建议与跨国规则PMΓ与ΠMΓ;俄罗斯联邦国家标准GOST R;俄罗斯联邦的其他标准化规范文件[2]。

检索俄罗斯标准途径:①进入俄罗斯联邦技术法规与计量局首页,点击“Standards Catalogue”[3],进入在线目录检索界面,可利用标准号、标准题目(关键词)和分类号等字段进行检索,以获得现行独联体跨国标准(GOST)和俄联邦国家标准(GOST R)的信息;②利用俄罗斯《国家标准目录》《技术规范目录》《作废与被代替标准目录》进行检索;③以下3种途径也可检索俄罗斯标准信息:新批准的标准信息及全文检索与浏览、标准草案最终稿信息及全文检索与浏览、2005年至今的全俄技术经济与社会信息分类(标准)。

2.2 ABNT

巴西技术标准协会(ABNT)成立于1940年,是巴西标准化的主管机构,主要业务是研究制定巴西标准(NB),开展产品质量认证及其他与标准化相关的活动,代表国家参与国际/区域标准化活动。ABNT于1947年加入国际标准化组织(ISO),也是国际电工委员会(IEC)、泛美标准委员会(COPANT)、南锥体共同市场标准化协会(AMN)的成员[4]。

巴西标准可通过以下几个途径进行检索:登录ABNT网站,或者登录ABNT的网上书店http://www.abntcatalogo.com.br/,查找相关标准信息。

2.3 SABS

南非国家标准局(South African Bureau of Standards, SABS)是根据1945年颁布的《国家标准法》设立的,是南非惟一制定和颁布标准的机构,南非的国家标准通过技术委员会(TC)来制定,SABS下属有450个TC,每年约500个新标准的速度增长[5]。南非标准大部分为自愿采用的标准,也有少部分为强制性标准,其数量约为70个,主要涉及产品包括电气和电子设备及其部件、机动车及其零部件以及食品等。除了强制性标准外,南非还有另外两种形式的技术法规:一是法律法规引用的国家标准,这类技术法规大约有300个;二是其他政府部门制定的有技术要求的法规,能够制定这类技术法规的有交通、能源、环境保护、卫生、农业、通讯、劳动、贸易与工业等10个政府部门。

南非标准检索可通过以下途径:①进入SABS网站首页。该页面提供按领域检索标准信息的功能。目前共涉及36个领域,选择领域后再点击左侧列表中的“Standards & Publications”,即可看到该领域内所有标准列表,显示信息为标准号与标准题目。②利用网上书店的标准搜索引擎。在SABS网站主页点击购物车图标进入网上书店页面,或直接输入书店网址http://www.sabs.co.za/进入页面。在其主页上的检索框中输入标准号或者关键词即可进行简单搜索,或者点击“Advanced search”进入高级检索,利用其提供的多种途径检索到需要的标准信息。③目录《STANDARDS CATALOGUE》。该目录每月更新,可免费从网站下载,进入SABS网上书店,点击主页面下端的“VIEW OUR SABS CATALOGUE ID PDF”,该目录中包含標准审定委员会批准或SABS标准发布的所有标准和相关出版物的信息,其中通知是从官方通报上获悉的新发布标准和已有标准更新的信息。

2.4 BIS

印度设立的印度标准局(BIS)成立于1986年,并于1987年4月1日正式取代印度标准学会成为印度法定的全国性标准及认证管理机构。主要任务是制定推行国家标准;实施合格评定制度;代表国家参与ISO、IEC等国际标准化活动。印度的标准体系主要由涉及标准及认证管理的法律法规、标准管理制度以及印度认证制度组成[6]。

检索印度标准信息,可登录BIS主页www.bis.org.in,点击左侧的“Buy Standards Online”栏目,在“Search for Standard”中直接输入标准号或标题进行检索,也可以点击“Advanced Search”进入高级检索界面進行检索,还可以在线购买纸版、电子版/DVD版本的标准。BIS每年制定350多条新增或修订的标准。

3 金砖国家标准信息检索平台的比较及特点

3.1 收录内容

各种标注文献检索平台收录的标准文献不同,主要表现在内容层次、语言种类、技术领域、标准种类、标准数量5个方面(见表1),英语是最常用的语言,是各类标准文献都采用的语种,其次是本国的官方语言和英语同时存在。BIS制定的印度标准涉及14个领域,每年4月1日,BIS向14个分区理事会的各个理事会,发布详细的工作计划,这14个领域为生产与一般工程、化工、土木工程、电子与信息技术、电工学、食品业和农业、管理和系统、机械工程、医疗设备和医院规划、冶金过程、石油煤炭及相关产品、纺织业、运输工程、水利资源。

3.2 检索标准编号

标准编号基本结构为标准代号+专业类号+顺序号+年代号,如表2所示。

(2)高级检索字段(见表4)

标准编号、标准名称、时间范围、标准制定委员会代码、关键词、ICS号是基本检索字段。SABS在高级检索中提供如下检索字段,如标准号、小描述、价格、出版社、批准日期、版本号、修正号、摘要、国际关系(采用标准)、重申日期、撤回数据日期、代替标准、被代替标准、与其他字段结合使用、印发单位、校对、阶段日期、ISBN、委员会、阶段码、年份、ICS、文件状态码、短名字。BIS提供如下检索字段:标题、IS号、司/分司、年份、价格范围、重申日期、修正号、是否有同等标准。ABNT提供如下字段:组织类型、标准号、部分、关键词、委员会、ICS/CIN、出版社、出版时间、状态。GOST提供的检索字段最少,如:序号、关键词、ICS号、验证码,并且在常用的检索字段提供验证码,并在search下有帮助文档。

3.5 检索功能

检索功能主要根据是否支持截词检索、精确检索和布尔逻辑检索进行划分。逻辑检索词包括与、或、非。4个国家的检索功能如表5所示。

3.6 著录方式

标准文献基本的著录信息包括标准编号、标准名称、出版日期、语种、委员会代码和标准状态等。标准编号是标准文献的唯一标识符,其格式是“标准代号+顺序号+年代号”。ICS号是指国际标准分类号,通常ICS分为40大类(一级类目),其组成分为3级:第一级由两个数字组成,第二级由三个数字组成,第三级由两个数字组成,各级之间以“.”隔开。除基本信息外,SABS提供关联标准信息、引用关系,这些信息体现了知识的流动方向,是了解技术发展过程的重要信息。日期著录不仅包括出版日期、有效日期,还包括公开日期、批准日期、撤销日期。

著录方式中,ABNT提供字段最多,如:标准号、出版日期、实施日期、英语标题、葡萄牙语标题、委员会、页数、状态、语言类型、正文、价格、范围、ICS、相关标准。SABS提供字段如:标准号、标题、版本号、修正案、摘要、印发单位、阶段码、委员会、出版社、ICS号。BIS提供字段如:标准号、出版年、重申时间(年)、标题、委员会、修正次数、状态、印度国内价格、印度国外价格。而GOST字段最少,仅有3个:标准号、英文标题、ICS号。详见表6。

3.7 检索结果排序

标准检索结果提供的排序方式,可以更加方便用户浏览和筛选相关标准文献。但是ABNT和SABS均未提供排序方式,默认依照相关度进行排序,而GOST提供的3种排序方式更符合标准信息用户的行为习惯。详见表7。

3.8 其他检索方式

标准检索文献中,提供最新和卖得较好的标准记录,可以方便用户及时了解标准的更新和发展。4个国家中,均提供在首页显示最新标准目录,提供免费电子版出版物促进对标准的了解,而只有SABS在首页显示卖得较好的标准。详见表8。

4 国内标准检索平台的启示

针对国内检索文献中不足:如注重数量忽略质量、查全率和查准率低以及更新速度慢等问题,国内标准文献检索平台可以从以下几个方面改进:(1)注重标准文献收录的时效性和连续性。(2)整合国内外不同标准文献字段,整理出用户最关心的字段。(3)注重对原文标准数据的深加工以及著录质量的审查。(4)针对不同用户习惯提供可选用户选择的不同排序方式,在标准文献首页提供最新、卖得较好等目录,增加标准服务的多样化。(5)定期针对标准出版相应期刊等出版物,促进标准的推广和实施。

信息检索报告范文第4篇

关键词:信息检索;跨语言检索;检索模型;多语言信息资源

信息技术的发展产生了大量的数字信息,人们进入了海量信息资源和大数据时代。特别是互联网技术的快速发展,因特网上的信息资源类型和数量愈来愈丰富,所使用的语言愈来愈具有多样性。网络资源语言的多样性和网络用户所掌握语言的差异性不可避免地给人们利用网络检索信息带来了语言障碍。这种语言障碍极大地限制了人们对信息资源的有效获取,跨语言信息检索由此应运而生。跨语言信息检索由康奈尔大学的Salton于20世纪70年代初首先提出。他利用手工编制的英语—德语双语种词表,进行了跨语言信息检索的尝试;1973年,他又编制了英语—法语词表,并对跨语言信息检索的效率进行了评价。1964年,法国道路研究实验室开发了“国际道路研究文献系统”,该系统通过英、法、德三种语言索引词构成的多语言受控词表来实现跨语言信息检索。跨语言信息检索是指用户以自己熟悉的一种语言来构建和提交查询提问式,从多语言信息资源系统中检索出符合用户需求的另一种或多种语言描述的相关信息资源。例如,输入中文的提问式,从多语言信息资源系统检索出英文、法文或中文及其他语言描述的相关信息资源。用户查询提问时所使用的语言称之为源语言,而系统检索出的信息资源所包含的语言称之为目标语言。跨语言信息检索,可分为双语言信息检索和多语言信息检索。双语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外一种语言表达的文献信息,即目标语言为另一种语言。多语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外多种语言表达的文献信息,即目标语言为多种语言。相对于双语言信息检索,多语言信息检索往往更符合网络用户的查询需求。与跨语言信息检索相对应,查询提问式语言和检索出信息资源表述语言相同的信息检索称为单语言信息检索。跨语言信息检索是传统计算机信息检索技术和语言自动处理技术的有机结合,涉及语言学、情报学、计算机科学等多门学科知识,是一个综合性强、富有挑战性的研究领域。源语言和目标语言的统一是跨语言信息检索的关键技术,信息检索模型则是实现查询和信息资源匹配的重要理论基础。本文对此都进行了讨论,以利于图书馆员们更好地了解和掌握跨语言信息检索相关技术。

一、跨语言信息检索方法

跨语言信息检索一般可以分为如下三个过程:①多语言信息资源的搜集以及多语言信息索引的建立;②应用语言自动处理技术实现提问语言(源语言)和信息资源表述语言(目标语言)的统一;③应用单语言信息检索技术实现查询提问式与索引信息的匹配,得到检索结果。其中源语言和目标语言的统一是实现跨语言信息检索的关键技术,主要通过提问式翻译、文献翻译、中间语种转换及非翻译方法等四种方式来实现。提问式翻译是指将用户提交的查询请求翻译成系统支持的多种语言,然后对不同语言的信息集进行查询。提问式翻译主要有字典和语料库两种方法。其核心思想在于通过语料库中不同语种同一信息的对应关系对提问式进行翻译并且过滤提问式翻译后产生的非正常翻译结果。提问式翻译是实现跨语言信息检索较为经济的方法。其缺陷在于,系统返回的信息仍然用目标语言表达,只能算一种不完全的跨语言信息检索。文献翻译是指在信息检索之前,将文献信息资源表述的目标语言转化为查询提问式的源语言。目前实现文献翻译的方法主要有机器翻译和基于字典翻译文献索引词方法。文献翻译的优点是检索结果用提问语言描述,用户能够方便地选择利用。同时,文献层次的翻译与提问层次的翻译相比,其语境更加宽泛,比较容易消除歧义。不足之处在于要求所有被检索信息改变语言表述,而现有机器翻译系统的正确率还难以达到令人满意的程度,无法达到实用水平;此外,将数据库中全部文献从目标语种翻译到提问语言工作量大,代价昂贵。中间语言转换是将提问的源语言转换成中间语言,再把中间语言转换为信息资源的目标语言,或者是把提问的源语言和信息资源的目标语言都转换为中间语言。中间语言通常是计算机容易自动处理的语言。这种方法常用于多于两个语种的跨语言信息检索或者两种语言之间不存在直接对应转换的跨语言信息检索。非翻译方法是指不对提问语种或者信息语种进行翻译而实现跨语言信息检索的方法,即潜语义索引。这种方法的实现方式是,首先将原始文档与相对应的翻译文档建立联系,构建训练文档集,然后利用奇异值分解技术对其进行分析,获得双语文档集的特征信息和检索词的映射关系,最后以平行文档中的语词检索出另一语言的相关信息。这种方法的优点是,不需要字典、词表和机器翻译系统,也不存在翻译过程中消除歧义的问题,具有很高的灵活性和适应性;不足之处在于对具体问题构造优化的向量空间模型是一种经验型的工作,且向量空间模型的奇异值分解计算需要时间,训练文档不容易获取。

二、跨语言信息检索模型

信息检索模型是信息检索中的一个重要理论问题。已有的单语言信息检索模型包括布尔模型、向量空间模型、概率模型、统计语言模型和语义处理模型等。这些信息检索模型在跨语言信息检索中有着重要的作用。布尔模型是一种基于集合论的检索模型。在该模型中,一篇文档通过称之为标引词的关键词来表示,文档语义内容中标引词的重要性用一个二值权值来表示,一个查询表示为多个标引词通过逻辑联结词连接的表达式。布尔模型结构简单、容易实现,但只能判断文档相关或不相关,无法描述与查询条件的匹配程度情况。模糊集合模型和扩展布尔模型在此方面进行了改进。在模糊集合模型中,将文档看成与查询在一定程度上相关,每一标引词都存在一个模糊的文献集合与之相关。扩展布尔模型吸取了模糊集合模型和向量空间模型的长处。在该模型中,一篇文档对应的标引词被赋予了一个0~1之间数值的权值,文档与查询的相似度通过公式来计算。布尔模型及其扩展模型在跨语言信息检索的查询翻译消歧中得到成功应用。向量空间模型是将文档和查询表示为向量的检索模型。在该模型中,标引词在一篇文档中的权值是一个0~1之间的实数。查询中的标引词也有一个正的加权值。文档向量与查询向量夹角的余弦用来计算它们之间相似度。向量空间模型能根据相似度对检索结果进行排序,有效地提高了检索效率。其不足之处在于标引词被假定为相互独立,这样会丢掉大量的文本结构信息,且相似度计算量大。为此,人们对向量空间模型进行了改进,提出了广义向量空间模型。广义向量空间模型已应用于跨语言信息检索,其基本思想在于根据双语言训练文档集分别建立源语言与目标语言的检索词——文档关联矩阵。在源语言与目标语言之间建立映射关系,在不需要翻译的条件下实现跨语言信息检索。概率模型是基于概率和随机过程理论的检索模型。在该模型中,一个用户查询对应一个由相关文档构成的集合,称之为理想集合。如果知道理想集合的特征,就可以找到所有的相关文档,剔除所有的无关文档。概率模型具有严格的数学理论基础,采用相关反馈原理克服了不确定性推理的缺点。但其参数估计难度较大,缺乏理论知识。于是人们将统计学引入到概率模型中,形成了各种基于贝叶斯网络的检索模型。推理网络模型是概率模型的一种扩展形式,它模拟人脑的推理思维模式,将文档与用户查询匹配的过程转化为一个从文档到查询的推理过程。跨语言信息检索系统InQuery是基于贝叶斯推理网络模型的信息检索系统,InQuery允许使用查询算符,这在跨语言信息检索中是非常有用的。统计语言模型是关于某种语言所有语句或者其他语言单位的分布概率,也可以将统计语言模型看作是生成某种语言文本的统计模型。根据马尔可夫链的阶数,统计语言模型分为一元语言模型和多元语言模型。一元语言模型假设词与词之间是相互独立的,一个词出现的概率与这个词前面的词没有必然联系。多元语言模型假设词与词之间是相互关联的,一个词出现的概率与这个词前面的词存在一定的关联。根据目标词前面其他词个数的多少,多元语言模型可被划分为二元语言模型、三元语言模型等。统计语言模型检索方法能够利用统计语言模型来估计与检索有关的参数,在如何改善检索系统性能方面有更加明确的指导方向。但该方法隐含着词汇相互独立关系,没有考虑词汇间的相互影响。统计语言模型已经应用于跨语言信息检索,并在解决查询翻译的语言歧义性中发挥重要作用。概率模型和统计语言模型可以看作在同一概率框架下不同的推导结果,然而统计语言模型却克服了传统概率模型在概率估计上的不足。如果不进行查询扩展,概率模型的效果要稍好于统计语言模型。如果进行查询扩展,那么统计语言模型进行跨语言信息检索的效率更高。语义处理模型能够探究词语背后所指代的本质概念,明确词语的主题范畴,识别同一概念的各种表示形式。在该模型中,词语的含义、词语和文档之间的语义关联、文档的相似度分析,采取了从文档结构入手的潜在语义分析方法,以及从内容入手的利用知识组织体系的本体方法。潜语义标引模型将标引词之间、文档之间的相关关系以及标引词与文档之间的语义关联都考虑在内,将文档向量和查询向量映射到与语义概念相关联的较低维度空间中,从而将标引词向量空间转化为语义概念空间,并在降维后的语义概念空间中,计算文档向量和查询向量的相似度。潜语义标引模型克服了同义词和多义词对检索结果的影响。本体模型将用户的信息需求通过共享本体转化为计算机可理解的查询表达。为了提高查全率,再通过共享本体中概念与概念之间的关系扩展查询表达。在跨语言信息检索中,潜语义标引模型将有代表性的文档与其对应的翻译文档联系起来形成训练文档集,利用奇异值分解技术对双语检索词——文档关联矩阵进行奇异值分解,获得双语文档集的特征信息以及检索词用法上的映射关系,最后根据平行文档中语词的用法特征检索出另一种语言的相关信息。基于本体的跨语言信息检索比常规的单一语言信息检索在查全率和查准率方面有明显的优势。

传统的信息检索技术,往往只能帮助用户使用自己熟知的一种语言提出查询。互联网技术与数字图书馆技术的发展产生了大量的多语言信息资源。这样,不同的用户可能会使用不同的语言提出查询,同一个用户也可能采用同一种语言来查询不同语言表述的信息资源。由此,表述信息资源的语言的多样性以及用户使用语言的差异性,带来了信息检索的语言障碍。跨语言信息检索是为满足此要求应运而生的新方法和技术。数字图书馆以及网络信息资源服务是图书馆业务拓展的新平台,跨语言信息检索是这些资源服务中必须采用的技术手段,了解和掌握跨语言信息检索相关技术对于图书馆员有着重要的意义。

参考文献:

[1]Witten Ian H.et.al.Greenstone:Open-Source digital Library Software[J].D-Lib Magazine,2001,7(10):288-298.

[2]Wiederhold Gio.Digital Libraries:Value and Productivity[J]. Communication of the ACM,1995,38(4):85-96.

[3]Douglas W Oard,Anne R Diekema. Cross-language Information Retrieval[J]. Annual Review of Information Science and Technology,1998,(6):223-256.

[4]骆卫华.跨语言信息检索方法概述[J].数字图书馆论坛,2006,(9):1-7.

[5]Kazuaki Kishida. Technical issues of cross-language information retrieval:a review[J]. Information Processing & Management,2005,(41):433-455.

[6]吴丹,齐和庆.信息检索模型及其在跨语言信息检索中的应用进展[J].现代情报,2009,29(7):215-221.

信息检索报告范文第5篇

关键词:信息检索;跨语言检索;检索模型;多语言信息资源

信息技术的发展产生了大量的数字信息,人们进入了海量信息资源和大数据时代。特别是互联网技术的快速发展,因特网上的信息资源类型和数量愈来愈丰富,所使用的语言愈来愈具有多样性。网络资源语言的多样性和网络用户所掌握语言的差异性不可避免地给人们利用网络检索信息带来了语言障碍。这种语言障碍极大地限制了人们对信息资源的有效获取,跨语言信息检索由此应运而生。跨语言信息检索由康奈尔大学的Salton于20世纪70年代初首先提出。他利用手工编制的英语—德语双语种词表,进行了跨语言信息检索的尝试;1973年,他又编制了英语—法语词表,并对跨语言信息检索的效率进行了评价。1964年,法国道路研究实验室开发了“国际道路研究文献系统”,该系统通过英、法、德三种语言索引词构成的多语言受控词表来实现跨语言信息检索。跨语言信息检索是指用户以自己熟悉的一种语言来构建和提交查询提问式,从多语言信息资源系统中检索出符合用户需求的另一种或多种语言描述的相关信息资源。例如,输入中文的提问式,从多语言信息资源系统检索出英文、法文或中文及其他语言描述的相关信息资源。用户查询提问时所使用的语言称之为源语言,而系统检索出的信息资源所包含的语言称之为目标语言。跨语言信息检索,可分为双语言信息检索和多语言信息检索。双语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外一种语言表达的文献信息,即目标语言为另一种语言。多语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外多种语言表达的文献信息,即目标语言为多种语言。相对于双语言信息检索,多语言信息检索往往更符合网络用户的查询需求。与跨语言信息检索相对应,查询提问式语言和检索出信息资源表述语言相同的信息检索称为单语言信息检索。跨语言信息检索是传统计算机信息检索技术和语言自动处理技术的有机结合,涉及语言学、情报学、计算机科学等多门学科知识,是一个综合性强、富有挑战性的研究领域。源语言和目标语言的统一是跨语言信息检索的关键技术,信息检索模型则是实现查询和信息资源匹配的重要理论基础。本文对此都进行了讨论,以利于图书馆员们更好地了解和掌握跨语言信息检索相关技术。

一、跨语言信息检索方法

跨语言信息检索一般可以分为如下三个过程:①多语言信息资源的搜集以及多语言信息索引的建立;②应用语言自动处理技术实现提问语言(源语言)和信息资源表述语言(目标语言)的统一;③应用单语言信息检索技术实现查询提问式与索引信息的匹配,得到检索结果。其中源语言和目标语言的统一是实现跨语言信息检索的关键技术,主要通过提问式翻译、文献翻译、中间语种转换及非翻译方法等四种方式来实现。提问式翻译是指将用户提交的查询请求翻译成系统支持的多种语言,然后对不同语言的信息集进行查询。提问式翻译主要有字典和语料库两种方法。其核心思想在于通过语料库中不同语种同一信息的对应关系对提问式进行翻译并且过滤提问式翻译后产生的非正常翻译结果。提问式翻译是实现跨语言信息检索较为经济的方法。其缺陷在于,系统返回的信息仍然用目标语言表达,只能算一种不完全的跨语言信息检索。文献翻译是指在信息检索之前,将文献信息资源表述的目标语言转化为查询提问式的源语言。目前实现文献翻译的方法主要有机器翻译和基于字典翻译文献索引词方法。文献翻译的优点是检索结果用提问语言描述,用户能够方便地选择利用。同时,文献层次的翻译与提问层次的翻译相比,其语境更加宽泛,比较容易消除歧义。不足之处在于要求所有被检索信息改变语言表述,而现有机器翻译系统的正确率还难以达到令人满意的程度,无法达到实用水平;此外,将数据库中全部文献从目标语种翻译到提问语言工作量大,代价昂贵。中间语言转换是将提问的源语言转换成中间语言,再把中间语言转换为信息资源的目标语言,或者是把提问的源语言和信息资源的目标语言都转换为中间语言。中间语言通常是计算机容易自动处理的语言。这种方法常用于多于两个语种的跨语言信息检索或者两种语言之间不存在直接对应转换的跨语言信息检索。非翻译方法是指不对提问语种或者信息语种进行翻译而实现跨语言信息检索的方法,即潜语义索引。这种方法的实现方式是,首先将原始文档与相对应的翻译文档建立联系,构建训练文档集,然后利用奇异值分解技术对其进行分析,获得双语文档集的特征信息和检索词的映射关系,最后以平行文档中的语词检索出另一语言的相关信息。这种方法的优点是,不需要字典、词表和机器翻译系统,也不存在翻译过程中消除歧义的问题,具有很高的灵活性和适应性;不足之处在于对具体问题构造优化的向量空间模型是一种经验型的工作,且向量空间模型的奇异值分解计算需要时间,训练文档不容易获取。

二、跨语言信息检索模型

信息检索模型是信息检索中的一个重要理论问题。已有的单语言信息检索模型包括布尔模型、向量空间模型、概率模型、统计语言模型和语义处理模型等。这些信息检索模型在跨语言信息检索中有着重要的作用。布尔模型是一种基于集合论的检索模型。在该模型中,一篇文档通过称之为标引词的关键词来表示,文档语义内容中标引词的重要性用一个二值权值来表示,一个查询表示为多个标引词通过逻辑联结词连接的表达式。布尔模型结构简单、容易实现,但只能判断文档相关或不相关,无法描述与查询条件的匹配程度情况。模糊集合模型和扩展布尔模型在此方面进行了改进。在模糊集合模型中,将文档看成与查询在一定程度上相关,每一标引词都存在一个模糊的文献集合与之相关。扩展布尔模型吸取了模糊集合模型和向量空间模型的长处。在该模型中,一篇文档对应的标引词被赋予了一个0~1之间数值的权值,文档与查询的相似度通过公式来计算。布尔模型及其扩展模型在跨语言信息检索的查询翻译消歧中得到成功应用。向量空间模型是将文档和查询表示为向量的检索模型。在该模型中,标引词在一篇文档中的权值是一个0~1之间的实数。查询中的标引词也有一个正的加权值。文档向量与查询向量夹角的余弦用来计算它们之间相似度。向量空间模型能根据相似度对检索结果进行排序,有效地提高了检索效率。其不足之处在于标引词被假定为相互独立,这样会丢掉大量的文本结构信息,且相似度计算量大。为此,人们对向量空间模型进行了改进,提出了广义向量空间模型。广义向量空间模型已应用于跨语言信息检索,其基本思想在于根据双语言训练文档集分别建立源语言与目标语言的检索词——文档关联矩阵。在源语言与目标语言之间建立映射关系,在不需要翻译的条件下实现跨语言信息检索。概率模型是基于概率和随机过程理论的检索模型。在该模型中,一个用户查询对应一个由相关文档构成的集合,称之为理想集合。如果知道理想集合的特征,就可以找到所有的相关文档,剔除所有的无关文档。概率模型具有严格的数学理论基础,采用相关反馈原理克服了不确定性推理的缺点。但其参数估计难度较大,缺乏理论知识。于是人们将统计学引入到概率模型中,形成了各种基于贝叶斯网络的检索模型。推理网络模型是概率模型的一种扩展形式,它模拟人脑的推理思维模式,将文档与用户查询匹配的过程转化为一个从文档到查询的推理过程。跨语言信息检索系统InQuery是基于贝叶斯推理网络模型的信息检索系统,InQuery允许使用查询算符,这在跨语言信息检索中是非常有用的。统计语言模型是关于某种语言所有语句或者其他语言单位的分布概率,也可以将统计语言模型看作是生成某种语言文本的统计模型。根据马尔可夫链的阶数,统计语言模型分为一元语言模型和多元语言模型。一元语言模型假设词与词之间是相互独立的,一个词出现的概率与这个词前面的词没有必然联系。多元语言模型假设词与词之间是相互关联的,一个词出现的概率与这个词前面的词存在一定的关联。根据目标词前面其他词个数的多少,多元语言模型可被划分为二元语言模型、三元语言模型等。统计语言模型检索方法能够利用统计语言模型来估计与检索有关的参数,在如何改善检索系统性能方面有更加明确的指导方向。但该方法隐含着词汇相互独立关系,没有考虑词汇间的相互影响。统计语言模型已经应用于跨语言信息检索,并在解决查询翻译的语言歧义性中发挥重要作用。概率模型和统计语言模型可以看作在同一概率框架下不同的推导结果,然而统计语言模型却克服了传统概率模型在概率估计上的不足。如果不进行查询扩展,概率模型的效果要稍好于统计语言模型。如果进行查询扩展,那么统计语言模型进行跨语言信息检索的效率更高。语义处理模型能够探究词语背后所指代的本质概念,明确词语的主题范畴,识别同一概念的各种表示形式。在该模型中,词语的含义、词语和文档之间的语义关联、文档的相似度分析,采取了从文档结构入手的潜在语义分析方法,以及从内容入手的利用知识组织体系的本体方法。潜语义标引模型将标引词之间、文档之间的相关关系以及标引词与文档之间的语义关联都考虑在内,将文档向量和查询向量映射到与语义概念相关联的较低维度空间中,从而将标引词向量空间转化为语义概念空间,并在降维后的语义概念空间中,计算文档向量和查询向量的相似度。潜语义标引模型克服了同义词和多义词对检索结果的影响。本体模型将用户的信息需求通过共享本体转化为计算机可理解的查询表达。为了提高查全率,再通过共享本体中概念与概念之间的关系扩展查询表达。在跨语言信息检索中,潜语义标引模型将有代表性的文档与其对应的翻译文档联系起来形成训练文档集,利用奇异值分解技术对双语检索词——文档关联矩阵进行奇异值分解,获得双语文档集的特征信息以及检索词用法上的映射关系,最后根据平行文档中语词的用法特征检索出另一种语言的相关信息。基于本体的跨语言信息检索比常规的单一语言信息检索在查全率和查准率方面有明显的优势。

传统的信息检索技术,往往只能帮助用户使用自己熟知的一种语言提出查询。互联网技术与数字图书馆技术的发展产生了大量的多语言信息资源。这样,不同的用户可能会使用不同的语言提出查询,同一个用户也可能采用同一种语言来查询不同语言表述的信息资源。由此,表述信息资源的语言的多样性以及用户使用语言的差异性,带来了信息检索的语言障碍。跨语言信息检索是为满足此要求应运而生的新方法和技术。数字图书馆以及网络信息资源服务是图书馆业务拓展的新平台,跨语言信息检索是这些资源服务中必须采用的技术手段,了解和掌握跨语言信息检索相关技术对于图书馆员有着重要的意义。

参考文献:

[1]Witten Ian H.et.al.Greenstone:Open-Source digital Library Software[J].D-Lib Magazine,2001,7(10):288-298.

[2]Wiederhold Gio.Digital Libraries:Value and Productivity[J]. Communication of the ACM,1995,38(4):85-96.

[3]Douglas W Oard,Anne R Diekema. Cross-language Information Retrieval[J]. Annual Review of Information Science and Technology,1998,(6):223-256.

[4]骆卫华.跨语言信息检索方法概述[J].数字图书馆论坛,2006,(9):1-7.

[5]Kazuaki Kishida. Technical issues of cross-language information retrieval:a review[J]. Information Processing & Management,2005,(41):433-455.

[6]吴丹,齐和庆.信息检索模型及其在跨语言信息检索中的应用进展[J].现代情报,2009,29(7):215-221.

信息检索报告范文第6篇

1、举例说明搜索引擎中filetype、site、双引号这三个高级检索语法的功能。 1),filetype

Filetype是 Google 开发的一个非常强大而且实用的搜索语法。通过这个语法,Google 不仅能搜索一般的网页,还能对某些二进制文件进行检索。目前Google支持的文件格式包括Doc, Excel,Pdf,Ps, PPT,RTF等等 通过Filetype可以使检索后的内容更精确。

例如 ,我们想搜索包含“大学转专业申请书”关键词的office文件,就在百度中输入“大学转专业申请书 filetype:doc”。则百度搜到全为DOC文件,可打开来寻求需要的内容。

如此可使我们更快更精确的找到想要的内容。 2),site

Site是指把搜索范围限定在特定站点中。如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”

例如,我们想在四川师范大学的网站上查找“国家奖学金申请表”,可在百度中输入“国家奖学金申请表 site:sicnu.edu.cn”。则百度搜的内容全为川师大网站上的内容。

3),双引号

检索系统会把双引号括起来的检索词作为一个词组来检索,而不是拆分。 例如,我们想找“天亮你不想见我”这句话出自的博客,如果不加双引号,会出现被拆分后的众多结果。

而加上双引号后,会搜索出整句。

如此便找到了我们想找的内容。

2、查询本专业经典书籍。

1),公共事业管理专业必读书籍有:

1 . 尼古拉斯·亨利. 公共行政与公共事务[M]. 北京:中国人民大学出版社, 2002 2.陈振明 . 公共管理学原理 [M]. 北京:中国人民大学出版社, 2003 3.欧文·休斯 . 公共管理导论 [M]. 北京:中国人民大学出版社, 2001 等等。

2),这三本书籍可在厦门大学、武汉大学、四川大学三个图书馆找到。

3),通过四川师范大学图书馆网站上的书生之家数据库和超星数据库查询这些书的全文 欧文·休斯 . 公共管理导论:

尼古拉斯·亨利. 公共行政与公共事务:

陈振明 . 公共管理学原理: 未检索到相关内容。 4),电子书下载地址

欧文·休斯 . 公共管理导论 http:///Ebook/2533.html http:///ISBN-9787300051093.pdf

3、结合自己的专业和学习,从四川师范大学图书馆网站上所列示的数据库中各查找一篇文献。

1)阅读器:CAJViewer

检索点:CNKI 检索词:研究生论文

文献题目:非英语专业研究生英语自主学习现状调查研究 作者:魏卫

发表时间:2011-12-01 来源:南京航空航天大学

2)阅读器:PDF全文浏览器 检索点:维普中文科技期刊数据库 检索词:化学 文献题名:铜对地聚合物化学结构的影响

作者:李克亮 仝玉萍 刊名:建筑材料学报 出版年:2014 3)阅读器:网页

检索点:人大复印资料 检索词:辛亥革命

文献题名:辛亥革命与现代中国文学 作者:李怡/陈国恩

复印期号:2011年12期

4)阅读器:笔记本

检索点:springgerlink 检索词:Stories of Family 文献题目:Stories of Families 作者:Laurel Lindgren 发表时间:2013

5)阅读器:PDF阅读器 检索点:ebsco 检索词:管理

文献题目:Country Context in Management Research: Learning from John Child

作者:Cheng, Joseph L. C. 来源:Management & Organization Review. Nov2014, Vol. 10 Issue 3, p337-346. 10p.

6)阅读器:Acrobat Reader V6.0

检索点:万方学位论文全文数据库 检索词:公共事业

文献题目:公共事业管理专业人才培养模式研究 作者:辛颖 分类号:F24

7)阅读器:PDF阅读器

检索点:PQDD学位论文检索平台

上一篇:行为科学管理理论范文下一篇:高中数学学科的核心素养范文