信息检索相关论文范文第1篇
摘要:该文对当前Web信息检索技术进行分析和研究。分别介绍了三种经典检索模型和基于潜在语义分析的检索技术,以及基于超级链接分析研究的搜索算法,并进行了比较和分析,最后,指出当前信息检索的智能化发展方向。
关键字:Web信息检索;潜在语义分析;LSA;链接分析
文献标识码:A
信息检索相关论文范文第2篇
关键词:标准文献 检索 GOST ABNT SABS BIS
Contrastive Analysis of the Retrieval Information of BRICS Standard
Lin Bin
( Zhejiang Institute of Standardization )
Dong Zhihui, Wang Lili, Chen Xixi
( Zhejiang Fangda Standards Information Co. Ltd )
Key words: standard document, retrieval, GOST, ABNT, SABS, BIS
1 引言
标准文献是指记录标准化活动、知识、成果的各种载体[1]。标准信息检索平台是标准信息用户最常用的标准文献信息源,也是国际标准组织依托自身的资源优势和技术优势构建的标准检索平台,使得标准信息和数据的解释上更加全面、真实。金砖国家(BRICS)包括中国、俄罗斯、印度、巴西以及南非5个国家,国家之间遵循开放透明、团结互助、深化合作、共谋发展原则和“开放、包容、合作、共赢”的金砖国家精神。本文选取“金砖国家”的俄罗斯、印度、巴西和南非4个国家的标准检索平台进行分析、比较和评价,方便用户在标准检索时选择使用,也为我国标准文献检索平台的建设提供参考,并且以国外标准组织的检索平台作为标杆,对国内文献检索平台的建设给出相关建议。
2 金砖国家标准文献的检索平台
2.1 GOST
1993年6月10日,俄罗斯联邦《标准化法》的发布标志着俄罗斯标准化工作从此步入了法制化轨道。2003年,俄罗斯联邦国家标准化与计量委员会通过第63号决议,“现行的全国标准仍保留国家标准原来规定代号GOST R和跨国标准原来规定代号GOST。”俄罗斯联邦现在执行的标准化规范文件主要有以下几种:独联体跨国标准GOST;独联体跨国建议与跨国规则PMΓ与ΠMΓ;俄罗斯联邦国家标准GOST R;俄罗斯联邦的其他标准化规范文件[2]。
检索俄罗斯标准途径:①进入俄罗斯联邦技术法规与计量局首页,点击“Standards Catalogue”[3],进入在线目录检索界面,可利用标准号、标准题目(关键词)和分类号等字段进行检索,以获得现行独联体跨国标准(GOST)和俄联邦国家标准(GOST R)的信息;②利用俄罗斯《国家标准目录》《技术规范目录》《作废与被代替标准目录》进行检索;③以下3种途径也可检索俄罗斯标准信息:新批准的标准信息及全文检索与浏览、标准草案最终稿信息及全文检索与浏览、2005年至今的全俄技术经济与社会信息分类(标准)。
2.2 ABNT
巴西技术标准协会(ABNT)成立于1940年,是巴西标准化的主管机构,主要业务是研究制定巴西标准(NB),开展产品质量认证及其他与标准化相关的活动,代表国家参与国际/区域标准化活动。ABNT于1947年加入国际标准化组织(ISO),也是国际电工委员会(IEC)、泛美标准委员会(COPANT)、南锥体共同市场标准化协会(AMN)的成员[4]。
巴西标准可通过以下几个途径进行检索:登录ABNT网站,或者登录ABNT的网上书店http://www.abntcatalogo.com.br/,查找相关标准信息。
2.3 SABS
南非国家标准局(South African Bureau of Standards, SABS)是根据1945年颁布的《国家标准法》设立的,是南非惟一制定和颁布标准的机构,南非的国家标准通过技术委员会(TC)来制定,SABS下属有450个TC,每年约500个新标准的速度增长[5]。南非标准大部分为自愿采用的标准,也有少部分为强制性标准,其数量约为70个,主要涉及产品包括电气和电子设备及其部件、机动车及其零部件以及食品等。除了强制性标准外,南非还有另外两种形式的技术法规:一是法律法规引用的国家标准,这类技术法规大约有300个;二是其他政府部门制定的有技术要求的法规,能够制定这类技术法规的有交通、能源、环境保护、卫生、农业、通讯、劳动、贸易与工业等10个政府部门。
南非标准检索可通过以下途径:①进入SABS网站首页。该页面提供按领域检索标准信息的功能。目前共涉及36个领域,选择领域后再点击左侧列表中的“Standards & Publications”,即可看到该领域内所有标准列表,显示信息为标准号与标准题目。②利用网上书店的标准搜索引擎。在SABS网站主页点击购物车图标进入网上书店页面,或直接输入书店网址http://www.sabs.co.za/进入页面。在其主页上的检索框中输入标准号或者关键词即可进行简单搜索,或者点击“Advanced search”进入高级检索,利用其提供的多种途径检索到需要的标准信息。③目录《STANDARDS CATALOGUE》。该目录每月更新,可免费从网站下载,进入SABS网上书店,点击主页面下端的“VIEW OUR SABS CATALOGUE ID PDF”,该目录中包含標准审定委员会批准或SABS标准发布的所有标准和相关出版物的信息,其中通知是从官方通报上获悉的新发布标准和已有标准更新的信息。
2.4 BIS
印度设立的印度标准局(BIS)成立于1986年,并于1987年4月1日正式取代印度标准学会成为印度法定的全国性标准及认证管理机构。主要任务是制定推行国家标准;实施合格评定制度;代表国家参与ISO、IEC等国际标准化活动。印度的标准体系主要由涉及标准及认证管理的法律法规、标准管理制度以及印度认证制度组成[6]。
检索印度标准信息,可登录BIS主页www.bis.org.in,点击左侧的“Buy Standards Online”栏目,在“Search for Standard”中直接输入标准号或标题进行检索,也可以点击“Advanced Search”进入高级检索界面進行检索,还可以在线购买纸版、电子版/DVD版本的标准。BIS每年制定350多条新增或修订的标准。
3 金砖国家标准信息检索平台的比较及特点
3.1 收录内容
各种标注文献检索平台收录的标准文献不同,主要表现在内容层次、语言种类、技术领域、标准种类、标准数量5个方面(见表1),英语是最常用的语言,是各类标准文献都采用的语种,其次是本国的官方语言和英语同时存在。BIS制定的印度标准涉及14个领域,每年4月1日,BIS向14个分区理事会的各个理事会,发布详细的工作计划,这14个领域为生产与一般工程、化工、土木工程、电子与信息技术、电工学、食品业和农业、管理和系统、机械工程、医疗设备和医院规划、冶金过程、石油煤炭及相关产品、纺织业、运输工程、水利资源。
3.2 检索标准编号
标准编号基本结构为标准代号+专业类号+顺序号+年代号,如表2所示。
(2)高级检索字段(见表4)
标准编号、标准名称、时间范围、标准制定委员会代码、关键词、ICS号是基本检索字段。SABS在高级检索中提供如下检索字段,如标准号、小描述、价格、出版社、批准日期、版本号、修正号、摘要、国际关系(采用标准)、重申日期、撤回数据日期、代替标准、被代替标准、与其他字段结合使用、印发单位、校对、阶段日期、ISBN、委员会、阶段码、年份、ICS、文件状态码、短名字。BIS提供如下检索字段:标题、IS号、司/分司、年份、价格范围、重申日期、修正号、是否有同等标准。ABNT提供如下字段:组织类型、标准号、部分、关键词、委员会、ICS/CIN、出版社、出版时间、状态。GOST提供的检索字段最少,如:序号、关键词、ICS号、验证码,并且在常用的检索字段提供验证码,并在search下有帮助文档。
3.5 检索功能
检索功能主要根据是否支持截词检索、精确检索和布尔逻辑检索进行划分。逻辑检索词包括与、或、非。4个国家的检索功能如表5所示。
3.6 著录方式
标准文献基本的著录信息包括标准编号、标准名称、出版日期、语种、委员会代码和标准状态等。标准编号是标准文献的唯一标识符,其格式是“标准代号+顺序号+年代号”。ICS号是指国际标准分类号,通常ICS分为40大类(一级类目),其组成分为3级:第一级由两个数字组成,第二级由三个数字组成,第三级由两个数字组成,各级之间以“.”隔开。除基本信息外,SABS提供关联标准信息、引用关系,这些信息体现了知识的流动方向,是了解技术发展过程的重要信息。日期著录不仅包括出版日期、有效日期,还包括公开日期、批准日期、撤销日期。
著录方式中,ABNT提供字段最多,如:标准号、出版日期、实施日期、英语标题、葡萄牙语标题、委员会、页数、状态、语言类型、正文、价格、范围、ICS、相关标准。SABS提供字段如:标准号、标题、版本号、修正案、摘要、印发单位、阶段码、委员会、出版社、ICS号。BIS提供字段如:标准号、出版年、重申时间(年)、标题、委员会、修正次数、状态、印度国内价格、印度国外价格。而GOST字段最少,仅有3个:标准号、英文标题、ICS号。详见表6。
3.7 检索结果排序
标准检索结果提供的排序方式,可以更加方便用户浏览和筛选相关标准文献。但是ABNT和SABS均未提供排序方式,默认依照相关度进行排序,而GOST提供的3种排序方式更符合标准信息用户的行为习惯。详见表7。
3.8 其他检索方式
标准检索文献中,提供最新和卖得较好的标准记录,可以方便用户及时了解标准的更新和发展。4个国家中,均提供在首页显示最新标准目录,提供免费电子版出版物促进对标准的了解,而只有SABS在首页显示卖得较好的标准。详见表8。
4 国内标准检索平台的启示
针对国内检索文献中不足:如注重数量忽略质量、查全率和查准率低以及更新速度慢等问题,国内标准文献检索平台可以从以下几个方面改进:(1)注重标准文献收录的时效性和连续性。(2)整合国内外不同标准文献字段,整理出用户最关心的字段。(3)注重对原文标准数据的深加工以及著录质量的审查。(4)针对不同用户习惯提供可选用户选择的不同排序方式,在标准文献首页提供最新、卖得较好等目录,增加标准服务的多样化。(5)定期针对标准出版相应期刊等出版物,促进标准的推广和实施。
信息检索相关论文范文第3篇
关键词:信息检索;跨语言检索;检索模型;多语言信息资源
信息技术的发展产生了大量的数字信息,人们进入了海量信息资源和大数据时代。特别是互联网技术的快速发展,因特网上的信息资源类型和数量愈来愈丰富,所使用的语言愈来愈具有多样性。网络资源语言的多样性和网络用户所掌握语言的差异性不可避免地给人们利用网络检索信息带来了语言障碍。这种语言障碍极大地限制了人们对信息资源的有效获取,跨语言信息检索由此应运而生。跨语言信息检索由康奈尔大学的Salton于20世纪70年代初首先提出。他利用手工编制的英语—德语双语种词表,进行了跨语言信息检索的尝试;1973年,他又编制了英语—法语词表,并对跨语言信息检索的效率进行了评价。1964年,法国道路研究实验室开发了“国际道路研究文献系统”,该系统通过英、法、德三种语言索引词构成的多语言受控词表来实现跨语言信息检索。跨语言信息检索是指用户以自己熟悉的一种语言来构建和提交查询提问式,从多语言信息资源系统中检索出符合用户需求的另一种或多种语言描述的相关信息资源。例如,输入中文的提问式,从多语言信息资源系统检索出英文、法文或中文及其他语言描述的相关信息资源。用户查询提问时所使用的语言称之为源语言,而系统检索出的信息资源所包含的语言称之为目标语言。跨语言信息检索,可分为双语言信息检索和多语言信息检索。双语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外一种语言表达的文献信息,即目标语言为另一种语言。多语言信息检索是指用户以自己熟悉的语言提交查询请求,除源语言之外,系统可检索到另外多种语言表达的文献信息,即目标语言为多种语言。相对于双语言信息检索,多语言信息检索往往更符合网络用户的查询需求。与跨语言信息检索相对应,查询提问式语言和检索出信息资源表述语言相同的信息检索称为单语言信息检索。跨语言信息检索是传统计算机信息检索技术和语言自动处理技术的有机结合,涉及语言学、情报学、计算机科学等多门学科知识,是一个综合性强、富有挑战性的研究领域。源语言和目标语言的统一是跨语言信息检索的关键技术,信息检索模型则是实现查询和信息资源匹配的重要理论基础。本文对此都进行了讨论,以利于图书馆员们更好地了解和掌握跨语言信息检索相关技术。
一、跨语言信息检索方法
跨语言信息检索一般可以分为如下三个过程:①多语言信息资源的搜集以及多语言信息索引的建立;②应用语言自动处理技术实现提问语言(源语言)和信息资源表述语言(目标语言)的统一;③应用单语言信息检索技术实现查询提问式与索引信息的匹配,得到检索结果。其中源语言和目标语言的统一是实现跨语言信息检索的关键技术,主要通过提问式翻译、文献翻译、中间语种转换及非翻译方法等四种方式来实现。提问式翻译是指将用户提交的查询请求翻译成系统支持的多种语言,然后对不同语言的信息集进行查询。提问式翻译主要有字典和语料库两种方法。其核心思想在于通过语料库中不同语种同一信息的对应关系对提问式进行翻译并且过滤提问式翻译后产生的非正常翻译结果。提问式翻译是实现跨语言信息检索较为经济的方法。其缺陷在于,系统返回的信息仍然用目标语言表达,只能算一种不完全的跨语言信息检索。文献翻译是指在信息检索之前,将文献信息资源表述的目标语言转化为查询提问式的源语言。目前实现文献翻译的方法主要有机器翻译和基于字典翻译文献索引词方法。文献翻译的优点是检索结果用提问语言描述,用户能够方便地选择利用。同时,文献层次的翻译与提问层次的翻译相比,其语境更加宽泛,比较容易消除歧义。不足之处在于要求所有被检索信息改变语言表述,而现有机器翻译系统的正确率还难以达到令人满意的程度,无法达到实用水平;此外,将数据库中全部文献从目标语种翻译到提问语言工作量大,代价昂贵。中间语言转换是将提问的源语言转换成中间语言,再把中间语言转换为信息资源的目标语言,或者是把提问的源语言和信息资源的目标语言都转换为中间语言。中间语言通常是计算机容易自动处理的语言。这种方法常用于多于两个语种的跨语言信息检索或者两种语言之间不存在直接对应转换的跨语言信息检索。非翻译方法是指不对提问语种或者信息语种进行翻译而实现跨语言信息检索的方法,即潜语义索引。这种方法的实现方式是,首先将原始文档与相对应的翻译文档建立联系,构建训练文档集,然后利用奇异值分解技术对其进行分析,获得双语文档集的特征信息和检索词的映射关系,最后以平行文档中的语词检索出另一语言的相关信息。这种方法的优点是,不需要字典、词表和机器翻译系统,也不存在翻译过程中消除歧义的问题,具有很高的灵活性和适应性;不足之处在于对具体问题构造优化的向量空间模型是一种经验型的工作,且向量空间模型的奇异值分解计算需要时间,训练文档不容易获取。
二、跨语言信息检索模型
信息检索模型是信息检索中的一个重要理论问题。已有的单语言信息检索模型包括布尔模型、向量空间模型、概率模型、统计语言模型和语义处理模型等。这些信息检索模型在跨语言信息检索中有着重要的作用。布尔模型是一种基于集合论的检索模型。在该模型中,一篇文档通过称之为标引词的关键词来表示,文档语义内容中标引词的重要性用一个二值权值来表示,一个查询表示为多个标引词通过逻辑联结词连接的表达式。布尔模型结构简单、容易实现,但只能判断文档相关或不相关,无法描述与查询条件的匹配程度情况。模糊集合模型和扩展布尔模型在此方面进行了改进。在模糊集合模型中,将文档看成与查询在一定程度上相关,每一标引词都存在一个模糊的文献集合与之相关。扩展布尔模型吸取了模糊集合模型和向量空间模型的长处。在该模型中,一篇文档对应的标引词被赋予了一个0~1之间数值的权值,文档与查询的相似度通过公式来计算。布尔模型及其扩展模型在跨语言信息检索的查询翻译消歧中得到成功应用。向量空间模型是将文档和查询表示为向量的检索模型。在该模型中,标引词在一篇文档中的权值是一个0~1之间的实数。查询中的标引词也有一个正的加权值。文档向量与查询向量夹角的余弦用来计算它们之间相似度。向量空间模型能根据相似度对检索结果进行排序,有效地提高了检索效率。其不足之处在于标引词被假定为相互独立,这样会丢掉大量的文本结构信息,且相似度计算量大。为此,人们对向量空间模型进行了改进,提出了广义向量空间模型。广义向量空间模型已应用于跨语言信息检索,其基本思想在于根据双语言训练文档集分别建立源语言与目标语言的检索词——文档关联矩阵。在源语言与目标语言之间建立映射关系,在不需要翻译的条件下实现跨语言信息检索。概率模型是基于概率和随机过程理论的检索模型。在该模型中,一个用户查询对应一个由相关文档构成的集合,称之为理想集合。如果知道理想集合的特征,就可以找到所有的相关文档,剔除所有的无关文档。概率模型具有严格的数学理论基础,采用相关反馈原理克服了不确定性推理的缺点。但其参数估计难度较大,缺乏理论知识。于是人们将统计学引入到概率模型中,形成了各种基于贝叶斯网络的检索模型。推理网络模型是概率模型的一种扩展形式,它模拟人脑的推理思维模式,将文档与用户查询匹配的过程转化为一个从文档到查询的推理过程。跨语言信息检索系统InQuery是基于贝叶斯推理网络模型的信息检索系统,InQuery允许使用查询算符,这在跨语言信息检索中是非常有用的。统计语言模型是关于某种语言所有语句或者其他语言单位的分布概率,也可以将统计语言模型看作是生成某种语言文本的统计模型。根据马尔可夫链的阶数,统计语言模型分为一元语言模型和多元语言模型。一元语言模型假设词与词之间是相互独立的,一个词出现的概率与这个词前面的词没有必然联系。多元语言模型假设词与词之间是相互关联的,一个词出现的概率与这个词前面的词存在一定的关联。根据目标词前面其他词个数的多少,多元语言模型可被划分为二元语言模型、三元语言模型等。统计语言模型检索方法能够利用统计语言模型来估计与检索有关的参数,在如何改善检索系统性能方面有更加明确的指导方向。但该方法隐含着词汇相互独立关系,没有考虑词汇间的相互影响。统计语言模型已经应用于跨语言信息检索,并在解决查询翻译的语言歧义性中发挥重要作用。概率模型和统计语言模型可以看作在同一概率框架下不同的推导结果,然而统计语言模型却克服了传统概率模型在概率估计上的不足。如果不进行查询扩展,概率模型的效果要稍好于统计语言模型。如果进行查询扩展,那么统计语言模型进行跨语言信息检索的效率更高。语义处理模型能够探究词语背后所指代的本质概念,明确词语的主题范畴,识别同一概念的各种表示形式。在该模型中,词语的含义、词语和文档之间的语义关联、文档的相似度分析,采取了从文档结构入手的潜在语义分析方法,以及从内容入手的利用知识组织体系的本体方法。潜语义标引模型将标引词之间、文档之间的相关关系以及标引词与文档之间的语义关联都考虑在内,将文档向量和查询向量映射到与语义概念相关联的较低维度空间中,从而将标引词向量空间转化为语义概念空间,并在降维后的语义概念空间中,计算文档向量和查询向量的相似度。潜语义标引模型克服了同义词和多义词对检索结果的影响。本体模型将用户的信息需求通过共享本体转化为计算机可理解的查询表达。为了提高查全率,再通过共享本体中概念与概念之间的关系扩展查询表达。在跨语言信息检索中,潜语义标引模型将有代表性的文档与其对应的翻译文档联系起来形成训练文档集,利用奇异值分解技术对双语检索词——文档关联矩阵进行奇异值分解,获得双语文档集的特征信息以及检索词用法上的映射关系,最后根据平行文档中语词的用法特征检索出另一种语言的相关信息。基于本体的跨语言信息检索比常规的单一语言信息检索在查全率和查准率方面有明显的优势。
传统的信息检索技术,往往只能帮助用户使用自己熟知的一种语言提出查询。互联网技术与数字图书馆技术的发展产生了大量的多语言信息资源。这样,不同的用户可能会使用不同的语言提出查询,同一个用户也可能采用同一种语言来查询不同语言表述的信息资源。由此,表述信息资源的语言的多样性以及用户使用语言的差异性,带来了信息检索的语言障碍。跨语言信息检索是为满足此要求应运而生的新方法和技术。数字图书馆以及网络信息资源服务是图书馆业务拓展的新平台,跨语言信息检索是这些资源服务中必须采用的技术手段,了解和掌握跨语言信息检索相关技术对于图书馆员有着重要的意义。
参考文献:
[1]Witten Ian H.et.al.Greenstone:Open-Source digital Library Software[J].D-Lib Magazine,2001,7(10):288-298.
[2]Wiederhold Gio.Digital Libraries:Value and Productivity[J]. Communication of the ACM,1995,38(4):85-96.
[3]Douglas W Oard,Anne R Diekema. Cross-language Information Retrieval[J]. Annual Review of Information Science and Technology,1998,(6):223-256.
[4]骆卫华.跨语言信息检索方法概述[J].数字图书馆论坛,2006,(9):1-7.
[5]Kazuaki Kishida. Technical issues of cross-language information retrieval:a review[J]. Information Processing & Management,2005,(41):433-455.
[6]吴丹,齐和庆.信息检索模型及其在跨语言信息检索中的应用进展[J].现代情报,2009,29(7):215-221.
信息检索相关论文范文第4篇
摘 要: 本文通过对档案检索发展模式及地位的叙述,从哲学、心理学角度分析档案检索体系理论范式和原理发展轨迹,进一步探讨档案检索体系在网络信息化时代的发展原则和保障方法。
关键词: 档案检索体系 理论分析 发展原则
1.档案检索模式演变及地位
1.1档案检索模式发展
档案检索经历了传统档案检索模式、计算机半自动档案检索模式及网络档案检索模式等阶段。传统档案检索依赖档案工作者预先著录,在预先著录的基础上进行人工直接检索。传统模式人工著录效率低下,人工因素参与较多,依赖档案著录项目的档案检索的查全率和查准率会受到直接影响。计算机半自动档案检索模式指在同一台计算机上进行档案数据存储、人机交互,按多种方式检索和输出检索结果。网络档案检索模式是利用网络技术,将档案信息制作成网页,在网络上传输,用户只要在搜索栏中填入所查档案的相关信息,就可以通过网络方便地查到档案信息,大大提高档案的时效性。另外,档案部门还可以从网上搜集有关网站网址,对其档案信息进行著录标引,建立网上档案检索体系,使众多网址和网上档案信息条理分明、便于使用。
1.2档案检索地位
档案检索是档案工作的重要环节,是档案基础工作向利用转换的环节,做好这个环节,就能把档案工作整个链条牵动起来。档案检索作为提供档案利用的基本途径,其基本要求是在繁杂的档案资料文件中找到有效信息。馆藏档案资料信息无法与社会需求形成有效的沟通路径,档案检索工作就无法推进,丰富的馆藏与利用效率成反比,提高档案需求效率和效用,取决于检索手段的优劣。由此可见,检索是提供档案信息的必经途径。档案检索是开启档案信息资源利用的一把钥匙。档案拥有丰富的知识信息资源,是积累、贮存、反馈档案信息的阵地。
2.档案检索体系的理论分析
2.1档案检索体系的理论范式
档案检索研究的理论基础经历了从理性主义传统向基于认知观点的档案检索理论的过渡,其基本原理经历了从相关性判断到适用性判断到用户满意度判断的革新。
档案检索的理性主义观点的研究者在一个模拟档案检索作业的人工或虚拟环境中进行标引方法、表征手段、检索理论和方法的开发、应用、比较及效果评价。在理性主义的研究范式下,档案检索研究的重点是检索方法和文献表征的开发、改善、受控环境下的科学验证、检索结果的相关性评价、新媒体的应用等。
档案检索认知观点主张认知过程发生在任意信息交流系统的两端,强调人的知识结构、认知能力等对检索信息的接收、感知及创造活动的媒介及互动作用。其主要汲取认知科学的基本思想和有关理论,研究人对信息处理的原理,以达到设计支持和改善对信息利用和吸收的检索系统和检索服务的目的。
2.2档案检索体系的哲学基本原理发展
从传统角度来看,档案检索体系的相关性原理指的是文献与用户提问之间的相符(或一致)程度,这种相关性反映的是档案检索系统的检索能力。相关性判断由专家判定,因而这种相关性判断是片面的、不确切的。档案检索的认知观点对相关性原理进行了扩充和修正,提出了适用性判断原理。
档案检索体系适用性原理指档案与用户需求之间的匹配程度,适用性原理的判定者是用户本人。适用性判断具有强烈的即时性特征,带有极强的主观主义偏向,用户对档案资料适用与否的判断,会因条件、时间的不同而有所变化。适用性原理判断反映的不是信息检索及检索系统的客观评价,而是信息检索系统的服务能力,即检索系统能否满足特定用户需求,适用性原理是反映检索系统功能和效率的最主要指标。在网络环境下,档案检索人员角色转换,用户直接在网上获得自己所需的各种信息资料。档案检索人员和用户都可以接触和利用信息系统,在档案检索人员无法介入的情况下,档案检索效率依然存在,只是衡量其效率的指标不再是查全率和查准率。在关键词检索加模糊检索的浏览方式下,如何提供少量而适用的信息,成为衡量搜索引擎功能的主要指标,所以人们提出用户满意度的概念。这实际上是对适用性的一种扩展,用户满意度越高,说明检索系统的效率越高。
3.档案检索体系的发展原则与方法
3.1档案检索体系的发展原则
标准化原则是档案检索体系发展最关键的原则,直接影响档案检索质量,关系档案检索能否实现真正的有效共享。档案检索的发展标准主要包括:档案著录格式的标准化、描述与标引语言标准化、档案信息元数据标准化、数据库管理标准化等。
档案检索体系的安全性原则包括不危害国家安全、集体与个人利益,在档案检索体系建设和使用过程中,必须做好网络安全问题的处理工作,当出现系统缺陷、黑客或者病毒攻击、非法调用档案信息等问题时,应及时解决,防止档案信息遭到破坏。
档案检索体系化发展是为了整合档案资源、实现共享,更好地为用户提供服务,如果只有理论基础却不具有可操作性,就违背了档案检索的初衷。档案检索体系化发展应降低成本,避免资源的闲置浪费。
3.2档案检索体系发展的保障方法
档案检索体系的发展建设涉及诸多环节及因素,宏观政策的指引、充足的资金来源、最新的技术支持、高素质的人才培养,必然成为成功实现档案检索体系化发展的有力保障。
档案检索体系是一项复杂的系统工程,需要国家政策、法律法规进行引导与规范。国家档案领域相关政策、法律法规对档案检索体系工作起着宏观指导和控制作用,标准体系的建立能微观指导档案工作者的具体工作。档案检索体系化是一项巨大的系统工程,从档案检索数字化建设到管理和利用都需要大量资金投入,档案工作者在依靠政府财政支持的同时,还应该开拓思路,积极利用有效的社会资源,扩展资金渠道,同时可以研发增值服务,实现资金的自我补偿。
档案检索体系的构建需要高新科学技术的支撑,除了档案工作者,还需要计算软件开发、网络技术等领域的专业人才。能否拥有优质的人才队伍,关系到档案检索体系建设的成败,档案人才队伍的素质是推动档案事业发展的关键。档案检索体系具有很强的信息技术依赖性,信息技术的先进与否直接关系档案检索体系的开发利用程度和效果。
参考文献:
[1]邓绍兴.档案检索[M].北京:档案出版社,1985.
[2]陈丽.档案信息检索[M].成都:四川人民出版社,2010.
信息检索相关论文范文第5篇
〔摘要〕本文总结了北京师范大学珠海分校图书馆的读者教育实践成果,归纳了基于各种需求的读者信息教育形式,分享了引导和激发读者信息意识的经验,同时也分析了存在的问题和不足,指出了独立学院图书馆读者信息教育的发展方向。
〔关键词〕独立学院;信息教育;信息检索
收稿日期:2011-04-26
作者简介:田辛玲(1970-),女,副研究馆员,研究方向:数字化图书馆,发表论文10余篇。
DOI:10.3969/j.issn.1008-0821.2011.06.036
〔
Practical Study on the Readers Information Education in Separated College
——A Case Study of Beijing Normal University Zhuhai campus Library
Tian Xinling
(Library,Beijing Normal University Zhuhai Campus,Zhuhai 519085,China)
〔
〔Key words〕separate academy;information education;information retrieval
2002年2月,在教育部颁布的《普通高等学校图书馆规程(修订)》总则第3条中明确规定,当前高等学校图书馆的5项任务之一就是“开展信息素养教育,培养读者的信息意识和获取、利用文献信息的能力”[1]。这是我国首次在政府文件中对大学生信息素质教育问题做出明确规定。作为办学机制创新与模式变革的独立学院,理应成为大学生信息素养教育的倡领者。然而,独立学院与普通本科院校相比,其建校时间短,资源建设和评估压力大,加之本科生层面的应用型人才培养方式也直接导致了学校对科研的需求不高,因此在办馆过程中往往忽略了读者的信息素养教育。北京师范大学珠海分校作为独立学院中的一员,图书馆从2003年建立至今,一直坚持资源建设与信息教育并重的原则,在大学生信息素质教育方面进行了积极的探索,本文在总结本馆教育实践成果的基础上,探讨切实可行的独立学院读者信息素养教育模式。
1 本馆读者信息教育实践成果
1.1 分层次进行读者信息教育
信息教育不能搞一刀切,我馆在理论上借鉴了瑞典查尔奠斯大学菲埃尔·勃兰特博士(Fiall Brant)提出的“三阶段模式”,即分层次对在校学生和教师进行信息培训的方法[2],把图书馆的读者分为3个层次。
(1)第一层次读者对专业知识和图书馆知识均不了解或了解很少。这类读者以刚刚迈入学校的新生为代表,他们对图书馆的基本知识,数据库的使用,图书、期刊和相关信息的查找方法等一片茫然。因此,在入学之初,我们以学院为单位举办了新生入馆教育讲座,以常规知识性内容为主,着重介绍图书馆基本知识、资源分布及简单的检索技术,引领他们使用图书馆。
(2)第二层次读者具备一定的信息检索和利用能力,对图书馆知识有一定了解,但不够深入,尤其缺乏在专业方向上的检索技能。针对这部分读者,我们主动联系专业课教师,采取馆员—教师协作的方式,将信息检索内容嵌入专业课,在专业课上有针对性地讲解数字资源的查找和使用。对大三、大四年级需要写毕业论文做毕业设计的特定读者群,举办专业论文写作资料查找培训,并从论文的文题选择,关键词、摘要的撰写,参考文献的格式规范等方面进行指导。
(3)第三层次读者对专业知识研究精深,但对数字资源使用不清楚或欠缺检索技巧。这类读者以教师为代表,他们面临教学和科研的双重压力,既要懂得专业数据库的检索技巧,又需要将获得的信息进行鉴别评价,融入已有的知识,实现科研创新。因此,我们对教师开展了专业性较强的定题服务,同时提供“一对一”辅导,帮助他们了解本专业领域的学科动向、相关数字资源的检索方法和技巧。
1.2 以读者需求为导向开展多种形式的信息教育
“3A理念”是一种崭新的读者服务理念——Any time、Any where、Anyway (无论何时、何地、以何种方式),也就是说,无论读者在什么时间、什么地方、通过何种方式,都能得到图书馆方便、快捷、高效的文献信息服务[3]。我们把读者需求划分为问题型、学习型和科研型3种,以“3A理念”为指导,对每种类型的特定需求力求提供多种信息服务,从而满足信息教育的需要。
1.2.1 问题型
读者在利用图书馆的过程中,经常会遇到一些或大或小有关图书馆服务和资源利用的问题,诸如:我要找一本书,应该怎么找?我在图书馆借的书丢了,怎么办?我要查一本期刊,图书馆没找到,还有其他办法吗?……这些问题的针对性和时效性较强,读者希望立即得到解答。我们提供在线QQ、电话、E-mail、论坛等多种咨询方式,由专门的参考咨询员负责解答。如果在馆内遇到问题,读者还可到图书馆的咨询台进行现场咨询。灵活的咨询方式,让读者感到图书馆的信息服务无处不在,提高了读者对图书馆的认知度。读者把参考咨询员当成自己的良师益友,他们在得到信息帮助的同时,也愿意把自己对图书馆的意见和建议反馈给参考咨询员,这是读者和图书馆双赢的模式。
1.2.2 学习型
读者有自我学习的信息意识,希望能够自主选择或系统地学习信息检索知识。我馆用的是简单培训与系统培训相结合的方式,给读者提供多种可选择的信息教育形式。OPAC查询时一个小小的提示,网页上醒目的常见问题,放在图书馆门口的各种读者手册、数据库使用指南等,信息素质培训以各种姿态,或成熟或小巧,出现在读者需要的各种场合,为读者提供切实的服务。
我馆参考咨询部还按学期制定专题教育计划,定期推出“60分钟讲座”,不定期地举办各种系列、专题的读者培训。“60分钟讲座”由图书馆参考咨询馆员主讲,采用“实例讲解+演示+实习操作”的方式,注重与读者的互动,以生动的实例为读者讲授常用的文献数据库的检索方法和检索技巧。讲座每周一个专题,每学期循环两次,每期都有很多师生参加,他们用一篇题为《花费“一个60分钟”赚取“无数个60分钟”》的报道说出了他们的收获和喜悦。
除此之外,“信息检索与利用”作为2学分的通识选修课,由图书馆老师主讲,供各年级学生自由选修。信息检索与利用课现在每学期有6个班,开始时选修并不踊跃,有的同学不知道能从课上学到什么,有的同学觉得网络这么发达,用不着再学什么检索了。我们结合专业设置检索课程内容,并不断地增加实践学习的比重,讲解如何选择关键词、评价检索结果及各种检索系统的异同等。学生感觉信息检索离自己的专业和生活很近,因此,选修时也越来越踊跃。课程考核的方式是期末完成一份综述材料的写作。综述写作既能考查学生分析资料和提取有用信息的能力,又有利于学生掌握论文格式规范,树立知识产权意识。
1.2.3 科研型
读者有论文写作和课题查新的需求,包括论文的写作规范是什么、如何进行科研课题的资料查找、科技查新等。基于科研的服务需求,我们开展了两个“中心”、课题查新、定题跟踪、论文写作资料查找培训等多种服务方式。
根据我们的调查,有些同学到了大四还不了解或基本没有使用过图书馆丰富的数字资源,很多同学写论文或做作业的时候主要是通过百度、GOOGLE等搜索引擎去查找资料,而本应作为学习和研究信息资源主渠道的图书馆大量学术资源却得不到充分的利用。因此,我馆于2010年末成立了“学生论文写作资料查找帮助中心”和“学生作业资料查找帮助中心”,以帮助、指导大学生利用图书馆数据库有效查找相关学术资料[4]。
此外,我馆实行学科联系人制度,每个院系都有专门的学科联系人负责对教师的科研课题进行课题查新和定题跟踪服务。学科联系人根据课题进展和需要,为教师提供相应的数据库和电子图书等资源。学科联系人服务主动,提供的资料有较高专业水准,受到教师的一致好评。
表1 信息需求类型及信息教育方法、途径
1.3 导引性读者信息教育
当代大学生个性鲜明、思维活跃、渴求知识,我馆与“常青藤读者协会”共同组织策划了一系列大型活动,引导学生的读书兴趣,在轻松愉快的活动中培养他们的信息意识。比如每年举办的“4.23世界读书日”活动,包括了国学讲座、知识竞赛、找书比赛、读书之星评选、书签设计大赛、图书漂流等,让学生由被动参与变为主动参与,脱离课堂教学的枯燥乏味,在充满着情趣的无拘束的氛围中学习知识、交流信息,在竞赛的气氛中激发他们的信息需求意识。我们在实践中认识到,信息素质教育不应当停留在严肃的课堂,应当把它定义成一个又一个以学生为主体的培训,学生们更希望它是生动的、友好的、时尚的、激情的。
我馆与“常青藤读者协会”联合举办的“圆桌漫谈”活动,成了图书馆的一个品牌活动,深受同学们喜爱。“圆桌漫谈”就同学们关心的热点问题聘请他们喜爱的老师或学长,围坐一起,或是讨论考研热点、流行前沿,或是品读文学经典、热议时政要闻,广泛地引导他们对各类知识的兴趣。
为引导学生多读书、读好书,图书馆每月更新阅览室和图书馆宣传栏,向同学进行好书推荐。同时,倡导成立“晨读会”、学习小组,支持兴趣学习、研究性学习。图书馆为各学习小组提供定期学习讨论室、优先采购或提供有关专题学习研究资料。在这些活动中,我们与学生定期进行交流反馈,及时总结经验,最大限度地发挥学生的积极性,使他们真正成为图书馆的主人和信息的主宰者。
1.4 借鉴IC理念,构建良好的读者教育环境
信息共享空间(Information Commons,简称IC)是一种新型服务模式,它的主要目标是为读者提供一站式服务、支持读者协作式学习。我馆借鉴国内外信息共享空间建设的实践经验,遵循“因需而建”、“因地制宜”的原则,整合现有环境、资源和服务[5]。原有的电子阅览室面积较大,能容纳300台微机,但没有功能分区,学生不喜欢这种环境,前来上机的同学寥寥无几。为此我馆将视听室和电子阅览室合并为多媒体阅览室,并将原来的空间进行合理改造,划分出培训区、上网区和视听区,间隔了1个50台微机的培训室和1个视听研讨室。这样,电子阅览室不再只提供单一的上网服务,还可以提供视听、培训和研讨等多种服务功能。为给读者营造协同和交互式的学习环境,我馆又对原有书刊阅览室进行改造,新增了7个小组讨论室。
经过IC建设,多媒体阅览室的读者增长至原来的2倍,自由上网区和视听区甚至出现了“一位难求”的局面。小组讨论室受到老师和同学的喜爱,尚未正式推出时就不断有电话催询,正式推出之后预约一空,图书馆真正成为了同学们的第二课堂。
2 问题及展望
2.1 在线教育不够完善,尝试开发多元化在线教育模式 以新生入馆教育为例,目前我馆采用的还是以院为单位的讲座方式,同时参与的学生每次约有六、七百人,讲座经常达不到预期效果。而如果采取网络在线的新生入馆教育:如能展示图书馆功能的网络视频、虚拟图书馆导览、讲解图书馆基础知识的网络课程等,图书馆的设施和服务可以立体地展现在读者面前,允许读者以自己喜欢的方式,随时随地学习基本的入馆知识和检索技能,与传统的讲座相比,起到事半功倍的效果。
在线信息教育涉及的内容很多,可以借鉴他馆的成功经验,开发适合本校师生的在线教育。例如:清华大学图书馆INTERNET教室、浙江大学信息检索网上自助教学课件、国家图书馆网上教室等。在这些读者教育网页中,读者能够根据自己的需要自由选择学习内容,不受时间和场所限制。在线教育是讲座、培训等传统读者教育方式的有力补充。
2.2 与专业课结合不够紧密,引进信息素养学科整合模式的实践研究 我馆采用了专业课嵌入方式进行信息教育,但是仅限于在专业课上讲授信息检索知识,信息检索与专业知识相互独立。在这方面,可以借鉴澳大利亚信息素养学科整合的信息教育模式,使信息素养内容与学科及专业课程相整合,课程讲授由教师和图书馆教学人员共同完成,在课程学习中融入讲座、学术报告、短期课程、在线和独立学习活动方式,在专业学习中培养学生收集、利用与评价信息的能力[6]。这是信息素养教育的高级层次,信息检索不再是孤立的课程,而是真正参与到专业课的学习中,提高学生的专业信息素养能力,培养学生终身学习能力。
2.3 馆员素质有待提高,要加大人才培养力度
我馆现有馆员多数是图书情报学专业毕业,缺乏其他学科的相关专业知识,在为读者提供专业性的信息教育服务时显得力不从心。因此,未来应当本着引进和培养两手抓的原则,组建一个多层次咨询服务团队。结合IC空间建设,构建良好的读者教育环境,为读者提供真正意义上的“一站式”服务。
3 结 语
独立学院致力于培养具有较高信息素质的复合型、应用型人才,是高等院校办学机制创新与模式变革的一项重大突破。图书馆作为信息素质的培训基地,不仅要培养大学生的信息检索技能,更要培养大学生的信息利用能力、自主学习和科研创新能力。独立学院图书馆应当转变以资源建设为主的思想,积极探索信息素质培养的新方法,以读者需求为中心、创建协同学习环境,尝试开发多元化在线教育模式,将信息素质培养有机地融入专业课的学习中,提高学生的专业信息素养,为创新型人才培养贡献力量。
参考文献
[1]普通高等学校图书馆规程(修订)[EB/OL].http://www.bvtc.edu.cn/libraryweb/train/liblaw.htm,2011-03-22.
[2]汤满满.信息时代高校信息素质教育的实践探索[J].科技情报开发与经济,2010,(33):112-114.
[3]顾江,陆宏弟.高校图书馆读者服务新探[J].图书馆理论与实践,2004,(1):62-64.
[4]资料查找有困难,两个“中心”帮助您[EB/OL].http://library.bnuep.com/synews/newspaper.asp?id=483,2011-03-22.
[5]张素.借鉴IC理念,开拓学习空间[J].浙江高校图书情报工作,2010,(5):5-9.
[6]杜安平.澳大利亚高校信息素养教育剖析[J].情报理论与实践,2008,(4):637-640.