文献信息检索论文

2022-05-17

本论文主题涵盖三篇精品范文,主要包括《文献信息检索论文(精选3篇)》仅供参考,希望能够帮助到大家。摘要:对除中国外的“金砖国家”俄罗斯、印度、巴西、南非的标准信息检索平台进行调研,并从收录内容、检索方式、著录方式及检索结果排序方式4个方面做了分析、评价与比较,以便用户选择使用。最后,针对我国检索平台给出相关建议。

第一篇:文献信息检索论文

跨语言信息检索文献的计量分析

随着信息的日益增长,用户查询多话种文本集合的情形越来越普遍,这就产生了以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题,也就是如何跨越语言界限的问题,即跨语言信息检索(CLIR)。学术界普遍认为,跨语言信息检索的概念是在20世纪60年代末70年代初,由康奈尔大学的Sahons首次提出的。然而跨语言信息检索真正的发展高峰是在20世纪90年代,国际上有几个定期召开的关于跨语言信息检索的会议,反映了跨语言检索的热点和发展趋势。这些会议分别是文本检索会议(TREC)、跨语言评价论坛(cLEF)、日本国家科学信息系统中心信息检索系统测试集会议(NTCIR)、美国计算机协会信息检索特殊兴趣小组会议(ACM SIGIR)。目前,国内对跨语言信息检索的研究比较少,基本上集中在2001年以后,为了推进国内跨语言信息检索的研究,本文从载文量、著者、主题、地区等角度分析了Web Of Sci-ence中跨语言信息检索的部分文献,希望能够对国内跨语言信息检索的研究有所帮助。

1 文献数量分析

论文在检索时段上选取1997年至2007年1月24日间的一段数据,选择美国IsI公司的权威数据库Web0f sclence作为数据来源,用检索式“TI=(cross-lan-guage OR cross-1inguage OR biligual information re-tneval)”进行文献检索,对关于跨语言信息检索的文献总量及分布、著者、主题等情况进行统计分析,共检索到176篇相关文献。

某领域的文献数量在一定程度上反映了一门学科的研究水平和发展程度。1997~2006年Web Of Sclence中关于跨语言信息检索文献的年发文量。

1997~2002年文献量基本维持稳定状态,这段时间是跨语言信息检索研究真正开始发展的时期,尽管在这期间文献量有少许波动,但基本处于平稳中略有上升的状态.2002~2003年是文献量的第一个增长期,尤其是2003年出现了一个文献量增长的小高潮;2004年文献量出现了一个低谷;2005~2006年是文献量增长的第二个时期,虽然每年的文献增长幅度在降低,但文献量却呈现大量增长的趋势。据此我们可以预测,跨语言信息检索在今后一段时间内仍将迅速地发展,研究将逐渐走向成熟。

值得注意的是,2003年的小高潮和2004年的低谷。通过阅读发现,2002年ACM SIGIR(Association for Computing Machinery Special Interest Group on Information Retrieval)在芬兰举行了第25次会议。ACM SIGIR是ACM多个特殊兴趣小组中的一个,该小组致力于信息的存储、检索和传播研究,包括研究策略、输出方案和系统评价。跨语言检索、多种语言检索和机器翻译是其感兴趣的领域之一。因此,可以说该会议的召开对跨语言信息检索文献量的增长有一定的影响。对于2004年的低谷,可能是由于2003年的高峰造成一定的疲软。

从以上分析可以看出,跨语言信息检索是一个起步较晚而发展很快的研究领域。该领域的研究始于20世纪70年代初,起初十几年的发展较慢,进入20世纪90年代以后,随着计算机技术和网络技术的迅猛发展,跨语言信息检索的研究也取得了飞速进展,初步形成了一个完整的研究体系。尤其是近年来,新的研究成果不断涌现,体现了该领域良好的发展势头。

2 著者分析

在检索到的176篇文献中,作者共有366人(包括合作者)。

从作者人数与其所著论文数之间的关系来看,176篇论文的366位作者中,发表1篇论文的作者有291位,发表2篇论文的作者有42位,发表3篇论文的作者只有16位。发表1篇论文的作者数量约占所有作者数量的79.5%,这与洛特卡定律所描述的发表N篇论文的作者数量约为发表1篇论文的作者数量的1/n2以及发表1篇论文的作者数量约占作者总数的60%并不很吻合,表明跨语言信息检索领域的研究尚未完全成熟,写一篇论文的作者群体过大,在未来的发展中发表多篇文章的作者将会增加。

由表2可知,Web Of Science中关于跨语言信息检索的文献作者中79.5%的作者只发表了一篇文章,11.5%的作者发表了2篇文章,发表3篇的作者有4.4%,发文多于3篇的作者比例逐渐降低,发表论文最多的作者发文量达12篇,可见还是有一些核心作者的。但也可以看出,研究跨语言信息检索的专家发表论文的数量还是有限的,这与跨语言信息检索的发展还并没有走向成熟有关。这里列举发文数量在7篇以上(包括7篇)的作者情况。

这些核心作者研究的主题大部分是计算机科学、理论与方法,可见跨语言信息检索与计算机科学是密切相关的,它是在计算机科学的基础之上发展起来的。计算机科学现如今已是一门很成熟的学科,而跨语言信息检索还只是刚刚起步,但有了这样一个雄厚的基础,我们可以预测,跨语言信息检索在未来几年的发展速度还会加快。

研究主题可以看出,当前跨语言信息检索研究涉及到多个方面,如图书馆和信息检索领域以及计算机科学、信息系统等。另外,跨语言信息检索的关键技术研究也是热点。这些方面的研究对跨语言信息检索的发展将会起到很大的促进作用。

3 主题分析

对文献主题和内容进行分析,可以了解跨语言信息检索研究的方向和热点,从而对该领域的研究有一个比较准确、全面的把握。

3.1 根据文献所属的学科领域分类

纵观Web of Sciefice中收录的关于跨语言信息检索的176篇文献,可以发现关于跨语言信息检索的研究论文按学科性质主要分为4个领域:计算机科学、理论与方法,计算机科学、信息系统,图书馆学、情报学类,计算机科学、人工智能。其中,计算机科学、理论与方法方面的文献高达90篇,计算机科学、信息系统方面的文献有37篇,图书馆学、情报学类方面的文献有27篇,计算机科学、人工智能方面的文献有15篇。以上数字充分说明这4个领域是跨语言信息检索研究的核心领域,而这4个领域的核心又是计算机科学,因此,计算机科学是跨语言信息检索的重中之重。

3.2 从文献的主题内容来看

通过从微观角度对跨语言信息检索文献的各主题进行分析,可以看出,近年来对跨语言信息检索的研究主要集中在以下几个方面:跨语言信息检索的理论及综述性研究、跨语言信息检索的关键技术研究、跨语言信息检索的具体应用及系统开发研究。而从这176篇文献来看,关于理论及综述性研究的文献数量极少,而关于跨语言信息检索的关键技术、具体应用及系统开发方面的文献数量颇具规模。通过对检索到的文献进

行研究,可以看出,跨语言信息检索领域的几个研究热点是跨语言信息检索翻译技术、基于本体的跨语言信息检索模型、词义消歧(Word Sense Disambiguation.WSD)等。从研究的主题内容来看,当前跨语言信息检索的热点集中在跨语言信息检索翻译技术、基于语义的跨语言信息检索模型、WSD问题、OOV问题等,这与跨语言信息检索作为信息检索的重要处理技术、广泛应用于信息检索系统等特定领域、满足特定领域不断发展的要求不无关系。作为信息检索的核心技术之一,跨语言信息检索的应用仍是将来研究的热点。

3.2.1 跨语言信息检索翻译技术

跨语言信息检索的关键在于如何使用以某种单一语言书写的查询,在以不同语言书写的多语种文本集合中检索出相关文本。从研究的文献来看,这可以通过翻译用户查询、翻译文本或者将用户查询与文本两者翻译为某种媒介物或中间语言来解决。目前使用第一种方法的系统居多,第二种方法实现的难度较大,第三种方法常用在多于两个语种的跨语言检索系统中。

跨语言信息检索的研究重心在于查询条件的翻译,而查询条件翻译有两个最为关键的问题:一是对存在对应翻译的查询条件词汇的翻译选项进行消歧(即WSD问题),二是给未知翻译的查询条件项寻找合适的翻译(即OOV问题)。

词义消歧问题(WSD问题)是由于查询条件的词汇数目变大,而机器可读字典的翻译项经常不止一个造成的;Out Of Vocabulary(即OOV问题)是指在字典中找不到指定技术领域的词汇。目前这两个问题还没有得到很好的解决,因此在未来一段时间内都将是跨语言检索的研究热点。

3.2.2 基于本体的跨语言信息检索模型

在跨语言信息检索的具体应用及系统开发方面最为典型的就是基于本体的跨语言信息检索系统的模型设计。该模型主要有以下3个特点:以本体为基础,建立领域语义模型,为信息源提供语义标注信息;借助本体,为用户提供的双语查询进行概念映射,利用相关反馈机制与用户进行交互,进一步精炼查询表达。通过对本体的研究试图解决目前跨语言信息检索的翻译歧义性问题,这在一定程度上是对跨语言信息检索的一大突破,并在未来相当长的一段时间内都会成为跨语言信息检索的研究热点。

在整个跨语言信息检索过程中,本体所起的作用可以概括为两方面:一是将提问表达式转换为本体中的概念表达,二是对检索对象进行语义表达。这两方面的结合可以提高翻译的准确度。

4 文献地区分析

1997~2007年跨语言信息检索研究的176篇文献共来自32个国家或地区,覆盖面比较广阔,各个国家或地区的文献量具体情况统计,由于数量比较多,这里只列出几个主要的国家或地区。

美国的研究文献量达53篇,占世界总数的30%以上,表明了美国在跨语言信息检索研究领域处于绝对领先地位。紧随其后的是英格兰地区。处于第三层次的是西班牙,它研究的文献量占到了世界的10%。日本和中国台湾属于第四层次,紧紧追随西班牙。另外,德国、意大利、瑞士也取得了相当的成就。值得注意的是,一些比较小的国家如瑞士在跨语言信息检索的研究中也有了一定的进展。这充分说明了跨语言信息检索这一研究方向在世界范围内都有了发展,引起了各国科研工作的关注。此外,还可以看出,跨语言信息检索的研究形成了北美、西欧、东亚等几个主要的核心区域,并在这几个区域不断向外扩散,由此可以预测,跨语言信息检索的未来是光明的。

通过以上分析可以看出,跨语言信息检索在因特网普及率较高的欧美国家发展较快,无论是在理论研究还是在应用研究方面都具有相对优势。我国台湾地区在该领域的研究也已取得了一定的成果。可以预测,随着互联网的普及和各国学术的交流,跨语言信息检索在我国大陆地区也会取得很大的发展。

5 引文分析

文献被引用次数是衡量该文献学术水平和科研价值的重要尺度之一,对文献进行被引分析可以让我们了解该学科领域的经典文献或成果。同时也可以通过对每年被引数的统计来预测该学科的发展趋势。对1997~2006年关于跨语言信息检索的文献被引数的统计。

在本文统计的176篇论文中,由Kuhl Pk等人合作的《closs-language analysis of phonetic umits in lan-guage addressed to infants》一文被引次数高达83次,堪称跨语言信息检索研究领域的经典著作。通过表5可以发现,1997~2006年关于跨语言信息检索的文献被引数几乎呈正比例增长,2005和2006两年几乎持平。跨语言信息检索从20世纪90年代后期到现在一直处于高速发展期,而且这种发展速度还在持续,并在一定时间段内都将保持这种发展态势。这也说明跨语言信息检索的发展正一步步走向成熟。

6 结语

综上所述,本文通过从几个不同角度进行分析,主要研究了跨语言信息检索的进展,提出了跨语言信息检索的研究热点,并预测了其未来发展的趋势。跨语言信息检索近年来发展迅速,在未来几年其前途依旧明朗,目前我国对该领域的研究尚不成熟,主要集中在我国台湾地区,因此,希望通过以上的分析给我国大陆地区对该领域的研究提供一点指导。本文在选取数据库上还存在一定的缺陷,出于用户数据处理的考虑,选取了Web Of Science数据库,而如果出于检索结果的全面性和准确度考虑的话,应该选取ACM数据库,因此,本文在对跨语言信息检索进行深度和广度挖掘方面还有待改进,这也将是未来几年跨语言信息检索发展的一大趋势。

作者:陈风娟 邵 波

第二篇:金砖国家标准文献信息检索对比分析

摘要:对除中国外的“金砖国家”俄罗斯、印度、巴西、南非的标准信息检索平台进行调研,并从收录内容、检索方式、著录方式及检索结果排序方式4个方面做了分析、评价与比较,以便用户选择使用。最后,针对我国检索平台给出相关建议。

关键词:标准文献 检索 GOST ABNT SABS BIS

Contrastive Analysis of the Retrieval Information of BRICS Standard

Lin Bin

( Zhejiang Institute of Standardization )

Dong Zhihui, Wang Lili, Chen Xixi

( Zhejiang Fangda Standards Information Co. Ltd )

Key words: standard document, retrieval, GOST, ABNT, SABS, BIS

1 引言

标准文献是指记录标准化活动、知识、成果的各种载体[1]。标准信息检索平台是标准信息用户最常用的标准文献信息源,也是国际标准组织依托自身的资源优势和技术优势构建的标准检索平台,使得标准信息和数据的解释上更加全面、真实。金砖国家(BRICS)包括中国、俄罗斯、印度、巴西以及南非5个国家,国家之间遵循开放透明、团结互助、深化合作、共谋发展原则和“开放、包容、合作、共赢”的金砖国家精神。本文选取“金砖国家”的俄罗斯、印度、巴西和南非4个国家的标准检索平台进行分析、比较和评价,方便用户在标准检索时选择使用,也为我国标准文献检索平台的建设提供参考,并且以国外标准组织的检索平台作为标杆,对国内文献检索平台的建设给出相关建议。

2 金砖国家标准文献的检索平台

2.1 GOST

1993年6月10日,俄罗斯联邦《标准化法》的发布标志着俄罗斯标准化工作从此步入了法制化轨道。2003年,俄罗斯联邦国家标准化与计量委员会通过第63号决议,“现行的全国标准仍保留国家标准原来规定代号GOST R和跨国标准原来规定代号GOST。”俄罗斯联邦现在执行的标准化规范文件主要有以下几种:独联体跨国标准GOST;独联体跨国建议与跨国规则PMΓ与ΠMΓ;俄罗斯联邦国家标准GOST R;俄罗斯联邦的其他标准化规范文件[2]。

检索俄罗斯标准途径:①进入俄罗斯联邦技术法规与计量局首页,点击“Standards Catalogue”[3],进入在线目录检索界面,可利用标准号、标准题目(关键词)和分类号等字段进行检索,以获得现行独联体跨国标准(GOST)和俄联邦国家标准(GOST R)的信息;②利用俄罗斯《国家标准目录》《技术规范目录》《作废与被代替标准目录》进行检索;③以下3种途径也可检索俄罗斯标准信息:新批准的标准信息及全文检索与浏览、标准草案最终稿信息及全文检索与浏览、2005年至今的全俄技术经济与社会信息分类(标准)。

2.2 ABNT

巴西技术标准协会(ABNT)成立于1940年,是巴西标准化的主管机构,主要业务是研究制定巴西标准(NB),开展产品质量认证及其他与标准化相关的活动,代表国家参与国际/区域标准化活动。ABNT于1947年加入国际标准化组织(ISO),也是国际电工委员会(IEC)、泛美标准委员会(COPANT)、南锥体共同市场标准化协会(AMN)的成员[4]。

巴西标准可通过以下几个途径进行检索:登录ABNT网站,或者登录ABNT的网上书店http://www.abntcatalogo.com.br/,查找相关标准信息。

2.3 SABS

南非国家标准局(South African Bureau of Standards, SABS)是根据1945年颁布的《国家标准法》设立的,是南非惟一制定和颁布标准的机构,南非的国家标准通过技术委员会(TC)来制定,SABS下属有450个TC,每年约500个新标准的速度增长[5]。南非标准大部分为自愿采用的标准,也有少部分为强制性标准,其数量约为70个,主要涉及产品包括电气和电子设备及其部件、机动车及其零部件以及食品等。除了强制性标准外,南非还有另外两种形式的技术法规:一是法律法规引用的国家标准,这类技术法规大约有300个;二是其他政府部门制定的有技术要求的法规,能够制定这类技术法规的有交通、能源、环境保护、卫生、农业、通讯、劳动、贸易与工业等10个政府部门。

南非标准检索可通过以下途径:①进入SABS网站首页。该页面提供按领域检索标准信息的功能。目前共涉及36个领域,选择领域后再点击左侧列表中的“Standards & Publications”,即可看到该领域内所有标准列表,显示信息为标准号与标准题目。②利用网上书店的标准搜索引擎。在SABS网站主页点击购物车图标进入网上书店页面,或直接输入书店网址http://www.sabs.co.za/进入页面。在其主页上的检索框中输入标准号或者关键词即可进行简单搜索,或者点击“Advanced search”进入高级检索,利用其提供的多种途径检索到需要的标准信息。③目录《STANDARDS CATALOGUE》。该目录每月更新,可免费从网站下载,进入SABS网上书店,点击主页面下端的“VIEW OUR SABS CATALOGUE ID PDF”,该目录中包含標准审定委员会批准或SABS标准发布的所有标准和相关出版物的信息,其中通知是从官方通报上获悉的新发布标准和已有标准更新的信息。

2.4 BIS

印度设立的印度标准局(BIS)成立于1986年,并于1987年4月1日正式取代印度标准学会成为印度法定的全国性标准及认证管理机构。主要任务是制定推行国家标准;实施合格评定制度;代表国家参与ISO、IEC等国际标准化活动。印度的标准体系主要由涉及标准及认证管理的法律法规、标准管理制度以及印度认证制度组成[6]。

检索印度标准信息,可登录BIS主页www.bis.org.in,点击左侧的“Buy Standards Online”栏目,在“Search for Standard”中直接输入标准号或标题进行检索,也可以点击“Advanced Search”进入高级检索界面進行检索,还可以在线购买纸版、电子版/DVD版本的标准。BIS每年制定350多条新增或修订的标准。

3 金砖国家标准信息检索平台的比较及特点

3.1 收录内容

各种标注文献检索平台收录的标准文献不同,主要表现在内容层次、语言种类、技术领域、标准种类、标准数量5个方面(见表1),英语是最常用的语言,是各类标准文献都采用的语种,其次是本国的官方语言和英语同时存在。BIS制定的印度标准涉及14个领域,每年4月1日,BIS向14个分区理事会的各个理事会,发布详细的工作计划,这14个领域为生产与一般工程、化工、土木工程、电子与信息技术、电工学、食品业和农业、管理和系统、机械工程、医疗设备和医院规划、冶金过程、石油煤炭及相关产品、纺织业、运输工程、水利资源。

3.2 检索标准编号

标准编号基本结构为标准代号+专业类号+顺序号+年代号,如表2所示。

(2)高级检索字段(见表4)

标准编号、标准名称、时间范围、标准制定委员会代码、关键词、ICS号是基本检索字段。SABS在高级检索中提供如下检索字段,如标准号、小描述、价格、出版社、批准日期、版本号、修正号、摘要、国际关系(采用标准)、重申日期、撤回数据日期、代替标准、被代替标准、与其他字段结合使用、印发单位、校对、阶段日期、ISBN、委员会、阶段码、年份、ICS、文件状态码、短名字。BIS提供如下检索字段:标题、IS号、司/分司、年份、价格范围、重申日期、修正号、是否有同等标准。ABNT提供如下字段:组织类型、标准号、部分、关键词、委员会、ICS/CIN、出版社、出版时间、状态。GOST提供的检索字段最少,如:序号、关键词、ICS号、验证码,并且在常用的检索字段提供验证码,并在search下有帮助文档。

3.5 检索功能

检索功能主要根据是否支持截词检索、精确检索和布尔逻辑检索进行划分。逻辑检索词包括与、或、非。4个国家的检索功能如表5所示。

3.6 著录方式

标准文献基本的著录信息包括标准编号、标准名称、出版日期、语种、委员会代码和标准状态等。标准编号是标准文献的唯一标识符,其格式是“标准代号+顺序号+年代号”。ICS号是指国际标准分类号,通常ICS分为40大类(一级类目),其组成分为3级:第一级由两个数字组成,第二级由三个数字组成,第三级由两个数字组成,各级之间以“.”隔开。除基本信息外,SABS提供关联标准信息、引用关系,这些信息体现了知识的流动方向,是了解技术发展过程的重要信息。日期著录不仅包括出版日期、有效日期,还包括公开日期、批准日期、撤销日期。

著录方式中,ABNT提供字段最多,如:标准号、出版日期、实施日期、英语标题、葡萄牙语标题、委员会、页数、状态、语言类型、正文、价格、范围、ICS、相关标准。SABS提供字段如:标准号、标题、版本号、修正案、摘要、印发单位、阶段码、委员会、出版社、ICS号。BIS提供字段如:标准号、出版年、重申时间(年)、标题、委员会、修正次数、状态、印度国内价格、印度国外价格。而GOST字段最少,仅有3个:标准号、英文标题、ICS号。详见表6。

3.7 检索结果排序

标准检索结果提供的排序方式,可以更加方便用户浏览和筛选相关标准文献。但是ABNT和SABS均未提供排序方式,默认依照相关度进行排序,而GOST提供的3种排序方式更符合标准信息用户的行为习惯。详见表7。

3.8 其他检索方式

标准检索文献中,提供最新和卖得较好的标准记录,可以方便用户及时了解标准的更新和发展。4个国家中,均提供在首页显示最新标准目录,提供免费电子版出版物促进对标准的了解,而只有SABS在首页显示卖得较好的标准。详见表8。

4 国内标准检索平台的启示

针对国内检索文献中不足:如注重数量忽略质量、查全率和查准率低以及更新速度慢等问题,国内标准文献检索平台可以从以下几个方面改进:(1)注重标准文献收录的时效性和连续性。(2)整合国内外不同标准文献字段,整理出用户最关心的字段。(3)注重对原文标准数据的深加工以及著录质量的审查。(4)针对不同用户习惯提供可选用户选择的不同排序方式,在标准文献首页提供最新、卖得较好等目录,增加标准服务的多样化。(5)定期针对标准出版相应期刊等出版物,促进标准的推广和实施。

作者:林斌 董智辉?王莉丽?陈茜茜

第三篇:研究性课程英文文献信息检索技术教学效果分析

[摘要]文献信息检索技术的广泛应用不仅大大促进科研信息的传播,也为研究性课程的教学带来了便利。通过设计中英文双语调查问卷,对安徽大学商学院(样本组)和弗林德斯大学商学院(对照组)已接受《高级财务管理》研究性课程教育学生的英文文献成果检索与利用情况调查。结果显示,澳方学员在课程基础知识,尤其是计算能力、信息检索的基础知识、文献检索前的准备工作等方面弱于中方学生;在阅读英文文献的平均时间、面对困难的态度、信息检索的技能(精确性和适当性)、处理紧急情况和检索英文文献的经验等方面则强于中方学生,在此基础上提出了改进中方研究性课程教学的建议。

[关键词]信息检索与利用;初级检索;高级检索;研究性课程;教学效果分析

0引言

从科研论文写作流程来看,一项体现研究能力的研究工作至少可以被分为4个具有时间或逻辑顺序的关键节点,几乎每个节点都与文献的掌握和利用相关。第一个节点是发现实务中的現象或问题——问题导向范式,研究工作的入门者应该遵循这种范式。梳理和掌握已有研究成果(文献)有利于深入了解或验证这些现象或问题。第二个节点是基于实务、实验或者理论提出理论问题。从实务出发开展研究不是一个好的研究范式。相反,教师应当通过现象或者问题去提炼出理论问题。检索并阅读相关文献对于认识实际问题并理解其重要性是很有帮助的。第三个节点是分析所提出的问题。分析更多地依赖于理论,而如今大多数分支学科还不够完整,理论体系也尚未形成。学生必须检索到足够的文献并试着去合理组织理论,才能进行深层次的分析。第四个节点就是解决问题。解决问题不仅仅是为了与分析问题相协调,也是为了达到研究的最终目标。通过检索与利用文献,更好地理解和分析前人的研究工作,以“站在巨人的肩膀上”,是得出更有说服力的研究结论的主要前提之一。不难看出,获取并利用文献是研究工作的基础。

这样,研究性课程教学的第一步往往就是让学员(澳大利亚的学生往往是边工作边读书,通常可称作学员)学会如何高效地检索文献,尤其是英文文献。检索技能内容丰富,新生应当通过长期的积累熟练掌握它。简单检索和高级检索是两种基本的检索技能,几乎每个学生都可以熟练地运用这两种技能。但是如果教学的目的是帮助学员今后从事学术研究,那么至少有5个方面的检索细节值得在教学过程中重点关注。(1)文献资源的知识。虽然存在诸多不同的学术资源,但是学员们的时间是有限的。所以要教会学员在开始检索之前,先明确这些资源的特点。例如,法律专业的学生通常不会在数学数据库中检索文献。(2)检索主题的精确性。应该帮助学员清楚地知道什么样的信息真正需要检索。一个明确的检索主题对于快速获取文献是很有帮助的。(3)熟知学科边界。检索文献不是最终的目的。检索的结果被用于进一步的学习或研究。熟知学科边界有利于后续工作的进行。(4)捕捉灵感的学术敏感性。文献可以激发灵感、指明道路或复核研究结果。如果学员对于新想法反应迟钝,文献就无法发挥它应有的作用。(5)关于期刊或资源本身的知识。学员在较高水平的期刊上更有可能获得对其有用的文献,反之在垃圾期刊里则可能一无所获。精确的识别期刊的优劣是检索高质量文献的第一步工作,也是本科研究性课程教学中的一项高级技能。

刚开始接受研究性课程教育和训练的学员,应当首先着眼于文献。本文的研究对象是建立在西方管理理论基础上的《高级财务管理》课程、比较的对象是澳方学员,因此首先关注的是英文文献的获取与使用情况。通常对中国的学生来说,检索与利用英文文献的难度也要大于中文文献。熟练掌握检索和使用经典、前沿英文文献的技能,老师通过传授这项技能帮助他们进行科学素养的训练是很重要的。获取知识、培养研究能力的方法主要有以下3种:课堂教学、在线教学、图书馆资源,都无法离开信息检索的帮助。互联网的出现进一步推动了信息检索技术的普及。因此,《高级财务管理》研究性课程的所有学员应该首先利用信息检索技术去获取文献,尤其是英文文献。为了分析中(以安徽大学商学院学生为样本)、外(以弗林德斯大学商学院学员为样本)在检索文献时面临的问题,笔者精心设计了一套包括23项问题的调查问卷,以了解接受《高级财务管理》研究性课程的学员们的文献信息检索与应用情况。作为一种教学反馈和教学研究的手段,此项调查研究的结果可以帮助研究性课程的实施者或教学管理部门调整教学策略或管理政策。

1文献信息检索技术的基本认知与研究性教学应用简况1.1文献信息检索技术研究

目前,关于文献检索与利用的研究主要集中在信息效率的测量标准和如何提高检索结果的准确性两个方面。在区别学员检索信息效率的差异之前,需要设置评价标准。信息效率的概念被广泛地应用在许多领域中,尤其是经济学和管理学。在研究性课程中应用文献信息检索技术教学工具时,关注并总结研究现状是一项前提与基础性工作。

关于检索信息效率(information retrieval efficiency,以下简称IRE),现有研究认为要从概念、学习、精炼和计算机科学应用等环节出发提高检索信息效率。可以从经济学和管理学等领域中获得信息检索与利用相关的完整的概念,这些概念可以被用于检测信息检索效率[1]。“不同级别的输出取决于对应级别的输入”[2],这意味着IRE的高低依赖于对相关技能的充分学习。“理性预期均衡可以很好地处理模糊信息并达到信息效率”[3],这意味着对检索结果的精炼有助于提高信息检索效率。尤其是对计算机科学的应用,多媒体演示可能影响到相关学科学习的信息效率[4]。据此推断,对研究目的理解是否深刻,应当取决于能否正确、高效地检索出目标文献。

关于如何提高检索结果准确性的研究集中于处理并利用相关性问题。一是相关性的概念及其重要性。“提高检索结果的精确度的最重要的环节,就是恰当地处理相关性。”[5]许多研究领域都会用到“相关性”的概念。相关性是指参照物与手头资料之间的关系。更进一步来说,相关性是指在信息研究领域中的检索结果与查询活动本身的依赖关系[6]。二是基于相关性提高检索结果准确性的方法。相关性可以用实证研究中的相关系数来衡量。根据Hassanpour和Zahmatkesh所做的研究,“在排列网络资源时,所谓的元搜索引擎采用的是使用者依赖法”“研究中所提出的方法吸纳了查询和文档之间的相似性以及用户的兴趣和文档之间的相似性,并以此为依据,对搜索结果进行排序”[7]。这些都意味着可以通过对检索结果排序的方法提高相关性。为了对检索结果进行排序,围绕概念相似性和语义相似性,产生了两大分支。概念相似性指的是一种使用了最富有创新性的前沿技术进行设计并且可以自动生成检索结果的方法。作为一种电子学习系统的应用程序,它与跨本体的相似性度量一起被用于适应性的电子学习系统中[8]。他们通过实验显示出相似性度量对检索结果的影响,并利用用户个性化模型来评估学生的学习能力。针对概念的演化,从某一特殊领域使用了多选集。研究结果表明,电子学习系统可以提供可行的结果,并且比现有的模型做的要好。“其他的数据挖掘技术和数据操作技术对于电子学习系统也有所帮助”[9]。语义相似性是Khan和Mustafa提出的一个语义搜索方法,该方法使用主题相似性来解决包含检索信息的语义异构问题[10]。他们使用一种叫做主题相似性的特殊方法得到文章的关键词,然后通过测量文献的资源描述性框架(resource description framework,以下简称RDF)的3倍数(triples,指增强文献资源的主题语义至原来的3倍)和使用者询问(指检索需求)之间的相关性,他们知道如何找到具有相关性的文献。因此,文献可依据其重要性排序。

1.2文献信息检索技术在研究性教学中的应用

目前,国内的一些学校已经尝试了开设文献信息技术及其应用类课程,并逐步积累教学经验。研究性课程教学的一个重要环节就是文献学习与文献研究,也是建立在文献检索与利用技术基础之上的。一方面,研究性课程是检验文献信息检索技术教学成果的理想平台;另一方面,研究性课程本身没有足够的容量去重复教授文献信息检索技术。因此,把两类课堂加以整合,发挥协同效应,是非常有必要的。当前,在研究性课程中利用信息检索技术教学,存在如下问题。

1) 受众差异性大。由于文献信息技术及其应用类课程大多是选修课程,接受研究性课程教育的学生对文献信息技术的了解或掌握程度参差不齐。

2) 重理论、轻能力的倾向仍然较为明显。受课堂教学展现方式的局限,研究性课程尤其重视理论教学,对理论的挖掘、检验和应用则不够重视,也表现在文献信息技术方面。

3) 文献资源可获得性的横向差异较大,影响教学质量及其评价。不同高校的文献资源、尤其是外文文献资源禀赋存在较大差异。以笔者的亲身经历来看,即使是985高校之间,也是有差异的。这显然会影响教学质量。

但是,针对“英文文献检索与利用”在研究性课程中的实施及效果,相关的观察、总结与对策研究目前还比较缺乏。本研究的目标在于测试安徽大学商学院和弗林德斯大学商学院接受《高级财务管理》研究性课程教育的学员们是否具有信息检索(检索英文文献)的基础知识、已经在多大程度上掌握了与信息检索相关的技术,以及他们是否已经掌握文献检索结果的利用技术。同时,对双方学员“英文文献检索与利用”的学习效果加以比较,进而提出改进研究性课程教学的建议。

2研究设计和度量

2.1问卷设计

通过总结文献信息检索技术研究成果,一方面从概念、学习、精炼和计算机技术的应用等途径来提高检索信息效率;一方面借助相关性(概念相似性与语义相似性)来对检索结果排序等方法,提高检索结果的准确性。已有文献信息检索技术的教学应用情况,尚存在教学对象差异大、教学理念滞后、文献资源的可获得性差异大等一系列问题。

本文针对中、澳两所高校开设的《高级财务管理》研究性课程的受众,设计了一套调查问卷。问卷设计了27个问题,一共收集了7个部分的信息。(1)学员的基本信息,包括性别、年龄、教育背景、工作背景(以职位表示)、阅读英文文献的时间;(2)在需要英文文献时的反应情况,目的是搜集学员早期收集文献信息的能力的相关信息;(3)路径和渠道,目的是搜集学员是否已经掌握检索英文文献的基本知识相关的信息;(4)方法,目的是搜集学员是否已经掌握检索英文文献的技能的相关信息;(5)替代选择,目的是观察学员在遇到紧急情况时的反应能力;(6)重要性水平的态度,使用李克特量表,目的是为了收集学员进一步分析、搜集或处理信息的必要能力;(7)质量控制项,目的是识别出没有信息检索经验的学生,他们可能会严重影响调查结果,以控制问卷样本的质量。

有的问题还能够帮助识别出在答卷时“说谎”的学员,例如阅读英文文献所花费的时间(问题5)、有没有直接向作者索要论文的经历(问题12)、如何提高檢索结果的准确性(问题15)和有无遇到特殊的困难(问题27)。

2.2问卷发放与回收情况

本次研究在理论分析法的基础上运用了问卷调查法,设计的是中、英文双语问卷。以中方学生作为样本组,以澳方学员作为对照组。笔者打印了100份问卷,分别于2016年5月在中方的课堂、2016年11月在澳方的课堂上作为课堂教学活动要求双方的学员当场填写。其中,要求中方的学生一共填写了60份,收回55份,其中52份是有效问卷;要求澳方的学员一共填写了40份,收回38份,38份都是有效问卷。有效问卷总数是90份。在发放问卷之前,确保双方的学员已经完成了《高级财务管理》研究性课程的“文献导读”部分的学习和基本训练。

3调查结果与简要分析

收集的问卷中的信息被集中录入到Excel表格中并加以处理。本文对7个部分的问卷信息处理结果分别加以简要地分析、说明如下。

1)基本信息。(1)样本组的性别很不平衡,女性居多,占75%;而对照组的性别相对均衡。(2)样本组大部分有效问卷者的年龄在18岁~22岁之间,占样本总体的98%;对照组的年龄差别较大,这与澳大利亚学员“边工边学”的大学教育体制有关。(3)样本组财务管理专业和非财务管理专业学生的比例是25∶1,而对照组的专业构成则更为复杂。(4)样本组有22人有过实践工作经历,占42%;而对照组中的38人都有实践工作经历。(5)样本组每周阅读英文文献的时间低于1小时占55%,只有15%的人每周阅读英文文献的时间超过11小时。如图1所示,由对照组对应的数字不难看出,对照组比样本组花费更多的时间阅读英文文献。

图1对照组的阅读英文文献时间2) 反应情况。相对于对照组,样本组对英文文献的认可度更低(85%~89%,问题6),需为检索文献做出的更多准备。对照组相对较少出现“不知所措”和“排斥”的态度,更能接受和适应英文数据库资料(问题8),花费更多的时间在完成检索任务上(问题9)。出现这种情况的原因可能是样本组忽视对英文文献的运用,相对于对照组,样本组利用英文文献的经验较少。

3) 途径和渠道。可以看出样本组更低地依赖数据库(问题10),数据库偏好不一致,对网络论坛求助的途径了解较少,即出现更多的逻辑(问题11)和经验(问题12、13)上的困惑。这体现了样本组信息检索技能和经验的欠缺。

4) 方法。样本组和对照组相同程度地掌握了从简单检索到高级检索的知识(问题14)。令人感到奇怪的是,根据调查结果来看,对照组的信息检索技能稍弱于样本组(问题15~17)。原因可能在于前者轻视了这些“简单”的问题。

5) 替代选择。样本组倾向于尝试其他的方法搜集文献(问题18~21),因为他们更加不依赖于电子数据库,这在一定程度上意味着他们的信息检索效率不高。而对照组在紧急情况下显得不够“聪明”,这也意味着他们更加不愿意通过其他非数据库信息检索渠道获取想要的文献。图2反映了两组的趋势性差异。该结果实际上是通过反向指标,进一步体现了样本组较弱的信息检索技能与技巧。图2样本组与对照组的“聪明”人数与比率情况

6) 态度。样本组和对照组对检索资源的知识拥有高量值的和相同变动趋势的态度。但是从总体来看,对照组认为检索主题的准确性(问题23)、对创新点的敏感性(问题24)、熟悉学科的边界(问题25)、熟悉期刊(问题26)这4个因素对文献检索更重要(参见图3)。这说明对照组对文献检索基本要素的重要性的认识更加深刻。

7) 质量控制项。绝大多数接受调查的学员诚实地回答了问题。可以基本保证研究结果的稳健性。

4结语

4.1主要结论

样本组的学生检索文献的能力和理念方面稍弱于对照组的学员,具体包括阅读英文文献的平均时间、面对困难的态度、信息检索的技能(精确性和适当性)、处理紧急情况和检索英文文献的经验等方面;在理论和态度方面则稍强于对照组的学员,具体包括课程基础知识尤其是计算能力、信息检索的基础知识、文献检索前的准备工作等方面。

具体而言,样本组学生文献检索的基础知识更扎实,对照组的学员在观念上更多元化。然而,样本组和对照组的学员对于基本要素的重要性的认识,却在总体上呈现相似的趋势(经过李克特量表测量)。在这种情况下,搜索标题的准确性以及在学科界限或期刊知识方面获取新想法的学术敏感度,对于提高文献检索效率相对而言就显得更为重要。

调查结果显示,样本组的学生应该采取措施强化信息检索的学习与训练,尤其是在英文文献方面;对照组则应提高学员的韧性和学习强度。相关管理部门应当对学生的信息检索问题给予足够的关注。

4.2教学与管理建议

有关各方应当具有紧迫感,重视培养学生或学员的信息检索的理念和技能,这是在《高级财务管理》等研究性课程中掌握方法论的起点,也为今后一部分学员的学术研究活动的做出重要铺垫。为了提高双方学员检索和利用英文文献的能力,基于信息检索理论和本次比较调查结果中呈现的中、澳学生表现上的差异,双方的研究性课程教学都存在有待改进之处。基于本文的研究目标,仅针对中方师、生和教学管理部门,提出如下相关建议。

1) 学生要培养良好的英文文献检索习惯。由于中方学生的文献检索质量比澳方更依赖于事前的准备工作,因此必须提高这些准备工作的质量,具体包括如下维度:语言、时间、知识、勤奋与坚持、智慧。(1)检索英文文献必须具备一定的英文功底,尤其是专业英语和专业术语。(2)文献的检索与梳理、总结都是非常消耗时间的工作,因此要做好时间安排。(3)要做好知识储备。一方面是信息检索与利用方面的知识,例如数据库、资源库、检索过程、检索结果及精炼、检索结果的利用等;另一方面是研究议题有关的知识,例如《高级财务管理》课程中的资本市场、资本结构、股利政策、投融资决策、集团财务、企业并购等。(4)应有必要的勤奋与坚持,处理好“学”与“思”之间的关系。能够很好的运用文献检索利用技术,是建立在一定的训练数量和文献成果储备数量的基础上的,勤学、常用是一种态度和习惯。最后,还需要一定的智慧。正如发明家爱迪生所说“天才是1%的灵感加上99%的汗水”。當然,信息检索与利用的智慧,仍然是以勤奋作为基础的。

2) 高校应开设检索利用相关的信息技术课程或举办相关讲座,教师要逐步完善教学过程,提高教材教法。(1)帮助学生建立正确的研究范式。不同的范式形成不同的英文文献需求。规范研究范式主要使用英文文献进行推论,这意味着文献的选择显得尤为重要。实证研究范式利用英文文献建立研究目标和判断基础,这意味着教师必须搜集充足的论文或者学术专著。(2)直接开设信息检索课程,主要包括《文献检索》《信息检索》《科技文献检索》《文献检索与利用》《文献检索与论文写作》等。(3)创新授课方式。由于本科课程(培养方案)是在教育部的专业培养计划框架下制订的,通常没有足够的课内学时专门实施信息检索与利用方面的课程。因此,创新授课方式是相当重要的。要加强与各级各类图书馆、情报技术研究与服务机构之间的合作,推出在线课程或培训模块。(4)提高教材质量,完善教学方法。无论是课内授课,还是课外在线教程,教材的质量和授课方法都需要结合信息技术的进步和学生的学习需要持续改进而提高。

3) 倡导“边干边学”[11]。学生可以从课堂或者书本中学习知识,但这远远无法形成相关技能,技能的形成依赖于练习。信息检索技能的培养需要频繁使用相关理论的英文文献。这就要求学生平时要注意争取参加各级各类科研训练计划,包括参与校内外教研与科研人员的研究活动,边干边学。

4) 学生需要持续使用英文文献。如果学生希望熟练检索英文文献,就需要持续使用上述技巧。技巧使用得越频繁,就会越需要英文文献,并有助于形成一定水平的研究成果,从而带来更多的研究性需求,由此形成良性循环。

当然,中、澳教育体制和教学规律存在广泛的差异,本文仅就《高级财务管理》研究性课程中的“英文文献检索与利用”环节做了有限的调查和摸索,并据以提出相关的建议,存在“以斑窥豹”式的风险。希望在今后的交流与调研过程中,能够更加全面地研究和比较中澳两国的本科研究性课程教学。

参考文献

[1] Gersbach H.Information efficiency and majority decisions[J].Social Choice and Welfare,1995,12(4):363-370.

[2] Müller J.On sources of measured technical efficiency:the impact of Information[J].American Journal of Agricultural Economics,1974,56(4):730-738.

[3] Condie S,Ganguli J V.Informational efficiency with ambiguous information[J].Economic Theory,2011,48(2):229-242.

[4] Guan Y H.A Study on the learning efficiency of multimedia-presented,computer-based science information[J].Journal of Educational Technology & Society,2009,12(1):62-72.

[5] Zhang J,Fei W.Search engines′ responses to several search feature selections[J].The International Information & Library Review,2012,42(3):212-225.

[6] Abuata B,Al-Omari A.A rule-based stemmer for Arabic Gulf dialect[J].Journal of King Saud University-Computer and Information Sciences,2015,27(2):104-112.

[7] Hassanpour H,Zahmatkesh F.An adaptive meta-search engine considering the user′s field of interest[J].Journal of King Saud University-Computer and Information Sciences,2012,24(1):71-81.

[8] Saleena B,Srivatsa S K.Using concept similarity in cross ontology for adaptive e-Learning systems[J].Journal of King Saud University-Computer and Information Sciences,2015,27(1):1-12.

[9] Vassilakaki E,Garoufallou E.Multilingual digital libraries:a review of issues in system-centered and user-centered studies,information retrieval and user behavior[J].The International Information & Library Review,2013,45(1-2):3-19.

[10] Khan S,Mustafa J.Effective semantic search using thematic similarity[J].Journal of King Saud University-Computer and Information Sciences,2015,26(2):161-169.

[11] 王建萍,費跃农,王燕瑜.嵌入式系统“边干边学”教学模式探究[J].电气电子教学学报,2007(5):103-105+111.

作者:姚王信 代世阳

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:学校网站毕业论文下一篇:我与日本动漫论文