- A+
1.禁用词概述
禁用词(Stop Words),也称噪声词(Noise Words),是指一些联机系统、光盘数据库和检索期刊中不能用作为检索词进行文献检索的词。如在·Dialog, KR OnDisc, ProQuest, LISA, GRADLINE, CA on CD, MEDLINE和Super Tech Abstracts Plus等联机系统和光盘数据库,及《科学引文索引》(SCI)《科学技术会议录索引》(ISTP)等检索工具中均有各自的禁用词(噪声词)。我们在进行文献检索和用户教育时,必须注意这一点。
现将笔者收集到的一些联机与光盘数据库的禁用词归纳于表1。
除了上述这些数据库系统和光盘数据库有禁用词之外,由美国科学情报研究所(ISI)编辑出版的《科学引文索引》(Science Citation Index,简称SCI)和《科学技术会议录索引》(Index of Science and Technical Proceedings,简称ISTP)每期的轮排主题索引(The Permuterm Subject Index)之前也分别列出了全禁用词表(Full Stop Last)和半禁用词表(Semi一Stop List),其中SCI列禁用词199个,半禁用词963个;ISTP列禁用词211个,半禁用词1035个。
2.禁用词的词类分
从表1可知,这些数据库的禁用词(噪声词)的类型有以下几种:(1)冠词,如a,an(AN),the(THE);(2)连词,如and(AND);(3)介词,如as, at, by,during;(4)代词,如their, THAT, those;(5)动词,如has, have ARE, used,using; (6)形容词,如various;(7)副词,如also;(8)缩略词,如yt,ta。其中禁用词最多的是MEDLUNE光盘数据库,有251个,最少的是Dialog联机系统,只有9个。
另外,对ISTP和SCI的全禁用词和半禁用词的词类进行分析可知:其中除了以上提到的冠词、连词、介词、代词、形容词之外,动词占了相当大的比例,如analysis, process, practice, need, review, study等动词本身无独立的
检索意义,但可以与其他词配合成为有意义的词组,故把它们列人半禁用词之列。
3文献检索中的禁用词处理方法
目前,在文献检索中,对禁用词的处理有如下三种方法:
(1)使用位置算符(W)或(N)代替检索词中出现的禁用词。
如在Dialog联机系统中检索ORBITS AND TRAJECTORIES方面的文献,可用检索式:
S ORBITS(1W)TRAJECTORIES
再如在ProQuest系统的INSPEC光盘数据库中检索RESEARCH AND DEVELOPMENT方面的文献,可用检索式:
SELECT RESEARCH(1W)DEVELOPMENT
(2)当检索词是用词组表引时,检索时用双引号(“”)将整个词组引起来。
如在Dialog联机系统中,检索刊名为JOUNAL OF PHYSICS AND CHEMISTRY OF SOLIDS的文献,可用检索式:
S JN'=“JOUNAL OF PHYSICS AND CHEMISTRY OF SOLIDS”
(3)在SCI和ISTP的轮排主题索引中进行检索时,检索者可以利用索引中出现的“见”(See)指引去核对全禁用词表(Full Stop List)和半禁用词表(Semi-Stop list)。
我们要特别注意论文标题中有些词既不能作主要词,也不能作配合词,如A, AND, AS, IS, OF, ON, OR等属于全禁用词,而有些词如analysis, method只可作配合词,它们属于半禁用词。
如果我们在进行文献检索时注意了对禁用词的处理,并在用户文献检索教育中强调这方面的内容,就可以避免漏检,从而提高文献的查全率和查准率。(本文节选自:《上海高校图书情报学刊》1999年第4期,作者:鲍国海)
本文编辑:周编辑;投稿邮箱:edit02@ei-istp.net;联系电话:0523-82829309
在线咨询:2440938714(腾讯QQ)
本文由:http://eiwhy.com/ 整理提供。
- 我的微信
- 这是我的微信扫一扫
- 我的微信公众号
- 我的微信公众号扫一扫