欢迎访问文稿网!

文献信息检索语言

范文之家 分享 时间: 加入收藏 我要投稿 点赞

文献信息检索语言

    2.3 文献信息检索语言

    2.3.1 检索语言的定义

    信息语言(Retrieval Language),是指用于描述信息系统中信息的外表特征、内容特征及表达用户信息提问的一种专门语言。信息检索语言是适应信息检索的需要,并为信息检索特设的专门语言。信息检索语言也称标引语言、索引语言等,是人与检索系统对话的基础,它使文献的标引者和检索者取得共同理解,从而实现检索。检索语言的使用是检索技能的一个重要方面。

    2.3.2 检索语言的类型

    检索语言可划分为不同的类型:按文献的有关特征可划分为内容特征语言和外表特征语言;按构成原理可划分为分类语言和主题语言;按适用范围可划分为综合性语言、专业性语言和多学科语言;按标识形式可分为先组式语言和后组式语言等几种类型。其中分类语言和主题语言是最常用的检索语言。

    

    图2-1 检索语言类型

    2.3.2.1 分类语言

    分类语言是按学科范畴和知识之间的相互关系列出类目,并用数字、英文字母对类目进行标识的一种检索语言。它集中反映学科之间的系统性及学科与学科之间的相关、从属、派生关系。这种检索语言体系是从大类到小类,从总体到局部,层层展开形成分类体系的。它由类目号码及名称构成分类类目表,在情报检索中作为检索语言。分类语言可分为等级体系分类语言和组配分类语言,目前最普通使用的是等级体系分类语言。

    我国目前常用的分类语言主要有《中国图书馆图书分类法》(简称《中图法》)、《中国科学院图书馆图书分类法》(简称《科图法》)、《中国人民大学图书馆分类法》(简称《人大法》)等,国外常用的分类语言有《杜威十进分类法》、《国际十进分类法》和《美国国会图书馆分类法》等。

    (1)《中国图书馆图书分类法》简称《中图法》,是由政府部门编制的一部大型综合性图书分类法,1973年完成初稿,1975年由科学技术文献出版社正式出版,此后不断修订,1999年3月第四版正式出版,《中图法》是目前我国图书馆和情报单位普遍使用的一部综合性分类法。

    《中图法》分有5个部类和22个大类。

    img2

    img3

    《中图法》的标记符号采用拉丁字母与阿拉伯数字相结合的混合号码制。其中拉丁字母表示大类,其他各级类目用阿拉伯数字表示。“T工业技术”类的二级类目太多,也采用字母表示。例“TB9”,T代表一级类目——工业技术,B代表二级类目——一般工业技术,9代表三级类目——计量学。《中图法》基本采用层累制作为编号制度。

    例:

    [大类]F经济

    [二级类]F0政治经济学

         F1世界各国经济概况、经济史、经济地理

         F2经济计划与管理

    [三级类]F20国民经济管理

         F21经济计划

         F22经济计算、经济数学方法

         F23会计

    [四级类]F239审计

         F24劳动经济

         F25物质经济

         F27企业经济

         F28基本建设经济

         F29城市与市政经济

    (2)《中国科学院图书馆图书分类法》简称《科图法》,是中国科学院图书馆1954年编制的,到1994年已对版本修订了三次,《科图法》分为5大部类,下分25个大类,还有6个附表、1个索引,所有大类号均用两位数表示。《科图法》影响很大,其编制既适合大型综合性图书馆,又能适应专业性图书馆使用,其自然科学部分类目较为详细,系统性强,具有较强的科学性。

    《中国科学院图书馆图书分类法》(主表示例)

    00马克思列宁主义、毛泽东思想

    10哲学

    20社会科学

    50自然科学(总论)

    71工程技术

    90综合性图书

    (3)《中国人民大学图书馆图书分类法》简称《人大法》,1953年第一版,到1996年已经出版第六版,《人大法》是新中国成立后第一部科学性、实用性较强的图书分类法,当时以社会科学见长。分类法由4大部分、17个大类、9个复分表和2个附表组成。类目标识完全采用阿拉伯数字,一个数字代表一个类号,用1~17的数码表示17个基本大类;对两位一类的数码标识在号码数字后加小圆点;对全部类目等级列举次第展开,反映类目之间的种属和并列关系。

    《中国人民大学图书馆图书分类法》(第六版主表示例)

    1马克思列宁主义毛泽东著作

    2哲学

    3社会科学、政治

    4经济

    5军事

    6法律

    7文化  教育  科学  体育

    8艺术

    9语言、文字

    10文学

    11历史

    12地理

    13自然科学

    14医药、卫生

    15工程技术

    16农业科学技术

    17综合性科学、综合性图书

    (4)国外主要分类法以《杜威十进分类法》和《美国国会图书馆图书分类法》最为著名。《杜威十进分类法》(Dewey Decimal Classification),简称《杜威法》或《DC法》,是目前国外使用较为广泛、较有影响的图书分类法,由美国图书馆学家麦威尔·杜威1876年创制,目前已被翻译成30多种语言,并有大约130多个国家使用这一分类体系。杜威法是根据培根关于知识分类体系的倒排,采用十进制的等级分类体系,即把所有学科分成9大类,分别标100~900的数字,9大类表示9个专门的主题范畴。各类中的类目均按照从一般到特殊,从总论到具体的组织原则,以下逐次分类,形成一个层层展开的等级体系。《杜威十进分类法》发表后,先后有许多国家的学者以此为根据编制了多种分类法,其中以《国际十进分类法》影响最大。

    《杜威十进制分类法》主要类目

    000 总论

    100 哲学

    200 宗教

    300 社会科学

    400 语言学

    500 纯粹科学

    600 技术科学

    700 美术

    800 文学

    900 地理与历史

    《美国国会图书馆图书分类法》(Library of Congress Classification)简称《国会法》或《LC分类法》,是目前美国大多数图书馆采用的分类方法。《国会法》是世界上最大型的列举式分类法,其类目设置与次序并无严格的科学系统,未细致照顾学科之间的亲疏远近、并列从属等关系,而是以本馆藏书实际情况为依据,由各门类有关专家就自己领域逐类列类,众多不同类被安排为便于使用的次序。《国会法》分为21个大类,分别由A到Z的21个字母构成,采用拉丁字母与阿拉伯数字组成的混合号码为标记,字母表示基本大类和二级类,多为传统学科和知识门类,子目用数字为标记,从1~9999,类目标记具有弹性,可无限延展,至小数点以后,各大类均有详细索引及专用的复分表。

    《美国国会图书馆图书分类法》主要类目

    A  总类:著作集

    B  哲学、宗教

    C  历史相关科学

    D  历史:世界史

    E~F 历史:美洲史

    G  地理、人类学

    H  社会科学

    J  政治

    K  法律

    L  教育

    M  音乐

    N  美术

    P  语言、文学

    Q  科学

    R  医学

    S  农业及其他

    T  工业技术

    U  军事科学

    V  海军兵学

    Z  目录学及图书馆科学

    2.3.2.2 主题语言

    主题语言是直接以代表文献内容主题概念的标识作为检索标识,并按其字顺组织起来的一种检索语言。它打破了按学科分类的方法,使分散在各个学科领域里的有关课题的信息按字顺集中于同一主题,使用时就如同查字典一样按字顺找到所需的主题词,在该词下,列出反映该主题内容的有关信息。根据词语的选词原则、组配方式、规范方法,主题语言可分为标题词语言、关键词语言、单元词语言和叙词语言。

    标题词语言是以标题词(规范的事物名称、名词术语)作为文献内容标识和检索依据的一种主题词语言,是最早出现的一种按主题来标引和检索文献的传统检索语言。标题词语言是来自自然语言中比较定型事物的名称,并经过规范化处理的能表达文献主题内容的词、词组或短语。标题词按字顺排列,词间语义关系用参照系统显示,以标题词表的形式体现。如美国工程信息公司编制的《工程主题词表》(Subject Headings of Engineering,简称SHE)。

    关键词语言是直接从原文的标题、摘要或全文中抽选出来,具有实质意义的、未经规范化处理的自然语言词汇,是作为信息存贮和检索依据的一种检索语言。关键词不受词表限制,表达事物概念直接、准确,能及时反映新事物、新概念,目前关键词语言已被广泛地运用于手工检索和计算机检索系统中。如美国《化学文摘》(Chemical Abstracts,简称CA)的关键词索引。

    单元词语言。单元词是一种最基本的、不能再分的单元词语,亦称元词,它也是从文献内容中抽出,并经过规范化处理,代表一个独立的概念。单元词具有灵活的组配功能,在检索时可以将某些单元词组配起来代表某一特定概念,因此这种语言属于后组式主题语言。

    叙词语言是主题语言的最高级形式,其基本成分是叙词。叙词是从文献内容中抽选出来的、从概念上不可再分的基本概念的单元词汇。检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词语言适用于计算机检索和手工检索,是目前应用较广的一种语言。如英国《科学文摘》(Science Abstracts,简称SA)、《EI》(1993年后)等均采用叙词语言。叙词语言是一种规范化、后组式的主题语言。

221381
领取福利

微信扫码领取福利

微信扫码分享