欢迎访问文稿网!

信息检索查全率与查准率怎么算

范文之家 分享 时间: 加入收藏 我要投稿 点赞

信息检索查全率与查准率怎么算

    

    在实际检索中,检索者期望检索出来的信息均是自己所需的,并且能够把适合自己所需的全部信息全部检索出来。那么该如何来衡量这种情况呢?这就涉及检索效果评价问题。

    检索效果(retrieval effectiveness)是指检索系统检索的有效程度,它反映了检索系统的能力。检索效果包括技术效果和经济效果,技术效果是由检索系统完成其功能的能力确定,主要指系统的性能和服务质量;经济效果是由完成这些功能的价值确定的,主要指检索系统服务的成本和时间。克兰弗登(Cranfield)在分析用户要求的基础上,提出了六项评价系统性能的指标,分别为收录范围、查全率、查准率、响应时间、用户负担和输出形式。此外,还有漏检率(omission factor)和误检率(noise factor)两个指标。但在评价检索效果时最常用的和最重要的是查全率和查准率两个指标。

    (一)查全率

    查全率(recall factor)是指检出的相关文献信息与检索系统中相关信息总量的比率,是衡量信息检索系统检出相关信息能力的尺度。可用下式表示。

    

    (二)查准率

    查准率(precision factor)是指检出的相关信息量与检出信息总量的比率,是衡量信息检索系统检出信息准确度的尺度。可用下式表示:

    

    (三)查全率和查准率的关系

    由于诸多因素的影响,在实际检索中,查全率和查准率是不可能同时达到100%的,两者存在着一种互逆关系,即在同一检索系统中查全率和查准率达到某一程度后,提高查全率,查准率则会降低;反之,查准率提高,查全率则会下降。查全率和查准率的互逆关系如图1-3所示。

    那么对于一个检索者而言,该如何得到理想的检索效果呢?以下途径可供参考:一是要选择好检索工具,既要注意选择质量较高的检索工具,又要选用适合检索课题需要的检索工具;二是要准确使用检索语言,所用检索语言应能准确表达信息需求,灵活运用泛指性较强和专指性较强的检索语言,使用泛指性较强的检索语言(如上位类、上位主题词)能提高查全率,但查准率下降,使用专指性较强的检索语言(如下位类、下位主题词)能提高查准率,但查全率下降;三是要善于利用各种辅助索引,一种检索工具通常有许多辅助索引,提供多种检索途径,应根据检索需要综合运用,选用相应的索引进行检索;四是要提高检索策略制订水准,检索策略是一项技巧性很强的检索方案,不同的检索方案得到的检索效果有着很大的差别。因此,检索人员不仅要具备较高的专业素质,也要具有一定的信息检索常识,能全面正确表达检索要求,制订出科学、全面、合理、细致的检索策略,这样才能有效地降低漏检率和误检率,提高检索效果。

    

图1-3 查全率与查准率关系

    【思考题】

    1.《中国图书馆分类法》的分类号码的标识符号是如何设置的,用什么字母作为“医药卫生”的类目代码?

    2.美国《医学主题词表》中主题词与副主题词的关系。

    3.写出常用的信息检索途径。

    4.写出五种计算机检索技术。

    5.写出该课题的检索表达式:手损伤影像诊断的综述文献。

    (闫 蓓)

    参考文献

    [1]李晓玲,夏知平.博学·基础医学医学信息检索与利用.第4版.上海:复旦大学出版社,2008.

    [2]曹洪欣.医学信息检索与利用.上海:第二军医大学出版社,2008.

    [3]何怡,刘毅.医学信息检索实用教程.天津:天津科学技术出版社,2009.

    [4]刘薇薇,王虹菲.医学信息检索.天津:天津大学出版社,2009.

    [5]范吉莲,张静昌.医学信息检索与利用.上海:第二军医大学出版社,2006.

    [6]王庭槐.医学信息资源检索与利用.北京:高等教育出版社,2005.

221381
领取福利

微信扫码领取福利

微信扫码分享