下载此文档

七章信息检索技术知识分享.ppt


文档分类:IT计算机 | 页数:约56页 举报非法文档有奖
1/56
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/56 下载此文档
文档列表 文档介绍
第七章信息检索技术信息检索的概念 信息检索数据库 检索语言和检索效果评价 信息检索的基本流程第一节信息检索的概念1、检索的意义信息具有共享性,信息资源共享(informationresourcesharing)是当今社会的一个热点问题。为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息源中去识别和获取所需要的那部分信息,这个过程就是检索(searching)。信息的检索、利用和创造是一个循环和增值的过程,人们通过工具(数据库)检索获得信息,经过处理筛选出需要的部分,在利用信息的过程中又创出新的信息,这些信息经过核准后又被标引、组织进检索工具(数据库),再提供人们使用,信息在这个循环的处理过程中不断得到扩充,它的增长是没有穷尽的。2、检索的基本原理信息检索基本原理的核心是用户信息需求与文献信息集合的比较和选择,是两者匹配(match)的过程。 一方面是用户的信息需求,一方面是组织有序的文献信息集合,检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出(search,locate,hit)相关的信息。 匹配有其匹配标准,这里涉及到两者一致性、相关度等问题,按一定的标准筛选出符合要求的信息。3、检索点检索点(accesspoint)是检索的出发点,以前常用“检索途径”(approach)这一术语。每件文献均有内部的(信息内容)特征及其相关的外部特征,在检索系统中检索点是标目的总称。从文献的特征出发,将其特征值与检索系统中标目数据进行计算比较,通过匹配达到检索目的。反映文献信息内容特征:分类检索和主题检索;反映文献外部特征:作者、名称和号码检索等。1)分类检索(classification)分类检索是从文献内容所属的学科类别出发来检索文献,它依据的是一个可参照的分类体系(classificationsystem)。 分类体系按文献内容特征的相互关系加以组织,并以一定的标记(类号)作排序工具,它能反映类目之间的内在联系,包括从属、并列、交替、相关等。 较权威的图书分类法有:中国图书馆图书分类法美国国会图书馆分类法(LibraryofCongressClassification)杜威十进分类法(DeweydecimalClassificationsystem)2)主题检索主题(subject)检索是从反映文献内容的有关主题词出发来检索文献,主题是检索点,它对应文献主题概念。检索按主题词的音或形的字顺进行,其方式如查字典、词典。主题词有多种类型:有规范词和自由词,有单元词和多元词,有先组结构和后组结构等。主题词的合理选择与使用对检索结果的优劣直接相关。3)作者检索作者(author)检索是从文献的作者姓名出发来检索其文献。“作者”广义上还应包括:piler)、编者(editor)、主办者(sponsoringbody)、译者(translator)等此外,还有代表机构、单位的团体作者(corporateauthor),包括作者所在单位(author'saffiliation)。4)名称检索名称(title)检索点是从各种事物的名称出发来检索文献信息。这些名称包括:书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等等,也包括人名和机构名。检索的对象既包括对应的文献,也包括有关的信息、事项等。比如个人电话簿(whitepages)或公司电话簿(yellowpages),查找的是号码信息。

七章信息检索技术知识分享 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数56
  • 收藏数0 收藏
  • 顶次数0
  • 上传人nnyoung
  • 文件大小1.53 MB
  • 时间2019-11-29