下载此文档

《搜索引擎教学》.ppt


文档分类:IT计算机 | 页数:约66页 举报非法文档有奖
1/66
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/66 下载此文档
文档列表 文档介绍
该【《搜索引擎教学》 】是由【相惜】上传分享,文档一共【66】页,该文档可以免费在线阅读,需要了解更多关于【《搜索引擎教学》 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。搜索引擎教学何晓阳整理课件Thewebcreatesnewchallengesforinformationretrieval. SergeyBrinandLawrencePage ?TheAnatomyofaLarge-ScaleHypertextualWebSearchEngine? 1998年4月在广泛关注。目前该文被引用309次。整理课件内容: 网络资源的特点 搜索引擎 医学搜索引擎 实例整理课件网络资源的特点〔与传统数据库相比〕内容丰富,应有尽有。更新变化太快,不确定性高。有待于标准化、标准化。(能标准化吗?)检索没有定式,没有标准答案。整理课件搜索引擎介绍整理课件起源:所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity三名学生〔AlanEmtage、PeterDeutsch、BillWheelan〕创造的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。整理课件起源:由于Archie深受欢送,受其启发,putingServices大学于1993年开发了一个Gopher〔GopherFAQ〕搜索工具Veronica〔VeronicaFAQ〕。Jughead是后来另一个Gopher搜索工具。整理课件发展:世界上第一个Spider程序,是MITMatthewGray的WorldwideWebWanderer,用于追踪互联网开展规模。刚开始它只用来统计互联网上的效劳器数量,后来那么开展为也能够捕获网址〔URL〕。搜索引擎一般由以下三局部组成:爬行器〔机器人、蜘蛛〕索引生成器查询检索器整理课件发展:改进:假设所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:TheWorldWideWebWorm、NASA的Repository-BasedSoftwareEngineering(RBSE)spider。RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。整理课件发展:Excite的历史可以上溯到1993年2月,6个StanfordUniversity〔斯坦福大学〕大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资工程Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做ExciteforWebServers。〔注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile〕整理课件

《搜索引擎教学》 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数66
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小4.80 MB
  • 时间2024-04-09