【导语】2020年计算机三级考试备考模式已启动,为了方便考生及时有效的备考,下面无忧考网为您精心整理了2020年计算机三级考试网络技术备考要点:搜索引擎的原理和组成,供大家的参考。如想获取更多计算机三级考试的模拟题及备考资料,请关注无忧考网的更新。
2020年计算机三级考试网络技术备考要点:搜索引擎的原理和组成
(1)搜索引擎的原理
搜索引擎的原理起源于传统的信息全文检索理论,即计算机程序通过扫描一篇文章中的所有词,建立以词为单位的排序文件,检索程序根据检索词在每篇文章中出现的频率和概率,对包含这些检索词的文章排序,后输出排序结果。
(2)全文搜索引擎功能模块的组成
现在的全文搜索引擎一般由搜索器、索引器、检索器和用户接口4个部分组成。
①搜索器。搜索器也称为“蜘蛛”、“机器人”或“爬虫”,实际上是一种基于Web的程序。搜索器在Internet上逐个访问服务器来收集信息,它通过请求Web站点上的HTML网页来采集该HTML网页,并建立一个网站的关键字列表。搜索器建立关键字列表的过程称为网络爬行。
②索引器。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。索引器可使用集中式索引算法或分布式索引算法。索引算法对索引器的性能有很大的影响。一个搜索引擎的有效性在很大程度上取决于索引的质量。
③检索器。检索器的功能是根据用户查询在索引库中快速地检索出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性的反馈机制。网页检索器是一个在Web服务器上运行的CGI(公共网关接口)程序。
④用户接口。用户接口的作用是输入用户查询,显示查询结果,提供用户相关性反馈机制。用户接口可以分为简单接口和复杂接口两种。
(3)目录导航式搜索引擎和网页搜索引擎的组成
目录导航式搜索引擎的信息搜集系统主要由人工完成,搜索引擎的标引专家依靠手工来搜寻不断出现的新网站,给每个网站一个标题和大概描述,将其放入相应的类目体系中。在页面上体现为每个类目路径下排列着的相关网站,所以也称为目录导航。目录导航式搜索引擎提供两种查询接口形式:一种是直接单击目录树,另一种是关键字检索。
2020年计算机三级考试网络技术备考要点:搜索引擎的原理和组成.doc
下载Word文档到电脑,方便收藏和打印[全文共977字]
编辑推荐: