搜索引擎技术的原理与分类

2016-03-14 03:55谭凯文
大科技 2016年35期
关键词:信息检索搜索引擎页面

谭凯文

(湖南长沙麓山滨江实验学校 410000)

搜索引擎技术的原理与分类

谭凯文

(湖南长沙麓山滨江实验学校 410000)

在互联网的发展下,网络中的信息资源也呈现出爆炸式的增长趋势,给人们带来了海量的信息,同时也对信息的搜索提出新的要求,搜索引擎技术的应用即可解决这一问题。本文主要针对搜索引擎技术的原理与分类进行分析。

搜索引擎技术;原理;分类

网络时代的到来拉近了人与人之间,人与世界之间的距离,改变了人们获取信息的方式。在当今世界,面对纷杂而繁乱的信息世界,要想快速、高效而精准地获取自己想要的信息,我们需要高效的搜索技术和工具的支持。搜索引擎的出现有效地解决了信息获取困难的问题。

1 搜索引擎技术的原理分析

搜索引擎是一种技术,也是一种信息检索的工具,还是存储有大量信息的数据库,也可以被称之为可以对信息进行查询的网站。因为搜索引擎其实就是人们可以在互联网上使用网络的搜索软件,根据设定的要求进行大量相关信息的检索、收集、分析,并形成相关信息数据库、索引数据库,一旦出现信息的检索,则提供相应的信息服务或指引。搜索引擎的信息采集是网络机器人扫描一定IP地址范围内的网站,通过链接遍历Web空间,来采集网页资料。为保证采集的资料最新,网络机器人还会回访已抓取过的网页。

搜索引擎技术的应用首先是利用所谓的爬虫软件对web页面进行抓取,也就是页面的链接和读取,在固定时间内会有重复的动作以查看页面的变化和更新。只有对抓取过的页面进行拷贝和建立索引以后才有可能完成搜索引擎的搜索和信息的实时更新。搜索引擎技术的使用还需要有分析软件,进行信息检索的时候才会查找并搜索出与要求相互匹配的信息和数据并进行某一属性的升降的排序。

为了更快捷高效地得到自己想要的信息,必须保证运用搜索引擎进行信息检索的时候,搜索出的网页排序靠前。这就需要人们在用搜索引擎进行信息检索的时候注意关键词的位置排列和出现的频率的高低。要根据所搜索的信息找出最重要的作为关键词,它必须有具体的含义和指向并且在检索信息中应该位置靠前。如要买睡衣,不能用衣服做关键词,否则我们就会看到裤子、裙子、甚至是鞋子很多可选页面;我们可以用睡衣甚至是男式或女式睡衣来作为关键词进行检索,这样搜出的页面就更符合我们的要求,我们只需注意款式、材质甚至价格就行。如果再加上“棉”字来作为关键词,那么就更接近我们所要的东西的要求了。搜索引擎对网页进行检索的时候,关键词出现的频率越高,越容易被查找出来,这也是我们要高效得到搜索内容的途径之一。

2 搜索引擎技术的分类与应用

搜索引擎可以分为全文搜索引擎、目录搜索引擎和元搜索引擎三种类型。

全文搜索引擎是真正意义上的搜索引擎。全文搜索引擎是通过搜索引擎的爬虫软件对互联网的网页进行抓取,分析并提取相关网站的信息,建立记录并创建索引数据库,一旦用户查询条件符合记录的信息和数据,就会自动执行返回操作。

目录索引仅仅是能在信息检索的时候按目录分类提供相应的网站站点的链接,需要人工的信息摘要和分类以便进行目录的浏览和直接的信息检索。所以说目录搜索引擎只是具备了搜索的功能而名不副实。

元搜索引擎没有建立自己的数据库,所以需要向多个搜索引擎递交用户的查询请求,对返回的结果进行分析排序然后提供给用户。

在用全文搜索引擎的时候,所有的操作是自动的,其搜索的信息量大而全面,并且更新及时,不会出现落伍和过时的信息。但由于信息量的庞大,用户需要自己筛选有用的信息,摒弃那些没用的记录和结果,比较浪费时间,不能实现查找的精确性。而目录搜索引擎需要进行手动的人工操作,虽然比较麻烦,提供的可用信息量小,但可以实现信息查找的分类和逐层的目录检索,查找的准确度要优于全文搜索引擎。元搜索因为同时对多个搜索引擎进行查询的申请,所提供的信息量最大,但同样需要用户进行更多的精确筛选,费时尤甚。

搜素引擎给人们提供了信息查找和检索的方便,但随着互联网的应用领域的日益拓展和人们要求的不断提高,显现出很多应用上的问题。各种搜素引擎的检索规则不统一,人们使用起来并不方便;同时搜素引擎技术也应该与时俱进,对搜素的空间和信息查询结果的精确度上应该有更大的提高。搜素引擎目前的检索速度还不够快,搜素出来的结果不仅单一,达不到用户个性化服务的要求。而搜索引擎技术随着人们对信息检索的要求,对数据库的信息储存提出更高的要求,这种大容量的数据库需要大量的带宽和中央处理器的空间,在一定程度上影响了计算机运行的速度。

3 结语

搜索引擎技术的发展深刻地影响着人们的生活。随着未来网络的发展和信息技术的进步,搜索引擎技术的研究与发展也将出现新的契机。

[1]王涛,田涛,李昌林.云电视关键技术——云计算搜索引擎技术专利分析[J].电视技术,2013(S2).

[2]陈楚云,李丽霞,周蔚林.用搜索引擎技术开发和利用针灸古文献[J].世界科学技术(中医药现代化),2011(05).

[3]祁延莉,张扬扬.搜索引擎技术专利的统计分析[J].中国发明与专利,2010(07).

[4]张焕武.搜索引擎技术研究的现状与展望[J].科技情报开发与经济,2009(03).

TP391.3

A

1004-7344(2016)35-0249-01

2016-12-4

猜你喜欢
信息检索搜索引擎页面
刷新生活的页面
医学期刊编辑中文献信息检索的应用
基于神经网络的个性化信息检索模型研究
网络搜索引擎亟待规范
基于Nutch的医疗搜索引擎的研究与开发
教学型大学《信息检索》公选课的设计与实施
基于Lucene搜索引擎的研究
公共图书馆信息检索服务的实践探索——以上海浦东图书馆为例
网站结构在SEO中的研究与应用
浅析ASP.NET页面导航技术