搜索引擎有哪些基本类型? 随着搜索引擎技术和市场的不断发展,出现了多种不同类型的搜索引擎,各类媒体上有关搜索引擎的名词也越来越多,甚至产生让人眼花缭乱的感觉,如交互式搜索引擎、第三代搜索引擎、第四代搜索引擎、桌面搜索、地址栏搜索、本地搜索、个性化搜索引擎、专家型搜索引擎、购物搜索引擎、自然语言搜索引擎、新闻搜索引擎、MP3搜索引擎、图片搜索引擎……如何尽快熟悉如此众多类型的搜索引擎,又如何利用各种搜索引擎作为***工具呢?首先要对搜索引擎的种类有一个比较清晰的认识。 尽管搜索引擎有各种不同的表现形式和应用领域,如果从搜索引擎的工作原理来区分,搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如google、AltaVista、www.wwspw.net Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。需要说明的是,这些信息并不是搜索引擎即时从互联网上检索得到的,通常所说的搜索引擎,其实是一个收集了大量网站/网页资料并按照一定规则建立索引的在线数据库,如2004年3月底google收录的网页数量已经超过42亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。 另一类称为分类目录,这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。yahoo是分类目录的典型代表,国内的搜狐、新浪等搜索引擎也是从分类目录发展起来的。分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。 从实质上看,利用机器手自动检索网页信息的搜索引擎才是真正意义上的搜索引擎。现在的大型网站一般都同时具有“搜索引擎”和“分类目录”查询方式,只不过一些网站的搜索引擎技术来自于其他提供全文检索的专业搜索引擎,如yahoo拥有自己经营的网站分类目录,而曾经采用的网页搜索引擎包括Inktomi、google
QQ表情等公司提供的技术。因此,从用户应用的角度来看,无论通过技术性的搜索引擎,还是人工分类目录型的搜索引擎,都能实现自己查询信息的目的(两种形式可以获得的信息不同,分类目录通常只能检索到相关网站的网址,而搜索引擎则可以直接检索相关内容的网页),因此习惯上没有必要严格区分这两个概念,而是通称为搜索引擎。不过要注意的是,由于两种类型的搜索引擎原理不同,导致各种搜索引擎营销方式的差异,需要针对不同的搜索引擎采用不同的搜索引擎营销策略,因而处于***研究和应用,有必要从概念和原理上给予区分。 但是,也有一些搜索引擎的操作方式不同于上述两类基本的搜索引擎,比较有影响力的有两种:一种是“多元搜索引擎”(Meta search Engine),另一种被称为“集成搜索引擎”(All-in-One Search Page www.wwspw.net engine)。这两种搜索引擎也是在前述两种基本搜索引擎的基础上发展演变而成的,但又不同于传统的搜索引擎模式。由于这些搜索引擎应用于***时在基本思想和方法上并没有重大差别,因此这里仅做简要介绍。 “多元搜索引擎”的主要区别在于,并不像全文搜索引擎那样拥有自己的索引数据库,而是当用户提交搜索申请时,通过对多个独立搜索引擎的整合和调用,然后按照多元搜索引擎自己设定的规则将搜索结果进行取舍和排序并反馈给用户。从用户的角度来看,利用多元搜索引擎的优点在于可以同时获得多个源搜索引擎(即被多元搜索引擎用来获取搜索结果的搜索引擎)的结果,但由于多元搜索引擎在信息来源和技术方面都存在一定的限制,因此搜索结果实际上并不理想,目前尽管有数以百计的多元搜索引擎,但还没有一个能像google等独立搜索引擎那样受到用户的广泛认可。
http://wwspw.net/newsList.asp?city_oneid=19&city_twoid=14&newsid=4&page=2