账号通
    

账号  

密码  

2674

查看

5

回复
主题:了解搜索引擎的索引器是SEOer的需要 [收藏主题] 转到:  
o0em0o 当前离线

116

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:191 分
登录次数:21 次
注册时间:2011/7/12
最后登录:2011/9/6
o0em0o 发表于:2011/7/16 16:02:23   | 只看该作者 查看该作者主题 楼主 
科汛在线网校系统
 一个合格的SEOer需要对搜索引擎的结构有一定的了解,这样在进行seo时可以做到心中有数,有条不紊,而不必拘泥于固定的优化方法和技巧。而此时要分析的索引器,它是搜索引擎结构中一个比较重要部分。

  索引 器第对搜索引擎是比较重要的,比如:我们熟悉的百度新闻,它是“由机器每5分钟自动选取更新”,比较具有实时性,并且数据量也是相当的大。此时索引器的算法对索引器的影响就显得十分突出了。因此有人说,一个搜索引擎的有效性在很大的程度上取决于索引器的质量(精确的说应该归功于索引器的索引算法)。

  下面我们一起来系统了解索引器的功能,索引器的功能是理解搜索器(之前我在A5上发表过一篇“SEO需知其所以然之——搜索器”的介绍)搜索的信息,并对收集回来的网页进行分析,提取相关网页信息,如网页的关键词,页面使用的编码,网页URL等等。然后更具搜索引擎的相关算法进行大量复杂的计算,得到一些相关信息,然后利用这些相关信息建立相应的网页索引数据库。

  1. 索引项

  通过前面的介绍,你一定了解了索引器的一些知识,下面有必要对索引项有所了解。什么是索引项了?举个例子,比如我们平时所说的索引器索引的时间,编码,作者,标题等等都属于索引项。

  索引项可以分为两种,一种是客观索引项,另一种是内容索引项。其中客观索引项是与文档的内容无关的,比如,我们发一遍帖子,里面的发帖作者,发帖时间,帖子地址等等都是客观索引项;而内容索引项是反应文档内容的,其理解起来就很容易了,在此就不举例了。内容索引又可以分为单索引项和多索引项两种。

  2. 中文分词

  提供中文分词,你一定会想到全球最大的中文搜索引擎——百度,因为百度搜索引擎在中文分词上有着深厚的技术功底。一般搜索引擎索引英语单词或者句子时候,是比较容易提取的,因为英文单词之间是用空格分开的,而这一切都是约定俗成的。但是对于汉语书写的句子,就不能凭空格区别了,必须要进行词语的切分,也就是我们常说的分词。

  中文分词是文本提取的基础,对于输入的一段中文,然后进行中文分词,然后搜索引擎达到识别语句含义的效果。

  中文分词的方法一般可以分两种,一种是机械匹配方法(基于字符串匹配的分词方法),另一种是概率统计方法。其中机械匹配是建立在已有的词典大全上的,是和里面词语匹配而得到的分词结果。它一般分词方法有:正向最大匹配法(由左到右的方向),逆向最大匹配法(由右到左的方向),最少切分(使每一句中切出的词数最小)和双向最大匹配法(进行由左到右、由右到左两次扫描)。概率统计方法是通过概率统计后,然后再进行处理而得到分词。

  3. 对seo的启示

  根据上面分析搜索引擎索引器的原理,我们可以粗略判断一个搜索引擎的技术成熟程度,例如上面说到百度5分钟自动更新新闻。如果网站是新闻资讯类的,可以注重信息发布的实时性;我们在确定网站的核心关键词和关键词时根据中文分词原理,去掉冗余的词语,把网站最核心的关键词反馈给搜索引擎,这样搜索引擎会给网站一个不错的排名。

  seo技术不仅仅是这一方面就能攻无不克的,还需要整体了解搜索引擎的结构和工作原理的。当然我会在后面陆续分享一些搜索引擎的知识,并分享自己根据这些原理和几年的seo实战经验。来源:QCC中文网

 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
muye 当前离线

394

主题

0

广播

0

粉丝
添加关注
级别:三年级

用户积分:244 分
登录次数:39 次
注册时间:2011/6/8
最后登录:2011/10/23
muye 发表于:2011/7/16 17:30:25   | 只看该作者 查看该作者主题 沙发 
做在线知识付费 选科汛云开店

原来上班和学习是两回事啊

 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
buyudaren 当前离线

2638

主题

0

广播

0

粉丝
添加关注
级别:大一

用户积分:2265 分
登录次数:110 次
注册时间:2010/7/8
最后登录:2012/5/10
buyudaren 发表于:2011/7/16 23:15:13   | 只看该作者 查看该作者主题 藤椅 
做在线知识付费 选科汛云开店

要清楚了解了搜索引致,知彼知己,百战百胜

 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
dota321 当前离线

2472

主题

0

广播

0

粉丝
添加关注
级别:高三年

用户积分:136 分
登录次数:114 次
注册时间:2011/7/6
最后登录:2011/12/18
dota321 发表于:2011/7/17 20:09:24   | 只看该作者 查看该作者主题 板凳 
 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
hanxiaobo023 当前离线

5

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:6 分
登录次数:3 次
注册时间:2011/6/16
最后登录:2011/7/30
hanxiaobo023 发表于:2011/7/17 23:52:28   | 只看该作者 查看该作者主题 报纸 
做在线知识付费 选科汛云开店
我现在还在加班啊,悲剧了...艹.
 
北京银泰投资中心 http://www.bgxykfw.com 广州银泰投资中心 http://www.gzxykfw.com 上海银泰投资中心 http://www.shxinyongkafw.com 深圳银泰投资中心 http://www.szxykfw.com 成都圣达公司 http://www.qbwtx.com/
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
lyx123 当前离线

321

主题

0

广播

0

粉丝
添加关注
级别:三年级

用户积分:300 分
登录次数:17 次
注册时间:2011/7/8
最后登录:2011/7/29
lyx123 发表于:2011/7/18 9:38:55   | 只看该作者 查看该作者主题 地板 
做在线知识付费 选科汛云开店
seo技术不仅尼龙扎带仅是这一方面就能攻无不克的,还需要整体了解杭州美术培训搜索引擎的结构和工作原理的。当然我会在后面陆续分享一些搜索引擎的知识,并分享自己根据这些原理和几年的seo实战经杭州画室
 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
<上一主题 | 下一主题 >
Powered By KesionCMS Version X1
厦门科汛软件有限公司 © 2006-2016 页面执行0.15625秒 powered by KesionCMS 9.0