账号通
    

账号  

密码  

3015

查看

5

回复
主题:关于链接的排序算法你知多少 [收藏主题] 转到:  
dxaapap1 当前离线

44

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:71 分
登录次数:15 次
注册时间:2010/11/13
最后登录:2011/7/25
dxaapap1 发表于:2011/7/23 14:54:06   | 只看该作者 查看该作者主题 楼主 
科汛智能建站系统
基于链接的排序算法彷佛已遍及利用到各类贸易搜索引擎中。为了让计划进去的网坐能够在各类搜索引擎中得到较高排名,计划者们应当晓得这些算法的道理。Google排名的乐成象征着PageRank算法值得特此外存眷。PageRank算法是多数几个公开的排序算法之一。PageRank算法对数学请求很高,但可以做些简略的表明,以阐发它对收集空间的影响。搜索引擎的其余排序算法也大概得到与PageRank算法雷同的结果,虽然他们没有公开任何与其相关的消息。HITS算法是另外一个基于链接的排序算法,与PageRank算法构成光鲜比拟,上面的引述归纳综合了链接对付搜索引擎的代价。“经由过程阐发网页间的链接关系,搜索引擎可以断定出一个网页是关于什么的,也能够果断它是否很紧张并值得参加排序列表中去。”

  

  搜索引擎在排序进程中不斟酌链接身分,而使用一个基于关头词词频的公式,该公式在潜伏立室文档中统计以用户为中间的查询的关头词的词频。比方,检索“动物学”时,引擎大概返回文档题目、头部和注释或是在URL中呈现该词语的所有网页。这类排序算法大概无法断定哪些是关于“动物学”的最权势巨子的网页,而只能断定哪些页面中与“动物学”相关的词语至多。但PageRank算法却可以经由过程链接布局,鉴别出哪一个是最权势巨子的网页——排名位于最后面的阿谁,即具有至多入链的网页。这就使得引擎能够返回一个真实的权势巨子网页,而不是一个雷同于“动物学”课程表的网页。

  

  1998年Google排名的PageRank算法的计划者和奠定者Brin和Page将其焦点部门公开。随后,在1999年他们和Motwani、Winogriad对其进行了更加细致地论述。教学论文网直到2004年,该算法仍在使用,只是作为一个更大范围的算法集的一部门,该算法集采纳100多个目标来断定网页是否和用户的查询相关,并对它们进行排序。Google排名民间申明:“固然咱们有很多工程师在为周全进步Google排名的方方面面而高兴,但PageRank算法仍旧是咱们收集搜索东西技能的底子。”上面是支持PageRank算法的两个根本理念:

  

  人链是权衡方针网页紧张性的很好的目标。

  

  源于紧张网页的人链比源于主要网页的人链更能阐明该网页的紧张性。

  

  在一个简略的基于链接的投票体系中,可以给每一个网页投票,并容许网页将其一票平分后投给它所链接的网页,末了统计每一个网页的终极票数即可构成一个排序体系。在这一进程中,具有较多人链的网坐能得到较高的票数。但是,这个简略的投票体系不足以阐明问题。如受接待的列表网页的入链不少,就会得到不少投票,但该页面只要一票,可平分给它所链接的方针网页,这些方针网页中大概含有有代价的形式。反复这个投票进程,使得每一个网页在前一轮中得到的票数平分给其方针网页。但是可惜的是,当投票体系堕入轮回时,或碰到一个没有出链的网页时,投票的反复进程便无法进行上来了。

  

  对此,Brin和Page提出的办理计划是,在每次投票时,网页收受接管一部门票数,而不全数通报给它的链接方针网页。他们发起保存15%的票数,如许,每次投票时,网页只将其85%的票数平分给其链接方针网页,而别的15%的票数供体系中所有的URL平分。应用数学算法可以有用地完成这一投票体系。反复如许的投票进程,直至所有网页的票数都趋于不乱,即在新的一轮投票中,网页票数的变革很小,如许,PageRank算法便出生了。

  

  有两种PageRank算法和批改算法,批改后的算法有较着的分歧。实际中,Google排名采纳的大概是PageRank批改算法。第一种批改算法是由Lifantsel在2000年提出的,行将PageRank的投票统计创建在网坐的底子上,而不是对单个网页进行投票统计。第二初中英语教育论文种批改算法是由Page、Brin、Motwain和Winograd于1999年提出的,即主动付与一个网坐的首页较高的票数。Google排名彷佛同时采纳了这两种批改算法,大概是与基于网页的尺度算法相连系,也大概是彻底将其代替,但这些都只是猜想
 
  支持(8) | 反对(8) 回到顶部顶端 回到底部底部
sisroot 当前离线

8

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:6 分
登录次数:3 次
注册时间:2011/7/23
最后登录:2011/7/23
sisroot 发表于:2011/7/23 15:05:02   | 只看该作者 查看该作者主题 沙发 
 
  支持(8) | 反对(6) 回到顶部顶端 回到底部底部
panyuqin10 当前离线

768

主题

0

广播

0

粉丝
添加关注
级别:六年级

用户积分:1016 分
登录次数:275 次
注册时间:2010/4/14
最后登录:2013/2/4
panyuqin10 发表于:2011/7/23 15:39:22   | 只看该作者 查看该作者主题 藤椅 
科汛在线网校系统
不是我不是我不是很清楚所以来看看。
 
  支持(5) | 反对(5) 回到顶部顶端 回到底部底部
jsgcw 当前离线

185

主题

0

广播

0

粉丝
添加关注
级别:一年级

用户积分:123 分
登录次数:12 次
注册时间:2011/7/12
最后登录:2011/8/3
jsgcw 发表于:2011/7/23 17:55:48   | 只看该作者 查看该作者主题 板凳 
科汛在线网校系统
楼主讲的还是真好啊。
 
  支持(3) | 反对(2) 回到顶部顶端 回到底部底部
longshezhiwu 当前离线

20

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:15 分
登录次数:6 次
注册时间:2011/7/8
最后登录:2011/7/24
longshezhiwu 发表于:2011/7/24 15:24:00   | 只看该作者 查看该作者主题 报纸 
 
  支持(1) | 反对(0) 回到顶部顶端 回到底部底部
上海sem小冲 当前离线

314

主题

0

广播

0

粉丝
添加关注
级别:二年级

用户积分:100 分
登录次数:10 次
注册时间:2011/5/31
最后登录:2011/7/27
上海sem小冲 发表于:2011/7/27 11:25:52   | 只看该作者 查看该作者主题 地板 
 
  支持(0) | 反对(0) 回到顶部顶端 回到底部底部
<上一主题 | 下一主题 >
Powered By KesionCMS Version X1
厦门科汛软件有限公司 © 2006-2016 页面执行0.15625秒 powered by KesionCMS 9.0