账号通
    

账号  

密码  

2426

查看

4

回复
主题:百度蜘蛛的工作原理 [收藏主题] 转到:  
wydyzq10 当前离线

86

主题

0

广播

0

粉丝
添加关注
级别:学前班

用户积分:153 分
登录次数:15 次
注册时间:2011/5/3
最后登录:2011/6/7
wydyzq10 发表于:2011/5/17 17:29:51   | 显示全部帖子 查看该作者主题 楼主 
科汛在线考试系统(NET)

以下内容只有回复后才可以浏览,请先登录!
百度是如何收录到那么多网页的呢?这个百度用以抓取互联网上数以亿计的网页的程序,就叫做Baiduspider - 百度蜘蛛。

它是一个程序,夜以继日得在互联网上找寻新的URL,接着抓取URL上的内容,返回到百度的网页暂存数据库。

百度用来抓取网页内容的程序,叫做Baiduspider,抓取其他内容的蜘蛛,则是新的名字:

产品名称                 对应user-agent

网页搜索                Baiduspider

无线搜索                Baiduspider-mobile

图片搜索                Baiduspider-image

视频搜索                Baiduspider-video

新闻搜索                Baiduspider-news

百度搜藏                Baiduspider-favo

百度联盟                Baiduspider-cpro



 
  支持(19) | 反对(19) 回到顶部顶端 回到底部底部
<上一主题 | 下一主题 >
Powered By KesionCMS Version X1
厦门科汛软件有限公司 © 2006-2016 页面执行0.09180秒 powered by KesionCMS 9.0