1.从分析系统的第一步和第二部过程,告诉我们要明确需要保留的信息
网页是有HTML语言编写而成是一个半结构化的对象,要将其中有价值的信息,例如标题和正文保留下来,而将无用的信息丢弃,例如HTML标签,主要是通过网页结构化,一般来说,TITLE标签,MEAT标签,H标签是搜索引擎认为最重要的网页信息。比如,针对TITLE标签,在搜索引擎蜘蛛爬行的过程中,< TITLE >与< /TITLE >之间的内容往往是蜘蛛们第一个获取到网页的文字内容。除此之外,锚文本,网页正文都是有价值的信息,要加以保留和重视。
2.从分析系统的第三步来看,告诉我们要重视网页的内容建设
网络中的网页数以亿计,对海量网页进行存储和处理是一项艰巨的任务,而且这些网页中又包含很多相同或者类似的页面。所以搜索引擎的分析系统在正式对网页进行分析之前首先要做的工作就是网页消重。搜索引擎中把这4种页面看做是相同或相似的,两个网页的内容和格式上完全相同、两个网页的内容完全相同,但格式不同、两个网页有部分重要的内容相同并且格式相同、两个网页有部分重要的内容相同,但格式不同。从搜索引擎的分析系统看网站优化,可见网页内容的独特性很重要,所以做好原创是有意义的。
3.从网页重要性的计算,也就是分析系统的第四五部来看,做好网页的权重是很有意义的
在这里,拿谷歌的PR值举例,它是Google用来标识网页的等级/重要性。百度也有类似的系统,所以我们应该根据它们的算法,做好提高网页重要性的工作,比如导入高质量的链接,写一些高质量的软文带上网页链接并发布到大型网站,比如提供有价值的网页内容,这些都可以提高网页的权重,具体的做法,站长朋友都知道,这里不再详述。
http://www.shengbentouzi.com 上海公司增资 整理发布