今天测试了好几个站的采集,发现科讯的采集功能并不完善,在采集的时候有大部分地址是采集不到代码中的时间,另外就是关键字的截取问题,
代码如下:
<html>
<head>
<title>教你防黑之小心防范RM,WMV木马的方法 - 计算机网络学院</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="keywords" content="教你防黑之小心防范RM,WMV木马的方法,计算机教程,网络学院,电脑技术">
<meta name="description" content="教你防黑之小心防范RM,WMV木马的方法,计算机教程,网络学院,电脑技术">
<link href="../../images_v6/style.css" rel="stylesheet" type="text/css" />
截取关键字的时候开始代码为:<meta name="keywords" content=" 结束代码为
">
<meta name="description" 采集以后发现关键字是截取到了,可是又把所采集到的关键字给划分掉了,变成了(教你|你防|防黑|黑之|之小|小心|心防|防范|)这样格式的,这到底是我采集的时候没设置对还是程序本身就存在这个问题呢?
等待回答中