分类分类
更新时间:2026-02-18 21:34:06作者:yezheng
采集有的站点,同样的标题会出现两次,出现这个问题主要是链接标记没有设置好.比如某个文章列表的代码是这样的:
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090813/000011.htm">决定胎儿大小的6个疑问(图)</a>[<a href="/a/20090813/000011.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">13日09:47</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090812/000004.htm">孕时妊娠反应大 宝宝更聪明</a>[<a href="/a/20090812/000004.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">12日09:31</td>
</tr>
<tr align="left">
<td height="22" class="f18 dottedb">·
<a target="_blank" class="fontbrown nl" href="/a/20090811/000003.htm">怀了双胞胎应该注意些什么?</a>[<a href="/a/20090811/000003.htm" target="_blank">详细</a>]
</td>
<td align="right" class="f18 dottedb">11日09:29</td>
</tr>
如果链接开始和结束标记设置为:
链接开始标记:href="
链接结束标记:"
得到的文章列表Url就会有重复,因为这里每篇文章除了标题有链接外,标题后还有个"详细"也有链接,所以正确的链接开始和结束标记设置为:
链接开始标记:class="fontbrown nl" href="
链接结束标记:"
也就是说链接前后多截取一点字符,保证链接的唯一性
相关
归墟战纪策略游戏262.92 MBv3.95802026-02-14
下载爆裂老奶策略游戏209.43 MBv1.0.112026-02-14
下载超能下蛋鸭策略游戏395.4 MBv1.2.82026-02-14
下载你好盒子实用工具12.1 MBv2.2.852026-02-14
下载我在峡谷当牛马休闲益智87.95 MBv0.7.12026-02-14
下载抽卡监狱2策略游戏190.75 MBv1.4.92026-02-14
下载Campus社交通讯94.36 MBv1.19.02026-02-14
下载冒险传奇角色扮演141.73 Mv9991.12026-02-14
下载心动次元app社交通讯43.96 Mv1.0.1.32026-02-14
下载致亲爱的我角色扮演1.63Gv1.02026-02-14
下载狼伴侣游戏手机版冒险游戏155.6 Mv1.02026-02-14
下载Loclike社交通讯169.08 Mv2.2.112026-02-14
下载










