推广 热搜: 食品  快递      www  民事主体  网络营销  代理  东莞市  橡塑 
点击 229回答 3 2022-03-16 17:14

关于百度蜘蛛爬取路径不完整的问题

已解决 悬赏分:80 - 解决时间 2022-03-16 23:40
有没有碰到一个问题,百度在爬取我们网页的时候路径不完整:比如:你的路径是 /food/article/1000001/ 百度却爬取 /food/article/1000001 你的路径是 /news/2012_11_08/133707_0/ 百度却爬取 /news/2012_11_08/1337这样一来,百度抓取的结果返回的都是 404 ,我想对网站肯定是有影响的。首先可以保证这个不是内链造成的(我们的内链都是规范化的,也检查过),想问大家有没有出现过这种情况,怎么解决的?
反对 0举报 0 收藏 0 打赏 0
最佳答案
支持 0 反对 0 举报 2022-03-16 17:33
有没有碰到...
支持 0 反对 0 举报 2022-03-16 17:39
你好,这个问题属于正常现象,几乎每一个网站都会出现这样的情况。

原因没有出在你这,而是百度蜘蛛抓取你的页面后,需要获取页面链接,在获取链接的时候,总是在偷懒,很多链接抓取一半或者还没有抓取完就跑了。

我们唯一能改善的就是减少页面体积,让蜘蛛抓取更快一点。

但是你的链接结构不是很合理2012_11_08/133707_0/为什么不自己20121108/1337070/??
支持 0 反对 0 举报 2022-03-16 18:25
最好统计一下数量,看一下有没有什么规律可循。贴一段日志代码出来给大家看看。
网站首页  |  营业执照  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报