当前位置:论坛首页 > Linux面板 > 求助

个别正常页面百度蜘蛛抓取路径错误是什么原因

发表在 Linux面板2019-8-25 00:52 [复制链接] 2 629

这是正常抓取的情况,GET后面的地址是不带域名的:
[23/Aug/2019:06:52:22 +0800] "GET /1149.html

个别网页可以正常访问,抓取却带了域名导致404:

[23/Aug/2019:05:14:02 +0800] "GET /xxxx/3724.html

还有一个页面,出现了两只蜘蛛抓取完全不同的结果:

[23/Aug/2019:08:17:16 +0800] "GET /3075.html

[23/Aug/2019:03:48:59 +0800] "GET /xxxx/3075.html "

请问这到底是蜘蛛的问题,还是我自己的问题?


使用道具 举报 只看该作者 回复
发表于 2019-8-26 10:59:14 | 显示全部楼层
如果不影响收录就没问题。可以去站长平台看看有没有抓取错误。
使用道具 举报 回复 支持 反对
发表于 2019-8-28 15:28:10 | 显示全部楼层
用Screaming Frog SEO Spider这个软件自己抓取分析一下。看是不是存在这些404,如果存在那就是你的问题,不是的话,那可能是百度的问题
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

普通问题处理

论坛响应时间:72小时

问题处理方式:排队(仅解答)

工作时间:白班:9:00 - 18:00

紧急运维服务

响应时间:3分钟

问题处理方式:宝塔专家1对1服务

工作时间:工作日:9:00 - 18:30

宝塔专业团队为您解决服务器疑难问题

点击联系技术免费分析

工作时间:09:00至18:30

快速回复 返回顶部 返回列表