点击 233回答 14
2022-03-16 00:48
如何精准查询究竟哪些页面被搜索引擎删除了?![]() ![]() RT。在一个数据量足够庞大的网站中,使用遍历记录的方法查询网站页面的收录情况几乎是不可能的。由于收录删除有可能由很多原因引起,所以查清楚究竟哪些页面被删除了就十分重要了。请问大家有什么好方法,能够精确的定位究竟哪些页面在上一次的更新中被删除了呢?求赐教。
|
支持 0
反对 0
举报
2022-03-16 02:06
几百万的收录,对于每天掉的链接统计来讲,确实是一个问题,但还有一个问题是,既然有几百万的收录,即使掉了几十万的收录,也不会影响网站的大局,对于您想知道哪些URL被删除,来讲,也没有太大的意义。大致的了解一个删除的方向足以为今后的网推广做出明确的方向了。
百度的变化是十分快的,没准今天删除了的URL,在明天又会被重新收录,那么统计出了详细的删除URL到了第二天,又需要去统计,这无疑为您的工作添加了更多不必要的麻烦。几百万的收录,也不必在意几十万的数据变化了。即使减少了100万的收录,那又有何影响呢?如果减少再多,可能就是你网站的问题了。 |
支持 0
反对 0
举报
2022-03-16 03:37
我比较赞同三木提到的抽样法来研究被删除页面的规律。
具体方法,参考三木所说,我觉得说得很好。 另外补充下: 从经验上去反推原因,列出收录之后被删除的可能性有哪些,然后结合各个原因来做抽样研究。要结合之前收录的数据和现在的日志分析。 一般被收录之后又被删除的可能性有如下这些:
最后,关于这个问题,我找了几个在操作大站SEO的大侠(赶集的、大众点评网的、慧聪的)交流了下, 他们也提到采用抽样法和日志分析,是比较好解决这个问题的办法,但必要条件是,得有之前的收录数据。 感谢交流过程大家提到的百度站长平台里的索引量分析,如下图: ![]() 8 年前 赞同 1 评论 0 收藏 举报 ![]() 按照个人观点,其实也是和三木老师的观点相同 |