点击 299回答 10
2022-03-16 08:59
【求助】百度索引量近2亿,实际收录不到2千万,近期索引量下降?![]() ![]() 直接上图 帮忙分析分析,有哪几种原因引起的。1、还有一个问题,网站内容由于是企业发布,每天会有很多非法的页面,所以会产生每天删除大量的页面,会导致今天蜘蛛爬过的页面,可能明天就被删除了,这种URL如何处理了?(已提交百度站长平台死链接URL)2、另外一个,同行B2B的网站近期有木有出现这样的情况了? 追加问题 网站收录 百度索引量 网站分析 内容不收录 举报 2014-03-28 发布7,477 次浏览 最新问题 如何才能获取快速收录权限(5 小时前) 游戏网站收录了7000多 关键词也80多个 流量却少的可怜(5 小时前) 我的网站已经建站很久了,百度一直没有收录(6 小时前) 我的站收录2万多条,关键词排名全没了。。。(6 小时前) site有结果页没有是不是被K了(6 小时前) 新域名,新站,今天第3个月,百度出现秒收录了,如何保持住,如何起飞!(7 小时前) 你们真正意义上互联网第一桶金是怎么赚取的?(7 小时前) 收录也不给权重 怎么办了(7 小时前) 想买一个有百度快速收录权限的域名(9 小时前) 用wp搭了一个网站,经常会出现打不开的情况,重启服务器后就能正常打开,这是什么原因?(9 小时前) .question-ccx {display: flex;width: 100%;margin: 0 auto;padding: 0;}.question-ccx .sw-area {width: 50%;padding: 12px 26px 10px 26px;box-shadow: none;float: left;}.question-ccx .sw-area ul li {padding: 3px 0;white-space: nowrap;text-overflow: ellipsis;overflow: hidden;display: flex;}.question-ccx .sw-area ul li a{white-space: nowrap;text-overflow: ellipsis;overflow: hidden;}.question-ccx .sw-area span {color: #999;}.question-ccx .side-reward span {color: #ec5a12;}.question-ccx .sw-area .mod-head {padding-bottom: 5px;}.question-ccx .side-reward {border-left: 1px solid #e0e8ee;float: right;}.question-ccx .sw-area ul li:nth-child(5) {display: none;}.ccx-question { border: 1px solid #e4eaee; overflow: hidden; padding: 20px 0; display: flex; width: 100%;}.ccx-new-question { width: 50%; padding: 0 20px;}.ccx-new-question li { height: 36px; line-height: 36px; border-bottom: 1px dashed #e2e2e2; white-space: nowrap; text-overflow: ellipsis; overflow: hidden;}.ccx-new-question li:last-child { border-bottom: none;} 分享到微信 收藏 关闭 没有找到相关结果 已邀请: --> .ccx-img {padding: 0; margin: 0 auto; width: 100%;position: relative;} .ccx-img_l {float: left; width: 49%;} .ccx-img_r {float: right;width: 49%;} .ccx-img img {width: 100%;border-radius: 8px;} 交换友情链接,就用搜外友链,方便! 9 人参与回答 夫唯·搜外网创始人,专注SEO和小程序李盛辉、袭明、虚子雨、房华帅、实名等 8 人赞同该回答一呼百应 的百度索引量这么大,之前有一个同学是搜了网的SEO总监,一起去参加了百度的高级站长大会,他提到的问题和你类似。就是百度的索引量过亿,但Site的数值却才1千万,我刚才看了下,目前还是一千万左右。百度工程师在场的回复是,这是百度site数值的误差,以索引量为准。但问题是,site数值决定排名和流量,即只有site有的网页才参与排名。这个问题,百度工程师没给予回复。目前site数值与索引量的问题还是没完全解决中。楼主的问题,我想可以参考下这个话题:http://ask.seowhy.com/question/8585人人网的 @殷祎东 发起的。这个话题里那些回复很有价值,研究下会有启发,特别是通过在索引量里设置各个栏目、目录的针对性查询。从而获知,收录不理想的栏目。楼主提到的一个特殊情况,即:企业发了很多信息,可能今天被抓取,第二天被删除的问题。我想,如果这个情况数量确实庞大,是否可以利用下这个牛x的Nofollow标签。我们可以对一些新注册的企业刚发布的N天之内的帖子,给予 nofollow。过了N天,这个帖子如果没被删除,则代表其质量过了贵网站的审核期,然后可以让蜘蛛抓取了。这样利用nofollow来协调,有很多好处。望多加体会。
|
支持 0
反对 0
举报
2022-03-16 10:11
一呼百应 的百度索引量这么大,之前有一个同学是搜了网的SEO总监,一起去参加了百度的高级站长大会,他提到的问题和你类似。就是百度的索引量过亿,但Site的数值却才1千万,我刚才看了下,目前还是一千万左右。
百度工程师在场的回复是,这是百度site数值的误差,以索引量为准。但问题是,site数值决定排名和流量,即只有site有的网页才参与排名。这个问题,百度工程师没给予回复。目前site数值与索引量的问题还是没完全解决中。 楼主的问题,我想可以参考下这个话题:http://ask.seowhy.com/question/8585 人人网的 @殷祎东 发起的。这个话题里那些回复很有价值,研究下会有启发,特别是通过在索引量里设置各个栏目、目录的针对性查询。从而获知,收录不理想的栏目。 楼主提到的一个特殊情况,即:企业发了很多信息,可能今天被抓取,第二天被删除的问题。 我想,如果这个情况数量确实庞大,是否可以利用下这个牛x的Nofollow标签。 我们可以对一些新注册的企业刚发布的N天之内的帖子,给予 nofollow。过了N天,这个帖子如果没被删除,则代表其质量过了贵网站的审核期,然后可以让蜘蛛抓取了。 这样利用nofollow来协调,有很多好处。望多加体会。 |
支持 0
反对 0
举报
2022-03-16 10:49
索引量亿,那当然索引还真心不靠谱。我有网站Site有46个,但是索引却只有2个。到底哪个准,还真说不清楚。
对于数据量如此之大来看,把握质量和重复内容都是B2B网站的难点。 【索引下降原因】我觉得是 没有实际内容、title相同的页面,例如列表页。 重复的内容,由于同类企业发布的信息,30%的内容重复不为过。一呼百应的每天发布率那么高,同类行业非常多,企业发布的信息几乎都是互联网相互抄袭,同时发布在一呼百应的几率也很大。 非法页面,B2B网站审核机制可以避免一些,用敏感词禁止。对于审核在如此在的发布量前提下,漏网之鱼不少。产生的404、500页面,提交百度也无补于事。论坛也会发生同类的问题,帖子在被收录后,才进行审核删除。很难避免的一个问题。 个人想到的方法: 1、尽量完善自身网站的审核机制,尽量避免产生这类页面。 2、多在站内企业后台发布系统中做提示,设置带“*”的填写项,尽量增加相应的创意设计。 3、对于审核删除产生的404页面,可以在Robots内建立一个:Disallow: / 相应禁止蜘蛛再次浪费。页面删除也尽量不要留有入口。 (PS。只能说尽量这个词,内容审核方面,目前就连百度也无法完美的做到垃圾内容一个都不收录的程度) 目前我也是B2B网站,但是索引与site的比例也在增加,由于我这边网站每天的企业发布量并不是很多,审核还行。但是重复内容却是目前的难题,毕竟企业行业都相同。也在此请教一呼百应的运营:【你们是如何避免企业发布的内容大量重复的问题呢?】 |