支持 0
反对 0
举报
2022-03-16 05:41
百度并不是去爬你网站的根目录。
Robots协议是所有搜索引擎需要遵守的协议,因为网站是个人或者企业拥有的,所以就有属于个人或者企业私有的内容,所有权拥有者有权不对外开放。所以robots就是这样的规定,例如:支付宝页面,网银页面等等。 说这些只为证明,搜索引擎的抓取系统,例如百度蜘蛛就必须对任何一个域名的robots进行访问。 返回正题:百度只为了爬取,www。XXX。com/robots.txt这个URL。 网站地图也是一样,www。XXX。com/Sitemap。html、txt、xml这3种形式的URL。 百度蜘蛛爬取并不是去爬根目录。其实目录结构也正是URL的结构。但是蜘蛛并不能进入网站空间 |