填空题
网站通过一个文件()来告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
robots.txt
填空题 现在网站会采取一些()措施来阻止网络爬虫的不当爬取行为。
填空题 待下载网页集合就是()URL 列队中的网页,这些网页即将被爬虫下载。
填空题 robots.txt文件必须放置在一个站点的()目录下,且文件名必须小写。