填空题
robots.txt文件必须放置在一个站点的()目录下,且文件名必须小写。
根
填空题 网络爬虫时一种按照一定的规则,()请求万维网站并提取网络数据的程序或脚本。
填空题 当网络爬虫访问网站时,会优先检查该站点的根目录下是否存在()文件。
填空题 robots.txt文件是()访问网站时要查看的第一个文件,它会限制网络爬虫的访问范围。