覆盖超星/学习通/尔雅等10+学习平台 | 历年真题+答案解析+模拟试卷 | 免费下载 实时更新 精准检索
广告示例

想要快速找到正确答案?

立即关注 九八五题库微信公众号,轻松解决学习难题!

随机漂浮广告
超星学习通Python爬虫技术作业答案

作业论文指导

扫码关注
作业论文指导,轻松解决学习难题!

超星学习通Python爬虫技术作业答案

Python爬虫技术

学校: 无

问题 1: 1. 谷歌浏览器开发者模式打开方式不正确的为()

选项:

  • A. F12

  • B. F11

  • C. 鼠标右击,点“检查”

  • D. Ctrl+Shift+I

答案: F11

问题 2: 2. 下列不属于浏览器开发者模式面板的为()

选项:

  • A. Elements

  • B. Console

  • C. Sources

  • D. headers

答案: headers

问题 3: 3. 关于谷歌浏览器开发者工具描述错误的是()

选项:

  • A. 元素面板可查看元素在页面的对应位置

  • B. 源代码面板可以查看HTML源码

  • C. 网络面板可以查看HTML源码

  • D. 网络面板可以查看HTTP头部信息

答案: 网络面板可以查看HTML源码

问题 4: 4. 爬虫爬取的是网站后台的数据。

选项:

答案: 错误

问题 5: 5. 下列robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着可以爬虫的网页

选项:

答案: 错误

问题 6: 6. 每个网站都有robots.txt文件

选项:

答案: 错误

问题 7: 7. 爬虫是手动请求万维网网站且提取网页数据的程序。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 8: 8. 通用爬虫用于将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 9: 1. 下列 Python库或模块中,支持正则表达式语法的是____。

选项:

  • A. bs4

  • B. lxml

  • C. re

  • D. json

答案: 请关注公众号【博学搜题】查看答案

问题 10: 2. 下列选取节点的表达式中,代表着从根节点开始选取的是____。

选项:

  • A. /

  • B. //

  • C. name

  • D. @

答案: 请关注公众号【博学搜题】查看答案

问题 11: 3. 下列选项中,属于非结构化数据的是:

选项:

  • A. 图像

  • B. HTML

  • C. XML

  • D. JSON

答案: 请关注公众号【博学搜题】查看答案

问题 12: 4. 下列选项中,属于结构化数据的是____。

选项:

  • A. 图像

  • B. 文本

  • C. 办公文档

  • D. JSON

答案: 请关注公众号【博学搜题】查看答案

问题 13: 5. 正则表达式字符集中,( )表示数字

选项:

  • A. \d

  • B. \D

  • C. \s

  • D. \w

答案: 请关注公众号【博学搜题】查看答案

问题 14: 6. python中,正则表达式需要引入的模式是( )

选项:

  • A. re

  • B. requests

  • C. os

  • D. bs4

答案: 请关注公众号【博学搜题】查看答案

问题 15: 7. 正则表达式“[^a-z]”,可以匹配下列的字符串为( )。

选项:

  • A. a

  • B. z

  • C. 2

  • D. m

答案: 请关注公众号【博学搜题】查看答案

问题 16: 8. 如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 17: 9. 创建 BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 18: 10. 在使用bs4库调用find()方法查找节点时,只能将字符串作为参数。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 19: 11. 路径表达式是唯一的,只能从根节点开始搜索。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 20: 12. re模块中的match方法是从字符串的开头对输入的正则表达式进行匹配。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 21: 1. 下列selenium库的方法中,通过元素名称进行多元素定位的是()

选项:

  • A. find_element_by_name

  • B. find_elements_by_name

  • C. find_elements_by_id

  • D. find_elements_by_class_name

答案: 请关注公众号【博学搜题】查看答案

问题 22: 2. 下列方法中,获取当前页渲染后的源代码是()

选项:

  • A. close()

  • B. quit()

  • C. page_source

  • D. title

答案: 请关注公众号【博学搜题】查看答案

问题 23: 3. 查看下面表单的示例程序:
...
若要使用WebDriver定位上述元素,可以使用如下()方法实现。

选项:

  • A. find_element_by_id

  • B. find_element_by_name

  • C. find_elements_by_link_text

  • D. find_elements_by_tag_name

答案: 请关注公众号【博学搜题】查看答案

问题 24: 4. seleinum支持浏览器的功能,可以直接被用来执行命令。

选项:

答案: 请关注公众号【博学搜题】查看答案

问题 25: 5. 通过driver的get()方法可以将页面的内容加载到浏览器的对象中,如果页面没有加载完,此方法会一直阻塞等待。

选项:

答案: 请关注公众号【博学搜题】查看答案



收藏
文章说明
©版权声明
本站提供的一切试卷均来自网上;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集,版权争议与本站无关。您必须在下载后的24个小时之内从您的设备中彻底删除。如有侵权请邮件与我们联系处理。敬请谅解!
评论留言

昵称

试卷网
试卷网
本站专注整合全网学习平台试卷资源,涵盖超星、学习通、尔雅、学起Plus、安徽继续教育、云上河开等平台的海量试题与答案,提供免费下载及在线查询服务。包含期末考试、模拟试题、章节练习等类型,覆盖大学、职业考试、继续教育等多领域,同步更新各平台最新试卷,助力高效备考与学习
  • 文章43261
  • 评论0
  • 微语1
最新评论