Python网络爬虫

预约

Python网络爬虫

索取号 TP311.561/4317

丛编题名高等职业教育“互联网+”新形态教材

作者龚卫, 郭嗣鑫主编

出版项北京电子工业出版社 2024

标准编号 978-7-121-46851-3

载体信息 234页 26cm

论题主题软件工具程序设计

版本及来源 5

文献类型中文图书

丛书名高等职业教育“互联网+”新形态教材

内容提要本书内容包括: 第一部分是爬取静态网页, 由三个学习情境讲述: 使用Requests+BeautifulSoup4+CSV, 使用Mechanize+BeautifulSoup4+CSV, 使用Scrapy+XPath+MySQL爬取数据。第二部分是爬取动态网页, 使用两个学习情境描述: 使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取数据。第三部分是爬取APP数据由使用Fiddler+Requests爬取新闻类APP接口数据描述。第四部分反爬虫策略及解决办法。由常见反爬虫策略及解决办法, 处理输入式验证码校验讲述。第五部分是爬虫优化策略, 讲述了Scrapy+Redis分布式爬取数据。

复本数 1

在馆情况 1

预约情况无

引文龚卫, 郭嗣鑫主编. Python网络爬虫[M]. 北京电子工业出版社 2024.

点此复制

馆藏地址

条形码	目前状态	卷册号	馆藏地址	架位信息
H412908	在馆		徐汇中文书库	正在处理