Python网络爬虫
TP311.561/4317
高等职业教育“互联网+”新形态教材
龚卫, 郭嗣鑫主编
北京 电子工业出版社 2024
978-7-121-46851-3
234页 26cm
软件工具 程序设计
5
中文图书
高等职业教育“互联网+”新形态教材
本书内容包括: 第一部分是爬取静态网页, 由三个学习情境讲述: 使用Requests+BeautifulSoup4+CSV, 使用Mechanize+BeautifulSoup4+CSV, 使用Scrapy+XPath+MySQL爬取数据。第二部分是爬取动态网页, 使用两个学习情境描述: 使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取数据。第三部分是爬取APP数据由使用Fiddler+Requests爬取新闻类APP接口数据描述。第四部分反爬虫策略及解决办法。由常见反爬虫策略及解决办法, 处理输入式验证码校验讲述。第五部分是爬虫优化策略, 讲述了Scrapy+Redis分布式爬取数据。
1
1
无
龚卫, 郭嗣鑫主编. Python网络爬虫[M]. 北京 电子工业出版社 2024.
点此复制
馆藏地址
条形码 | 目前状态 | 卷册号 | 馆藏地址 | 架位信息 |
---|---|---|---|---|
H412908 | 在馆 | 徐汇中文书库 | 正在处理 |