Back to top

Python网络爬虫

Python网络爬虫

TP311.561/4317
高等职业教育“互联网+”新形态教材
龚卫, 郭嗣鑫主编
北京 电子工业出版社 2024
978-7-121-46851-3
234页 26cm
软件工具 程序设计
5
中文图书
高等职业教育“互联网+”新形态教材
本书内容包括: 第一部分是爬取静态网页, 由三个学习情境讲述: 使用Requests+BeautifulSoup4+CSV, 使用Mechanize+BeautifulSoup4+CSV, 使用Scrapy+XPath+MySQL爬取数据。第二部分是爬取动态网页, 使用两个学习情境描述: 使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取数据。第三部分是爬取APP数据由使用Fiddler+Requests爬取新闻类APP接口数据描述。第四部分反爬虫策略及解决办法。由常见反爬虫策略及解决办法, 处理输入式验证码校验讲述。第五部分是爬虫优化策略, 讲述了Scrapy+Redis分布式爬取数据。
1
1
龚卫, 郭嗣鑫主编. Python网络爬虫[M]. 北京 电子工业出版社 2024. 点此复制

馆藏地址

条形码目前状态卷册号馆藏地址架位信息
H412908在馆徐汇中文书库正在处理