
前言
PREFACE
“数字经济”时代,数据资源已经成为互联网企业经营的生产要素,而获取数据资源并基于此产出有价值的数据,已成为企业提升核心竞争力的关键。企业能够收集、获取的数据越多,越有可能在行业中占据优势地位。行业的发展带动了岗位需求的增长,工作中对网络爬虫技术的需求越来越多,爬虫工程师岗位涌现。网络爬虫技术与数据分析、数据挖掘、人工智能等技术紧密关联,是从互联网上批量获取数据的重要技术之一,网络爬虫、数据采集等课程也成为众多高校大数据相关专业的重要课程。
Python语言因其简单、易读、可扩展的特性,在编写爬虫程序方面有特别的优势。本书以Python语言为工具来介绍爬虫技术,读者无须掌握太多技术就可以快速上手,并能快速看到成果。
第2版教材与第1版教材的区别
结合近几年Python语言的发展情况和广大读者的意见反馈,本书在保留第1版原书特色的基础上,进行了全面的升级,修订的主要内容如下。
·体例结构由章节式修改为项目任务式。
·将Python版本由Python 3.6.0升级为Python 3.8.5;将MySQL版本由MySQL 5.6.39升级为MySQL 8.0.13;将MongoDB版本由MongoDB 3.4升级为MongoDB 5.0.13。
·每个项目中增设了项目背景、思维导图、思考题。
·项目1中新增了PyCharm的配置等内容。
·任务2.1由介绍Python网络编程更新为介绍网页基础知识。
·项目4新增了图片数据的获取方法。
·更新了项目5和项目6的项目案例。
·更新了全书的实训和课后习题。
本书特色
本书全面贯彻党的二十大报告精神,坚持以为党育人、为国育才为己任,以社会主义核心价值观为指引,尊重人才培养时代性、规律性、创造性,内容契合“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能等级证书(中级)考核标准。本书从初学者的角度出发,以项目为导向,将Python爬虫常用技术和真实项目相结合,循序渐进地讲解学习网络爬虫必备的基础知识,以及一些爬虫库、框架的基本用法。本书设计时以应用为中心,围绕真实项目展开,让读者明确如何利用所学知识来解决问题,并可通过实训和课后习题巩固所学知识,使读者真正理解并能够应用所学知识。本书大部分项目紧扣任务需求展开,不堆积知识点,着重于思路的启发与解决方案的实施。通过从任务需求到实现这一完整工作流程的体验,读者将真正理解与掌握Python网络爬虫技术。
本书适用对象
·开设有网络爬虫、数据采集课程的高校的教师和学生。
·Python程序开发相关人员。
·进行数据采集应用研究的科研人员。
·“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能等级证书(中级)考生。