会员
精通Scrapy网络爬虫
刘硕更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
刘硕
主页
同类热门书
最新上架
- 会员
算法训练营:入门篇(全彩版)
本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入了大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计9章。第1章讲解C++基础知识,涉及语法、数组、字符串、结构体和指针;第2章带读者感受算法之美,涉及算法复杂度、函数和递归;第3章讲解线性表的应用,涉及顺序表、链表、栈和队列,以及STL中的常用函数和容器;第4章讲解树的应用,涉及树、二叉树、二叉树遍历、哈夫曼树和二叉搜计算机9万字 - 会员
RISC-V体系结构编程与实践(第2版)
本书旨在介绍RISC-V体系结构的设计和实现。本书首先介绍RISC-V体系结构基础知识、实验环境搭建、基础指令集、函数调用规范与栈,然后讲解GNU汇编器、链接器与链接脚本、内嵌汇编代码,接着讨论RISC-V体系结构中的异常处理、中断处理与中断控制器、内存管理、高速缓存、缓存一致性、TLB管理、原子操作、内存屏障指令、合理使用内存屏障指令、与操作系统相关的内容、可伸缩矢量计算与优化,最后阐述RISC计算机26.2万字 Java Web动态网站开发(第2版·微课版)
全书将划分成二部分:第1—6章为第一部分,围绕JSP程序设计基础展开,包括JSP开发环境的搭建、JSP基本语法、JSP的内置对象、Java基本语法、JavaBean技术的应用等;第7—8章为第二部分,围绕实际项目展开,包括基于JSP+JavaBean+MySql技术框架的“天码行空企业网站”项目开发、基于JSP+Servlet+JavaBean+MySql技术框架的“孕婴服务中心网站”项目开发等。计算机8万字- 会员
剑指大数据:企业级数据仓库项目实战(金融租赁版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、计算机7.4万字 - 会员
Podman实战
本书主要介绍了如何构建、管理和运行容器,解释如何将人们在Docker中学到的技能轻松地转移到Podman上,以及如果你以前从未使用过容器引擎,你该如何轻松地学习使用Podman。本书还教你使用像pod这样的高级功能,并指导你构建准备在Kubernetes边缘或内部运行的应用程序。最后,本书解释了Linux内核中用于将容器与系统和其他容器进行隔离的所有安全功能。本书适用于希望了解、开发和使用容器的软计算机11.9万字 - 会员
区块链智能合约安全入门
《智能合约安全入门》从环境介绍,Solidity、web3基础和漏洞原理及利用方面,详细地介绍智能合约相关漏洞知识。其中,第一部分介绍了RemixIDE、Metamask以及geth等环境的安装和使用方法;第二部分介绍了solidity语言的基础知识与基本语法,以及web3的使用方法;第三部分重点讲解了智能合约常见漏洞的基本原理及其攻击方式,同时还增加了Ethernaut通关游戏的部分内容,以此计算机7.3万字 - 会员
TensorFlow程序设计
本书全面介绍TensorFlow2.x框架及其在深度学习中的应用,内容包括TensorFlow简介、Python语言基础、环境搭建与入门、TensorBoard可视化、多层感知机实现、卷积神经网络实现、循环神经网络实现、强化学习、迁移学习、生成对抗网络和GPU并行计算等。计算机7.9万字 - 会员
openGauss数据库开发实战
openGauss数据库是华为公司在多年数据库领域研发经验基础上开发的数据库产品,为企业级场景需求而设计。本书由浅入深地介绍了openGauss数据库的开发过程,主要内容包括openGauss数据库的安装和配置、体系结构和主要运行机制、GUC参数、用户管理和审计、数据类型、表和索引、SQL基础、常用函数、过程化SQL程序设计,以及数据库的备份与恢复等。本书通过实战帮助读者深入理解openGauss计算机9.5万字 - 会员
人人都能开发RPA机器人:UiPath从入门到实战
本书为UiPath的入门工具书。第1~3章介绍RPA与UiPath的基础知识;第4~5章依次介绍流程自动化基础知识与流程搭建的方法论,建议没有相关技术背景的读者详细阅读;第6~8章是UiPath流程开发的关键章,建议读者通读并跟练,便于加深记忆,熟练掌握相关知识,其中的关键知识可以根据章节索引,在实际开发时按需查阅;第9~10章介绍更深层次的云UiPathOrchestrator和机器人企业框架计算机11.2万字
同类书籍最近更新
- 会员
算法设计与分析:基于C++编程语言的描述
本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和C++编程实战。作者本着“易理解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造实例—算法描述—算法分析—C++实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和NP完全理论等9章内容。程序设计16.9万字 软件开发中的决策:权衡与取舍
本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可程序设计23.9万字