上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.1.3 Pandas的优势
Pandas主要面向数据处理与分析,其优势主要表现在7个方面,具体如下。
(1)相比 NumPy仅支持数字索引,Pandas的两种数据结构均支持标签索引,所以Pandas具有便捷的数据读写操作功能。
(2)类比 SQL的 join和 groupby功能,Pandas 可以很容易实现这两个核心功能,实际上,SQL的绝大部分操作在Pandas中都可以实现。
(3)类比 Excel 的数据透视表功能,Excel 中最为强大的数据分析工具之一是数据透视表,这在Pandas中也可轻松实现。
(4)自带正则表达式的字符串向量化操作,可以对 Pandas 中的一列字符串进行函数操作。
(5)Pandas具有丰富的时间序列向量化处理接口。
(6)Pandas具有常用的数据分析与统计功能,包括基本统计量、分组统计分析等。
(7)Pandas集成Matplotlib的常用可视化接口,无论是Series还是DataFrame,均支持面向对象的绘图接口。
正是基于这些强大的数据分析与处理能力,Pandas还有数据处理“瑞士军刀”的美称。