Pandas入门与实战应用:基于Python的数据分析与处理
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1.2 Pandas的主要数据结构

Pandas的主要数据结构有两种,分别是Series与DataFrame。

Series是一维数组,与 NumPy中的一维Array类似。二者与 Python的基本数据结构 List 也很相近,其区别是:List 中可以存储不同的数据类型,而Array 和 Series 中只允许存储相同的数据类型,这样可以更有效地使用内存,提高运算效率。

DataFrame是二维数组,非常接近Excel电子表格或者类似MySQL数据库的形式。它的竖行称为列(columns),横行称为行(index),也就是说数据的位置是通过columns和index来确定的。可以将DataFrame理解为Series的容器。

这两种数据结构可以处理金融、统计、社会科学、工程等领域里的绝大多数数据。