Pandas数据分析快速上手500招(微课视频版)
上QQ阅读APP看书,第一时间看更新

064 在读取Excel工作表数据时解析千分位符

此案例主要通过在read_excel()函数中设置thousands参数值,实现在读取Excel文件的工作表数据时自动解析千分位符。当在Jupyter Notebook中运行此案例代码之后,将自动解析Sheet1工作表的总手列和成交金额列的千分位符“,”,效果分别如图064-1和图064-2所示。

图064-1

图064-2

主要代码如下。

    import pandas as pd#导入pandas库,并使用pd重命名pandas
    #读取myexcel.xlsx文件的Sheet1工作表,并设置千分位符为','
    pd.read_excel('myexcel.xlsx',thousands=',', sheet_name='Sheet1')

在上面这段代码中,pd.read_excel('myexcel.xlsx',thousands=',',sheet_name='Sheet1')表示在读取myexcel.xlsx文件的Sheet1工作表时,指定','为千分位符。如果未设置thousands=',',则在执行pd.read_excel('myexcel.xlsx',sheet_name='Sheet1')之后,将把总手列和成交金额列的数据解析为字符串格式的object类型,而不是数值类型的int64(总手列)和float64(成交金额列)。

此案例的主要源文件是MyCode\H237\H237.ipynb。