上QQ阅读APP看书,第一时间看更新
040 读取文本文件的数据并设置列类型
此案例主要通过在read_csv()函数中设置dtype参数值为指定的类型,实现读取以空格分隔数据的文本文件,并据此在创建DataFrame时设置列的数据类型。当在Jupyter Notebook中运行此案例代码之后,将设置股票代码列的数据类型为str,即将股票代码列的数据按照字符串的格式读取,而不是按照数字的格式读取,效果分别如图040-1和图040-2所示。
图040-1
图040-2
主要代码如下。
在上面这段代码中,pd.read_csv('myspace.txt',delim_whitespace=True,dtype={'股票代码': str})表示读取以空格分隔数据的文本文件(myspace.txt),并据此在创建DataFrame时设置股票代码列的数据类型为str;如果未设置dtype参数值,则股票代码列的数据类型默认是int64。
此案例的主要源文件是MyCode\H188\H188.ipynb。