1-5 开发环境安装
1.开发环境安装
Python是目前机器学习主流的程序语言,可以直接在本机安装开发环境,亦能使用云端环境,首先介绍本机安装的程序,建议依照以下顺序安装。
(1)安装Anaconda:建议安装此软件,它内含Python及上百个常用工具包。用户可先至https://www.anaconda.com/products/individual下载安装文件,在Windows操作系统安装时,建议执行到图1.9所示画面时,将两者都勾选,就可将安装路径加入至环境变量Path内,这样就能保证在任何目录下均可执行Python程序。Mac/Linux系统则须自行修改登录文件(Profile),增加Anaconda安装路径。
图1.9 Anaconda安装注意事项
(2)安装TensorFlow最新版:Windows操作系统安装时,运行cmd命令,开启DOS窗口,Mac/Linux则须开启终端机,输入:
pip install TensorFlow
注意:此指令同时支持CPU及GPU,但要支持GPU须另外安装驱动程序及SDK。
(3)测试:安装完成,在DOS窗口或终端机内,输入python,进入交互式环境,再输入以下指令进行测试:
> import tensorflow
> exit()
①若出现下列错误:
from tensorflow.python._pywrap_tensorflow_internal import *
ImportError:DLL load failed:The specified module could not be found.则可能是Windows操作系统较旧,须安装MSVC 2019 runtime。
②如果还是出现DLL cannot be loaded.,也可使用Anaconda提供的指令来安装。
conda install tensorflow。
③注意:若安装Python V3.7或更旧版,则只能安装TensorFlow 2.0.0版或以下版本。
(4)若要支持GPU,则还需安装CUDA Toolkit、cuDNN SDK,只能安装TensorFlow支持的版本,请参考TensorFlow官网说明[3],如图1.10所示。
图1.10 TensorFlow支持的CUDA Toolkit版本
注意:目前只支持NVIDIA独立显卡,若是较旧型的显卡,则必须查阅驱动程序搭配的版本信息请参考NVIDIA官网说明[4],如图1.11所示。
图1.11 CUDA Toolkit版本与驱动程序的搭配
(5)提醒各位读者,低端的显卡,若不能安装TensorFlow支持的版本,就不用安装CUDA Toolkit、cuDNN SDK了,因为显卡内存过小,执行TensorFlow时常常会发生内存不足(OOM)的错误,徒增困扰。
(6)CUDA Toolkit、cuDNN SDK安装成功后,将安装路径下的bin、libnvvp加入至环境变量Path中,如图1.12所示。
图1.12 将bin、libnvvp加入Path中
(7)安装若有其他问题,可参考笔者的博客文章“Day 01:轻松掌握Keras”[5]。
2.云端环境的开通
我们再来谈谈云端环境的开通,Google、AWS、Azure都提供机器学习的开发环境,这里介绍免费的Google云端环境——Colaboratory,须具备Gmail账号才能使用,其具以下特点。
(1)常用的框架均已预安装,包括TensorFlow。
(2)免费的GPU:NVIDIA Tesla K80 GPU显卡,含12GB内存,设置合理。
(3)它在使用时实时开通Docker Container,限连续使用12小时,超时的话虚拟环境会被回收,所有程序、数据一律会被删除。
开通程序如下。
(1)使用Google Chrome浏览器,进入云端硬盘(Google Drive)接口。
(2)建立一个目录,如“0”,并切换至该目录,如图1.13所示。
图1.13 新建目录
(3)在屏幕中间右击,选择“更多”>“关联更多应用”选项,如图1.14所示。
图1.14 连结应用程序
(4)在搜索栏输入“Colaboratory”,找到后单击该App,单击“Connect”按钮即可开通,如图1.15和图1.16所示。
图1.15 搜索“Colaboratory”
图1.16 开通“Colaboratory”
(5)开通后,即可开始使用,可新增一个“Colaboratory”的文件,如图1.17所示。
图1.17 新增“Colaboratory”文件
(6)Google Colaboratory会自动开启虚拟环境,建立一个空白的Jupyter Notebook文件,后缀为ipynb,几乎所有的云端环境及大数据平台Databricks都以Notebook为主要使用接口,如图1.18所示。
图1.18 自动建立空白Jupyter Notebook文件
(7)或者直接以鼠标双击Notebook文件,也可以自动开启虚拟环境,进行编辑与执行。本机的Notebook文件也可以上传至云端硬盘,选择使用完全不用转换,非常方便。
(8)若要支持GPU可设定运行环境使用GPU或TPU,TPU为Google发明的NPU,如图1.19所示。
图1.19 设定运行环境使用GPU或TPU
(9)“Colaboratory”相关操作,可参考官网说明[6]。
注意:本书所附的范例程序,一律为Notebook文件,因为Notebook可以使用Markdown语法撰写美观的说明,包括数学公式,另外,程序也可以单独执行,便于讲解,相关的用法可以参考Jupyter Notebook:An Introduction [7]。