在第1章中提到,以Nvidia为代表的GPU厂商和以Google为代表的互联网云厂商,都研发了面向机器学习算法做了优化设计的并行运算硬件。那么,开发者应当如何编写程序,才能够有效调用这些并行运算硬件,发挥其最大作用呢?
本章将从最简单的并行计算程序开始,分析如何利用GPU等具备并行运算能力的硬件,来提升机器学习算法的运行效率。
注意:在本章中会涉及一些程序代码,其学习难度不会超过大学一年级C语言程序设计课程的学习难度。