移动端AI与ML应用开发:基于iOS和Android
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.2 数据:Fashion MNIST

学习和基准算法的基础数据集之一是来自Yann LeCun、Corinna Cortes和Christopher Burges修改后的国家标准与技术研究所(MNIST)数据库。该数据集由70000个手写数字(从0到9)的图像组成。图像为28×28灰度。

Fashion MNIST(https://oreil.ly/GmmUB)被设计为具有相同记录数、相同图像尺寸和相同类别的MNIST的直接替代品——因此,不是数字0~9的图像,Fashion MNIST包含10种不同类型服装的图像。

你可以在图2-9中看到数据集内容的示例。在这里,三行专用于每种服装类型。

图2-9:Fashion MNIST数据集

其中有各种各样的衣服,包括衬衫、裤子、连衣裙和许多类型的鞋子!你可能会注意到,它是灰度的,因此每张图片都由一定数量的像素组成,其值介于0~255之间。这使得数据集更易于管理。

你可以从图2-10的数据集中看到特定图像的特写。

图2-10:Fashion MNIST数据集中的图像特写

与任何图像一样,它也是一个矩形的像素网格。在这种情况下,网格大小为28×28,并且每个像素都是一个介于0~255之间的值,如前所述。