MNIST database of handwritten digits
Материал из MachineLearning.
(Новая: === Содержание базы === База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестировани...) |
м (викификация) |
||
Строка 1: | Строка 1: | ||
- | + | == Содержание базы == | |
- | База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестирования. MNIST является укороченной версией базы NIST. Кроме того изображения в базе нормированы по размеру и отцентрованы внутри изображения. | + | [[Базы данных изображений|База]] MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестирования. MNIST является укороченной версией базы NIST. Кроме того изображения в базе нормированы по размеру и отцентрованы внутри изображения. |
База отлично подходит для тех, кому необходимо опробовать методы обучения на реальных данных без дополнительных затрат усилий на форматирование и предобработку. | База отлично подходит для тех, кому необходимо опробовать методы обучения на реальных данных без дополнительных затрат усилий на форматирование и предобработку. | ||
- | + | ||
- | База состоит из 4 файлов: непосредственно изображений и меток, содержащих цифры соответствующие изображениям для обучающей и для тестовой выборки. | + | == Формат изображений == |
+ | База состоит из 4 файлов: непосредственно изображений и меток, содержащих цифры соответствующие изображениям для обучающей и для тестовой выборки. | ||
В базе содержатся изображения рукописных цифр в градациях серого, размером 20х20 пикселей вписанные в квадрат 28х28, центрование с помощью поиска центра масс. | В базе содержатся изображения рукописных цифр в градациях серого, размером 20х20 пикселей вписанные в квадрат 28х28, центрование с помощью поиска центра масс. | ||
База записана в формате IDX. Все данные записаны ''в формате high endian'', что не типично для не-intel процессоров. | База записана в формате IDX. Все данные записаны ''в формате high endian'', что не типично для не-intel процессоров. | ||
- | + | ||
+ | == Условия распространения == | ||
База распространяется свободно. | База распространяется свободно. | ||
- | + | ||
+ | == Ссылки == | ||
* [http://yann.lecun.com/exdb/mnist/index.html База MNIST на домашней странице Yann LeCun] | * [http://yann.lecun.com/exdb/mnist/index.html База MNIST на домашней странице Yann LeCun] | ||
- | * М-файл для Matlab, реализующий загрузку базы MNIST [[Media:readMNIST.zip|М-файл, ZIP ]] | + | * М-файл для Matlab, реализующий загрузку базы MNIST [[Media:readMNIST.zip|М-файл, ZIP ]] |
[[Категория:Базы данных изображений]] | [[Категория:Базы данных изображений]] |
Текущая версия
Содержание |
Содержание базы
База MNIST содержит 60000 образцов рукописных цифр для обучения и 10000 для тестирования. MNIST является укороченной версией базы NIST. Кроме того изображения в базе нормированы по размеру и отцентрованы внутри изображения.
База отлично подходит для тех, кому необходимо опробовать методы обучения на реальных данных без дополнительных затрат усилий на форматирование и предобработку.
Формат изображений
База состоит из 4 файлов: непосредственно изображений и меток, содержащих цифры соответствующие изображениям для обучающей и для тестовой выборки. В базе содержатся изображения рукописных цифр в градациях серого, размером 20х20 пикселей вписанные в квадрат 28х28, центрование с помощью поиска центра масс. База записана в формате IDX. Все данные записаны в формате high endian, что не типично для не-intel процессоров.
Условия распространения
База распространяется свободно.
Ссылки
- База MNIST на домашней странице Yann LeCun
- М-файл для Matlab, реализующий загрузку базы MNIST М-файл, ZIP