Corpora – коллекция небольших наборов данных для тестирования прототипов

Corpora - набор небольших наборов данных для ваших проектов

Часто при разработке и тестировании приложений или прототипов необходимо использовать данные. Иногда хочется сделать что-то по-настоящему странное и новое.

Часто при разработке и тестировании приложений или прототипов необходимо использовать данные. Иногда хочется сделать что-то по-настоящему странное и новое.

Corpora – это коллекция небольших наборов данных в json-файлах, которые подойдут как раз для таких случаев. Некоторые из наборов данных: животные, цвета, компании и еда.

Этот проект является набором статических данных, которые являются потенциально полезными в создании необычных проектов. Часто при разработке проекта необходимо получить доступ к большому  количеству прилагательных. Так, от проекта к проекту пополнялся файл с данными adjs.json.

Все наборы данных разбиты по типам, например: животные, архитектура, цвета, компании, еда, игры.

Фрагмент раздела проекта Corpora на GitHub.
Фрагмент раздела проекта Corpora на GitHub.

Собирая такие наборы данных, автор проекта Дариус Каземи (Darius Kazemi) из Бостона хочет помощь в быстром прототипировании проектов. Например, можно начать с использования файла с существительными nouns.json, чтобы проверить работоспособность идеи, после чего данные можно заменить на более сложные наборы.

Также такие данные могут быть использованы в образовательных целях. Дариус надеется, что студенты смогут отметить его проект и выберут интересные источники данных, чтобы объединиться для создания прототипов.

Так как данные размещены на GitHub, то любой желающий может использовать их для своих проектов, а также свободно пополнять эти наборы данных.

Наборы данных Corpora на GitHub.

Будьте с нами на связи, независимо от алгоритмов

Telegram-канал E-mail рассылка RSS-рассылка
Как победить алгоритмы: прочитай инструкции, как настроить приоритетный показ материалов в социальных сетях и подключить RSS-ленту.