Часто при разработке и тестировании приложений или прототипов необходимо использовать данные. Иногда хочется сделать что-то по-настоящему странное и новое.
Corpora – это коллекция небольших наборов данных в json-файлах, которые подойдут как раз для таких случаев. Некоторые из наборов данных: животные, цвета, компании и еда.
Этот проект является набором статических данных, которые являются потенциально полезными в создании необычных проектов. Часто при разработке проекта необходимо получить доступ к большому количеству прилагательных. Так, от проекта к проекту пополнялся файл с данными adjs.json.
Все наборы данных разбиты по типам, например: животные, архитектура, цвета, компании, еда, игры.
Собирая такие наборы данных, автор проекта Дариус Каземи (Darius Kazemi) из Бостона хочет помощь в быстром прототипировании проектов. Например, можно начать с использования файла с существительными nouns.json, чтобы проверить работоспособность идеи, после чего данные можно заменить на более сложные наборы.
Также такие данные могут быть использованы в образовательных целях. Дариус надеется, что студенты смогут отметить его проект и выберут интересные источники данных, чтобы объединиться для создания прототипов.
Так как данные размещены на GitHub, то любой желающий может использовать их для своих проектов, а также свободно пополнять эти наборы данных.
Наборы данных Corpora на GitHub.