Цель
На портале data.gov.ru накоплен огромный объём данных которые присутствуют там в разном качестве. Необходимо иметь возможность проверять качество этих данных и иметь удобный доступ, как к реестру наборов данных, так и к самим данным.
Задача
- выбрать язык программирования Python / R или иной, на выбор
- разработать библиотеку для доступа к данным на выбранном языке программирования
- выгрузить все описания наборов данных и организаций и сохранить в базе MongoDB
- [дополнительно] выгрузить все наборы данных и сохранить в виде файлов.
Требования
- открытый исходный код в Github под свободной лицензией
- открытые данные под лицензией Creative Commons
Пожелания
Оценки трудоёмкости
Ожидаемое время на задачу не более 3 дней
Вспомогательные материалы:
Вопросы
Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче