Бегтин Иван Викторович @ibegtin
Пользователь
Information
- Rating
- Does not participate
- Location
- Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity
Specialization
Chief Technology Officer (CTO), Data Engineering
Lead
Python
Database
High-loaded systems
MongoDB
Git
Проработать ТЗ можно было бы очень давно.
Проблема именно в способе. Они часто публикуют:
— сканы
— страницы закрытые каптчей
— сайты только под Internet Explorer
И много другой пакости формально в рамках закона.
По тому что они говорили — diff'ы им ненужны. Просят финансирование и только.
Поэтому открытые данные работают только при наличии сильного общественного прессинга который мы создаём.
Storify также интересный проект благодаря их API — dev.storify.com/api/summary
В принципе на открытых данных очень много стартапов которыми пользуются крупные медиа и бизнес — Socrata, Factual, Freebase, Enigma.io, Infochimps, DataMarket и десятки других
Задач для обработки больших данных действительно много и я могу лишь посоветовать посмотреть на успешные стартапы в этой области, например, тут — angel.co/data-mining
Основных монетизаций несколько:
1. Продукт и инструменты для специалистов — это путь Tableau, Good Data и так далее.
2. Целевые решения для конкретных направлений бизнеса — Aster Data и др.