Кажется, что мы постепенно входим в эпоху, когда наличие продукта опция, а не обязательное условие для получения инвестиций.
Сначала был Thinking Machines Lab (https://t.me/startuphunt/667)- $2 млрд на старте. Про реальные успехи пока особенно не слышно, хотя несколько человек уже вернулись обратно в OpenAI, что само по себе забавно. Потом Safe Superintelligence Inc. - тоже $2 млрд, оценка $32 млрд, продукта по сути нет, в интервью у Lex Fridman звучало красиво, но очень абстрактно. Mistral AI (https://t.me/startuphunt/838) уже что-то выкатывает и активно конкурирует.
И вот новая история. Ineffable Intelligence Ltd. поднимает $1 млрд при оценке около $4 млрд. Раунд, по слухам, ведёт Sequoia Capital, могут участвовать Alphabet Inc., Nvidia Corp. и Microsoft Corp.. Продукта нет, основан в ноябре.
И опять важен не продукт, а кто стоит за этим. Основатель Дэвид Сильвер, один из ключевых людей в Google DeepMind, человек, который фактически построил современные подходы к reinforcement learning. Это та самая история, когда модель учится не по книжке, а через опыт. Сделал правильно получил "конфетку", глупость получил "щелбан". И постепенно начал делать что-то лучше всех.
Именно этот подход лежал в основе AlphaGo, который в 2016 году обыграл чемпиона мира по го. Потом был AlphaZero, уже шахматы и сёги. А ещё AlphaStar, который играл в StarCraft II, где информации неполная и всё сложнее, чем в настольной игре.
Почему это сейчас вдруг стало так важно? Потому что данные для обучения в привычном виде заканчиваются. Интернет уже почти “съеден”. Следующий этап - модели должны учиться как человек после школы: выходить в реальный мир, пробовать, ошибаться, получать фидбек. Reinforcement learning становится центральным механизмом.
В DeepMind Сильвер не просто применял RL, они двигали саму теорию. Например, подход DiscoRL, когда функцию потерь, которая управляет обучением, заменяют нейросетью, способной самоулучшаться через агентов. Это уже мета-уровень обучения.
Что именно будет делать Ineffable пока туманно. Неясно, будут ли они строить универсальных агентов, инфраструктуру для RL или что-то совсем новое, но сам факт, что и Google, и Microsoft готовы инвестировать, намекает: это не фронтальная конкуренция с их LLM, а скорее фу��даментальный слой под будущие системы.
