Комментарии 6
Хотим ли мы узреть отечественный Ванус?)
для Моники логичнее было бы выбрать не manus, а oris.
компания мало что рассказала о своей базовой технологии
Зато немного рассказали особо интересующиеся:
https://x.com/jianxliao/status/1898861051183349870
https://gist.github.com/jlia0/db0a9695b3ca7609c9b1a08dcbf872c9
Что-то в последнее время много слов о б интеллекте новых ИИ и новых фичах, но до сих пор я не нашёл следующего:
1) Перевод исходного документа с сохранением форматирования и дизайна. Ну или хотя бы с попыткой сохранения. Переводить-то чатботы научились, но выдают перевод в виде сообщения в чате, а не обработанного файла.
2) Решение нетривиальных математических задач. Например, задача о козе в круге - все чатботы, даже в режиме рассуждения, доводят её до трансцендентного уравнения, разводят лапками - мол, такое решить слишком сложно (хоть бы один сказал прямо: такие уравнения аналитически нерешаемы!) и давай решим численно. То, что строгое решение этой задачи было найдено, им неведомо. Попытаться найти решение своими силами (даже с подсказками типа "решай через вышмат и не парься, что это слишком сложно, ты же гениальный ИИ") - не, это мы не проходили, это нам не задавали.
3) Построение графиков и геометрических чертежей. Китайцы прямо говорят, что они чертить чертежи не умеют. Grok в продолжение предыдущей задачи просто нарисовал козу. Ещё кто-то нарисовал некий фэнтезийный график, явно используя для этого ии-генератор картинок, хотя это очевидно не требуется.
4) Нормальное запоминание контекста. То ли им токенов не хватает, то ли что, но все чатботы теряют мелкую фактику.
5) Рассуждение без математики. В рассуждающем режиме они пытаются на любой вопрос дать ответ как на физико-математическую задачу. Его просишь смоделировать боксёрский поединок, он произвольно раскидывает по ответу числа типа силы давления, площади контакта и угла наклона. Вообще, моделирования реальных процессов даются чатботам плохо.
6) Использование внешних источников информации и вообще всего внешнего относительно себя. Например, ни один ИИ не догадался, что для игры в шахматы нужно подключиться к Стокфишу. Алиса не умеет запускать сторонние приложения и регулировать громкость звука на смартфоне.
7) Поиск по видео, а не по текстам. Не знаю, как это реализовать, но сейчас контент массово уходит в видео, и очень хотелось бы, чтобы, условно говоря, на запрос "какой в айфоне чип Bluetooth" ИИ нашёл видео какого-нибудь пакистанского блогера, который разобрал айфон и показал этот чип крупным планом, хотя ни один текстовый обзор этой инфы не содержит.
моделирования реальных процессов даются чатботам плохо
Так и людям даются плохо, кто такую задачу решит из людей? Один на миллион? тем более бесплатно.
Алиса не умеет запускать сторонние приложения и регулировать громкость звука на смартфоне.
Это политики безопасности Android, они обоснованны.
ИИ нашёл видео какого-нибудь пакистанского блогера
Ютуб не даст ИИ сканировать свои видео скорее всего.
А так Deepseek подсказал как искать какие ключевые слова использовать: Введите в поисковой строке YouTube фразы на русском или английском языке, например: "Разборка iPhone процессор"
И первое видео по запросу с процессором крупным планом
https://www.youtube.com/shorts/_uUaKK4Nhg0
(Снятие и зачистка процессора iPhone 15 Pro a17)
Думаю сам Ютуб делает это в той или иной форме и по запросу подбирает плейлист чтобы удержать пользователя. Выдает больше контента, чем запрошено изначально.
Уже сделали open source версию https://github.com/nikmcfly/ANUS
Китайский стартап Monica представляет AI-агента Manus для решения сложных задач