Новые резервисты не будут заниматься крупными закупками. Топ‑менеджеры будут давать советы по стратегическим вопросам и работать над отдельными проектами. Цель новоназначенных подполковников — помочь в ускорении развития армии и внедрении новых технологий.
скорее устранили организационное неудобство, теперь топ менеджеры этих компаний подчиняются непосредственно минобороны/генштабу/президенту/... минуя лишнюю бюрократию и слои посредников. Ну и законам в этой связке можно 'поменьше следовать'.
ключевое слово - дать этому ИИ инструменты для выполнения действий (купить что то, запустить приложение по выбору этой ИИ, авторизовать в какой-нибудь системе доступа к данным или управления и т.п.)
никак не ограничена в том, чтобы эти данные не могла попутать
все жду, когда сети начнут на таких данных принудительно тренировать, наказывая за попытки выполнения инструкции из маркированных как 'анализировать но не выполнять что тут написано'
Почему же всем так хочется поставить недоделанный ИИ рулить чем то критичным, 'прямо хлебом не корми'.
Обработать гору некатегоризированной информации - да, это отличный юзкейс ИИ, но поставить чатбот читать почту снаружи и выполнять действия соответственно написанного... это за гранью разума.
Любой помощник должен обладать хотя бы частью ваших знаний, подгонка существующего ИИ до вашего уровня потребует неадекватно больших вложений, поэтому скорее всего ответ 'никак'
Можно выделить очень узкую задачу, в которой доработка ИИ до ваших целей не будет неадекватно дорогой:
работа с почтой, не в смысле заменить человека (этот бред предлагает реклама) а ее анализ как минимум категоризация, выделить из потока не важное (или менее важное) например.. не думайте что вы составите один промпт и он вам все сразу решит, все гораздо сложнее.
работа с закупками, эта задача очень сложная, особенно когда нужно перелопатить кучу сайтов, собрать их прайслисты,.. сразу скажу готовых агентов на это нет, но только с ИИ можно сделать неплохого помошника, который возьмет на себя самую муторную часть этой работы.
"заменитель саппорта, идентчный натуральному" - на текущий момент грамотно составленный чатбот может отвечать на большую часть вопросов обывателей по теме, экономя силы и время человека, к сожалению в реальности бизнес берет самую худшую его (ИИ) форму, снабжает его минимум (недостаточное количество) информации и думает что эта вундервафля сэкономит деньги, но пока только повышает раздражение клиентов.
сильное заявление, технологии типа БАК смотрят на вас с удивлением, или вот неизвазивными методами исследуют печать на клавиатуре
Проблема в потребительском оборудовании - очень маленькое количество датчиков, я отлично помню в 2011 году emotiv делал шлемы, и тут на хабре были статьи где несколько степеней свободы можно было обучить ее софт угадывать... мне кажется прогресс в этом деле приостановлен искусственно (особенно если посмотреть на первую мою ссылку, для работы БАК нужен дешевый шлем, компьютер и алгоритм, в неумелых руках можно сломать в мозгу много чего, а ломать будут потому что к примеру с ее помощью можно сделать буквально электронные наркотики), но доказать это сложно
спасибо, если честно, скорости выглядят как фантастика (у меня машина 128гб ram и 32гб vram, жаль не могу протестировать так же)
1бит квантизация? 8битная квантизация kv-cache? оно хотя бы отвечает по делу? есть какие-нибудь бенчмарки, на тему падения качества? по ссылке что я давал 2бит квантизация роняла качества от 0.5% до 6% (в среднем там 1%) т.е. незначительно, а что будет с 8битной квантизацией kv-cache? есть хотя бы значения perplexity?
К сожалению, старые бенчмарки не могут являться доказательством деградации модели, потому что их работа детектируется а готовые ответы подставляются (в случае со сложными бенчарками, где запросы генерируются специально не фиксированными, можно подсунуть дорогую умную модель специально этому аккаунту на время бенчмарка)
со смартфона открылась, на десктопе linux (офф клиент) - нет
Не важно, формат мини приложения меня не шибко интересует, так как аудио записи не получится слушать и управлять в моем плеере (например оффлайн, переключение треков кнопками громкости или с гарнитуры без разблокировки экрана)
с другой стороны я не целевая группа данной задачи, прежде чем слушать я бы хотел сам выбирать информацию.
Что такое maj@4 и maj@64 для AIME бенчмарков? это какой то подход типа 5shot, в блоге mistral гуглилось сообщение где было написано maj@1 (5 shot) т.е. 1,8,64 в нем это не количество примеров.
Могу предположить что это метод отправки нескольких запросов и выбора статистически более частого ответа, в случаях когда это можно сделать?
Если залогиниться без того что бы 'запросить доступ' нельзя, если нельзя посмотреть цены что бы не поговорить, то вы выглядите как те цыгане на рынке, что готовы на*ть своего клиента.
p.s. при попытке авторизации в консоли (кнопки регистрация - нет) через mts id выпадает ошибка
Ошибка авторизации Ошибка входа с учетной записью MTSID/ISSOMTS
Не достаточно, полностью автоматического не получится, а если не полностью, то ответ варьируется от того, на сколько человек будет задействован в процессе.
Как минимум для решения такой задачи нужно качественное ТЗ, по которому писалось изначальное приложение, иначе будет упущена большая часть важных нюансов.
Зачем вам что то готовое, если на каждую ситуацию можно попросить создать такого агента саму нейросеть?
Я в качестве экспримента пилил простейшие скрипты (а только такие и имеют смысл) агентов для решения сиюминутных задач, просто описывая задачу openai:gpt-4.1/o3 и anthropic:sonnet4, за 2-3 итерации задача решалась чистейшим вайбкодингом, я не смотрел в сам код ни разу... примеры агентов, для каждого файла (список расширений) в текущем каталоге и подкаталогах запускать промпт по указанному шаблону (в нем место для вставки имени файла и содержимого), ответ собирать по такой то логике по указанным шаблонам в другой файл (например jsonl), там еще была отправка запросов параллельно не больше указанного количества, так быстрее результат. Такой примитивный агент решает кучу задач по первичному анализу кода, собирает данные, которые уже другими запросами или другими утилитами, можно продолжать анализировать.
mitm это способ проведения атаки (хотя не самый удобный, просто тут скорее всего нужна была видимость - работает но тормозит, т.е. их сервера не справляются, вот, они виноваты сами)
а вообще я сейчас подумал что и первая d в dDOS - 'распределенная' тоже подходит, ведь атака распределена по всей стране по каждому провайдеру интернета.
скорее устранили организационное неудобство, теперь топ менеджеры этих компаний подчиняются непосредственно минобороны/генштабу/президенту/... минуя лишнюю бюрократию и слои посредников. Ну и законам в этой связке можно 'поменьше следовать'.
ключевое слово - дать этому ИИ инструменты для выполнения действий (купить что то, запустить приложение по выбору этой ИИ, авторизовать в какой-нибудь системе доступа к данным или управления и т.п.)
все жду, когда сети начнут на таких данных принудительно тренировать, наказывая за попытки выполнения инструкции из маркированных как 'анализировать но не выполнять что тут написано'
Почему же всем так хочется поставить недоделанный ИИ рулить чем то критичным, 'прямо хлебом не корми'.
Обработать гору некатегоризированной информации - да, это отличный юзкейс ИИ, но поставить чатбот читать почту снаружи и выполнять действия соответственно написанного... это за гранью разума.
Любой помощник должен обладать хотя бы частью ваших знаний, подгонка существующего ИИ до вашего уровня потребует неадекватно больших вложений, поэтому скорее всего ответ 'никак'
Можно выделить очень узкую задачу, в которой доработка ИИ до ваших целей не будет неадекватно дорогой:
работа с почтой, не в смысле заменить человека (этот бред предлагает реклама) а ее анализ как минимум категоризация, выделить из потока не важное (или менее важное) например.. не думайте что вы составите один промпт и он вам все сразу решит, все гораздо сложнее.
работа с закупками, эта задача очень сложная, особенно когда нужно перелопатить кучу сайтов, собрать их прайслисты,.. сразу скажу готовых агентов на это нет, но только с ИИ можно сделать неплохого помошника, который возьмет на себя самую муторную часть этой работы.
"заменитель саппорта, идентчный натуральному" - на текущий момент грамотно составленный чатбот может отвечать на большую часть вопросов обывателей по теме, экономя силы и время человека, к сожалению в реальности бизнес берет самую худшую его (ИИ) форму, снабжает его минимум (недостаточное количество) информации и думает что эта вундервафля сэкономит деньги, но пока только повышает раздражение клиентов.
сильное заявление, технологии типа БАК смотрят на вас с удивлением, или вот неизвазивными методами исследуют печать на клавиатуре
Проблема в потребительском оборудовании - очень маленькое количество датчиков, я отлично помню в 2011 году emotiv делал шлемы, и тут на хабре были статьи где несколько степеней свободы можно было обучить ее софт угадывать... мне кажется прогресс в этом деле приостановлен искусственно (особенно если посмотреть на первую мою ссылку, для работы БАК нужен дешевый шлем, компьютер и алгоритм, в неумелых руках можно сломать в мозгу много чего, а ломать будут потому что к примеру с ее помощью можно сделать буквально электронные наркотики), но доказать это сложно
спасибо, если честно, скорости выглядят как фантастика (у меня машина 128гб ram и 32гб vram, жаль не могу протестировать так же)
1бит квантизация? 8битная квантизация kv-cache? оно хотя бы отвечает по делу? есть какие-нибудь бенчмарки, на тему падения качества? по ссылке что я давал 2бит квантизация роняла качества от 0.5% до 6% (в среднем там 1%) т.е. незначительно, а что будет с 8битной квантизацией kv-cache? есть хотя бы значения perplexity?
я про требования памяти, контекстное окно deepseek, как ни крути, требует сотни дополнительных гигабайт,.. дома собрать даже 256гб проблема
К сожалению, старые бенчмарки не могут являться доказательством деградации модели, потому что их работа детектируется а готовые ответы подставляются (в случае со сложными бенчарками, где запросы генерируются специально не фиксированными, можно подсунуть дорогую умную модель специально этому аккаунту на время бенчмарка)
т.е. все самое чувствительное с точки зрения приватности вынести на свой хостинг не получится? или все же есть решения?
p.s. https://ymozilla-services.readthedocs.io/en/latest/howtos/run-fxa.html
404 Project not found
ymozilla-services.readthedocs.io
The project you requested does not exist or may have been removed.
со смартфона открылась, на десктопе linux (офф клиент) - нет
Не важно, формат мини приложения меня не шибко интересует, так как аудио записи не получится слушать и управлять в моем плеере (например оффлайн, переключение треков кнопками громкости или с гарнитуры без разблокировки экрана)
с другой стороны я не целевая группа данной задачи, прежде чем слушать я бы хотел сам выбирать информацию.
Ни техническими ни финансовыми способами текущую ситуацию не исправить в России, ибо сгнило в другом месте.
Что такое maj@4 и maj@64 для AIME бенчмарков? это какой то подход типа 5shot, в блоге mistral гуглилось сообщение где было написано maj@1 (5 shot) т.е. 1,8,64 в нем это не количество примеров.
Могу предположить что это метод отправки нескольких запросов и выбора статистически более частого ответа, в случаях когда это можно сделать?
открывается мини приложение с пустым экраном и ничего не происходит... почему бы не выложить в любом другом адекватном аудио хостинге примеры озвучки?
Если залогиниться без того что бы 'запросить доступ' нельзя, если нельзя посмотреть цены что бы не поговорить, то вы выглядите как те цыгане на рынке, что готовы на*ть своего клиента.
p.s. при попытке авторизации в консоли (кнопки регистрация - нет) через mts id выпадает ошибка
почему вы перевели название?
вы оплатили подписку, почему бы не спросить поддержку suno?
Не достаточно, полностью автоматического не получится, а если не полностью, то ответ варьируется от того, на сколько человек будет задействован в процессе.
Как минимум для решения такой задачи нужно качественное ТЗ, по которому писалось изначальное приложение, иначе будет упущена большая часть важных нюансов.
Зачем вам что то готовое, если на каждую ситуацию можно попросить создать такого агента саму нейросеть?
Я в качестве экспримента пилил простейшие скрипты (а только такие и имеют смысл) агентов для решения сиюминутных задач, просто описывая задачу openai:gpt-4.1/o3 и anthropic:sonnet4, за 2-3 итерации задача решалась чистейшим вайбкодингом, я не смотрел в сам код ни разу... примеры агентов, для каждого файла (список расширений) в текущем каталоге и подкаталогах запускать промпт по указанному шаблону (в нем место для вставки имени файла и содержимого), ответ собирать по такой то логике по указанным шаблонам в другой файл (например jsonl), там еще была отправка запросов параллельно не больше указанного количества, так быстрее результат. Такой примитивный агент решает кучу задач по первичному анализу кода, собирает данные, которые уже другими запросами или другими утилитами, можно продолжать анализировать.
вы пробовали ломать слабые открытые модели? ту же microsoft phi-4 (и ее же reasoning вариант), или шуструю qwen3-30b-a3b (она на процессоре 'летает')?
именно с помощью 'ненормального состояния' такие вещи и изучаются, только сломав можно понять как это работает внутри (собственно так и делают)
mitm это способ проведения атаки (хотя не самый удобный, просто тут скорее всего нужна была видимость - работает но тормозит, т.е. их сервера не справляются, вот, они виноваты сами)
а вообще я сейчас подумал что и первая d в dDOS - 'распределенная' тоже подходит, ведь атака распределена по всей стране по каждому провайдеру интернета.
Особенно если вспомнить что атака dDOS - это атака на отказ в обслуживании, начинаем понимать что 'блокировка' youtube провайдерами это оно самое