Комментарии / Профиль yatanai / Хабр

Пользователь

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

Это шутка какая-то? У меня 64\8 gemma-3-12b-it-qat на 9 токенов работает с 16К окном. У кореша 32\12 у него под 20 токенов фигачит, а с 32\16 можно и 40 достичь. 10 токенов хватает чтоб успевать читать, а +20 уже для приложений интересных хватает.
Генерить ответы со скростью последних GPT моделей надо покупать топовые видеокарты со скоростями памяти по 1.5ТБс, там можно больше 100токенов выжать на моделях которые в VRM умещаются.

Просто общаться с ними это уровень, охренеть, уже устаревших, ~GPT4, сейчас у всех агентный софт и готовых фри решений нету пока-что.

По статье скажу что gemma-3 самая базированная сетка. Её качество знаний самое лучшее среди открытых, но вот уже в составе приложения справляется не очень. Как пример на практике - gemma не поняла концепцию "сходимости идей и информации", а qwen3-8b-q_4 прекрасно понял, хотя сетка объективно слабее. Не может нормально в рабочие задачи, зато знает много.
А ещё если ломать её неэтичными вопросами, окажется что она на стороне правды, а в других сетках будто специально определённую информацию зашивают, лол. Тоже уровень!

Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости

yatanai 22 июн в 16:46

Оно не влияет если вычислительная сложность модели никая и упирается в память. Гонял какие-то "крутые" локальные модели и больше ядер давало буст. А вот самая тупорылая LLAMA, у меня, буквально считается на 4 из 20 ядер и никакой буст от ядер не получаю.

Эпоха «крошечных команд» в Кремниевой долине началась

yatanai 22 июн в 16:30

В человеке заложены способности, покруче, чем у ИИ

Их можно моделировать. Проблема что многие вещи машина выполняет долго.

Я сейчас делаю одну крутую штуку и вот есть одно занимательное поведение которое очень легко устроено в мозге но трудно моделировать алгоритмически. Мы можем создавать рассказы с 2 параллельными историями которые как-то пересекаются, и мы интуитивно понимаем что эти истории могут пересекаться по времени-месту-ассоциациями. И если моделировать поведение как цепочки мыслей, то извлечение смежных связей довольно мудрёно будет работать и часто придётся дёргать БД. Если моделировать через инъекции мыслей в широкое контекстное окно LLM то качество понимания уже напрямую зависит от качества модели и её понимания, что иногда недопустимо. (малые сети херово с длинными контекстами работают, а коммерческие слишком дорогие для такой системы)

Нужно разрабатывать специализированные сетки для различных когнитивных нагрузок, а это всё долго и дорого. Потому пока нужно создать инструмент который сможет за кучу времени, но сам, разобраться как сделать эти специализированные сети. И когда оно будет работать быстро и дёшево, тогда заживём

Будущее БПЛА: бикоптеры, народный автопилот, сверхскоростные ИИ-дроны

yatanai 17 июн в 06:49

Mission Planer это вроде вообще софтина из 2 файлов которая в одном потоке работает, если мне память не изменяет xD. "Новый" QGroundControl выглядит по живее, но они заманали каждый комит полностью переработать всё. Я написал кастом сборку а сейчас узнаю что они убрали переопределения ресурсов и половину функционала переделали и теперь не собирается ничего. Круто

GPT ломает приватность: что должен знать разработчик

yatanai 17 июн в 06:42

Я сейчас разрабатываю аналитические системы и даже представить себе не могу как не тренировать модель на пользователях.

Ты хочешь улучшить модель в юриспруденции, но для её улучшения ты должен нарушить соглашение и обучать модель на их данных. А где мне ещё брать актуальные датасеты? Что бы не палится нужно разрабатывать извлекатор знаний которые бы маскировали их удаляя конфеденциальную информацию.

GPT ломает приватность: что должен знать разработчик

yatanai 17 июн в 06:38

Вспоминаем новость что кто-то из директоров в OpenAI связан с разведкой США и продолжаем плодить конспирологические спекуляции

SOSAL: От теории к практике

yatanai 15 июн в 08:55

Это уже какой-то метавёрс получается. Там и PODSOSAL и VSOSAL и NESOSAL и прочие диалекты

SOSAL: От теории к практике

yatanai 15 июн в 08:51

Нужно донести эту гениальную мысль до англоговорящих и тогда посмотрим как залетит

+10

Windows Subsystem for Linux теперь open source. Как WSL объединяет Windows и Linux

yatanai 11 июн в 14:00

Раньше была поддержка и челы делают кастомные образы для запуска андроид приложений "нативно".

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

yatanai 10 июн в 12:40

А смысл? Квантованные не сильно в качестве падают. Судя по тестам до q6_0 падение макс 10%, а вот дальше уже плохо всё.

Мой первый AI агент: я пью чай, а Мила ищет вакансии (ожидания vs реальность)

yatanai 8 июн в 20:46

Есть такое

Современные LLM модели умеют очень много, но всё зависит от формулировки. Если использовать термины на которых они обучаюсь то качество в разы лучше. (Можно просто спросить у ИИ что оно знает по теме) Я сейчас делаю что-то похожее на ACT-R систему и я, без знаний NLP, просто прошу ИИ разобрать предложения, добавляем всякие парсеры и валидаторы и приложение готово.

OpenAI представила модель Codex-1

yatanai 20 мая в 08:47

Через сколько лет что? Придумают системы анализа и проектирования которые станут доступны? Наверное лет так через 5 минимум. Ибо только-только модели начали обучать на агентность, а значит минимум год-два обкатывать это будут. И учитывая что досихпор никому не интересны исследования по когнитивке мы ещё долго не увидим чего-то реально интересного. Может алгоритмический ИИ-софт появится чуть раньше чем "реально думающий". (уже выпускают, но для внутрянки компаний)

ЗЫ
Для меня "алгоритмический" и "думающий" разное, ибо первое подразумевает что в него зашивают некую логику по решению задач относительно которой он не может отступить, когда второе зачастую оперирует множеством процессов для решения задач.(разница в количестве, да) Банально посчитать различные методы познания и как мы ловко можем переключаться между ними при решении задач. Промоделировать это алгоритмически довольно нетривиальная задача, а выбрать какой-то один эффективный для чего-то метод относительно просто.

OpenAI представила модель Codex-1

yatanai 20 мая в 07:47

Я вам рекомендую всё же давать точные понятия различным словам и именам. Потому что иначе начинается путаница, буквально чистая диалектика.
Если у вас будет строгий терминалогический аппарат, то вас будет гораздо легче понять, даже если ваши "слова" не значат тоже самое что для других людей (некоторые философы античности этим грешили)

OpenAI представила модель Codex-1

yatanai 17 мая в 18:35

Как и 80% всех LLM которые были созданы в течении последних двух лет. Я строил всякие забавные тестики и уже phi3 подходит для решения задач через агентные системы, а LLM уже год исполнился, что по текущим меркам уже много.

Тут срач в основном за терминологию. ИИ это когда в процессе участвуют только различные математические структуры из которых этот ИИ и состоит. Вот ты создал ИИ которая умеет писать в специальную память LSTM и извлекать от туда данные = ты создал ИИ с настоящей памятью! Или ты взял готовую модель, не обучал её а просто спарсил её ответы как SQL запросы и просто на следующей итерации подкидывал ответы = ты создал ИИ с настоящей памятью? Скорее всего нет, это уже "ИИ программа" или "агентный ИИ"

OpenAI представила модель Codex-1

yatanai 17 мая в 08:58

Если коротко - машина стоит дешевле только там где минимальная ЗП от 3К баксов, в остальном люди в разы дешевле. Да это растянуто по времени но экономика говорит что человек стоит в разы дешевле покупки сервера для 1 робота. Если это не так, тогда скажи сколько стоит душа в регионах РФ если там 3 ребёнка и заработок семьи меньше 100К в месяц?

программный комплекс один раз обучил

Проблема что СЕЙЧАС эти комплексы стоят безумных денег, а самые качественные из них вообще на LLM работают которые жрут просто безумное количество ресурсов. Это может окупится только когда тиражи будут миллионные, но тогда планетарный энергокризис вероятнее начнётся чем столько ЦОД-ов построить успеют.

В целом я ожидаю когда сделают реально интеллектуальную систему анализа и проектирования чего-бы то нибыло. Тогда она сама сможет исследовать нейронауку и найти как сделать энергоэффективных роботов не требующих терабайты оперативки с 100ТБс на борту. И вот тогда то заживём, ух!
Но не скоро ещё.

OpenAI представила модель Codex-1

yatanai 17 мая в 07:06

Это конечно хорошо, но там походу всё тот же мульти-агент. Просто там сверху допилена интересная система аналитического решения задач, что тоже большая заслуга, я сам над этим сейчас бьюсь, но это не "один ИИ" а "много маленьких".
Так-то под капотом всё тот же Gemini используется, синкэбаут

OpenAI представила модель Codex-1

yatanai 17 мая в 07:01

Если бы за это ещё деньги платили... Подумаю на досуге, спасибо

Самый минус софта в том, что чем меньше модель, тем хуже она понимает тонкости языка. Какой-нибудь Gemma3 12B (которая на 8ГБ карточках запускается) вроде правильно на русский переводит но почему-то использует неправильные морфемы. Малые Китайцы хорошо справляются, но постоянно их уводит в Китайский и чем меньше модель те чаще это происходит.
Короче просто так взял рандомную модель и запустил не получится, надо ещё и этап проверки написать, но я просто модель по больше запускал и нормально.

OpenAI представила модель Codex-1

yatanai 17 мая в 00:04

Развитие самих LLM пошло по мультимодальности, новых архитектурах для больших моделей (типо МоЕ которое охренеть как круто работает Qwen3 A30 тестил, я в восторге) и агентности, а качеству в данных уже почти потолок. Новые LLM уже лучше справляются с ролью инструмента, чем буквально год-два назад. В остальном я прогресса какого-то не сильно заметил. И в целом где-то читал, что исходя из тестов скорость роста качества одной модели сильно замедляется. Мол, каждые новые 5% будут даваться сложнее в квадратичной сложности, если не придумать что-то принципиально новое.

На счёт агентности, я писал себе простое приложение переводчик. С начала я просто просил LLM переводить текст на язык Х и делало оно это ну, условно нормально. Но когда я создал кучу агентов которые проводили анализ текста всех видов что смог найти а потом последний агент переводил текст с учётом всей этой информации качество переводов стало просто превосходным. Потратил правда я на это раз в 6 больше времени, но меня интересует только качество)

OpenAI представила модель Codex-1

yatanai 16 мая в 23:50

Изучал на днях вопрос об экономической эффективность роботов даже с учётом удешевления стоимости этих самых роботов. Грустно но людей не заменят. Человек это биомашина которой нужна только еда и которая из коробки умеет решать почти любые виды когнитивных задач, когда машинный интеллект это больше специализированная вещь. Можно создать идеальный сортировщик, но не сортировщик-упаковщик-грузчики- машинист, синкэбаут.

Мы всегда можем создать неэффективную машину которая бы создавала эффективные машины, но сейчас сделать что-то универсальное будет стоить огромных денег, ибо ему придётся решать ОГРОМНЫЙ спектр задач, что требует огромных вычислительных ресурсов. С текущими направлениями в ИИ мы ещё долго не увидим быстрых и автономных систем. Сейчас прогресс пошёл куда-то в сторону "любой ценной но сделайте так чтоб оно само принимало решения, а дальше уже посмотрим"

ООП — это скам

yatanai 12 мая в 06:15

Систематизировать знания полезно. Но меня сильно удивляло когда я перешёл с verilog на C#/C± и нужно было знать эти паттерны, а это буквально единственный способ реализовать конкретную логическую схему в железе, а у программистов для этих случаев имена есть. Ляпота

1 2 3

5 6 ...

32 33