Комментарии / Профиль vasimv / Хабр

Пользователь

Подписчики

ПрофильСтатьи17ПостыНовостиКомментарии2K

Пузырь ИИ лопнул? Бизнес отказывается от ChatGPT, а Microsoft пытается спасти положение софтом: ML-дайджест

Как один умный человек на реддите написал - и нагреватели комнатные надо запретить, заменить боксами, которые ИИ запускают! :)

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

vasimv 11 июн в 21:34

Угу, chatgpt жжёт в поиске, и видео проверит и форумы... Гугл, в отличие от него - вообще херню какую-то лепит, не проверяет нифига. Несколько раз было такое, что переключаешь гугловый ИИ в думающий режим и он выдает совершенно противоположный ответ, буквально - первый ответ начинается с "Yes, ....", второй, после переключения - "No, ...".

Microsoft хотела сделать людей «зависимыми» от ИИ-агента Scout — а CEO отрекся от стратегии своих вице-президентов

vasimv 8 июн в 12:31

Больше похоже на кривые архитектуры сайтов, когда даже статическая информация отдается кодом, который вешает бэкенд при сколько-нибудь ощутимом количестве запросов. Ну и агент одиночный не сможет запрашивать с такой частотой - банально скорости работы LLM не хватит, чтобы генерировать токены для fetch_web с такой скоростью.

Магия чепухи: как «бессмысленные» инструкции заставляют нейросети работать лучше

vasimv 7 июн в 18:21

Творчество предполагает оперирование ограниченным набором инструментов для достижения цели, причем набор этот часто приходится использовать не самым банальным способом. Думаю, всякие странные промпты часто просто "подсказывают" моделям что можно какие-то необычные пути или инструменты найти. Можно даже провести эксперимент - просто подсовывать случайные слова/словосочетания в промпт, особенно когда модель заходит в логический тупик и смотреть за результатом.

Microsoft хотела сделать людей «зависимыми» от ИИ-агента Scout — а CEO отрекся от стратегии своих вице-президентов

vasimv 7 июн в 18:14

Сейчас самая большая проблема для агентов - это то что все ставят на свои раздутые до нельзя сайты "защиту от роботов" (причем, даже просто на чтение, а не на постинг). Агенты не могут посмотреть многие сайты, а поисковые запросы - вообще только платное работает нормально. Как индустрия собирается продвигать агентов, когда они ничего толком делать не могут, кроме как индексировать локальные файлы - непонятно.

ИИ Google Gemma 4 12B запускается на ноутбуке с 16 ГБ и почти догоняет модель вдвое крупнее

vasimv 3 июн в 20:07

qwen3.6-27b

-1

Почему б / у или поддержанный ThinkPad порой лучше чем любой игровой ноут для программиста

vasimv 30 мая в 14:17

Ну, у всех свои недостатки... Но когда у thinkpad 15 gen 2 массово самопроизвольно отпаивались от платы MOSFET-ы в цепи зарядки из-за сильного перегрева (в лучше случае - держались как-то, но подогревали всю материнку и SSD) - это как вообще?

NVIDIA ускорила языковую модель в 4 раза: вышла Nemotron-Labs Diffusion

vasimv 24 мая в 17:13

Это не просто похоже, а буквально описание MTP - сама модель генерит несколько варинатов за один проход, потом отфильтровывает.

Google AI Studio теперь делает нативные Android-приложения — без SDK, без среды, без знания Kotlin

vasimv 20 мая в 14:27

Я тестировал локальные модели с claude code и opencode, как раз для разработки аппликух для андроида. Причем без знания градле и котлина. Ну да, android studio пришлось ставить, компилять-то в чем-то надо. И еще телефончик дешевый к серверу кабелем подключил, потому как эмулятор тормозит жестоко без выделенной видеокарты, а она нужна самой модели, чтобы работать.

Компания Clear Gate провела аудит информационной безопасности мессенджера Max

vasimv 19 мая в 21:45

"It’s perfectly safe, I assure you." (c) Злой андроид, заманивающий человека к лицехвату чужого. (Это совершенно безопасно, уверяю вас). :)

-1

15 вещей, которые вы бы не хотели знать о мессенджере MAX: тайная запись звука с микрофона в звонках и много чего еще

vasimv 19 мая в 21:41

Ну, я не увидел одного важного функционала - crowd-sourced location, типа airtag. По блютусу передаем бродкасты с публичным ключом, кто-то его услышал и скинул на сервер вместе со своими GPS-данными. Потом приватным ключом расшифровываем и получаем список локаций.

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

vasimv 19 мая в 19:17

Этот аттрибут отключает специфичный для claude заголовок, из-за которого промпт-кэш сбрасывается постоянно, на собственно скорость работы модели никак не влияет, просто ей каждый раз приходится весь промпт с нуля перерасчитывать. Полный набор какой-то добрый человек выкладывал в реддите:

export CLAUDE_CODE_ATTRIBUTION_HEADER=0
export DISABLE_TELEMETRY=1
export DISABLE_COST_WARNINGS=1
export CLAUDE_CODE_ATTRIBUTION_HEADER=0
export CLAUDE_CODE_DISABLE_1M_CONTEXT=1
export CLAUDE_CODE_MAX_OUTPUT_TOKENS=64000
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=120000
export CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=95
export DISABLE_PROMPT_CACHING=1
export CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1
#export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
#export MAX_THINKING_TOKENS=0
export CLAUDE_CODE_DISABLE_FAST_MODE=1
#export DISABLE_INTERLEAVED_THINKING=1
#export CLAUDE_CODE_MAX_RETRIES": "3",
export CLAUDE_CODE_DISABLE_FEEDBACK_SURVEY=1
export CLAUDE_CODE_MAX_TOOL_USE_CONCURRENCY=1
export ENABLE_TOOL_SEARCH=auto
export CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1

Куда податься если 6 стало 9? "Чёрный слон" уничтожит...

vasimv 10 мая в 21:29

Не можешь победить - возглавь! :)

Claude Code — полный гайд и обучение для новичков с нуля

vasimv 10 мая в 15:02

Пишешь "дай мне промпт, который бы сгенерировал такую статью?" и аттачишь текст :)

Напиши большую статью для Хабра на тему: [ТЕМА].
Формат: полный практический гайд для новичков с нуля. Стиль — простой, уверенный, разговорный, без академической воды и без рекламного тона.
Структура:
0. Вступление: почему тема важна сейчас и что читатель получит.
1. Что это такое простыми словами.
2. Из каких частей состоит система.
3. Как начать: пошаговая настройка.
4. Основные режимы / функции / сценарии.
5. Настройки, которые реально влияют на результат.
6. Практические примеры использования.
7. Типичные ошибки новичков.
8. Лучшие практики.
9. Ограничения, риски и где нужна ручная проверка.
10. Чеклист внедрения.
11. Финальный вывод.
Пиши как технический автор на Хабре: с подзаголовками, примерами, кодовыми блоками, списками, блоками «подходит / не подходит», практическими советами и честными предупреждениями.
Не копируй чужие формулировки. Сделай статью самостоятельной, но в духе большого подробного гайда, который хочется сохранить в закладки.

Мистер Клод больше вам не друг

vasimv 8 мая в 16:00

Ну, берите v100 32GB тогда. Или уж r9700 ai pro, если хочется новое что-то. Arc B70, судя по всем обзорам и тестам, которые видел - херня для LLM (возможно и не сама карта, а её стек, но выглядит уж очень плачевно).

Вайбкодинг — это гемблинг

vasimv 8 мая в 15:57

Для больших проектов не использовал, но если opencode в виртуалке, обязательный коммит в гит после каждой успешной компиляции, почасовые снапшоты в ZFS/BTRFS - и можно отправить его в полноценный unattended, даже если напортачит - можно откатить всегда.

-1

Как гигантским корпорациям стало выгоднее вкладываться в AI, чем в майнинг биткоина

vasimv 5 мая в 03:22

Уже делают. Но получается охрененно дорого для тупой модели, которая никому особо не нужна - Taalas HC1. Зато охрененно быстро (15 тысяч токенов в секунду для сильно пожатой llama3.1-8b) - https://chatjimmy.ai/

Может, конечно, сумеют технологию допилить для более больших и современных моделей.

Японские военные начали использовать картонные дроны самолётного типа

vasimv 3 мая в 12:55

Похоже, это проект для случая, когда страна под серьезным ударом, логистика и промышленность почти полностью разрушены бомбардировками и/или частичной оккупацией. Просто достаем с секретных складов комплекты электроники и в домашних условиях клеим корпуса из картона, политым водоотталкивающим средством из балончика.

Выжать больше из локальных LLM. Ollama медленнее llama.cpp в 3 раза. UD_Q4_K_XL лучше чем Q4_K_M, а вес тот же и т.д

vasimv 28 апр в 19:18

Есть миникомпьютеры, типа Nvidia DGX Spark и его клоны (Asus GX10), но они довольно дорогие и не шибко быстрые. Зато памяти 128 GB (unified, общая для процессора и GPU), то есть можно даже довольно жирные модели запускать. Немного сыроватая платформа, но народу нравится. Маки, начиная с M3, где памяти достаточно.

Видеокарту надо брать из относительно современных, с кучей памяти. Для поиграться с маленькими моделями - и 12 гигов хватит, но если хочется нормальное чтобы кодило там или чего-то в этом духе, то лучше от 24 гигов, на сколько денег хватит. Можно подержанные майнинговые (MI50 32GB, V100 32GB), но если не хочется играть в лотерею "сколько еще времени она проработает, пока не посыпятся конденсаторы/mosfetы)", то лучше что-то приличное, типа R9700 AI Pro 32GB. Если есть хороший бюджет, то верхней планки уже нет - накупить RTX 6000 96GB, на которых все летает. :)

Можно ли сгенерировать видео нейросетью бесплатно? Собираем актуальные способы

vasimv 25 апр в 23:25

ComfyUI с Wan2.2 моделью можно запускать локально и видеокарточку минимум с 11GB (ну, можно и с меньшим VRAM, однако это будет уже за гранью приемлимого по скорости), для хороших скоростей - помощнее и с 32GB. Но там ограничения на длину клипа (text-to-video генерит только пять секунд максимум, потом приходится городить рекурсивный граф с text-to-video -> последний кадр -> image-to-video).

2 3 ...

98 99