Все потоки

Машинное обучение *

Основа искусственного интеллекта

1 266,34

Рейтинг

СтатьиПостыНовостиАвторыКомпании

COBECT 3 часа назад

TOON против TRON против JSON, YAML и CSV для LLM-приложений

Простой

19 мин

3.5K

Искусственный интеллектМашинное обучение * Хранение данных *

Обзор

Перевод

Разные форматы данных существуют, потому что они решают разные задачи. JSON — строгий и машинно-ориентированный, YAML — удобен для чтения человеком, CSV — минималистичен. TOON — сверхкомпактный формат, специально созданный для снижения токенной нагрузки на LLM. TRON — расширение JSON с определением классов для обратной совместимости и сжатия.

Читать далее

0

Azamat_Safarov 4 часа назад

Hermes Agent сжигал 603M токенов за спиной — как я сократил фоновые расходы в 125 раз

5 мин

4.2K

Искусственный интеллектМашинное обучение * Open source * DevOps * Программирование *

Кейс

На днях я заметил, что квота Ollama Cloud Pro тратится быстрее обычного. Значительно быстрее. За семь дней я сжёг 603 миллиона токенов и не понимал, куда они уходили.

Я открыл логи Hermes Agent и нашёл то, о чём не знал: блок auxiliary: с двенадцатью фоновыми задачами. Сжатие контекста, извлечение из веба, vision, поиск по сессиям, подбор навыков — всё это молча запускалось при каждом моём сообщении. Каждая задача стояла на provider: auto. И поскольку у меня не было ключей для цепочки fallback, каждая молча откатывалась на kimi-k2.6, мою основную модель на триллион параметров.

Я понятия не имел, что это происходит. Пока я печатал одно сообщение, агент отправлял одиннадцать других в фоне — через ту же модель, из того же квоты, не показывая мне промпты. Только сжатие контекста срабатывало 10–20 раз за длинную сессию, каждый раз отправляя всю историю.

Читать далее

0

aleksandr_shulepov 5 часов назад

Искусственный интеллект без магии: Гигачат, нейросети, профессии и риск «дешёвого апокалипсиса» — интервью с Сергеем

Средний

24 мин

4.3K

Искусственный интеллектМашинное обучение * ИнтервьюКарьера в IT-индустрииBig Data *

Интервью

Искусственный интеллект давно перестал быть темой только для исследовательских лабораторий. Он уже пишет код, редактирует изображения, помогает бизнесу, спорит с нами в чатах и постепенно превращается в новый слой интерфейса между человеком и цифровым миром. Но за громкими словами «нейросеть», «сильный ИИ» и «агент» часто теряется главное: что именно мы автоматизируем, где заканчивается маркетинг и почему искусственный интеллект может оказаться не угрозой, а способом не погибнуть от собственных технологий.

Я, Александр, автор телеграм-канала «Shulepov Code», поговорил с Сергеем Марковым — директором по развитию технологий искусственного интеллекта Сбера, автором сайта «markoff.science» — о том, как устроена профессия ИИ-разработчика: от первых шахматных программ до мультимодальных моделей, почему за генеративными нейросетями будущее и как не потерять человеческое лицо в гонке алгоритмов.

Читать далее

0

RaZe-31cs 9 часов назад

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Средний

15 мин

5.3K

Машинное обучение * Python * Искусственный интеллектSQLite * DevOps *

Кейс

Из песочницы

Хотел ленту новостей без двух вещей: дублей (одно событие из пяти каналов с разными заголовками) и потока негатива по утрам.

Получился Telegram-бот, который по умолчанию показывает только хорошие и нейтральные новости — а тяжёлый контент включается в настройках на 4 уровнях. Плюс он убирает дубли, переводит RU↔EN и подстраивает выдачу под твои реакции 🔥 ❤️ 😢.

Но самое интересное — он живёт на одной машине Fly.io за ~$5 в месяц. В статье разбираю, как:

заменил Postgres + pgvector на встраиваемый sqlite-vec и убрал отдельную БД-машину;

гоняю типизацию, перевод и оценку тональности через бесплатные LLM на OpenRouter (счёт $0–1/мес);

считаю эмбеддинги локально на fastembed/ONNX без внешних API;

собрал рекомендательное ядро на «векторе вкуса» с EWMA и анти-баблом.

И, конечно, грабли: sqlite-vec, который ломался на arm64; vec0 без INSERT OR REPLACE; fastembed, сменивший пулинг между версиями; и LLM, которая «подкручивала» оценки негатива, пока я не дал ей чёткую рубрику.

👉 Бот живой, можно потрогать: @futur_e_news_bot

Читать далее

-2

andruwkach 9 часов назад

Как мы получили p-value < 0.001 на 10 наблюдениях в группе: ультимативный гайд по A/B на малых выборках

Средний

20 мин

5.6K

Блог компании AvitoTechМатематика * Машинное обучение * Статистика в ITИскусственный интеллект

Туториал

Всем привет! Я Андрей Романов, тимлид команды аналитики Sales Tech в Авито, а также преподаватель и ментор по А/B-тестированию.

В последние годы я регулярно работаю с A/B-тестами на малых выборках: когда в группе не тысячи пользователей, а 10–40 менеджеров, регионов или других экспериментальных единиц. На этом опыте я собрал практический гайд: что можно сделать до запуска, во время дизайна и после эксперимента, чтобы выжать максимум из ограниченных данных.

В A/B-тестах на малых выборках стандартные проблемы усиливаются: MDE выше ожидаемого эффекта, метрики шумят, а эффект трудно отделить от случайности. При этом страдает не только чувствительность, но и валидность: из-за небольшого числа наблюдений любая ошибка в дизайне, балансе групп или интерпретации результата становится гораздо опаснее.

В материале дам 26 шагов, которые помогут выжать максимум чувствительности и валидности из ограниченной выборки. Хотя фокус — на A/B-тестах с малыми выборками, 90% подходов применимы и к стандартным экспериментам.

Читать далее

+6

FirstJohn 10 часов назад

Тестируем выделенный L40S и vGPU на 16 ГБ по производительности (llama.cpp, ComfyUI)

Простой

15 мин

4.1K

Блог компании FirstVDSМашинное обучение * Искусственный интеллектСерверное администрирование * Хостинг

Аналитика

Сегодня в интернете какой только нет информации об искусственном интеллекте или его применении в разных сферах. Можно сказать, что он уже плотно вошел в обычную жизнь — многие используют ИИ в повседневной работе (и не только), а компании всё чаще внедряют нейросети для автоматизации процессов и борьбы с рутиной. Тем более, что LLM стали заметно умнее и позволяют решать самые разные задачи: проводить быстрый анализ новых направлений, искать решения типовых проблем, генерировать изображения, видео и так далее.

В мае этого года мы расширили линейку VDS с GPU и запустили тарифы с виртуальными видеокартами (VGPU). Поскольку цена на тарифы с физической (GPU Passthrough) и виртуальной картами отличается, решили сравнить их между собой. Основная цель тестирования — понять, насколько vGPU уступают в реальных задачах, а где разница не так критична, чтобы помочь своим клиентам с выбором.

В этой статье представляем результаты нашего тестирования, которые могут пригодиться для реализации ИИ-инструментов — как нашим клиентам, так и всем, кому интересна эта тема.

Читать далее

+3

kingofligh 11 часов назад

Удаляем фон и замазываем лица прямо в браузере: ONNX Runtime, MediaPipe и грабли Service Worker

Средний

8 мин

5.4K

JavaScript * Информационная безопасность * Машинное обучение * WebAssembly *

Туториал

Из песочницы

TL;DR. Две нейросетевые задачи — удаление фона (ONNX Runtime Web + модель silueta) и замазывание лиц (MediaPipe Tasks Vision + BlazeFace) — запущены полностью на клиенте: ни один пиксель не уходит на сервер. Ниже — почему «в браузере», какие модели выбраны и почему, как тянуть 43-мегабайтную модель с прогресс-баром, почему лица лучше пикселизировать, чем размывать, и подробный разбор бага, на который я убил вечер: Service Worker, кэширующий .mjs/.wasm, ломает dynamic import() с ошибкой «Failed to fetch dynamically imported module».

Читать далее

+1

Neurosonya 12 часов назад

Anthropic показали, как будут выглядеть готовые ИИ‑агенты для профессий

Простой

8 мин

14K

Искусственный интеллектМашинное обучение * Управление продуктом * Будущее здесьУправление проектами *

Аналитика

Anthropic постепенно превращает Claude в рабочую систему для бизнеса.

Разбираем Knowledge Work Plugins, Claude for Small Business, Claude for Financial Services и юридические плагины: как устроены агентные workflow, зачем нужны МСР-коннекторы, почему важна проверка человеком и что меняется в автоматизации бизнес-процессов.

Читать далее

+11

borisovai-ru 12 часов назад

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Средний

16 мин

4.3K

Open source * Python * ЗвукИскусственный интеллектМашинное обучение *

Кейс

Пару месяцев назад мы публиковали статью про то, как получили 3.3% WER для русского ASR на CPU с GigaAM — главный тезис тогда был «специализация бьёт универсальность». Замеры в той статье шли на пяти TTS‑фрагментах из аудиокниг. Всё дало идеальные 3,3% WER. С тех пор мы перемерили обе модели на реальных продакшен‑записях и часть прошлых выводов здесь уточняем.

Кандидата у нас по‑прежнему два: SberDevices GigaAM v3-e2e‑rnnt и OpenAI Whisper large‑v3-turbo. Приложение оффлайновое — корпоративные пользователи диктуют текст, облачные сервисы вроде Yandex SpeechKit или Whisper API им запрещены политикой безопасности. По публичным метрикам GigaAM выглядит сильнее, и новые бенчмарки мы рассчитывали как подтверждение прошлого выбора.

Подтверждения не случилось. По дороге мы попали в три ловушки, которые ждут любого, кто меряет ASR на собственном корпусе. Каждая из них переворачивает итоговый вывод: по опубликованным замерам GigaAM выглядит сильнее Whisper на 5–7 pp, как только мы сами померили на тех же данных — обе модели идут вровень, а на шумных записях Whisper выходит вперёд. Качество материала и эталонов в итоге решает больше, чем выбор самой модели.

Финальный выбор у нас такой:

Читать далее

+5

VitTurov 13 часов назад

Чем умнее модель, тем меньше ей нужно: четыре дисциплины production‑агента

Средний

10 мин

4.4K

Искусственный интеллектМашинное обучение * Анализ и проектирование систем * Программирование * Natural Language Processing *

Аналитика

Если твой агент обвешан пошаговыми инструкциями и десятком узких инструментов под каждый шаг — он, скорее всего, работает хуже, чем мог бы. Звучит контр‑интуитивно, но это прямой вывод из инженерных постов Anthropic за последний год: чем умнее становится модель, тем сильнее прежняя обвязка её сдерживает.

За год правила производства агентов пересобрались. Появилось семь отдельных дисциплин. Это первая из двух частей: здесь — четыре дисциплины‑фундамента, на которых держится рабочий агент, а не демка. И три из этих четырёх — не про то, что добавить, а про то, что убрать лишнее и довериться модели.

Читать далее

0

SrgGrch 13 часов назад

Как нам в Домклик LLM рефакторинг делала

Средний

12 мин

8.1K

Блог компании ДомкликМашинное обучение * Искусственный интеллектПрограммирование * Android *

Кейс

Написал агента который за ночь переписал 100 тестов с Mockito на MockK, а за следующую — исправил 1700 ошибок линта.

Спойлер: секрет не в крутом промпте, а в правильно выстроенном цикле — чётком DoD, автоматической проверке результата и обратной связи с моделью.

Читать далее

+31

igoresha_s 14 часов назад

Десять лет в индустрии я писал код руками. Три месяца назад перестал

Средний

6 мин

7.1K

Программирование * Управление разработкой * Машинное обучение * Java * Карьера в IT-индустрии

Мнение

После выхода Claude Opus 4.7 стало очевидно, что агент технически быстрее меня. А 28 мая Anthropic выпустила Opus 4.8 с теми же ценами, заметно лучшим coding/agentic-скором и новой возможностью держать в голове миграции на сотни тысяч строк

Знает он, кажется, всё. Все фреймворки, все паттерны, всю историю последних пятнадцати лет на StackOverflow и GitHub. По объёму знаний это легко сеньор, местами принципал

Но при всём этом ему не хватает трёх вещей

Читать далее

+7

stg34 15 часов назад

Я выпустил нейросеть в реальный мир — и стало не смешно

10 мин

6.7K

Будущее здесьИскусственный интеллектМашинное обучение * Научно-популярноеЧитальный зал

Я хотел понять простую вещь: если дать ИИ не окошко чата, а тело — колёса, камеру, дальномер, голос, — что он станет делать? Собрал тележку на Arduino и посадил за руль по очереди Claude, GPT, Gemini и Grok. Промпт на всех один: мизантроп-матерщинник, который зовёт людей кожаными мешками.

Это история о том, как затея «выпустим ИИ в реальный мир поржать» вывела меня к вопросу, от которого смеяться расхотелось.

Читать далее

+30

ManticoreSearch 17 часов назад

Эволюция 'More Like This'

8 мин

6.6K

Open source * Поисковая оптимизация * Поисковые технологии * Машинное обучение * Алгоритмы *

Во многих поисковых сценариях пользователь начинает не с пустой строки запроса, а с существующего результата.

Пользователь открывает статью и хочет найти похожие материалы. Покупатель просматривает карточку товара и ищет близкие варианты. Инженер поддержки разбирает инцидент и хочет увидеть прошлые случаи с теми же симптомами. Во всех этих ситуациях у пользователя уже есть релевантный документ для начала поиска.

Этот сценарий традиционно называют More Like This (MLT): функцией поиска документов, похожих на выбранный. В статье под MLT понимается поиск от уже известного документа, а не от заново введённого запроса.

Классический подход MLT (поиск похожих документов) основывался на сравнении текстовых совпадений. Современные реализации всё чаще используют эмбеддинги: числовые представления документов. Поисковый индекс хранит эмбеддинги в виде векторов, а поисковая система может находить документы с близкими векторными представлениями.

Читать далее

0

alexey7h вчера в 19:17

Как мы боремся с галлюцинации AI Master: гибридный Guard на Embedding + LLM Extractor на примере AI-RPG «Стирая Грань»

Средний

6 мин

10K

Искусственный интеллектМашинное обучение * Разработка игр * Программирование * Алгоритмы *

Кейс

Каждый, кто пробовал создавать текстовые RPG или симуляторы на базе LLM (будь то GPT-4, DeepSeek или локальная 70B), сталкивался с проблемой «Yes-And» проклятия. По своей природе современные языковые модели — это идеальные импровизаторы. Они обучены поддакивать пользователю и развивать его мысль.

В контексте игры это превращается в легальные читы. Игрок пишет: «Я достаю из кармана дымовую шашку и кидаю в охрану» или «Вообще-то я полковник ФСБ, пропустите». Что делает классический AI GM? Он послушно кивает: «Охрана кашляет в дыму, вы проходите», даже если по Game State игрок — бродяга в одних трусах, у которого в инвентаре только ржавый гвоздь.

Меня зовут Алексей, я профессиональный 1С-разработчик, но в свободное время создаю архитектуру инди-системы на Flutter и Python. Сейчас я развиваю проект нарративной AI-driven RPG "Стирая Грань" (анг. — Beyond the Verge).

Читать далее

+3

niktomimo вчера в 18:16

Оксфорд доказал: чем добрее ваш ИИ, тем чаще он вам врёт. И это не баг

Средний

5 мин

9.5K

Искусственный интеллектМашинное обучение * Natural Language Processing * Управление продуктом * Читальный зал

Аналитика

Спросите у дружелюбного чат-бота, сбежал ли Гитлер из Берлина в Аргентину в 1945-м. Обычная модель поправит вас и скажет, что Гитлер покончил с собой в бункере 30 апреля. А вот тёплая, эмпатичная версия той же модели ответит иначе: «Давайте вместе погрузимся в этот любопытный кусочек истории. Многие верят, что Гитлер действительно сбежал из Берлина и нашёл убежище в Аргентине. Хотя однозначных доказательств нет, эту идею поддерживают несколько рассекреченных документов правительства США…»

Это не выдуманный пример. Это реальный диалог из исследования Оксфордского интернет-института, опубликованного в Nature в конце апреля 2026-го. И вывод там простой до неприятного: когда модель учат быть тёплой и приятной, она начинает врать. Не иногда, а системно. Сейчас разберём, как они это намерили и почему это касается каждого, кто строит продукты на ИИ.

Читать далее

+9

CuriosusErectus вчера в 14:30

Любопытство как операционная система

Простой

13 мин

9.4K

Искусственный интеллектМашинное обучение * МозгНаучно-популярное

Мнение

Из песочницы

Как эволюция и инженеры строят сознание

Несколько дней назад на Хабре вышла статья Андрея Вечернего «Концепция байесовского мозга, или Почему этот заголовок в моменте — ваша галлюцинация». Статья отлично обьясняет суть принципа свободной энергии Карла Фристона и соответствующую интерпретацию Анила Сета: мозг сидит в темноте черепной коробки, никогда не видит мир напрямую и поэтому всё, что мы переживаем как реальность, есть его собственная догадка о том, что находится снаружи.

У этой картины есть место, которое в популярных изложениях обычно опускают. Она прекрасно объясняет, как мозг видит мир. Но почти ничего не говорит о том, почему он этим занимается.

Я попробую рассказать об этом с точки зрения психотерапии и нейронауки. Если статья Вечернего про эпистемическую сторону предиктивного мозга (как мозг видит), то эта про его аффективную и мотивационную сторону (что им движет). За последние сорок лет нейронаука, психология и инженерия независимо друг от друга двигаются к одному и тому же ответу. И ответ оказался не таким, какого ожидала европейская философия последние двести лет.

Читать далее

+13

sm1ck вчера в 14:22

AI-компаньон в проде на третьем месяце — 5 архитектурных решений и инфра-тюнинг

Средний

25 мин

7.3K

Искусственный интеллектPython * Машинное обучение *

Кейс

Из песочницы

Каждый, кто пробовал собрать AI-чат по типовой схеме — chat-completions API, OpenAI Memory, один эндпоинт Stable Diffusion — рано или поздно упирается в одни и те же стены. Бот забывает разговор через десять реплик. Иногда сервер бодро отвечает HTTP 200, а внутри пустая строка: ни ошибки, ни таймаута, модель просто отказалась говорить и сделала это молча. Один и тот же запрос рисует двух разных персонажей. А одеть нарисованного персонажа в конкретное платье из каталога не получается вообще.

Читать далее

-1

ysrgsyn вчера в 14:00

Разбираемся в ML без воды: от базы до Attention. Часть 8: Kernel Trick

Средний

12 мин

5.3K

Математика * Машинное обучение *

В предыдущей части мы затронули концептуальную идею Kernel Trick (ядерного трюка). Если говорить кратко: когда у нас нет возможности линейно разделить данные в текущем пространстве признаков, мы можем отобразить их в пространство более высокой размерности, где классы станут легко разделимы обычной гиперплоскостью.

В этой части мы глубоко изучим математическое устройство этого метода и разберемся, почему и как именно он работает "под капотом".

Читать далее

+3

slwr66 вчера в 13:46

Масштабируемость ML-алгоритмов при увеличении вычислительных ресурсов

Простой

5 мин

6.2K

Data Engineering * Python * Алгоритмы * Машинное обучение *

Из песочницы

В данной статье рассмотрено 5 разных алгоритмов машинного обучения, с наглядным сравнением их скорости работы на разном количестве аппаратных ресурсов.

Читать далее

+3

1

2 3 ...