Pull to refresh
11
Gena Genai@Qwertcoserread⁠-⁠only

Ai research

Send message

AgentKit: единая среда от OpenAI для создания и тестирования собственных агентов

Reading time1 min
Reach and readers4.2K

AgentKit — это среда, где можно собирать агентов без возни с кучей инструментов. Раньше приходилось мучиться: одни сервисы для оркестровки, другие для коннекторов, третьи — для тестов и интерфейсов.

Читать далее

Google LiteRT-LM — новый фреймворк для офлайн-запуска LLM на Android, Chrome и даже Raspberry Pi

Reading time1 min
Reach and readers9.7K

Новый фреймворк который позволяет запускать большие языковые модели локально, без подключения к интернету. Он же LiteRT-LM

Читать далее

HunyuanVideo-Foley — генерация звука для видео

Reading time2 min
Reach and readers4.1K

В видео-генерации давно есть проблема: ролик выглядит реалистично, но без синхронного звука всё ломается. Tencent сделали новую систему — HunyuanVideo-Foley. Она умеет генерировать звук для видео так, чтобы он совпадал и по динамике, и по смыслу.

Читать далее

Grok Code Fast 1

Reading time2 min
Reach and readers7.5K

Тихо, незаметно, модель появилась на Openrouter и Github Copilot, я начал копать:

Модель Grok Code Fast 1 — это супербыстрая и экономичная модель для генерации кода, выпущенная командой Grok (xAI). Она оптимизирована для агентных рабочих процессов и качественного кода, поддерживает очень большой контекст (около 256К токенов), имеет 314 миллиардов параметров с архитектурой MoE. Эта модель предназначена для ускорения программирования и отлично справляется с проектами сложной структуры. Grok Code Fast 1 имеет скорость примерно 92 токена в секунду, что делает ее одной из самых быстрых кодирующих моделей на данный момент.

Читать далее

DeepSeek-V3.1 теперь можно запускать локально

Reading time2 min
Reach and readers33K

Unsloth сделали то, что еще год назад казалось невозможным — ужали модель весом 715 ГБ до 170 ГБ, почти без потерь в качестве. Они использовали динамическую квантовку: важные слои остаются в 6–8 бит, а менее критичные ужимаются до меньшей разрядности. При этом для калибровки брали 2–3 миллиона токенов хороших данных

Читать далее

️Google выпустила ультракомпактную модель Gemma 3 270M

Reading time1 min
Reach and readers5.1K

В линейке Gemma 3 появилась новая версия — Gemma 3 270M, рассчитанная на выполнение локальных задач прямо на устройствах. Несмотря на небольшой размер (270 млн параметров), модель демонстрирует уверенное следование инструкциям и хорошо подходит для дообучения под узкие домены.

Основные особенности:

Читать далее

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity