Comments / Profile of leon

@leon_sergey

User

ProfileArticlesPostsNewsComments10

Gemma 3: Google DeepMind делает ИИ по-настоящему доступным

leon_sergey Mar 16 at 09:47

Зацикливание кстати очень часто происходит, даже далеко от границы достижения макс токенов

Look

Gemma 3: Google DeepMind делает ИИ по-настоящему доступным

leon_sergey Mar 16 at 09:46

Зависит от оболочки для запуска и установленного макс контекста.

Open webui с ollama есть гораздо больше памяти, лм студии меньше, но в любом случае, максимальный контекст даже для лм студии не больше 40-50 токенов для 12б 4км модели. Больший контекст не влазит в 24 гб памяти и после этого происходит значительный дроп производительности.

Look

Gemma 3: Google DeepMind делает ИИ по-настоящему доступным

leon_sergey Mar 13 at 07:14

и gpu? И какое время инференса на обеих моделях?

Look

Gemma 3: Google DeepMind делает ИИ по-настоящему доступным

leon_sergey Mar 13 at 04:33

Попробовал 12б 6км - 40 токенов и есть ещё запас по памяти, думаю 8 бит потянет. Но ничем выдающимся не отличается, только поддержка русского на высоте.

Look

Gemma 3: Google DeepMind делает ИИ по-настоящему доступным

leon_sergey Mar 12 at 18:33

27b 4_k_m на 3090 "летит" со скоростью 2,5 токена в сек. То есть неюзабельно.

Look

От каскадных моделей до картинок в 4к: как эволюционировали диффузионки

leon_sergey Mar 11 at 11:57

Look

Я угадаю, что рабочий цеха хочет ввести, с трёх букв

leon_sergey Nov 27 2024 at 15:35

Согласен, это весомые риски. Держим в голове обязательно 👍

Look

Мы потратили 320 тысяч рублей ради Nvlink для нейросетей. Но был ли в этом смысл?

leon_sergey Nov 27 2024 at 13:48

Спасибо за интересный тест. Почему такая низкая скорость инференса, если вся модель влезла в vram? Какого компонента не хватает системе для инференса хотя бы на уровне 10т\с?

Look

Я угадаю, что рабочий цеха хочет ввести, с трёх букв

leon_sergey Nov 25 2024 at 05:09

Ребята, спасибо за крутую идею! Как раз такая сейчас стоит задача в цехе и потом примерно к тем же мыслям - что ллм здесь излишне применять. А есть код или пример похожей реализации где-нибудь на github? Задача прямо 1 в 1.

Look

Как подружиться с хаосом и осознанно управлять своим временем. Опыт продуктового дизайнера

leon_sergey Apr 16 2023 at 08:04

Очень хорошее базовое руководство по выходу из начального выгорания для менеджеров. Можно бесконечно детализировать различными инструментами, но рабочая основа уже есть. Забрал.

Look