Comments / Profile of Smartor / Habr

User

-1,6

Rating

А в чём слоп-то? Какие претензии к содержанию? Никаких, да? Просто стадо дебилов среагировало на "ааа!!!! нейросеть написала!!!". А как вы вообще представляете новостной пост в день выхода модели?

Когда вам тут по 10 статей пишут на тему очередного Клауда, авторов тоже "топите"? Нет? А почему? Просто подумайте над своими стадными инстинктами.

Ставьте минус в карму тогда ВСЕМ авторам с нейросетями в тексте. Снова нет?:) А что так?:)

-7

DeepSeek-V4: Тихий гигант

Smartor 23 hours ago

А Вас хамить кто заставляет?

-8

DeepSeek-V4: Тихий гигант

Smartor 23 hours ago

Ну и кто вы после этого?

-9

DeepSeek-V4: Тихий гигант

Smartor yesterday at 16:13

Ошибок нет, есть лишь глупое высокомерие читателей, которые не понимают, как MoE работают на меньшем количестве памяти.

Можете, кстати, пояснить, что вот это за зверь

Fine-grained и Coarse-grained - это общепринятые термины, относятся к параллелизации выполнения экспертов.
Параллелизация экспертов - это стратегия распределения этих экспертов по нескольким GPU при обучении или инференсе.

Coarse-grained - каждый эксперт целиком размещается на одном GPU.
Fine-grained - вычисления одного эксперта могут быть разделены между несколькими GPU, или эксперты динамически перераспределяются.

**Fine-grained Mixture of Experts (MoE)**

При 384 экспертах на слой и 1.6 трлн параметров "грубое" распределение быстро упирается в ограничения памяти и пропускной способности, а fine-grained схема позволяет динамически балансировать нагрузку, когда одни токены требуют больше вычислений, чем другие.

Валидация на H100/A100 означает, что схема работает стабильно и эффективно именно на этой архитектуре (NVLink, топология межсоединений, драйверы). DeepSeek делает акцент на кросс-платформенной валидации — одна и та же схема параллелизации работает и на NVIDIA, и на Huawei Ascend.

Термины "fine-grained Mixture of Experts", "гранулярность специализации экспертов " часто встречается в технических отчётах по масштабированию больших моделей:

Google: Expert Choice Routing + fine-grained sharding - в Switch Transformer.

Meta: fine-grained Hierarchical Expert Parallelism - в Mixtral-подобных архитектурах.

-1

DeepSeek-V4: Тихий гигант

Smartor yesterday at 15:49

Ну так возьмите и напишите как считаете нужным, в чём проблема-то? Потратьте своё свободное личное время.

-10

DeepSeek-V4: Тихий гигант

Smartor yesterday at 15:44

Ну и кто вы после этого?

-11

DeepSeek-V4: Тихий гигант

Smartor yesterday at 15:23

Вы мне за статью наставили мисусы и сливаете карму.

Ну напишите свою версию новости про новый Дипсик, зачем гадите-то?

Вы серьёзно требуете бесплатную новостную статью в писательском стиле - в день выхода новой модели, да?

-12

DeepSeek-V4: Тихий гигант

Smartor yesterday at 14:29

Конечно же нейросеть.
Руками это писать не один день.

-18

Первое решение суда поразило всех, но второе оказалось еще хлеще: иск на 766 000 000 ₽ за надпись «Я люблю свою семью»

Smartor yesterday at 11:47

Как же хорошо, что патенты протухают через 20 лет, и как же плохо, что торговая марка + слоган = потенциально бессрочная монополия на идентификацию в торговом обороте.

Telegram-бот за вечер через Spec Kit: что AI-ассистированная разработка сделала с моим инженерным процессом

Smartor Apr 23 at 22:08

Спасибо за статью:)
К сожалению, автор был краток, и я исследовал и реконструировал (где не всё понял, гг) логику бота.
Бот https://github.com/zahaand/smart-task-bot использует инлайн-клавиатуры (кнопки под сообщениями), поэтому интерфейс выглядит так:

Список задач (/tasks)
📝 Ваши задачи (3):

🔘 Купить молоко ⏰ Напомнить: 15.12 18:00
──────────────
[👁 Просмотр] [✏️ Изменить]

🔘 Подготовить отчёт ⚠️ Просрочено: 14.12 23:59
──────────────
[👁 Просмотр] [✏️ Изменить]

🔘 Позвонить маме ✅ Без дедлайна
──────────────
[👁 Просмотр] [✏️ Изменить]

[➕ Новая задача] [⚙️ Настройки]

Детали задачи (после выбора из списка)

📌 Задача: Подготовить отчёт

📄 Описание: Сделать квартальный отчёт по проекту “Alpha” и отправить руководителю.

🗓 Создана: 10.12.2024 ⏰ Дедлайн: 14.12.2024 23:59 🔔 Напоминание: не установлено

[🔔 Напомнить] [✅ Выполнить]
[🗑 Удалить] [← Назад к списку]

При нажатии «Напомнить» появляется календарь:

📅 Выберите дату напоминания:

< Декабрь 2024 >
Пн Вт Ср Чт Пт Сб Вс
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18
19 20 21 22 23 24 25 26 27
28 29 30 31
[← Назад] [Отмена]

После выбора даты бот просит ввести время текстом: «Введите время в формате ЧЧ:ММ (например, 18:30)»

Меню настроек
⚙️ Настройки профиля

🌐 Язык: Русский 🌍 Часовой пояс: Europe/Moscow (UTC+3)

[🌐 Сменить язык] [🌍 Сменить часовой пояс]
[❗️ Удалить аккаунт] [← Назад]

С целом, всё довольно-таки просто, но в принципе логично:)

В Казахстане начали блокировать возможность скачивания инструментов и релизов с GitHub

Smartor Apr 23 at 20:24

Вообще, эта ситуация с ограничением детям доступа в соцсети - крайне тупой мировой тренд. Детям, у которых плохие отношения со сверстниками в школе, им что теперь, в одиночестве со своими проблемами оставаться? Зачем такое делать? Должны же быть мозги у взрослых Лиц, Принимающих Решения.

Razer представила Atlas Pro — стеклянный коврик для мыши толщиной 1,9 мм

Smartor Apr 23 at 13:54

Много лет использую жёсткий пластиковый A4Tech X7-801MP и считаю, что лучше его ничего нет:) К сожалению, эту модель перестали выпускать.

Роскомнадзор аннулировал 1967 лицензий операторов связи

Smartor Apr 23 at 11:55

Спасибо:)

DLSS 5 — не провал. Будущее рендеринга: глубокий технический взгляд на новые подходы после 15-ти лет в геймдеве

Smartor Apr 22 at 22:29

А почему мне, как не эксперту, нельзя судить по официальной демке? Что нам показали - на то мы и ответили, что за претензии.

А "новости из будущего", от политиков и визионеров всех мастей, уже немного поднадоели:)

Роскомнадзор аннулировал 1967 лицензий операторов связи

Smartor Apr 22 at 21:12