Comments / Profile of SlavikF / Habr

Славик Фурсов@SlavikF

Developer

ProfileArticles9PostsNewsComments569

40 млн человек ежедневно спрашивают ChatGPT о здоровье. OpenAI хочет, чтобы FDA это узаконила

SlavikF Jan 7 at 18:08

Это вопрос гражданской ответственности.

У Гугла есть неплохая модель для работы с медицинскими данными - https://huggingface.co/google/medgemma-27b-it

Может и снимки анализировать, и диагнозы ставить, ... Кстати и русский язык поддерживается.

Вот только на сайтах Гугла (AI Studio) вы эту модель попробовать не можете.

И у других провайдеров, например OpenRouter, вы можете использовать почти любую из сотен открытых моделей, но только не эту медицинскую.

Почему? Потому что никто не хочет подставляться под риск гражданской ответственности.

Остаётся только вариант запускать эту модель на своём сервере, что я и делаю...

Рабочие станции для ML и Data Science — как собрать сервер под столом

SlavikF Jan 7 at 16:50

Я здесь в США купил себе на Ebay:

Dell Precision 7960 с блоком питания на 1400W
Xeon W5-3425 (12 cores / 24 threads)
16GB DDR5
$1000

Поставил 512GB DDR5-4800 ( 8 * 64GB) - $2000. Сейчас память конечно намного дороже стоит. Теоретически 8 каналов памяти должны выдавать около 300 GB / s, но я получаю около половины этого: я так и не понял - то ли у Dell стоит кривой контроллер памяти, то ли процессор не вытягивает полную скорость памяти, то ли рэнкинг на модулях памяти неоптимальный...

Купил из Китая RTX 4090D 48GB - $3000. Когда нагружаешь - гудит как самолёт, но работает хорошо. Пришлось повозиться, чтобы подобрать правильный кабель питания - я просто заказал несколько разных, пока нашёлся тот который нужен.

Devstral-Small-2-24B выдаёт у меня 40 т / с

Minimax 2.1 230b выдаёт около 15 т / c

А чтобы не было шума у меня в доме, я построил маленький сарайчик на улице (я тут в частном доме), с одного бока воткнул портативный кондиционер - и всё работает. Ещё я в тот сарай поставил литиевый аккумулятор на 2kW*h и китайский инвертер-UPS на 3kW... А так как у меня к дому идёт файбер на 2Gbps, то у меня тут прямо свой "дата-центр".

Представлен локальный и бесплатный сервис BentoPDF для...

SlavikF Jan 6 at 15:13

Я пользовался вот этим сервисом:

https://github.com/Stirling-Tools/Stirling-PDF

Кто-нибудь сравнивал их?

Запускаем Qwen3-VL-30B на 48GB VRAM

SlavikF Jan 6 at 00:08

Интересный --host...

Я обычно пишу --host 0.0.0.0

0.0.0.0 означает - отвечать на запросы с любого сетевого интерфейса.

Kubernetes 1.29 → 1.33 за 30 минут: реальный апгрейд кластера с помощью ИИ под контролем инженера

SlavikF Jan 5 at 14:23

А какой инструмент использовался, чтобы из чата запускать SSH сессии и команды?

Запускаем Qwen3-VL-30B на 48GB VRAM

SlavikF Jan 4 at 15:30

А с какими параметрами запускаете llama.cpp? Чтобы работать с изображениями нужно использовать --mmproj

В llama.cpp добавили функцию для динамического переключения моделей без перезагрузки сервера

SlavikF Dec 18 2025 at 14:58

я попробовал --fit . Очень удобно, но ещё немного сыро. Не умеет брать в расчёт "слой зрения" (или как это правильно по русски?) - крэшится:

https://github.com/ggml-org/llama.cpp/issues/18111 Eval bug: llama-fit-params does not include vision stack in calculations

Есть ещё баг, что они слои не в том порядки загружают.

Но думаю в ближайшее время пофиксят.

В llama.cpp добавили функцию для динамического переключения моделей без перезагрузки сервера

SlavikF Dec 17 2025 at 01:43

Что ещё нужно знать про этот режим:

по умолчанию llama.cpp держит в памяти 4 модели. Поэтому если у вас 24GB VRAM, вы отправили запрос к первой модели на 16GB - она загрузится и ответит. Если теперь придёт запрос ко второй модели на 10+GB, то она попробует загрузиться и свалится с ошибкой OutOfMemory. Решается --models-max 1 - это означает что на VRAM нужно держать только одну модель и при обращении ко второй, первую нужно выгрузить.
по умолчанию все модели загружаются с длиной контекста 8192. Если прописать другое значение - то оно будет использоваться для всех моделей. А если надо для каждой модели использовать своё значение контекста, температуры, ... то нужно использовать --models-preset config.ini

Разворачиваем Proxmox VE 9: Исчерпывающая инструкция по установке и эксплуатации

SlavikF Dec 16 2025 at 15:26

Пользуюсь Proxmox 9 у себя дома.

В общем, всё неплохо.

Но вот нарвался на такую проблему:

в случае использования NVMe дисков и файловой системы ZFS, - как только есть серьёзная нагрузка IOPS на диск, то зависает и крэшится как сама виртуалка, так и сам гипервизор.

Про эту проблему много трэдов написано на их форуме. Решения с ZFS - нету.

Я решил это тем, что использую BTRFS.

Сегодня обновим n8n, установленный по инструкции через...

SlavikF Dec 16 2025 at 14:20

Уже не первая статья про n8n.

А я всё не могу понять: где же этот n8n может быть полезен?

Кто-нибудь, напишите, пожалуйста, пост о реальном, жизненном сценарии (use case) использовании n8n.

Обзор проекта WhisperLiveKit — синхронный перевод между любыми языками

SlavikF Dec 13 2025 at 23:07

Почему "выходит двойной перевод через english"?

В случае использования NLLW:

Whisper делает только транскрибацию (перевод не делает)
NLLW делает перевод

Как я тв-шоу переводил с помощью ML-моделей без подписок и СМС

SlavikF Dec 12 2025 at 17:19

Очень интересно. Спасибо за код в Github.

В декабре-2023 "книгалиц" написали у себя в блоге, что у нас есть AI для аудио-перевода... У них есть демка (русский не поддерживается), которую я тогда попробовал (я тут говорю по английски, а меня переводят на испанский):

https://s3.fursov.family/shares/fb_translate.mp4

Тут используется технология VOICE CLONING. Которая сохраняет и тембр голоса и интонацию.

Месяц назад QWEN выкатила вот эту модель:

https://huggingface.co/Qwen/Qwen3-Omni-30B-A3B-Instruct

Эта модель может:

распознавать аудио (STT)
переводить (LLM)
синтезировать речь (TTS)

У них на сайте есть демка, по 30 секунд работает. Но открытого движка для этой модели вроде бы ещё ни у кого нет. VLLM и llama.cpp могут с этой моделью работать как с LLM, но TTS не поддерживается пока.

Self-hosted AI-платформа: полный стек для локального ИИ на Docker

SlavikF Dec 4 2025 at 22:41

Qwen2.5-Coder?
deepseek-r1?

Вы из прошлого века?

Топ-10 бесплатных нейросетей для создания презентаций

SlavikF Dec 3 2025 at 17:30

Как-то я сомневаюсь, что AI выдаст адекватную презентацию... Так - черновик может быть.

Я экперементировал вот с этим open-source:

https://github.com/presenton/presenton

И оно работает. Я использовал локальную модель OSS-GPT-120B, а картинки - через API Google Gemini.

Отчёт Microsoft: что скрывается за глобальным разрывом в применении ИИ

SlavikF Dec 1 2025 at 16:14

Какой-то мутный список в статье...

Gemma 3 - это модель Британии? Серьёзно?

Число школьников на домашнем обучении в США достигло рекордного уровня

SlavikF Nov 24 2025 at 22:07

А сегодня согласно законов убивают детей.

Этот диалог можно продолжать бесконечно...

Вот поэтому я в Южной Каролине: потому что мои дети (у меня их 9) здесь ходят в частную христианскую школу. В которой и близко не подпустят учить и преподавать человека, который считает что аборт - это нормально. Или который считает что мальчик может стать девочкой.

А какой будет академический уровень образования, в какой университет поступят мои дети - вопросы конечно важные, но второстепенные. Думаю, что с этим у них тоже всё будет нормально, потому что один мой двоюродный брат тут - доктор, другие два - программисты (я - тоже) и т.д. Но главное - никто из них детей не убивает.

Число школьников на домашнем обучении в США достигло рекордного уровня

SlavikF Nov 24 2025 at 21:16

Если нет малыша, то кого же тогда абортируют? Это называется "расчеловечевание".

В какой момент "не малыш" становится "малышом"? Уже на 6й неделе бьётся сердце. На 13й неделе есть развитая нервная система способная чувствовать боль. Даже на 5-ом месяце беременности недоношенный младенец уже способен выжить.

У человечества уже есть опыт, когда некоторых считали "недочеловеками", и сейчас стесняются об этом вспоминать.

Вот решать за женщину, что ей нельзя убить ребёнка, когда он уже родился - это в нашем обществе нормально. А решать за женщину, что ей нельзя убить ребёнка до того, как он родился - это ая-яй-яй, нельзя! Какие-то двойные стандарты.

ни разу не родные родители

Ну да, родные родители, которые тебя убили, чтобы найти "лучше оплачиваемую работу" - это лучшие родители. (сарказм)

Число школьников на домашнем обучении в США достигло рекордного уровня

SlavikF Nov 24 2025 at 20:54

"Жизнь лучше сложилась"?

А как сложилась жизнь у малыша, которого убили абортом?

Кстати, тут в США, во всех штатах, можно добровольно отдать ребёнка сразу после рождения. Вопрос "полного содержания" решён.

Число школьников на домашнем обучении в США достигло рекордного уровня

SlavikF Nov 24 2025 at 20:33

Давить - нельзя, а "опекать" - можно. Только бы не перепутать.

Вот в штате Missouri аборты запрещены, поэтому в школах "опекали" девочек: возили делать аборты в соседний штат, - там можно. А родителям - не говорили.

И подобных примеров - много. Поэтому народ тут массово валит из школ: будет ли моя дочь делать аборт или нет - намного важнее того, какая у неё оценка по биологии...

Число школьников на домашнем обучении в США достигло рекордного уровня

SlavikF Nov 24 2025 at 20:15

Рейтинг образования может и волнует конгрессменов, но большинству родителей - до лампочки. А даже если и волнует родителей - мало кто может что-то сделать по этому поводу.

А вот активисты реально страху нагнали на родителей. Показательный пример: у нас тут в прошлом году вопрос получил вот такой оборот:

родители обнаружили в школьных библиотеках книги про геев, трансов и т.д.
родители подняли шум и в нашем округе запретили, чтобы в школьных библиотеках были "порнографические" книги.
активисты подняли шум, что дикие варвары (это про родителей) запрещают книги! У нас свобода слова, а тут хотят ввести "цензуру"!

Я так и не понял чем кончилась именно эта баталия, но показательно, что именно такие вот книжки вызвали очень резкую реакцию родителей, чем какие-то непонятные "рейтинги образования".

2 3 ...

28 29