Comments / Profile of illian / Habr

Алексей Подойников@illian

Программист

Subscribers

Рабочие станции для ML и Data Science — как собрать сервер под столом

Тоже собирал систему, много проблем было, 5090 в основной блок питания, 4090 + 3090 в дополнительный блок питания. Все это удалось запихать в домашний (не серверный) корпус, правда очень большой.

Все видеокарты на райзерах, разнесены максимально, насколько позволило место, чтобы не грелись друг от друга, и у всех пришлось ограничить потребляемую энергию. материнка супермикро, процессор эпик, памяти думал позже побольше взять, но не успел докупить до подорожания.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Dec 12 2025 at 14:43

Тут кажется проблема в том, что перевод текста, это условно дёшево, а обучение модели по текстам пользователей очень дорого, да и потом ещё под каждого пользователя эти модели надо хранить. Поэтому сервисы перевода и не будут давать возможности дообучения для пользователей. И не факт еше, что загруженный текст(ы) будут иметь достаточный объем /вес, чтобы модель начала их учитывать при переводе. Так что здесь очень много сложных факторов.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Nov 5 2025 at 14:08

Тоже заметил. Поэтому кажется, что лучше небольшие куски текста с контекстом переводить.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Nov 5 2025 at 14:06

Тут скорее вопрос, справится ли используемая модель. Но в основном промпт сейчас строится на одном исходном языке.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Oct 8 2025 at 13:26

Попробовал, ситуация интересная. Мне перевод показался плохим - в каких-то местах выдуманные куски, модель путает "вы-ты", странные конструкции. Но при этом формальная оценка - 91,33, выше, чем у любой другой модели. Добавил результаты в гугл-таблицу, ссылка на которую приведена в статье.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Oct 7 2025 at 00:21

Нет, можно попробовать.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Oct 2 2025 at 12:38

Наверно, можно ссылку на гугл док прикрепить

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Oct 1 2025 at 09:25

Было бы интересно почитать результаты, хотя бы субъективные.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 29 2025 at 06:47

Все упирается в необходимость cuda для некоторых моделей. И перевод медиа, через whisper, тоже потребует. Если оставить только перевод через лм студио, то может и получится сделать портабельно. Но надо смотреть. Попробуйте установку по первому пункту, через внешние системы для портабельной установки. Я попробовал через одну из них, была одна проблема, я описал в документации решение.

Пишите, какие будут сложности или проблемы, попробуем решить)

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 28 2025 at 23:50

В русском тексте слова могут быть практически в любом порядке, но в английском - нет. Поэтому при переводе на английский, без дополнительного контекста с нужными эмоциями, это будет потеряно.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 28 2025 at 23:47

Получается, что я сам пришёл к варианту с первым проходом, подача текста и предыдущего контекста. Но при переводе книг я подаю только один параграф, чтобы было проще делать соответствие оригинального параграфа и перевода, потому что пытаюсь читать сначала текст в оригинале, потом перевести мысленно, а потом уже заглянуть в перевод. Думаю, это очень редкий случай, что кто-то ещё захочет читать именно так, но делал в первую очередь под себя.

Если бы не этот подход, то можно было бы, как и описано выше, брать несколько абзацев (ограничение по длине взять из параметров) и отдавать в перевод. Возможно, стоит сделать и такой вариант тоже. И потом сравнить, на сколько это даст эффект в качестве.

Ниже обсуждалось, что есть вариант сделать глоссарий имён, возможно, сразу вида имя - пол - вид (если не человек) - краткая характеристика. Вопрос в том, сколько это займёт контекста и не запутается ли в нем модель.

При разбивке по предложениям перевод будет очень плохим, да, но и использовать его стоит только для тех моделей, которые иначе начмнают терять что-то. Все ллм модели нормально работают с несколькими параграфами текста.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 28 2025 at 23:35

Это можно пробовать решить созданием контекста с именами и передачей его в перевод. Можно попробовать добавить.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 28 2025 at 23:31

Если бы речь шла про звезду, то был бы верный. Но в данном случае ожидалось, что будут именно кентавры, если смотреть на образец от команды переводчиков.

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

illian Sep 28 2025 at 14:28

В зависимости от используемой модели. Скорее всего, каждая по своему истолкует.

Приложение само по себе не переводит, а только подгатавливает текст для перевода. А переводят модели, которые создали и обучили компании и возможно дообучили другие люди.

На модели saiga_yandexgpt: Тебя я люблю. -> I love you. -> Я люблю тебя.

Переводим fb2 книжки, с нейронками, для себя

illian Sep 27 2025 at 01:12

Интересная статья. Я тоже написал переводчик на питоне, с поддержкой llm, и более специфичных моделей, в котором есть как модуль перевода (вроде гугл транслейт), так и перевод файлов. Есть кэши, разбивка на части и тд. Пока что только fb2, epub, txt. Планов много, разработка идёт. Все хочу написать статью, и все не соберусь)

Электричкой из Москвы…Что представляет собой рынок электромобилей в России

illian Nov 8 2022 at 02:20

Посмотрите обзор i-pro, который делал За рулем. Там рассказывают (примерно на 5-й минуте), что штатно установлен контур обогрева, который питается от солярки. Можно выбрать, как обогревать салон - электричеством, или соляркой.

Angular 2 Beta, обучающий курс «Тур героев» часть 4

illian May 28 2016 at 15:06

Может быть здесь что-то найдете.

Angular 2 Beta, обучающий курс «Тур героев» часть 3

illian Apr 30 2016 at 17:33

Не совсем понял вопрос. Список директив в html-шаблоне?

Angular 2 Beta, обучающий курс «Тур героев» часть 3

illian Apr 28 2016 at 16:37

Извиняюсь, совсем вылетело из головы. Подправил ссылки, добавил оглавление.