Comments 40
Я Вас очень прошу - пропустите свой текст через Word, он Вам запятые поставит.
Просто слова переводит, короче ваще забей. Ну там у них еще прикол, что ты можешь реально переводчика подключить на проект.
Чувак! СмартКэт - это не сервис перевода, а среда для переводчиков. Если ты сам не переводчик, то он тебе ничего не даст. Аббревиатура CAT на это прямо указывает.
Непонятно, почему ты вообще в него полез.

Буквальное позиционирование на их сайте. Защитники smartcat уверен был, что придут.
Тогда пардон. Я даже не знал, что у смарткэт вообще есть такая функция.
Тогда скажу, что она у него не основная, и я бы на неё рассчитывал.
CAT-системы - это типа как IDE, только для переводчиков. Они про мелкую автоматизацию, а не про автоматический перевод. Их клиентами являются переводчики.
сколько, по времени, в итоге, занял процесс перевода всего объема текстов?
Скриптом 15-20 минут примерно.
а сколько ушло на работу с нейронными сетями, освоение дополнительного инструментария, под этот проект, и получение работающего кода от cursor?
Где-то 3 вечера, по часа 4. И это было не сложно и приятно. Для таких задач понял, что идеальная связка ChatGPT + Cursor. С ChatGPT верхне уровнено описываете проект, делаете промт. Потом переходишь в Cursor пару python файлос создаешь с кодом который ChatGPT выдал и уже с ним допиливаете. Оч рекомендую в Cursor именно Sonnet 3.7 выбирать, самый долгий, но лучше всего себя показал.
И! С ChatGPT буквально можешь писать ТЗ для курсора. А ещё 2 дня убил на этот долбаный шрифт.
p.s Статьи пишу сам, без ChatGPT, насколько же он дженерик пишет и насколько, это палится.
Блок Вывод в конце статьи - 146% маркер того что написано тупым американским роботом.
Я очень много читаю текстов от ллм и этот Вывод у меня уже в печенках сидит.
где в первой колонке комментарий разработчика, во второй текст на английском, в третьей, должен быть текст на русском
Не понял, а зачем для этого задания применять Chatgpt и его аналоги? Нам бесплатно дают переводчики - это обученные нейронки для этих задач, прекрасно справляются с переводам, качество их работы недостижимо для llm общего назначения. Я делал переводы тысяч страниц, тоже через скрипты, гугол переводчик справлялся.
У Гугл переводчика есть проблема для игр а том числе, так как там все разбито на лексемы на короткие части и часто реальная фраза от двух таких лексем состоит и переводчик не видит контекст и не видит связи в лексемах. Поэтому есть сервисы и софт для переводов потому что для приложений это не тоже самое что документ перевести
там все разбито на лексемы на короткие части
Где там разбито на лексемы? Если вы знаете устройство модели переводчика google, то там токены разбиваются на подслова и всё это векторизуется нейронкой по контексту общему и локальному; это то, что они показывали 6 лет назад. Переводчику не нужно понимать контекст, предложение должно содержать полный законченный смысл, не оборванный на полусмысле и продолженный через 200 предложений. Если вы об этом, то я не пробовал такие модели.
В целом выбраны неправильные инструменты для перевода, llm немного могут, только проектировались они не для этих задач. Узкоспециализированная нейронка справится гораздо лучше.
Переводчику не нужно понимать контекст
Эт как не нужно?))
GT (которой не знает контекст)
croakwork machines - машины для квашения
Pocket Snoozer - Карманный Снузер
Kroaka (NPC) - Кваканье
Quiet places, small spaces, warm embraces - Тихие места, небольшие пространства, теплые объятия
DS (которая знает контекст)
croakwork machines - квакательные механизмы
Pocket Snoozer - Карманный Дрыхун
Kroaka (NPC) - Квакша
Quiet places, small spaces, warm embraces - Тихие уголки, укромные местечки, тёплые объятия
Просто рандомне примеры, которые взял из перевода. small spaces - небольшие пространства. Вообще могут заруинить тебе игру, потому что, в игре именно, что про уют и они обитают не в "маленьких" пространствах, а уютных.
Может я не правильно комментарий понял, но как Google Translate может нормально перевести игру не понимая контекста?
Вот перевод от гугол переводчика - croakwork machines - Машины для кваканья
Pocket Snoozer - Карманный храпун
Kroaka (NPC) - Кроака (NPC)
Quiet places, small spaces, warm embraces -Тихие места, небольшие пространства, теплые объятия
Что вы там напереводили, я не понял. LLM модели рассчитаны на дописывания текста (произвольная интерпретация вывода на основе статистики последовательности слов ), а переводчики на подбор наиболее подходящих (точных) сочетаний переводного текста.
предложение должно содержать полный законченный смысл,
Как достать белок из клетки?
Лол. Почти любая нейронка переводит лучше, чем гугл-переводчик. Если разговор хоть немного использует сленг или идиоматические выражения, то гугл переводчик начинает писать чушь.
Пример:
RU: Меня пригласили на ёлку.
EN (GPT 4o mini): I've been invited to a Christmas party.
EN (Deepseek v3): I was invited to a New Year's party.
EN (Google Translate): I was invited to the Christmas tree.
В общем, продолжайте пользоваться гугл переводчиком, и не забывайте приглашать своих друзей на рождественское дерево.
"Рождественская елка" - что не устраивает? Так там и говорят, не нужно учить их родной речи основываясь на своём понимании.
Вы понимаете, что "ёлка" в данном случае - это название мероприятия, а не дерево?
Наиболее точный перевод из представленных: New Year's party
Британцы много столетий понимают Рождественская елка" как party. Ну такая у них культура. Переводчик и добавил слово рождественская к слову "ёлка". Не дерево ёлка, а рождественское празднество. Там ещё и отмечают его не так как христиане, поскольку там множество католиков. Это страновые и культурные традиции.
Пока лучший софт для переводов на мой взгляд это https://github.com/WeblateOrg/weblate у него есть конекты к апи ии и скриншоты с метками.
написал скрипт в котором ты загружаешь таблицу и он тебе переводит через нейронку от самого Google Translate
К слову, Google Translate как и Яндекс умеет принимать файл в формате эксельки для перевода, без всяких скриптов.
Кстати, если видите в статье среднее тире «‑» это 99.9% что писал ChatGPT, нормальны люди никогда его не ставят.
Даже немного обидно стало. Мне нравится среднее тире – оно по ширине примерно как обычный символ и не портит пропорцию текста.
Нормальные люди ставят минус ("-"). Потому что ничего другого на клавиатуре не предусмотрено.
Нормальные люди ставят два минуса, которые в нормальных редакторах превращаются в тире (но к сожалению не здесь и не на гитхабе. А вот джира молодец).
Простите, но это пижонство. Минус, отбитый пробелами - это тире.
Заморачиваться имеет смысл при подготовке к изданию. А в комментах и прочих постах - нецелесообразно.
Два минуса ставлю просто на автомате. Даже если редактор не превращает их в тире, все равно это выглядит лучше, чем одиноко стоящий дефис, как будто обиженный отсутствием слов справа и слева. У меня дефис в таком виде вызывает ассоциации с невычищенным результатом OCR.
Если есть цифровой блок на клавиатуре, то alt + 0150 даст –
Для длинного тире alt + 0151 —
Мой опыт локализации игры через нейронку