Pull to refresh

Comments 50

ого какое длинное "да" на японском :)

даааааааааааааа)

Как я понял это что-то типа «согласен» в вежливой форме.

Всё-таки фуригана должна быть фуриганой, как в Вашем же примере на китайском ниже.

Да, тут текст без фуриганы. Но её тоже можно добавить.

Нет-нет, здесь текст с фуриганой, но она вывалилась из скобок, а поскольку лексика не совсем современная, фуригана добавлена к каждому второму слову. Смотрите, я вернул скобки на место:

Надо либо скобки сохранять, либо фуригану рисовать в положенном ей месте, либо вообще выкидывать. Но оставлять её вот так в тексте и без скобок нельзя.

Вот здесь фуригана проставлена как положено: https://www.ehime.com.my/ja/blog_detail/id=4

Понял о чем вы. Здесь это не фуригана, это цельный текст.

С фуриганой выглядит так:

image

Вижу, но теперь фуригана проставлена неправильно. Надо брать фуригану из источника, когда он есть. Я попытался отредактировать этот пример, но слишком много всего неправильно.

Здесь это не фуригана, это цельный текст.

Таки нет же, у Вас фуригана уже есть в тексте, просто потерялась разметка, которая показывала, что есть основной текст, а что фуригана. Посмотрите на моей картинке выше: что внутри скобок — это фуригана. Надо её подписывать рядом с иероглифами, а не оставлять внутри текста. И не надо подписывать те иероглифы, где фуриганы нет. И не надо давать автоматике пытаться угадать, как слова читаются, если она этого не понимает. Смотрите, я зачеркнул всё, что было неправильно, и по возможности подписал исправления:

Да, помотрел, вы правы. Это в тексте, который я нашел, уже так было. Нет ли у вас каких-либо текстов на японском (например, рассказов) и их переводов на русский? Я бы попробовал их выровнять.

По фуригане — тут бы просто тексты найти, не то что с фуриганой :) Фуригану я генерировал автоматически вот этой библиотекой. Самое лучшее, что есть.

Японцы очень берегут интеллектуальную собственность, поэтому только старые книжки можно найти.

Вот есть Нацумэ Сосэки, "Ваш покорный слуга кот":

По поводу библиотеки пока сложно что-то сказать, но вообще я бы не сказал, что подписывать фуригану везде где можно — это универсальный подход в обучении языку. Скорее, ученик сначала запоминает по фуригане некоторое чтение, а потом закрепляет по написанию того же слова без фуриганы. Например, в первой строчке 見つけた — мы не подписываем 見, потому что его могут правильно прочитать даже ученики второго класса школы; фуригана для этого слова избыточна. Или, например, второе вхождение слова 死骸 (в четвёртой строке) не надо подписывать, потому что первое (в первой строке) уже было подписано. Однако если следующее вхождение будет только на следующей странице, то там его можно снова подписать. Качественная расстановка фуриганы — это непростой навык. Тем более если двуязычное издание делается для изучающих язык, надо следить за её адекватностью.

Выровнял первую главу, поличилось вот так: https://t.me/lingtrain/25. Автоматическую фуригану пока что убрал, подумаю над этим вопросом.

Скачал пдфку. Проблема всё та же: фуригана выпала из своей положенной позиции и попала в текст.

Подводит библиотека, всё-таки. Не распознала 太刀打ち без окуриганы ち, не распознала 人(ひと). Ещё одна ошибка, которую она совершает: подписывает 無用 как むよう, из-за чего получается что все три знака каны относятся к обоим иероглифам. Такая практика допустима только для атэдзи: слов, в которых чтение нескольких иероглифов возникает только в определённом сочетании, но не существует по отдельности. Классический пример: 大人 читается おとな, но никакая часть おとな не относится отдельно ни к первому, ни ко второму иероглифу. Или из вашего отрывка: 太刀(たち). В слове же 無用 чтение む относится только к первому иероглифу, よう только ко второму. В типографике принято в таком случае подписывать каждый иероглиф по отдельности: 無(む)用(よう), а не 無用(むよう). Если вы отрисуете оба варианта бок о бок, вы увидите разницу. Она считается достаточно существенной для книгопечатания.

Вы дали крайне ценные замечания, спасибо!

Или так (с фонетическими подсказками, китайский язык):

Пока не тестил, но по описанию звучит как бесценный инструмент. Пытался верстать такие книги вручную и это тот еще геморрой. Большое спасибо!

Да, обязательно попробуйте. Вы какие языки хотите задействовать?

Английский и, через какое-то время, турецкий. Надо ещё дотянуть его до чтения адаптированных книг.

Турецкий классный. Есть особенный шарм в агглютинативных языках :)

Очень крутое ощущение перестройки мозгов, когда в него погружаешься. Местами весьма систематичная, но при этом абсолютно иная в отличие от индоевропейских языков логика. Интересно, короче.

Меня еще гармония гласных очень впечатляет. Вот бы в русском так.

Круто, очень круто!

Кстати, было бы неплохо сделать выравнивание текста по обоим краям, аккуратнее будет выглядеть. Глаз за невыровненный правый край постоянно цепляется.

А иллюстрация к "Пикнику на обочине" это вообще шедевр. Хорошо передаёт атмосферу книги. Даже не верится, что AI уже научился так рисовать.

Хорошая идея, добавлю флаг для этой опции.

По поводу книг согласен, понемногу такие генерации становятся доступными. Эту я нарисовал как ранний тестер midjourney. Вот еще иллюстрация к "Маленькому принцу".

Оригинальная "акварель". Я такую точно не нарисую. Ну или потрачу сравнимое с разработкой midjourney количество времени ;-)

для всех, даром, и пусть никто не уйдет обиженный!

Далек от переводов, но двойные книги удобны для изучения языка.

Так и хотел назвать статью сначала, только "пусть никто не уйдет неначитанный" 🧐

Надо попробовать. А то я задолбался переводить свою книжку на японский, переключаясь между двумя Word'ами.

Ахренеть тема какая. У меня скопилось очень много новой литературы по языкам программирования выпуска 2021 года. А они как всегда только на английском языке. И иногда мозг такой уставший, что хочется читать литературу уже на русском языке. Чем на английском.

Тоже мечтал о таком документе.

А ещё так как в сфере информационной безопасности работаю. Приходится иметь дело с иностранными источниками. И вот такой инструмент очень упрощает жизнь.

Честно сказать, если бы подписка стоила 100₽ в месяц. Я бы пользовался без оглядки!

Вы, наверное, машинный перевод имеете в виду. Для технической литературы, я думаю, его сложно применять (даже люди все время термины как-то по разному переводят).

Тут же тема в том, чтобы состыковать два хороших текста на разных языках (оригинал и перевод). Просто так это сделать сложно, так как количество предложений может различаться на сотни. Lingtrain как раз умеет выравнивать такие тексты, а затем красиво их оформлять как параллельную книгу.

по идее DeepL можно ж скормить docx или pdf и он выдаст готовый перевод.

Господа, а особенно - Уважаемый Автор и разработчик!

А можно где-то скачать готовые Eng/Ru книжки, плз?

Дмаю, многие были бы готовы даже заплатить.

Спасибо!

Я дома учу языки по книгам Ильи Франка. Удобно. Принцип тот же - два текста рядом.

Да, хорошие книжки. Надо подумать как такие генерировать.

Ребята, неужели такие книги как-то способствуют изучению языка? Я както осилил одну книгу Франка. Ничего в голове не осталось.. пустая трата времени, как по мне. Действительно же помогает только чтение на ино-языке. Только когда голова разваливается от работы, в ней что-то остается..

Я, например, в книге анекдотов узнал много новой лексики уровня B2-C1. Однако, в голове откладывается только если делать в quizlet карточки для новых слов с примерами предложений и периодически прорешивать их.

В таком подходе мне очень не хватает нового/другого контекста для изучаемых слов или фраз. Каких-то динамических карточек quizlet или anki

Я бы сказал, что тут большую роль играет личная заинтересованность, а не какой-то конкретный подход. Когда язык интересен, то ты где-то книгу почитаешь, где-то фильм посмотришь, обучающие видео, статьи, карточки себе сделаешь, какие-нибудь курсы найдешь или друга по переписке и т.д. Тогда и результат будет.

это верно. Но бывает необходимо себя заставлять, а это приводит к унынию. У меня период заинтересованности давно прошел, что-то осталось, но довольно мало. Другая культура меня все еще интересует, но я подспудно изучаю ее по источникам на русском.. вот такая обманка.

Для тех, кто заинтересовался генерацией картинок по тексту, нашел Colab для создания таких изображений в стиле pixel art (пиксельные картинки как в старых играх). Запускайте ячейки по одной, в конце будет место для ввода текстовой подсказки.

Рисует примерно так:

Дополнительно прогнал через Pixelator, чтобы до конца пикселизировать и подредактировать цвета.

Без него получается так:

И так (попытался нарисовать обложку к книге Азимова):

Мечтал о такой программе, делая песенник с текстами на русском и на иврите.
Тот ещё геморрой.
Пришлось совмещать и выравнивать текст картинками, иначе сползал формат.

Очень мешает ограничение в конфиге ввиде указания localhost и 80 порта для API.
Это мешает запуску в контейнере на отдельном сервере.
Править конфиг не очень удобно.
В итоге сделал пулл-реквест убирающий данное ограничение.

Upd. В новой версии выравнивателя (пока что только в библиотеке) добавил возможность выравнивания по главам. То есть каждая часть может выравниваться независимо от другой, это повышает качество выравнивнаия.

Sign up to leave a comment.