Как стать автором
Обновить
53
0

Пользователь

Отправить сообщение

Ох, ребят, вы про Kaitai Struct совсем ни разу не слышали? Ну зачем такие штуки писать руками на C#?

окей, окей, господа правильные японисты, не задерживаемся, проходим :)
мы тут немножко ересью занимаемся, а уж посмотреть, как я попытался объяснить про строение японских текстов — меня за такое на костре сжечь надо...

Проблема в том, что у меня пока не получилось это объяснить ни одному человеку. Да и в целом порог вхождения без шуток гигантский — это месяцы тренировок, чтобы уверенно узнавать все радикалы, знать, что 氵, 氺 и 水 — это одно и тоже и т.д. и т.п. Рисование черт и считание их в правильном порядке вообще толком неотделимо от изучения самих kanji как таковых. В современном мире, по большому счету, умение относительно бесполезное. Я сам, например, от руки пишу весьма криво и медленно, и куча моих знакомых так же. Все с клавиатуры, культуры 書道 никакой.


Китайские словари, кстати, сильно отличаются от японских, если уж на то пошло. Я так понимаю, в Китае более-менее победила 4-угловая система, что сильно упрощает жизнь при таком количестве значков. В Японии — кто в лес, кто по дрова.

Я про него только в книжках читал, о как.

Я его уже пару лет не пробовал, когда пробовал — результат был практически бесполезный. Сейчас попробовал на себе — в целом все сильно лучше, но, во-первых, до идеала еще очень далеко (особенно на более сложных kanji где >20 штрихов), во-вторых, возможно, это не потому, что там движок как-то улучшили, а скорее потому, что я сам стал рисовать это все несколько более правильно за это время.


Говорят, что еще помогают приложения, ставящиеся на телефон — фотографируешь текст, тебе его распознают.


Тут был еще неподтвержденный комментарий примерно в ту же тему, но модераторы его удалили :(

SPX — это который IPX/SPX или что-то другое?

Да мне самому процесс нравится — зачастую даже больше, чем результат :) Можно разбирать какие-нибудь сетевые протоколы, malware, а можно — всякие продукты игровой индустрии. Первого мне на работе хватает, а второе, на мой вкус, куда интереснее :)

Спасибо :)
イースターエッグを気づきましたか?

Спасибо :)
イースターエッグを気づきましたか?

Ну да, все так :) А что делаете и про что статью пишете, если не секрет?

Да я как-то равнодушно отношусь к русскоязычным новеллам. Практически все, что я видел, каких-то особых чувств во мне не вызвали.

Дело не в быстро/не быстро, дело в том, что специально приходится себя заставлять обдумывать каждый шаг и описывать его. Можете посмотреть у меня на гитхабе — там выложена часть моих наработок по другим движкам — для не очень сложных байткодов современных VN у меня типично уходит пара-тройка вечеров, чтобы в них разобраться. А тут — такой долгострой на полгода — именно потому, что после того, как разберешься — пытаешься осознать и понять, как ты при этом размышлял, какова была логическая цепочка, которая привела к успеху и какие из ложных следов стоит упомянуть, если вообще какие-то стоит.


В общем, да, очень похоже на детектив и, да, спасибо за пинание :)

Написание этой статьи я долго откладывал, потом долго писал ;) У меня сейчас уже написано текста примерно в 2.5 раза больше, чем тут опубликовано — и это совсем не конец исследования. Относительно легко понять, что такое sect1 и sect2, но когда дойдет до опкодов — дальше там идет кротопливая и требующая определенных знаний и доли интуиции работа по определению, что же есть что.


Сначала я хотел таки дописать ее до самого конца, но, к счастью, ряд товарищей, постоянно пинающих меня в стиле "обещал аж в апреле, а когда же уже будет продолжение" — отговорили от этой идеи, посоветовав опубликовать то, что уже есть в формате "по частям". И, наверное, это хорошо — а то оно бы мариновалось еще пару-тройку месяцев. А то бы и вообще сгинуло...

Ни разу, честно говоря, не сталкивался с тем, чтобы искали реверсеров за деньги на фрилансе — но могу предположить, что сейчас идет определенный бум популярности визуальных новелл у западных издательств. Есть MangaGamer, есть Sekai Project, которые если не прям купаются в долларах, то выходят на хороших промышленный уровень регулярных выпусков переводов.


Сами по себе затраты на лицензирование и переводы — сравнительно небольшие. Если повезет — то, вон, какая-нибудь Grisaia собрала на предзаказе почти пол-миллиона долларов. Лицензионные отчисления — единицы или десятки тысяч долларов, остальное забирает западный издатель. Для небольшой команды — это вполне себе деньги, особенно если выпускать по 2-3 новеллы в месяц.


На практике все, конечно, совсем не так радужно, но куча народа думает, что это именно что простой способ заработка. И как только ты провел переговоры с японцами, закупил права и начал перевод, выясняется что-нибудь вроде того, что:


  • их движок совсем не предназначен для работы с англоязычными текстами
  • исходники движка потеряли, потому что ты начал переводить игру начала 2000-х, которой уже 10-15 лет, есть только бинарник — как хочешь, так и крутись
  • исходники вроде бы даже есть, но оригинальная команда разработчиков распалась, а тимлид-программист переучился и пошел работать капитаном дальнего плавания, исходники и все инструменты для работы с ними лежат на дискетах у него дома и туда он приедет из своего очередного путешествия эдак через полгода

Тут, видимо, и приходит в голову остроумная идея нанять фрилансера для разбирательства с движком?

Они от этого обычно становится не такими цветными. Ну и, да, там их сейчас несколько тысяч, включая всякую платформо-эксклюзивную фигню типа «два мужчины держатся за руки и перед ними мальчик и девочка».
Это, кстати, обычно не работает, т.к. если libmysql производит экранирование в некоторой кодировке, то почти всегда она же и будет этот запрос интерпретировать, причем в той же кодировке. Может сработать в некоторых экзотических случаях, когда между экранированием и выполнением запроса есть дополнительные стадии, второй раз заменящие кодировку.
Кстати, на японском «Щекочихин» отлично записывается как シェコチヒン — «she-ko-chi-hi-n».

Гораздо хуже со всякими там «gasoline» (который выглядят страшно на записи — ガソリン), всякими там фамилиями типа «Волобуев» (которая становится «borobuebu») или с сосредоточением согласных типа «Мкртчян» (с другом могу представить).
Да, примерно так. こんにちは (konnichiwa) — традиционное японское нейтральное приветствие (типа «добрый день»). Проблема в том, что на записи последний слог формально «ha», а не «wa». Если взять само «konnichi» — это просто «этот день». Частица は после члена предложения обычно показывает что это слово — подлежащее. И когда は является именно этой самой частицей, ее надо произносить как «wa», а не «ha». Вообще, в японском очень простые правила чтения (примерно как в русском), исключений по пальцам пересчитать, но вот такое есть.

В обычных предложениях никто массово опечаток не делает (все пишут «ha», произносят «wa» и никакого когнитивного диссонанса не испытывают). С приветствием же проблема в том, что оно как бы полноценным предложением не является и устоялось в такой форме чисто по историческим причинам. Все на автомате произносят и никто даже не задумывается о том, что это значит дословно. И точно так же на автомате иногда пишут. Я в свое время даже по входящей почте статистику считал — на 100 писем с приветствием эдак 5-7 «неверных» записей точно будет. Причем письма вполне от чистокровных японцев, не от каких-нибудь понаехавших студентов.
Поэтому нужно именно выборочно.

Но не так же! Собственно, даже в приведенном вами PHP manual написано: разумеется, нужно понимать семантику кодируемого и, как правило, разделять URL на составные части и кодировать по частям. Причем разные части кодируются по разному: домен — в punycode, path — percent-encoding с одним набором «запрещенных» ASCII символов, query — другим, fragment — остается в unicode (если речь не о CURL, скажем, а о каких-то браузерах). То, что предлагаете вы — просто неверно (а местами и опасно). Попробуйте закодировать, скажем, какой-нибудь http://日本語.jp/ вашей функцией — я посмотрю, что получится.

Если адрес символа зарезервирован на 4 байтах, перевести его в 3 байта невозможно.

Это все отлично, только для демонстрации этого вы используете 3-байтовые символы. Я понимаю, что вставить напрямую не удалось — ну так вставьте картинками, или добавьте ссылку на какой-нибудь сервис, корректнее работающий с unicode, или еще что-нибудь. Пока получается, что примеры в статье несколько противоречат содержимому.

Информация

В рейтинге
Не участвует
Откуда
Токио, Токио, Япония
Зарегистрирован
Активность