Помнится, когда-то уже давным давно пробовал ради любопытства засунуть dll'ки от визуального васика в декомпилятор DotPeek и он декомпилировал его в обычный Си#, хотя она была написана (традиционно для Микрософта) на VB. Да, между си и паскалем порой разницу устранить можно чуть ли не через поиск и замену. А вот трансляцию из форта или лиспа в си мне увидеть было бы забавно (ну или просто чего-то подобного). А то ведь и с декомпиляцией вместо простого ассемблера в хотя бы простой си проблемы. Ну это просто мои мысли по поводу и ничего более.
Действительно, вроде проблема трансляции одного ЯП в другой достаточно давно решена. Пусть не идеально (это про про производительность и расход памяти результатов), но решена. Кое что давно было подобным образом конвертировано: в первую очередь мне вспоминается tetex, который был как бы на простом Си хотя исходный TeX был написан на паскале; но думаю ещё подобных примеров можно наприводить. Впрочем, косяки могут, конечно, встретиться, но всё же.
Скоро по версиям Винду догонит и перегонит (главное чтоб не Хром). И помнится, много-много лет назад (возможно даже до выхода Wine 1.0) у них на сайте был указан процент реализации Win32, а сейчас я что-то нигде его найти не могу. Никто не подскажет, может он всё же есть сейчас?
Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)
Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.
Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.
Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).
Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде. P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)
Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?
Помнится, когда-то уже давным давно пробовал ради любопытства засунуть dll'ки от визуального васика в декомпилятор DotPeek и он декомпилировал его в обычный Си#, хотя она была написана (традиционно для Микрософта) на VB.
Да, между си и паскалем порой разницу устранить можно чуть ли не через поиск и замену. А вот трансляцию из форта или лиспа в си мне увидеть было бы забавно (ну или просто чего-то подобного). А то ведь и с декомпиляцией вместо простого ассемблера в хотя бы простой си проблемы.
Ну это просто мои мысли по поводу и ничего более.
Да, спасибо, похоже на то.
Действительно, вроде проблема трансляции одного ЯП в другой достаточно давно решена. Пусть не идеально (это про про производительность и расход памяти результатов), но решена. Кое что давно было подобным образом конвертировано: в первую очередь мне вспоминается tetex, который был как бы на простом Си хотя исходный TeX был написан на паскале; но думаю ещё подобных примеров можно наприводить. Впрочем, косяки могут, конечно, встретиться, но всё же.
Скоро по версиям Винду догонит и перегонит (главное чтоб не Хром). И помнится, много-много лет назад (возможно даже до выхода Wine 1.0) у них на сайте был указан процент реализации Win32, а сейчас я что-то нигде его найти не могу. Никто не подскажет, может он всё же есть сейчас?
Ну на это я могу сказать что традиции славянских латиниц - это очень странный предмет, вроде бы они есть, но на самом деле их нет. К примеру, поляки и чехи [х] передают диграфом ch, а хорваты - одной буквой h, поляки [ч] cz, хорваты с чехами - č, ну [ш] sz - š. Так вот у чехов звук [в] передавался буквой w где-то до середины 19 века, ну и у всяких там хорватов и словенцев передача через w тоже вполне себе встречалась 8)
Судя по наличию Й на месте j и В на месте w - именно так оно и было. Хорошо хоть Ц не на z и З не s :) (в результате больше похоже на польский)
Меня таблицы в ТеХе тоже выбешивают, прочитав первый абзац я обрадовался, но в дальнейшем никаких примеров с использованием таблиц не увидел. Хотелось бы поглядеть именно на них.
Ну на самом деле это ИСО 9 (и не только его) я могу тоже долго критиковать. Например, буква ъ передаётся как ʺ (U+2BA) (в уникоде про этот знак прямо указано), явно подразумевается что он не может быть прописной буквой, т.к. не может идти в начале слова. Только вот современное болгарское слово ъгъл 'угол' всё это портит (ну и паровозы серий Ъ и Ь заодно). Можно ещё про кавказский знак палочка "Ӏ" вспомнить, который передаётся просто как "‡" (но кто тут больше налажал они или Unicode consortium я сказать не могу). А про часть кириллических букв я вообще не понял откуда они. Но в защиту его можно сказать одно - это стандарт. Всё.
ISO 9:1995 🤦
Почему-то вспомнился Лёд-9 из романа Курта Воннегута "Колыбель для кошки" 🙃
Так, я не понял, а зачем тут PUA-область? Они уже давно нормально в уникоде есть: 𓀀 и ᛉ
Ну вот ХЗ, всю жизнь (когда мне было лень указать явно кодировку, т.е. достаточно часто) - я использую enconv и не жужжу (какие-то самописные скрипты не нужны).
Не факт что там есть какой-то БИОС. Там сейчас там UEFI вроде.
P.S. Ещё в молодости прилично железок угробил, а теперь лезть вглубь никакого желания нет (если работает - не трожь)
Ну да, вот про НЖМД и .30-30 Winchester я как раз забыл ?
Было уже нечто подобное со словом "браунинг" для обозначения пистолета. Возможно ещё чего подобное было, но это первое приходит в голову.
Кобол всё же слегка постарше будет - 1959, а ПЛ/1 только 1964 :)
Я тут слегка посмотрел и выяснил:
Что упоминающийся Йероен Коеккоек - это Jeroen Koekkoek (https://imap.nlnetlabs.nl/people/, https://github.com/k0ekk0ek), т.е. явно голландец;
И следовательно тут надо применять правила нидерландско-русской транскрипции;
И он получается скорее Йерун Куккук, там oe передаёт у.
P.S. Прошу меня извинить, просто странный набора знаков в глаза бросился ?
Мне, как самому ленивому, хватило стандартной записной книжки ?
Эээ??? Чего-то я не понял - ЦРУ создано только в 1947, т.е. после Второй мировой ?
Ну это я тоже заметил, хоть и очень далёк от всех этих CJK и пытаюсь вглубь даже не соваться. Сначала они добавляли всякие составные символы, хоть там диакритические знаки в два ряда могли идти (ṏ), но потом перестали. Видимо дошло, что так их можно хоть до бесконечности добавлять (мне символы с тремя рядами диакритических знаков в книгах попадались, и не раз). В общем, прекратили такие символы добавлять, но критерии добавления для меня не совсем ясны. А вот со всеми этими китайскими иероглифами всё обстоит иначе — их так и продолжают добавлять, хоть их и спокойно можно разбить на несколько знаков и даже в этом уникоде есть специальные значки для описания состава (⿲ и т.п.). Но их продолжают вставлять (хотя, повторяю, я от всего этого далёк). Ну и подозреваю, что с древнеегипетскими иероглифами, клинописными значками и проч. будут свои заморочки, например значки фестского диска помечены как Other Symbol ?