Caiiiycuk May 12 2012 at 03:01

Портируем C/C++ библиотеку на JavaScript (xml.js)

7 min

21K

C++ * JavaScript *

Translation

+47

Comments 28

Mithgol May 12 2012 at 04:44

Прекрасный пошаговый walkthrough, спасибо.

TimID May 12 2012 at 06:14

Ребята, Вы что, серьезно, считаете «перекомпиляцию» байт-кода в код на js «портированием»? Вы хоть видели код, который получился — будет он вообще работать-то в браузерной песочнице на реальных объемах данных ?!

Я понимаю, если бы был только объектный код, но у Вас же есть исходник на С/С++!

Zelgadis May 12 2012 at 06:26

Так многое было портирована на js, и ничего, работает.

Zelgadis May 12 2012 at 06:28

портировано*

wentout May 12 2012 at 06:26

А, простите — Зачем?

Нет, можно, конечно, но я подозреваю что здесь речь всё таки не совсем о браузере.

wentout May 12 2012 at 06:27

Так что — само то.

Caiiiycuk May 12 2012 at 07:33

Мне кажется emscripten это проект больше на будущее. Он развивает экосистему LLVM и JavaScript. А генеренный код можно использовать например в nodejs. На данном этапе xml.js работает заметно медленнее своего нативного аналога, но я надеюсь что в будущем оптимизирующие возможности emscripten тоже подрастут.

Mithgol May 12 2012 at 08:23

FAQ гласит, что джаваскрипт работает втрое-вчетверо медленнее, чем итог компиляции «gcc -O3».

Если веровать закону Гордона-Мура (удвоение мощностей за два года), то употребление Emscripten как бы отбрасывает современные компьютеры к мощностям 2008 года, что не так уж и плохо.

Athari May 12 2012 at 10:12

Учитывая однопоточность — дальше…

wentout May 12 2012 at 06:26

Спасибо, действительно – Very Nice.
+1

Beyondtheclouds May 12 2012 at 07:59

Вот и дожили до момента, когда плюсовые либы портируют в js :)

Mithgol May 12 2012 at 08:19

Сразу возникает вопрос: а где Emscripten работает — только под Linux?

В Википедии я не нашёл списка поддерживаемых операционных систем, в README на Гитхабе и в тамошней вики на заглавной странице — тоже не нашёл.

Только добравшись до FAQ, насилу прочёл, что работает в Windows, OS X и Linux, хотя автор проверяет его только на Linux. В пособии также сказано, что под Windows требуется Cygwin для «make».

beardog May 12 2012 at 09:57

Я ничего не понял
У вас была программа (xmllint), которая в качестве аргументов командной строки берет имена xml и xcd файлов и проверяет соответствие xml xcd. Результат проверки выводится в консоль.
В результате всех этих манипуляций вы (или автор оригинальной статьи) получили js-файл с единственной функцией ValidateXML; в качестве параметров она получает имена файлов, в качестве результата выдает то же самое, что и xmllint
Если все так, то
а) почему везде написано «портирование библиотеки», когда на самом деле портируется программа, использующая библиотеку
б) возможно ли все-таки портировать именно libxml так, чтобы получить нечто вроде github.com/polotek/libxmljs но на чистом js без зависимостей?

seriyPS May 12 2012 at 10:31

Библиотека — libxml, программа — xmllint.

Caiiiycuk May 12 2012 at 12:14

Выше уже пробегала мысль что это не есть портирование в чистом виде. Скорее это транслирование LLVM байт-кода в JavaScript. По какой причине в оригинальной статье используется термин портирование мне не известно, для себя я счел это не важным. Скорее это вопрос терминологии.

А суть что происходит вы уловили правильно. Это лишь общая схема показывающая как можно выдернуть конкретную функцию из libxml.

Для того что бы получить порт библиотеки нужно написать обертку для вызова каждой конкретной функции из libxml2. Выполнив команду:

~/path/emscripten/emcc .libs/libxml2.a ../zlib-1.2.7/libz.a -o libxml2.js

Построится файл libxml2.js который будет содержать функции соответствующих статических библиотек, эти функции можно напрямую вызывать из JavaScript кода. Правда делается это не очень красиво, как-то так:

int_sqrt = cwrap('int_sqrt', 'number', ['number'])
int_sqrt(12)

Пример показывает как обернуть c-функцию, подробнее тут.

Zelgadis May 13 2012 at 04:20

Какая разница каким образом было сделано портирование? Портирование нацелено на результат, а не процесс.

BlessMaster Jul 29 2012 at 20:09

Разница примерно такая же, как результат перевода человеком или каким-нибудь «промтом». Вроде бы и всё понятно, но местами коряво, местами смешно.

Zelgadis Jul 29 2012 at 23:41

Нет. Языки программирования имеют очень жесткую семантику и синтаксис в отличии от языков на которых мы говорим.

BlessMaster Jul 30 2012 at 18:52

Это каким-то образом мешает писать говнокод? Нет.
Это мешает писать глючные программы? Ни капли.
Тогда при чём тут жёсткая семантика?
Можно написать очень понятный и чёткий код, который и человек хорошо прочитает, и интерпретатор/компилятор хорошо оптимизируют.
А можно написать нечто ужасное. Вот итог работы автоматических трансляторов (особенно через несколько этапов трансляции), программ оптимизированных совсем не под конечную платформу — и есть такой ужас.
При этом без возможности нормально исправить баг вылезший на неродной платформе.

Zelgadis Jul 30 2012 at 18:56

Цикл for будет всегда циклом for, а не будет менять свое значение в зависимости от ситуации и происхождения программиста. Так понятнее?

BlessMaster Jul 30 2012 at 19:31

Программа состоит не только из циклов for. И есть ситуации когда то, что эффективно в оригинале, транслированное становится очень неэффективным. И есть конструкции, имеющиеся в оригинальной платформе, но эмулируемые на конечной. Или в Вашем понимании вся трансляция сводится к замене одного синтаксиса на другой? Если бы всё было так просто — не было бы такого количества языков, а была бы масса препроцессоров для одного.

BlessMaster Jul 30 2012 at 19:50

Хорошо, попробую объяснить свою точку зрения на практическом примере: великолепный проект repl.it/#
Возьмём питон. Вот он транслированный в javascript: raw.github.com/replit/empythoned/master/dist/python.opt.js
Задача: впилить сюда интеграцию с браузером и DOM страницы.
Теперь Вы понимаете разницу между портировать и просто транслировать? Портированный — был бы читабельным аналогом оригинального кода и можно было бы легко найти соответствия и оперировать ими, можно было бы легко изучать структуру. Транслрованный — просто мешанина однообразных символов с точки зрения человека. Про неоптимальность этого кода для целевой платформы — я уже тоже упоминал.
Да, это работает. Но, сделать с этим что-то вменяемое по целесообразной цене — нереально.

Zelgadis Jul 30 2012 at 19:56

А вы понимаете, что транслирование это только первый этап?

BlessMaster Jul 31 2012 at 14:13

А вы понимаете, чем отличается первый этап от завершённой работы?

Zelgadis Jul 31 2012 at 17:04

А вы понимаете, что в некоторых случаях первого этапа достаточно?

BlessMaster Aug 1 2012 at 13:59

Ну так если в каком-то частном случае оказалось достаточно «заглушки» — это не значит, что «заглушка» равноценна полноценному инструменту

Zelgadis Jul 30 2012 at 19:59

Так же, если результат тралирования работает без доработок — было выполнено портирование. Понимаете?

BlessMaster Jul 31 2012 at 14:15

Не было выполнено — поскольку «работает» без доработок лишь частично: оно работает хуже и с ошибками. И эти баги исправлять — задача на порядки более сложная.