Comments / Profile of technic93 / Habr

Пользователь

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 9 2019 at 22:00

unsafe используется:

1) я написал очень упрощённый вариант glibc функции strpbrk, которая векторизирует поиск скобочек в строке (после беседы с twinklede). Без этого будет по-моему 700ms (там можно раскоментировать вариант с enumerate). Тогда даже на такой простой задаче С++ не догнать по определению, если прочий код будет работать одинаково. (Хотя я подозреваю что потоковый парсер плюсов мы не догоним). Без unsafe вы не получите sse42.

2) Прямой доступ к памяти это Вы про mmap? Возможно он не обязателен. Кстати mmap там кросс платформенный используется. Но во многих примерах выше он тоже присутсвовал.

Да я не аккуратно писал с unsafe, надо было как то завернуть в модуль, обложить комментариями и т п. По сути инвариант там всего один (я надеюсь :), нам надо скармливать буфер определённого размера в векторный регистр. Если дадим указатель на меньше памяти чем надо, то привет UB, я использовал растовый итератор chunks_exact а не арифметику с указателями чтобы сделать это более явно.

Алгоритм мержа у меня тоже не правильный. Я думал над тем какой лучше, но походу зависит от характера входных данных. Для нашего датасета, логичнее всего по быстрому отбрасывать повторения. Поэтому думаю это не так важно для сравнения. Upd: Вообще я подумал задача довольно странная мы соревнуемся в том чтобы как можно быстрее отбрасывать данные. Какая-то ддос атака. Достаточно было бы сравнить скорость сериализации до получения DebtRec.

Решение на го действительно выглядит красиво, просто и работает быстро. На serde писать свои Visitor далеко не так приятно. Но если данные не "грязные" а следуют обычному формату то можно было бы обойтись #[derive]. Хотя в го коде есть всякие читики, типа резервация векоторов на 10 елементов и вектора вместо set, я не знаю на сколько это влияет.

Я к сожелению на go не смог построить heatmap через perf, т.е. я построил но имена функции все unknown. Кто подскажет?

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 9 2019 at 17:33

Кстати автор ещё не оценивал решения на предмет обработки ошибок. Добавил мусор в джсон:

C++: Assertion `IsObject()' failed. Aborted (core dumped)
Go: Вывело не правильный результат ничего не сказав
Rust: Error("expected value", line: 1, column: 69)

Понятно что можно это везде реализовать, но в раст у меня не получилось бы подругому, либо паника либо сообщение об ошибке и его обработка.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 9 2019 at 16:52

Написал потоковый (как на Гошке) парсер на расте, с аллокациями не заморачивался, думаю можно ещё ускорить. Результаты на моём i5, это однопоточка:

rust = 636ms
gcc = 653ms
go = 663ms
clang = 799ms

Бойлерплейта много слабонервным не смотреть: https://gist.github.com/technic/5f23603ac955d246a90a8421a667c8c2#file-main-rs (лицензия кода на rust MIT)

PS На гист так же залил исходники плюсов и гошки с которой сравнивал. Надеюсь авторы не против.

PPS Возможно это не самая быстрые версии на альтернативных языках, что удалось найти среди комментов.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 8 2019 at 11:36

Тогда ТЗ не понятно, например HashSet для телефонов не нужен, достаточно общего HashMap. С учётом того что у нас там постоянно to_owned, выкидывание лишней строчки даёт ускорение на 10%. Например в последней версии на го вообще выкинули HashSet и всё в vector, что для десятка телефонов работает наверное быстрее с учетом константы. Но если телефонов тысяча тогда я уверен решение на го сольётся.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 7 2019 at 18:30

А ещё может быть экранированный бекслэш. Что тогда?
\"

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 7 2019 at 18:05

Добавте ссылку в статью. или ссылку на код которым этот файл сгенерирован.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 Jun 7 2019 at 17:42

Алгоритм не правильный.

Пример

[
{"company":"Рога и копыта", "debt": 800, "phones": [123, 234, 456]},
{"company":"Первая коллекторская", "debt": 1200, "phones": ["2128506", 456, 789]},
{"company":"Святой престол", "debt": "666", "phones": 666},
{"company": "Казачий спас", "debt": 1500, "phones": [234567, "34567", 789], "phone": 666},
{"company": {"name": "Шестерочка"}, "debt": 2550, "phones": 788, "phone": 789}
]

Должно объеденить всё в одного, но это не происходит. Я думаю этот неправильный алгоритм перекочивал во все примеры из комментариев, кроме многопоточки на С++ там подругому merge сделан.

Поддержка Visual Studio 2019 в PVS-Studio

technic93 Jun 5 2019 at 10:02

Торт на картинке это офисный корпоратив в честь релиза или наглый фотошоп? Или надо статью целиком читать чтобы узнать?)

Python в Visual Studio Code. Апрельский выпуск

technic93 May 31 2019 at 08:50

Отвечу сам себе. Открыл issue на гитхабе и проблему пофиксили.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 May 8 2019 at 13:46

Почему нет? Все лайфтаймы и заимствование ссылок описаны в объявлении функции. Далее есть код по одну сторону интерфейса (клиент) и по другую (библитека). Им ничего не нужно знать про друг друга — они работают через интерфейс. Есть время жизни 'static для каких-то синглетонов библиотеке. Safe Раст не возвращает голый указатель. Если мы возвращаем ссылку из функции то должны объявить её время жизни, которое зависит от времени жизни входных параметров. Или мы можем передать владение объектом наверх.

Если мы имеем дело с dll которая на Cи то нужно писать обёртку через unsafe. Ну тут серебрянной пули не существует. Либо жить на си/плюсах либо писать обёртки либо переписывать всё на раст. Очевидно что в зависимтости от ситуации и количества кода то или иное решение оптимально.

О жёлтом фосфоре и панической природе человека

technic93 May 8 2019 at 08:16

Но почему Донбасс и Палестина, когда есть примеры менее спорные.

Python в Visual Studio Code. Апрельский выпуск

technic93 May 7 2019 at 08:34

Поддерживаются ли тайп аннотации через комментарии в питон 2? К сожалению иногда ещё приходится с ним работать.

Swift против Rust — бенчмаркинг на Linux с (не)понятным финалом

technic93 May 6 2019 at 23:19

В этом и фишка раст.

Введение в Python

technic93 May 5 2019 at 16:19

Мы присутсвуем при историческом событии. Это первый шаг: "ИИ прочитал статью по питону и написал об этом на хабр". Потом ещё пару книг прочтет и начнет писать код. Следите за новостями.

Как я узнал, что моя виза не готова, сообщением в Slack

technic93 May 3 2019 at 16:36

А откуда автор заранее знал как будет выглядеть полученный PDF и в каком div будет лежать ответ на сайте? Это была не первая виза?)

Находим баги в LLVM 8 с помощью анализатора PVS-Studio

technic93 Apr 30 2019 at 05:54

Они же проверяют свой ког clang анализатором? Т.е это наглядно показывает что pvs находит больше или как минимум что то новое я правильно понял посыл статьи?)

Процесс разработки и тестирования с Docker и Gitlab CI

technic93 Apr 27 2019 at 16:39

С докером при разработке чаще проблема в том, что не все IDE умеюют подключать интерпретатор/компилятор из контейнера а также нужные импорты/инклюды оттуда.

Я в восторге от IoT

technic93 Apr 26 2019 at 17:11

Я думаю даже ссылки на хабр поставлять можно.

IntelliJ IDEA, ReSharper, SonarLint и SonarQube находят те же ошибки, что и PVS-Studio — ну и зачем нам PVS-Studio?

technic93 Apr 24 2019 at 09:38

Жаль, а почему не расскажете? Потому что гитлаб легко перенести потом на приватный хостинг? Спасибо за ответ.

IntelliJ IDEA, ReSharper, SonarLint и SonarQube находят те же ошибки, что и PVS-Studio — ну и зачем нам PVS-Studio?

technic93 Apr 24 2019 at 08:08

Только гитхаб и битбакет, а гитлаб.ком можно?