Обновить
0
Иван@sivolob93read⁠-⁠only

Пользователь

Отправить сообщение

Made at Intel. Молитвы, энтузиасты и разбитые лбы

Время на прочтение9 мин
Охват и читатели21K

Интел — это такая компания, которая все доводит до абсолюта. Или до абсурда. Что, как говаривал капитан Джек Воробей, есть две крайности одной и той же сущности. Надо понимать, что Интел — это огромная машина со своей бюрократией и внутренним пиаром, помноженным на американский энтузиазм. Любое начинание, пусть даже самое полезное, она разгоняет до невиданных масштабов. И, разогнавшись, уже не может остановиться. Иногда мне это напоминало слона, бегущего по джунглям, и сносящего все живое на своем пути. О некоторых примерах, иллюстрирующих известную русскую пословицу, я расскажу в этой главе.

Читать далее

Как мы нейросеть в браузер тащили

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.9K

Здравствуйте, товарищи! Хочу написать a good story про то, как портировал нейросеть в браузер.

Задача пришла ко мне от моих институтских друзей из ИВМ РАН. Есть некий фронтенд, на который доктор загружает КТ снимок. Доктору предлагается при помощи веб интерфейса выделить сектор с сердцем, который будет передан на сервер, где алгоритмически отсегментируется граф аорты для последующего анализа.

Меня попросили сделать нейросеть для выделения 3d сектора с сердцем, а затрачиваемое время не должно превышать 2-3 секунд.

Гонять весь КТ снимок на сервер только за координатами накладно, т.к. КТ снимок обычно состоит из 600-800 кадров размера 512 * 512 пикселей, поэтому мое предложение о браузерном варианте пришлось кстати.

Читать далее

Стохастический язык программирования на основе алгоритмов Маркова

Время на прочтение13 мин
Охват и читатели29K

MarkovJunior — это вероятностный язык программирования, в котором программы являются сочетаниями правил перезаписи, а инференс выполняется при помощи распространения ограничений. MarkovJunior назван в честь математика Андрея Андреевича Маркова, придумавшего и исследовавшего то, что сейчас называется алгоритмами Маркова.
Читать дальше →

Чего еще нас лишит нейросеть

Время на прочтение5 мин
Охват и читатели54K

Сначала этот текст должен был стать комментарием к посту GPT-3. Есть проблема побольше, чем потеря рабочих мест, где автор приводит несколько прогнозов, ни один из которых мне не нравится. Нет, прогнозы хорошие, может быть даже сбудутся, но самая главная, как мне видится, опасность – упрощение поиска с помощью нейросетей, там даже не упомянута. А именно она ударит по обществу первой, еще задолго до появления президента-нейросети.

Дальше много букв

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели17K

Владение английским языком принято оценивать по системе CERF (Common European Reference Framework), состоящей из шести уровней, где уровень A1 – начинающие, а уровень С2 – профессионально владеющие иностранным языком. Международный уровень С2 часто позиционируется как “уровень образованного носителя”, и получение соответствующего сертификата зачастую является либо заветной мечтой, либо предметом гордости преподавателя-лингвиста.

Однако я не встречала в научной литературе доказательства полного соответствия уровня С2 уровню владения английским как родным. На самом деле, среди ученых нет единого мнения о том, возможно ли вообще изучающим язык достичь уровня, идентичного владению языком как родным (вот две статьи с практически одинаковым названием и противоположными выводами [1; 2]). Проведя небольшой опрос в одной из соцсетей, я увидела, что большинство моих коллег-преподавателей английского в глубине души все-таки считают, что «между уровнем носителя и уровнем С2 – бездна». Хотя были и те, кто выбрал вариант, что С2 – это действительно уровень образованного носителя.

Так есть разница или нет? Я решила разобраться, рассмотрев для начала всего лишь один аспект владения языком – письменную речь. О своем эксперименте, в котором не обошлось без искусственного интеллекта, я и хочу рассказать.

Вначале я создала опрос на Google Forms и предложила 17 русскоговорящим коллегам следующий челлендж: определить, написан ли английский текст носителем языка (британцем) или русскоязычным автором с уровнем английского С1-С2. Всего было 20 текстов. К исследованию приглашались эксперты с большим опытом проверки студенческих эссе и чтения оригинальных текстов, но, тем не менее, задача оказалась не из простых. Подсчитав вручную метрики, получаем: Accuracy = 0.6617; Precision = 0.6627; Recall = 0.6588; F1 = 0.66. Замечу, что этот опрос я также предлагала коренным британцам (пока только троим), и ...

Читать далее

Высоконагруженный IPC между C++ и Python

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели4.9K

Несколько лет назад Аурига по заданию известного медицинского стартапа разрабатывала решение, связанное с параллельной обработкой нескольких потоков видеоданных. Ключевой особенностью технического решения была скоростная передача и обработка большого потока видеоданных от драйвера, написанного на С++, в обработчик, написанный на Python.

В процессе разработки мы успели отрефакторить код, написанный математиками, перепробовать распространённые протоколы IPC и написать свой собственный, и дать полную нагрузку на 40-ядерный Xeon.

А ещё мы дебажили Windows.

Читать далее

10 первых ошибок в карьере ML-инженера

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели38K

Работа ML-инженера заключается не только в обучении моделей — хороший специалист погружается в бизнес-контекст, умеет доносить мысли до коллег без ML-бэкграунда, а также не забывает про тесты, дизайн-документы и документацию. 

Богдан Печёнкин, автор Симулятора ML, собрал 10 ошибок специалистов, которые зачастую встречаются в первые годы карьеры.

Узнать больше

Почему понимание ограничений — ключ к будущему человечества

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели14K

Последние новости о прорыве в исследованиях ядерного синтеза провозглашают о возможности «неограниченной» энергии. Каждый раз, когда я вижу слово неограниченный, я вздрагиваю, потому что воспринимаю это как команду читателям «пожалуйста, теперь перестаньте думать». Спустя десятилетия ложных обещаний неограниченной энергии нам нужно начать думать и исследовать ограничения — как очевидные, так и сокрытые. Благодаря этому, мы обычно начинаем понимать, как всё работает.

К счастью, множество других людей уже успешно рассеяло мифы о «неограниченной энергии» в отношении ядерного синтеза, поэтому мне необязательно этим заниматься. Однако стоит объяснить, почему само обещание неограниченности сбивает с толку и иногда даже смертельно опасно. И почему ограничения в конечном счёте желанны.
Читать дальше →

Встречайте, новая стратегия Embrace, Extend, and Expropriate для Linux?

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели8.9K

image


Помните, несколько лет назад была проведена согласованная клеветническая компания против Ричарда Столлмана, в которой он был ложно обвинён в одобрении изнасилований, и по результатом которой его вынудили уволиться с поста президента Фонда Свободного Программного Обеспечения?


Уже тогда многие предполагали, что данная спланированная акция является подготовкой к атаке производителей проприетарных программ на экосистему свободного программного обеспечения. Многие в это не верили (типа, «не приписывайте обычную глупость злому умыслу»), а кто-то не верит и сейчас. Ведь гораздо проще и удобнее игнорировать якобы не существующую опасность, ведь в противном случае на нее нужно как-то реагировать (хотя бы морально).


И вот сейчас, в релизе ядра Linux 6.2, произошло очень важное изменение — разрешён приём кода в ядро Linux под лицензией Copyleft-Next, для которой заявлена совместимость с GPLv2, что подтверждено юристами компаний SUSE и Red Hat (кто бы сомневался?).


Данная лицензия также содержит пункт о предоставлении прав на запатентованные технологии, что делает Copyleft-Next совместимой и с Apache 2.0. А для обеспечения полной совместимости с GPLv2, в тексте Copyleft-Next явно указано, что производная работа может поставляться не только под исходной лицензией Copyleft-Next, но и под лицензией GPL.


Но как говорится, «есть нюанс».

Читать дальше →

Неудачный опыт: выявление аномалий в данных методами кластеризации

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели5.6K

Неудачный опыт: выявление аномалии в новостных данных методами кластеризации

Читать далее

Starting Electronics: руководство по веб-серверам на Arduino. Часть 6. Автоматическое AJAX взаимодействие с веб-сервером

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели5K


От переводчика. На шестом уроке мы добрались до практически полезного кода — с его помощью можно создать работающий пример «бесшовного» автоматического взаимодействия между клиентом (страницей в веб-браузере) и Arduino веб-сервером, который передаёт данные о состоянии подключённого оборудования и внутренних переменных.

Тут нужно помнить, что это только «концептуальный» и базовый пример такого взаимодействия, максимально упрощённый для лучшего понимания начинающими сути самой технологии. Когда вы поймёте принцип, то далее сможете как угодно улучшать и модернизировать этот код. Например, уделить внимание его быстродействию и безопасности.

Читать дальше →

Как я сделал синтез своего голоса

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели47K

Всем привет! Меня зовут Гриша Стерлинг, я занимаюсь синтезом речи в SberDevices. Недавно прошла конференция AI Journey, где я рассказал, как сделал синтез своего голоса. За 15 минут выступления я не успел рассказать все, поэтому решил написать большой пост с деталями. Он будет интересен датасаентистам, людям из бизнеса и ai‑энтузиастам. Приглашаю всех под кат.

Читать дальше

Иронии автоматизации

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

Вероятно, один из главных в мире текстов об автоматизации — статья «Ironies of Automation» когнитивного психолога Лизанны Бейнбридж, опубликованная в 1983 году в журнале Automatica. На неё ссылаются более 1800 других академических работ, про неё есть страница в Википедии, её продолжают вспоминать спустя сорок лет после публикации. Думаю, что сейчас, когда ChatGPT и беспилотные автомобили порождают новый виток замены людей машинами, этот текст по-прежнему очень актуален.

Но вот на Хабре об этой статье вроде бы никогда не писали. Я и сам узнал о ней почти случайно: мы проводим Java-конференции, где её упомянул один из спикеров. И ощутил, что она была бы полезна здесь на русском. Но поскольку исходная публикация академическая, она не вполне в стилистике Хабра. Поэтому я решил не переводить её дословно, а пересказать ряд тезисов оттуда своими словами и добавить немного от себя. Для тех, кому хочется полной точности, даю ссылку на оригинал.

Читать далее

Технологии, изменившие музыку. Часть 2: создание

Время на прочтение19 мин
Охват и читатели9.7K

Продолжаем цикл статей про технологии из мира музыки. Сегодня поговорим об инструментах, без которых невозможно представить современную музыкальную индустрию и целые жанры, такие как рок, фанк и практически любая популярная музыка. 

Речь пойдёт об устройствах, так или иначе, связанных с электричеством: электрогитаре, синтезаторе и прочем. Погрузимся в историю и посмотрим на главные инструменты, появление которых изменило музыкальный мир 20-го века.

Читать далее

Автокомпозитор мелодий Muzz — Доработка

Время на прочтение8 мин
Охват и читатели2.5K

Прошлая статья о автоматическом композиторе Muzz была написана в 2013 году. Muzz сочинял рандомные мелодии с рандомным типами аккомпанемента под рандомные ритмы рока. И вот осенью 2022 года пришло время для доработки Muzz. Теперь он сочиняет музыку более разнообразно и посовременней. Что было доработано и какие песни теперь сочиняет Muzz - об этом и пойдет речь в этой статье.

Почитать и послушать

Технологии, изменившие музыку. Часть 1: запись

Время на прочтение15 мин
Охват и читатели16K

Эта статья — первая из цикла, в котором мы рассмотрим технологии, изменившие музыкальный мир второй половины 20-го века.

В первой части мы поговорим про запись музыки. Если разобраться, отсутствие этих технологий столетия назад — подлинная трагедия человечества. Ведь мы никогда не услышим виртуозную игру четырёхлетнего Моцарта на клавире перед королём или трансляцию концерта Паганини, когда он исполнял сложнейшие каприччио на одной струне. Посмотрим, с чего всё начиналось и как развивалось.

Читать далее

Создаём и расширяем образы Docker с функциями middleware

Время на прочтение11 мин
Охват и читатели15K

Для переноса IT-среды в облако используют технологии контейнеризации, в первую очередь Docker. Такой подход помогает оптимизировать потребление ресурсов и ещё больше автоматизировать операционные процессы. Однако для поддержки энтерпрайз-приложений требуются дополнительные службы, которые называют функциями промежуточной обработки (middleware functions). Такие службы применяют для интеграции, обмена сообщениями, размещения приложений в контролируемой серверной среде и др. В статье рассказываем, как создавать и расширять образы Docker, содержащие функции промежуточной обработки. 

Читать далее

Дисковая подсистема в ОС Linux

Время на прочтение6 мин
Охват и читатели39K

В сегодняшней статье мы поговорим об устройстве дисковой подсистемы в ОС Linux. Конечно, многие скажут, что на эту тему написано уже множество статей и все и так прекрасно знают, как устроен Линукс и в том числе, как он работает с дисками. Однако, как показывает практика, даже многие администраторы при работе с дисковой подсистемой ограничиваются только начальным разбиением диска при установке операционки. Да и то, с параметрами по умолчанию. Так что я предлагаю подробнее рассмотреть такие вопросы дисковой подсистемы, как: работу с правилами правила системы udev, инструменты для работы с блочными устройствами и планировщики системы ввода/вывода.

Читать далее

Грядут цифровые деньги?

Время на прочтение7 мин
Охват и читатели8.5K

Меня дважды спрашивали о цифровых деньгах, которые якобы грядут в Подмосковье, и не только. Я данный вопрос упустил из виду – сейчас он мне мало интересен, – но подчитал что нужно. И вот что удалось выяснить.

Скажу сразу, что выражаю исключительно личное оценочное суждение. Но профессиональное. Как-никак я по образованию экономист и, хотя денежное обращение не моя специализация, задурить мне голову намного сложнее, чем простому обывателю. 

Объясняю, начиная с азов, – буквально на пальцах.

Вообще, денежное обращение – вещь неправедная (начиная с момента, когда человечество отринуло натуральное хозяйство, и особенно после отмены золотого стандарта). Потому что эмитент бумажных или электронных денег – это, по умолчанию, шулер с четырьмя тузами в рукаве. 

Фактически, денежное обращение предназначено для регулирование одной-единственной операции – товарного кредита. Субъект А передает субъекту Б товар стоимостью 1 единицу. К чему это приводит? К тому, что субъект Б оказывается должен субъекту А единицу стоимости. В денежной системе появляется положительный долг субъекта А (ему должны – на бухгалтерском языке, дебиторка) и отрицательный долг субъекта Б (он должен – кредиторка). 

Деньги предназначены выражать исключительно это отношение: другого применения им попросту нет. 

Обратите внимание, что в справедливой денежной системе положительные долги всегда равны отрицательным. Все правильно, ведь долг – понятие двухстороннее, иначе он не существует.

А что происходит при эмиссии бумажных или электронных денег? У эмитента на руках внезапно оказывается некая положительная сумма, которую он, строго говоря, не заработал – ведь никакого отрицательного долга в системе не значится. Это фактическое жульничество, поэтому я и говорю, что любой эмитент – шулер с четырьмя тузами в рукаве.

Читать далее

Производительность параллельных алгоритмов STL

Время на прочтение5 мин
Охват и читатели7.2K

В этой статье я собираюсь провести тест производительности на компиляторе Microsoft и компиляторе GCC, чтобы ответить на простой вопрос: окупается ли политика выполнения?

 

Читать далее

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Инженер по обеспечению качества
Средний
Python
Linux
SQLite
OpenCV
Git
Docker