Статьи / Закладки / Профиль sivolob93 / Хабр

Иван@sivolob93^{read⁠-⁠only}

Пользователь

ПрофильЗакладки208

@vvvphoenix 26 мар 2023 в 18:04

Made at Intel. Молитвы, энтузиасты и разбитые лбы

9 мин

21K

Управление персоналом * Читальный залИстория ITIT-компании

Интел — это такая компания, которая все доводит до абсолюта. Или до абсурда. Что, как говаривал капитан Джек Воробей, есть две крайности одной и той же сущности. Надо понимать, что Интел — это огромная машина со своей бюрократией и внутренним пиаром, помноженным на американский энтузиазм. Любое начинание, пусть даже самое полезное, она разгоняет до невиданных масштабов. И, разогнавшись, уже не может остановиться. Иногда мне это напоминало слона, бегущего по джунглям, и сносящего все живое на своем пути. О некоторых примерах, иллюстрирующих известную русскую пословицу, я расскажу в этой главе.

+108

@DmitriyValetov 18 мар 2023 в 14:59

Как мы нейросеть в браузер тащили

Простой

3 мин

7.9K

JavaScript * C++ * БраузерыМашинное обучение * WebAssembly *

Cезон machine learning

Из песочницы

Здравствуйте, товарищи! Хочу написать a good story про то, как портировал нейросеть в браузер.

Задача пришла ко мне от моих институтских друзей из ИВМ РАН. Есть некий фронтенд, на который доктор загружает КТ снимок. Доктору предлагается при помощи веб интерфейса выделить сектор с сердцем, который будет передан на сервер, где алгоритмически отсегментируется граф аорты для последующего анализа.

Меня попросили сделать нейросеть для выделения 3d сектора с сердцем, а затрачиваемое время не должно превышать 2-3 секунд.

Гонять весь КТ снимок на сервер только за координатами накладно, т.к. КТ снимок обычно состоит из 600-800 кадров размера 512 * 512 пикселей, поэтому мое предложение о браузерном варианте пришлось кстати.

+31

@PatientZero 17 мар 2023 в 05:41

Стохастический язык программирования на основе алгоритмов Маркова

13 мин

29K

Математика * Ненормальное программирование * Программирование *

Перевод

MarkovJunior — это вероятностный язык программирования, в котором программы являются сочетаниями правил перезаписи, а инференс выполняется при помощи распространения ограничений. MarkovJunior назван в честь математика Андрея Андреевича Маркова, придумавшего и исследовавшего то, что сейчас называется алгоритмами Маркова.

Читать дальше →

+136

@Hemml 12 мар 2023 в 15:36

Чего еще нас лишит нейросеть

5 мин

54K

Искусственный интеллект

Сначала этот текст должен был стать комментарием к посту GPT-3. Есть проблема побольше, чем потеря рабочих мест, где автор приводит несколько прогнозов, ни один из которых мне не нравится. Нет, прогнозы хорошие, может быть даже сбудутся, но самая главная, как мне видится, опасность – упрощение поиска с помощью нейросетей, там даже не упомянута. А именно она ударит по обществу первой, еще задолго до появления президента-нейросети.

Дальше много букв

+143

423

@jayatsea 12 мар 2023 в 11:05

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

Средний

5 мин

17K

Искусственный интеллектМашинное обучение * Изучение языковNatural Language Processing * Python *

Из песочницы

Владение английским языком принято оценивать по системе CERF (Common European Reference Framework), состоящей из шести уровней, где уровень A1 – начинающие, а уровень С2 – профессионально владеющие иностранным языком. Международный уровень С2 часто позиционируется как “уровень образованного носителя”, и получение соответствующего сертификата зачастую является либо заветной мечтой, либо предметом гордости преподавателя-лингвиста.

Однако я не встречала в научной литературе доказательства полного соответствия уровня С2 уровню владения английским как родным. На самом деле, среди ученых нет единого мнения о том, возможно ли вообще изучающим язык достичь уровня, идентичного владению языком как родным (вот две статьи с практически одинаковым названием и противоположными выводами [1; 2]). Проведя небольшой опрос в одной из соцсетей, я увидела, что большинство моих коллег-преподавателей английского в глубине души все-таки считают, что «между уровнем носителя и уровнем С2 – бездна». Хотя были и те, кто выбрал вариант, что С2 – это действительно уровень образованного носителя.

Так есть разница или нет? Я решила разобраться, рассмотрев для начала всего лишь один аспект владения языком – письменную речь. О своем эксперименте, в котором не обошлось без искусственного интеллекта, я и хочу рассказать.

Вначале я создала опрос на Google Forms и предложила 17 русскоговорящим коллегам следующий челлендж: определить, написан ли английский текст носителем языка (британцем) или русскоязычным автором с уровнем английского С1-С2. Всего было 20 текстов. К исследованию приглашались эксперты с большим опытом проверки студенческих эссе и чтения оригинальных текстов, но, тем не менее, задача оказалась не из простых. Подсчитав вручную метрики, получаем: Accuracy = 0.6617; Precision = 0.6627; Recall = 0.6588; F1 = 0.66. Замечу, что этот опрос я также предлагала коренным британцам (пока только троим), и ...

+53

@s_platov 6 мар 2023 в 09:53

Высоконагруженный IPC между C++ и Python

Средний

6 мин

4.9K

Блог компании АуригаАнализ и проектирование систем * Высоконагруженные системы *

Несколько лет назад Аурига по заданию известного медицинского стартапа разрабатывала решение, связанное с параллельной обработкой нескольких потоков видеоданных. Ключевой особенностью технического решения была скоростная передача и обработка большого потока видеоданных от драйвера, написанного на С++, в обработчик, написанный на Python.

В процессе разработки мы успели отрефакторить код, написанный математиками, перепробовать распространённые протоколы IPC и написать свой собственный, и дать полную нагрузку на 40-ядерный Xeon.

А ещё мы дебажили Windows.

+20

@karpovcourses 25 фев 2023 в 12:58

10 первых ошибок в карьере ML-инженера

Простой

12 мин

38K

Python * Машинное обучение * Учебный процесс в ITКарьера в IT-индустрии

Cезон machine learning

Работа ML-инженера заключается не только в обучении моделей — хороший специалист погружается в бизнес-контекст, умеет доносить мысли до коллег без ML-бэкграунда, а также не забывает про тесты, дизайн-документы и документацию.

Богдан Печёнкин, автор Симулятора ML, собрал 10 ошибок специалистов, которые зачастую встречаются в первые годы карьеры.

Узнать больше

+39

@ru_vds 22 фев 2023 в 13:00

Почему понимание ограничений — ключ к будущему человечества

Простой

13 мин

14K

Блог компании RUVDS.comНаучно-популярноеФизикаЭкологияЭнергия и элементы питания

Перевод

Последние новости о прорыве в исследованиях ядерного синтеза провозглашают о возможности «неограниченной» энергии. Каждый раз, когда я вижу слово неограниченный, я вздрагиваю, потому что воспринимаю это как команду читателям «пожалуйста, теперь перестаньте думать». Спустя десятилетия ложных обещаний неограниченной энергии нам нужно начать думать и исследовать ограничения — как очевидные, так и сокрытые. Благодаря этому, мы обычно начинаем понимать, как всё работает.

К счастью, множество других людей уже успешно рассеяло мифы о «неограниченной энергии» в отношении ядерного синтеза, поэтому мне необязательно этим заниматься. Однако стоит объяснить, почему само обещание неограниченности сбивает с толку и иногда даже смертельно опасно. И почему ограничения в конечном счёте желанны.

Читать дальше →

+73

@rsashka 20 фев 2023 в 18:40

Встречайте, новая стратегия Embrace, Extend, and Expropriate для Linux?

Средний

2 мин

8.9K

Open source * Исследования и прогнозы в IT * История ITКопирайтУправление сообществом *

Мнение

Помните, несколько лет назад была проведена согласованная клеветническая компания против Ричарда Столлмана, в которой он был ложно обвинён в одобрении изнасилований, и по результатом которой его вынудили уволиться с поста президента Фонда Свободного Программного Обеспечения?

Уже тогда многие предполагали, что данная спланированная акция является подготовкой к атаке производителей проприетарных программ на экосистему свободного программного обеспечения. Многие в это не верили (типа, «не приписывайте обычную глупость злому умыслу»), а кто-то не верит и сейчас. Ведь гораздо проще и удобнее игнорировать якобы не существующую опасность, ведь в противном случае на нее нужно как-то реагировать (хотя бы морально).

И вот сейчас, в релизе ядра Linux 6.2, произошло очень важное изменение — разрешён приём кода в ядро Linux под лицензией Copyleft-Next, для которой заявлена совместимость с GPLv2, что подтверждено юристами компаний SUSE и Red Hat (кто бы сомневался?).

Данная лицензия также содержит пункт о предоставлении прав на запатентованные технологии, что делает Copyleft-Next совместимой и с Apache 2.0. А для обеспечения полной совместимости с GPLv2, в тексте Copyleft-Next явно указано, что производная работа может поставляться не только под исходной лицензией Copyleft-Next, но и под лицензией GPL.

Но как говорится, «есть нюанс».

Читать дальше →

+23

@REU_Fin_Lab 20 фев 2023 в 13:03

Неудачный опыт: выявление аномалий в данных методами кластеризации

Средний

3 мин

5.6K

Машинное обучение * Big Data *

Из песочницы

Неудачный опыт: выявление аномалии в новостных данных методами кластеризации

@smart_alex 20 фев 2023 в 14:01

Starting Electronics: руководство по веб-серверам на Arduino. Часть 6. Автоматическое AJAX взаимодействие с веб-сервером

Сложный

6 мин

Блог компании Timeweb CloudDIY или Сделай самПрограммирование микроконтроллеров * Arduino * Умный дом

Туториал

Перевод

От переводчика. На шестом уроке мы добрались до практически полезного кода — с его помощью можно создать работающий пример «бесшовного» автоматического взаимодействия между клиентом (страницей в веб-браузере) и Arduino веб-сервером, который передаёт данные о состоянии подключённого оборудования и внутренних переменных.

Тут нужно помнить, что это только «концептуальный» и базовый пример такого взаимодействия, максимально упрощённый для лучшего понимания начинающими сути самой технологии. Когда вы поймёте принцип, то далее сможете как угодно улучшать и модернизировать этот код. Например, уделить внимание его быстродействию и безопасности.

Читать дальше →

+12

@sterling239 20 фев 2023 в 13:09

Как я сделал синтез своего голоса

Простой

12 мин

47K

Блог компании SberDevicesМашинное обучение * Искусственный интеллектЗвукГолосовые интерфейсы *

Кейс

Всем привет! Меня зовут Гриша Стерлинг, я занимаюсь синтезом речи в SberDevices. Недавно прошла конференция AI Journey, где я рассказал, как сделал синтез своего голоса. За 15 минут выступления я не успел рассказать все, поэтому решил написать большой пост с деталями. Он будет интересен датасаентистам, людям из бизнеса и ai‑энтузиастам. Приглашаю всех под кат.

+25

@phillennium 10 фев 2023 в 15:28

Иронии автоматизации

Простой

6 мин

11K

Блог компании JUG Ru GroupКонференцииИстория IT

Вероятно, один из главных в мире текстов об автоматизации — статья «Ironies of Automation» когнитивного психолога Лизанны Бейнбридж, опубликованная в 1983 году в журнале Automatica. На неё ссылаются более 1800 других академических работ, про неё есть страница в Википедии, её продолжают вспоминать спустя сорок лет после публикации. Думаю, что сейчас, когда ChatGPT и беспилотные автомобили порождают новый виток замены людей машинами, этот текст по-прежнему очень актуален.

Но вот на Хабре об этой статье вроде бы никогда не писали. Я и сам узнал о ней почти случайно: мы проводим Java-конференции, где её упомянул один из спикеров. И ощутил, что она была бы полезна здесь на русском. Но поскольку исходная публикация академическая, она не вполне в стилистике Хабра. Поэтому я решил не переводить её дословно, а пересказать ряд тезисов оттуда своими словами и добавить немного от себя. Для тех, кому хочется полной точности, даю ссылку на оригинал.

+40

@klimensky 2 фев 2023 в 12:32

Технологии, изменившие музыку. Часть 2: создание

19 мин

9.7K

Блог компании FirstVDSЗвукСтарое железоНаучно-популярноеИстория IT

Ретроспектива

Продолжаем цикл статей про технологии из мира музыки. Сегодня поговорим об инструментах, без которых невозможно представить современную музыкальную индустрию и целые жанры, такие как рок, фанк и практически любая популярная музыка.

Речь пойдёт об устройствах, так или иначе, связанных с электричеством: электрогитаре, синтезаторе и прочем. Погрузимся в историю и посмотрим на главные инструменты, появление которых изменило музыкальный мир 20-го века.

+28

@blackstrip 2 фев 2023 в 22:38

Автокомпозитор мелодий Muzz — Доработка

8 мин

2.5K

СофтЗвук

Прошлая статья о автоматическом композиторе Muzz была написана в 2013 году. Muzz сочинял рандомные мелодии с рандомным типами аккомпанемента под рандомные ритмы рока. И вот осенью 2022 года пришло время для доработки Muzz. Теперь он сочиняет музыку более разнообразно и посовременней. Что было доработано и какие песни теперь сочиняет Muzz - об этом и пойдет речь в этой статье.

Почитать и послушать

+11

@klimensky 27 янв 2023 в 13:25

Технологии, изменившие музыку. Часть 1: запись

15 мин

16K

Блог компании FirstVDSИстория ITНаучно-популярноеСтарое железоЗвук

Ретроспектива

Эта статья — первая из цикла, в котором мы рассмотрим технологии, изменившие музыкальный мир второй половины 20-го века.

В первой части мы поговорим про запись музыки. Если разобраться, отсутствие этих технологий столетия назад — подлинная трагедия человечества. Ведь мы никогда не услышим виртуозную игру четырёхлетнего Моцарта на клавире перед королём или трансляцию концерта Паганини, когда он исполнял сложнейшие каприччио на одной струне. Посмотрим, с чего всё начиналось и как развивалось.

+23

@edeshina 27 янв 2023 в 13:29

Создаём и расширяем образы Docker с функциями middleware

11 мин

15K

Блог компании СлёрмLinux * DevOps * IT-инфраструктура * Программирование *

Туториал

Перевод

Для переноса IT-среды в облако используют технологии контейнеризации, в первую очередь Docker. Такой подход помогает оптимизировать потребление ресурсов и ещё больше автоматизировать операционные процессы. Однако для поддержки энтерпрайз-приложений требуются дополнительные службы, которые называют функциями промежуточной обработки (middleware functions). Такие службы применяют для интеграции, обмена сообщениями, размещения приложений в контролируемой серверной среде и др. В статье рассказываем, как создавать и расширять образы Docker, содержащие функции промежуточной обработки.

@Andrey_Biryukov 27 янв 2023 в 14:22

Дисковая подсистема в ОС Linux

6 мин

39K

Блог компании OTUSНастройка Linux *

В сегодняшней статье мы поговорим об устройстве дисковой подсистемы в ОС Linux. Конечно, многие скажут, что на эту тему написано уже множество статей и все и так прекрасно знают, как устроен Линукс и в том числе, как он работает с дисками. Однако, как показывает практика, даже многие администраторы при работе с дисковой подсистемой ограничиваются только начальным разбиением диска при установке операционки. Да и то, с параметрами по умолчанию. Так что я предлагаю подробнее рассмотреть такие вопросы дисковой подсистемы, как: работу с правилами правила системы udev, инструменты для работы с блочными устройствами и планировщики системы ввода/вывода.

+33

@mikejum 27 янв 2023 в 14:48

Грядут цифровые деньги?

7 мин

8.5K

Криптовалюты

Мнение

Меня дважды спрашивали о цифровых деньгах, которые якобы грядут в Подмосковье, и не только. Я данный вопрос упустил из виду – сейчас он мне мало интересен, – но подчитал что нужно. И вот что удалось выяснить.

Скажу сразу, что выражаю исключительно личное оценочное суждение. Но профессиональное. Как-никак я по образованию экономист и, хотя денежное обращение не моя специализация, задурить мне голову намного сложнее, чем простому обывателю.

Объясняю, начиная с азов, – буквально на пальцах.

Вообще, денежное обращение – вещь неправедная (начиная с момента, когда человечество отринуло натуральное хозяйство, и особенно после отмены золотого стандарта). Потому что эмитент бумажных или электронных денег – это, по умолчанию, шулер с четырьмя тузами в рукаве.

Фактически, денежное обращение предназначено для регулирование одной-единственной операции – товарного кредита. Субъект А передает субъекту Б товар стоимостью 1 единицу. К чему это приводит? К тому, что субъект Б оказывается должен субъекту А единицу стоимости. В денежной системе появляется положительный долг субъекта А (ему должны – на бухгалтерском языке, дебиторка) и отрицательный долг субъекта Б (он должен – кредиторка).

Деньги предназначены выражать исключительно это отношение: другого применения им попросту нет.

Обратите внимание, что в справедливой денежной системе положительные долги всегда равны отрицательным. Все правильно, ведь долг – понятие двухстороннее, иначе он не существует.

А что происходит при эмиссии бумажных или электронных денег? У эмитента на руках внезапно оказывается некая положительная сумма, которую он, строго говоря, не заработал – ведь никакого отрицательного долга в системе не значится. Это фактическое жульничество, поэтому я и говорю, что любой эмитент – шулер с четырьмя тузами в рукаве.

185

@MaxRokatansky 27 янв 2023 в 14:39

Производительность параллельных алгоритмов STL

5 мин

7.2K

Блог компании OTUSПрограммирование * C++ *

Перевод

В этой статье я собираюсь провести тест производительности на компиляторе Microsoft и компиляторе GCC, чтобы ответить на простой вопрос: окупается ли политика выполнения?

1 2 3 4 5

7 8 9 10

Made at Intel. Молитвы, энтузиасты и разбитые лбы

Как мы нейросеть в браузер тащили

Стохастический язык программирования на основе алгоритмов Маркова

Чего еще нас лишит нейросеть

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

Высоконагруженный IPC между C++ и Python

10 первых ошибок в карьере ML-инженера

Почему понимание ограничений — ключ к будущему человечества

Встречайте, новая стратегия Embrace, Extend, and Expropriate для Linux?

Неудачный опыт: выявление аномалий в данных методами кластеризации

Starting Electronics: руководство по веб-серверам на Arduino. Часть 6. Автоматическое AJAX взаимодействие с веб-сервером

Как я сделал синтез своего голоса

Иронии автоматизации

Технологии, изменившие музыку. Часть 2: создание

Автокомпозитор мелодий Muzz — Доработка

Технологии, изменившие музыку. Часть 1: запись

Создаём и расширяем образы Docker с функциями middleware

Дисковая подсистема в ОС Linux

Грядут цифровые деньги?

Производительность параллельных алгоритмов STL

Информация

Специализация