Статьи / Закладки / Профиль SuperFly / Хабр

@SuperFly

Пользователь

Профиль Публикации Комментарии 52Закладки 206

phillennium 8 сен 2022 в 18:50

Со Stable Diffusion вы можете больше никогда не поверить увиденному в онлайне

9 мин

57K

Обработка изображений*Блог компании JUG Ru GroupМашинное обучение*Будущее здесь

Перевод

Генерация изображений с помощью AI пришла по-настоящему. Опенсорсная модель для синтеза изображений Stable Diffusion позволяет любому обладателю компьютера с хорошей видеокартой творить практически любую визуальную реальность, какую сможет выдумать. Она может имитировать практически любой визуальный стиль, и если задать ей фразу-описание, результаты возникают на экране словно магия.

Одни художники восхищаются открывшимися возможностями, другие недовольны, а общество в целом пока вроде бы не курсе той стремительно развивающейся технологической революции, которая происходит в сообществах на Twitter, Discord и GitHub. Возможно, синтез изображений приносит настолько же большие возможности, как изобретение камеры — или даже создание самого визуального искусства. Даже наше восприятие истории под вопросом, в зависимости от того, как всё утрясётся. В любом случае Stable Diffusion возглавляет новую волну творческих инструментов, основанных на глубоком обучении, которые намерены революционизировать создание визуального медиаконтента.

+78

kesn 2 сен 2022 в 18:15

Груг против сложности. Я пролинтил все посты на Хабре про Python, и вот что я нашёл

52 мин

60K

Python*Программирование*Блог компании Breakpoint

В какой-то момент времени я превратился в ~~педанта~~ брюзгу. В фильмах малейшие нестыковки и провалы в логике портят мне весь просмотр. В чатах меня бесит it's вместо its. А в статьях про программирование... Всё плохо. За меня всё уже сказал @AlexanderAstafiev, я лишь процитирую:

Простите, я не могу так больше. Я слишком хорошо знаю Python, чтобы молчать при виде такого кода.
Я устал. Я не могу это читать. Простите за токсичную критику, накипело.

Самое забавное, что, по моим ощущениям, везде я вижу одни и те же классы проблем. Я даже запилил сервис, где можно закинуть код и получить код ревью, и, собрав немного статистики, понял, что 50 типов ошибок достаточно, чтобы покрыть большую часть проблем в чужом коде. Но выборка у меня была небольшая, и я подумал: а что, если проверить много кода?

И всё заверте...

+134

153

Kopcheniy 30 авг 2022 в 21:03

Когда есть только дисплей и больше ничего

11 мин

23K

Реверс-инжиниринг*Программирование микроконтроллеров*Разработка под Arduino*DIY или Сделай самЭлектроника для начинающих

Начитался я как-то разных статей, заметок, форумов про то, как ребята подключают дисплеи от мобильных телефонов и тоже решил попробовать. Интересно ведь. Специально для опытов были куплены образцы дисплеев. Про часть из них я рассказал в своей прошлой статье. Но первыми были не они...Сегодня я поделюсь опытом разгадывания своего первого дисплея и его оживления.

+63

Bobrosoft 29 авг 2022 в 12:55

Как мы сделали распознавание речи нескольких говорящих

9 мин

11K

Машинное обучение*Искусственный интеллектNatural Language Processing*Голосовые интерфейсы*Блог компании SberDevices

В психологии есть понятие эффекта коктейльной вечеринки: человек способен воспринимать полезную для себя информацию даже в ситуации, когда вокруг него много источников речи и шума. Но насколько хорошо с такой задачей справляется искусственный интеллект? Можно ли добиться высокого качества распознавания речи, когда на записи говорят несколько человек?

Не так давно мы отметили 1 миллион проданных устройств с виртуальными ассистентами Салют. В нашей линейке в числе прочего представлены farfield-устройства, то есть те, с которыми можно “разговаривать” на расстоянии: смарт-дисплей SberPortal, ТВ-медиацентр SberBox Top и умная медиаколонка SberBox Time. В комнатах, где они стоят, может говорить одновременно несколько людей или играть телевизор, что существенно усложняет задачу распознавания. Иногда необходимость распознать больше одного голоса на записи возникает и у клиентов нашего API SmartSpeech — например, если это разговор двух людей.

В статье я расскажу, как мы решали эту проблему. Подробно остановимся на архитектуре нашего решения, узнаем о процессе её создания и возникавших сложностях, послушаем примеры работы системы.

+21

sbushuev 23 авг 2022 в 10:09

Как мы переходили с pip на Poetry

7 мин

13K

Python*Блог компании Semrush

Технотекст 2022

Всем привет! Я Станислав Бушуев, Software Engineer в Semrush. В этой статье я расскажу о том, как мы столкнулись с проблемой периодического обновления Python-зависимостей, тестировали решение с полной их фиксацией, ошибались, и в итоге перешли на Poetry.

MaxRokatansky 7 июл 2022 в 14:52

17 убойных репозиториев GitHub, которые нужно сохранить

6 мин

139K

Программирование*GitHub*Блог компании OTUS

Перевод

Здесь собраны лучшие и самые полезные репозитории Github, которые будут служить вам долгое время.

+114

Berkseo 4 мая 2022 в 12:00

Компактный DIY Zigbee датчик температуры с e-ink дисплеем

6 мин

14K

Беспроводные технологии*Mesh-сети*Блог компании RUVDS.comУмный домDIY или Сделай сам

В сегодняшней статье хочу рассказать о новой версии миниатюрного датчика температуры и влажности с e-ink дисплеем. Этот проект является продолжением моего старого открытого ардуино проекта миниатюрного датчика температуры c e-paper дисплеем, который работал на nrf52810.

Читать дальше →

+64

smart_alex 25 апр 2022 в 12:00

KC868-AG: IoT шайба

6 мин

6.5K

Программирование микроконтроллеров*Разработка для интернета вещей*Блог компании RUVDS.comРазработка под Arduino*DIY или Сделай сам

Не знаю как у вас, а меня первая ассоциация при взгляде на Kincony KC868-AG — это хоккейная шайба. На самом деле это очередной IoT контроллер от компании Kincony на популярном микроконтроллере ESP32, предназначенный для IR управления домашней аппаратурой и дополнительно снабжённый беспроводным приёмником и передатчиком 433 МГц для взаимодействия с устройствами наподобие метеодатчиков, умных розеток и тому подобных устройств.

Во многом KC868-AG напоминает уже рассмотренный нами раньше контроллер KC868-Uair, но есть и некоторые отличия. Об этих отличиях и о том, как можно использовать KC868-AG мы и поговорим дальше.

Читать дальше →

+40

Evgeny_E 24 апр 2022 в 20:50

Фиалку поливать не нужно

4 мин

20K

Программирование микроконтроллеров*Производство и разработка электроники*ГаджетыDIY или Сделай сам

Технотекст 2022

Серега уезжал покорять Москву, и я зашел к нему попрощаться, пожелать удачи. Взять нужно было все самое необходимое, все для новой работы и все для новой жизни. Кота хотелось бы оставить, но пришлось брать. А вот с другими обитателями квартиры – огромным числом фиалок, нужно было распрощаться.

— Возьмешь фиалку? Марина выращивает, не везти же их все с собой. Мы их всем друзьям раздаем.

Я ответил, что не держу дома цветов, поскольку забываю их поливать, и они у меня быстро загибаются. Поэтому у меня только кактус.

— Эту фиалку поливать не нужно.

Он принес из комнаты цветок, и я был вынужден признать верность его заявления. Фиалка имела «систему автополива». Растение было посажено в маленький горшок, который помещался в большой пластиковый стакан, вроде бы из под кваса. Из горшка спускалась веревочка, через которую и поступала необходимая для жизни влага. Таким образом, залив один раз пол литра, можно было не беспокоиться о цветке несколько месяцев. Фиалку я взял.

+45

yellowknife 22 апр 2022 в 13:23

Народная дозиметрия. Бюджетный детектор радиации своими руками

7 мин

21K

Программирование микроконтроллеров*Разработка под Arduino*DIY или Сделай самЭлектроника для начинающих

Туториал

Сегодня мы изготовим простой и бюджетный DIY-дозиметр на базе wifi-контроллера ESP32 и платы RadSens. В качестве сенсора будет использована популярная трубка СБМ20.

Целью статьи является создание максимально подробной инструкции по сборке. Если повторить описанные шаги сможет самый юный инженер-дозиметрист - мы достигли успеха.

+32

Geek_and_Cat 20 апр 2022 в 20:01

Домашняя масляная майнинг-ферма

21 мин

61K

Программирование микроконтроллеров*Разработка под Arduino*Умный домDIY или Сделай самКриптовалюты

Технотекст 2021

Это история одного моего хобби-проекта - создания встроенной в интерьер майнинг-фермы с видеокартами в масле, которая своим теплом отапливает лоджию.

+187

118

Mdm3 18 апр 2022 в 19:49

Нейронная сеть считает лес кругляк и распознает автомобильные номера. Как это сделано?

Средний

9 мин

16K

Python*Искусственный интеллектTensorFlow*

Из песочницы

Технотекст 2021

В статье покажем, как алгоритмы компьютерного зрения помогают решить задачу автоматического определения объема круглого леса в лесовозе по фотографии. Пройдем путь от идеи до прототипа. Расскажем, какие были выбраны решения и почему.

Необходимая подготовка читателя — должно быть общее представление о компьютерном зрении (computer vision) и нейронных сетях. Здесь не будет описаний, что такое сверточная нейронная сеть и т.п., статей по таким основам найдете много на хабре (вот хорошая Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей). В то же время, совсем новички могут получить представление, какие знания и компетенции нужны для решения подобных задач.

+26

janvarev 13 апр 2022 в 15:55

Ирина, голосовой помощник. Продолжение

7 мин

19K

Open source*Python*Умный домГолосовые интерфейсы*

— Слушай, она меня на кухне не слышит.
— Ну да, далековато. Давай дополнительный микрофон протянем.
<покупается 5 метров кабеля>
— О, классно!
— ...
— Теперь в комнате не работает.

Это продолжение статьи Ирина — опенсорс русский голосовой помощник. Offline-ready - про голосового помощника, не зависящего от крупных корпораций. Расскажу, что улучшилось за два месяца с момента прошлой статьи.

TL;DR> Отлажен клиент-сервер с несколькими микрофонами/машинами; можно командовать по всему дому. Сделан Телеграм-клиент. Несколько новых голосов (TTS). Обработка голоса в контексте (можно делать голосовые игры). Интеграция с Home Assistant. И ЕЩЁ больше плагинов и документации.

Ладно, рассказывай, что нового

+39

Furriest 7 апр 2022 в 17:34

Получаем список российских IP-адресов

4 мин

41K

Сетевые технологии*

Мир меняется. И в текущей ситуации становится полезным список IP-адресов, условно принадлежащих автономным системам той или иной страны.

В этой статье вы узнаете, как получить список префиксов, анонсируемых автономными системами любой страны. Если вы, конечно, не знали этого раньше.

+29

adamnsandle 10 дек 2021 в 15:32

А ты используешь VAD? Что это такое и зачем он нужен

5 мин

13K

Python*Машинное обучение*Искусственный интеллектГолосовые интерфейсы*

Очень часто при работе мы обращаем внимание на то, что все люди знают, что такое распознавание речи, но не знают, что такое Voice Activity Detector (VAD) или детектор речи. А ведь именно VAD на самом деле самый важный алгоритм при работе с речью людей в естественной среде обитания.

Как ни странно, если поискать поддерживаемые и высококачественные решения данной задачи в публичном доступе — найдутся буквально пара проектов достаточного уровня. Но вот незадача — академические решения тяжелы (и иногда работают запретительно долго) и зачастую принимают только целые аудио на вход (нельзя использовать потоково). Решение от Google (WebRTC) очень быстрое но плохо отличает речь от шума (но его можно использовать потоково). А некоторые коммерческие решения "привязаны" к личному кабинету и шлют какую-то телеметрию.

Мы решили исправить это недоразумение и сделать уникальный VAD мирового уровня (судите сами по метрикам), который работает на 1 ядре процессора с задержкой в 1 миллисекунду на кусочках аудио от 30 миллисекунд. В этой статье мы расскажем вам, что такое VAD, покажем на примерах как использовать его и наглядно потестировать на своем голосе.

Читать дальше →

+22

jekyll2017 28 мар 2022 в 13:16

Собственный голосовой помощник off-line

12 мин

14K

C#*Умный домГолосовые интерфейсы*

Из песочницы

Microphone вектор создан(а) storyset - ru.freepik.com

Никогда не был любителем голосового интерфейса, но пробовал дома и Amazon Echo, и Алису. Все-таки очень долго это и недостаточно надежно - произносить фразу и думать потом - правильно ли меня поняли и всё ли сделано, как я хотел.
Но после прочтения статьи и, главное, обсуждений после нее я пришел к выводу, что есть варианты, когда это правда удобно. Собственно, самым ярким мне показался пример с кухонным таймером - не хочется грязными руками что-то трогать - голосовой интерфейс тут идеален. А попробовав приложение и почитав код коллеги @janvarev я понял, что современные средства распознавания уже вышли на очень приличный уровень и легко подключаются в проекты с открытым кодом. Дальше стало интересно сделать что-то более удобное и более стабильно работающее (без обид, но проект "Ирина" у меня не весь заработал при вменяемых затратах времени и настроек там меньше, чем мне хотелось бы).

+14

Bright_Translate 20 мар 2022 в 13:00

Оптическое распознавание символов с помощью Rust и WebAssembly

6 мин

Python*Обработка изображений*Rust*Блог компании RUVDS.comWebAssembly*

Перевод

После переписывания Cyberscore я захотел отправить на сайт какие-нибудь результаты. Последнее, во что я играл, это Pokémon Legends: Arceus, по которой на Cyberscore есть около 3000 таблиц результатов. Я не собирался отправлять столько рекордов вручную, поэтому начал придумывать инструмент для автоматизации этого процесса.

Эта статья посвящена двум вещам: процессу извлечения результатов из JPG с помощью Rust и встраиванию этого функционала во фронтенд Cyberscore.

Читать дальше →

+43

Turundur 3 мар 2022 в 11:08

Как заходить в чужой монастырь

18 мин

20K

Управление персоналом*Карьера в IT-индустрииБлог компании Домклик

Привет, Хабр!

В моей IT-карьере время от времени судьба распоряжалась так, что мне выпадало возглавить новые команды разработки. Причем это были уже устоявшиеся сформированные коллективы, для которых я был новым непонятным персонажем, входившим в их уютный монастырь со своим уставом. В этой статье я хотел бы обобщить и сформулировать шаги, которые я предпринимал для «вливания» в коллектив и построения «доверительной» рабочей атмосферы.

Эта статья может быть интересна ребятам, которые переходят в новые компании на руководящие должности техлидов и тимлидов, либо разработчикам, которым выпало неожиданно возглавить не их «родные» команды.

Итак, рассмотрим ситуацию, когда в команду разработки (или в командЫ разработки) приходит новый руководитель, о котором самим участникам команды ничего не известно. И этот руководитель — вы.

+67

mr-pickles 1 ноя 2021 в 15:41

Глобальная блокировка интерпретатора (GIL) и её воздействие на многопоточность в Python

34 мин

52K

Python*Программирование*Алгоритмы*Блог компании Wunder Fund

Перевод

Прим. Wunder Fund: в статье рассказано, зачем появилась и существует глобальная блокировка интерпретатора в Питоне, как она работает, и как она влияет на скорость работы Питона, а также о том, куда в будущем, вероятно, будет двигаться Питон. У нас в фонде почти всё, что не написано на плюсах — написано на Питоне, мы пристально следим за тем, куда движется язык, и если вы тоже — вы знаете, что делать )

Как вы, наверное, знаете, глобальная блокировка интерпретатора (GIL, Global Interpreter Lock) — это механизм, обеспечивающий, при использовании интерпретатора CPython, безопасную работу с потоками. Но из-за GIL в конкретный момент времени выполнять байт-код Python может лишь один поток операционной системы. В результате нельзя ускорить Python-код, интенсивно использующий ресурсы процессора, распределив вычислительную нагрузку по нескольким потокам. Негативное влияние GIL на производительность Python-программ, правда, на этом не заканчивается. Так, GIL создаёт дополнительную нагрузку на систему. Это замедляет многопоточные программы и, что выглядит достаточно неожиданно, может даже оказать влияние на потоки, производительность которых ограничена подсистемой ввода/вывода.

Здесь я опираюсь на особенности CPython 3.9. По мере развития CPython некоторые детали реализации GIL, определённо, изменятся. Материал опубликован 22 сентября 2021 года, после публикации в него внесено несколько дополнений.

+57

kmoseenk 23 сен 2021 в 16:40

Лучшие GUI для MongoDB в 2021 году

8 мин

48K

NoSQL*MongoDB*Блог компании OTUS

Перевод

MongoDB — это NoSQL-база данных, которую в том или ином виде используют более четверти разработчиков. MongoDB и другие NoSQL-базы данных привлекают своей гибкостью: вместо жесткой схемы и вертикального масштабирования, у вас есть возможность развивать схему постепенно и масштабироваться горизонтально. Компания MongoDB вышла на биржу в 2017 году и сегодня стоит более 17 миллиардов долларов.

Документные базы данных используют вместо реляционных таблиц и столбцов вложенные пары ключ-значение. Одно из преимущество такого подхода в том, что вам не нужно преобразовать данные для взаимодействия с фронтендом — данные уже хранятся в необходимом виде (плюс-минус .map или .reduce).

Работа с MongoDB через командную строку не всегда удобна, и в этом посте мы рассмотрим доступные графические инструменты.

+11

3 4 ...

8 9