Articles / Bookmarks / Profile of AlexeyAB / Habr

Алексей @AlexeyAB

Пользователь

ProfileArticles7PostsNewsComments148

vladbataev Apr 28 at 09:01

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

12 min

29K

Яндекс corporate blogArtificial IntelligenceMachine learning*SoundNatural Language Processing*

Осенью 2021 года мы впервые представили пользователям технологию перевода видео в Яндекс Браузере. Этот инструмент быстро стал популярен: с его помощью переведены уже миллионы часов видеоконтента. Напомним, что на старте для перевода использовались только два голоса — мужской и женский. Затем мы расширили набор заранее созданных голосов. Ну а сегодня мы делаем следующий большой шаг вперёд.

Теперь наша технология сохраняет тембр и интонации оригинального голоса, создавая перевод, который звучит более естественно и близко к оригиналу. О том, как мы этого добились, расскажу в этой статье. Вы узнаете, как выглядит архитектура нашего нового решения, какие проблемы zero‑shot‑синтеза мы решали и как ускоряли инференс новой модели. Расскажу про эвристики для выбора аудиопромптов. Поговорим про замеры качества. Ну и, конечно же, покажу итоговый результат нашей работы в виде ролика в конце статьи.

+76

ValdikSS Aug 11 2017 at 16:11

Автономный способ обхода DPI и эффективный способ обхода блокировок сайтов по IP-адресу

7 min

757K

Network technologies*

Провайдеры Российской Федерации, в большинстве своем, применяют системы глубокого анализа трафика (DPI, Deep Packet Inspection) для блокировки сайтов, внесенных в реестр запрещенных. Не существует единого стандарта на DPI, есть большое количество реализации от разных поставщиков DPI-решений, отличающихся по типу подключения и типу работы.

Существует два распространенных типа подключения DPI: пассивный и активный.

Пассивный DPI

Пассивный DPI — DPI, подключенный в провайдерскую сеть параллельно (не в разрез) либо через пассивный оптический сплиттер, либо с использованием зеркалирования исходящего от пользователей трафика. Такое подключение не замедляет скорость работы сети провайдера в случае недостаточной производительности DPI, из-за чего применяется у крупных провайдеров. DPI с таким типом подключения технически может только выявлять попытку запроса запрещенного контента, но не пресекать ее. Чтобы обойти это ограничение и заблокировать доступ на запрещенный сайт, DPI отправляет пользователю, запрашивающему заблокированный URL, специально сформированный HTTP-пакет с перенаправлением на страницу-заглушку провайдера, словно такой ответ прислал сам запрашиваемый ресурс (подделывается IP-адрес отправителя и TCP sequence). Из-за того, что DPI физически расположен ближе к пользователю, чем запрашиваемый сайт, подделанный ответ доходит до устройства пользователя быстрее, чем настоящий ответ от сайта.

Читать дальше →

+211

352

Deleted-user Mar 14 2024 at 21:03

Надежный обход блокировок в 2024: протоколы, клиенты и настройка сервера от простого к сложному

Medium

46 min

343K

Configuring Linux*Information Security*System administration*Network technologies*

Tutorial

Поскольку блокировки интернета в РФ в последние недели и месяцы многократно активизировались, а маразм все крепчает и крепчает, стоит еще раз поднять тему обхода этих самых блокировок (и делаем ставки, через сколько дней на эту статью доброжелатели напишут донос в РКН чтобы ограничить к ней доступ на территории страны).

Вы, наверняка, помните отличный цикл статей на Хабре в прошлом году от пользователя MiraclePtr, который рассказывал о разных методах блокировок, о разных методах обхода блокировок, о разных клиентах и серверах для обходов блокировок, и о разных способах их настройки (раз, два, три, четыре, пять, шесть, семь, восемь, десять, десять, и вроде были еще другие), и можете спросить, а зачем еще одна? Есть две основные причины для этого.

+489

377

MichaelEk Jun 11 2024 at 09:00

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

12 min

25K

Яндекс corporate blogOpen source*Algorithms*Machine learning*Natural Language Processing*

✏️ Technotext 7

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

+111

MayaFinexpert Jun 26 2023 at 13:10

Как и о чём мне нужно информировать налоговую в России, если я переехал в Грузию, работаю и живу здесь?

Medium

3 min

9.1K

IT-emigrationLegislation in ITFinance in IT

From sandbox

Привет! Меня зовут Майя, я финансовый, налоговый и инвестиционный советник. Значительная часть моих клиентов сейчас находится за границей. Достаточно часто они сталкиваются с непониманием того, как взаимодействуют между собой русская и грузинская/турецкая/сербская финансовые системы. С учетом того, что в большинстве своем это фрилансеры и люди, работающие на удалёнке, которые не погружены в вопрос, я всегда рада помочь им не получить ненужный штраф.

Сегодня мы будем на простых примерах разбирать ситуации, в которых может оказаться любой гражданин России, проживающий в Грузии.

antoshkka Mar 28 2024 at 07:08

C++26 — прогресс и новинки от ISO C++

Medium

7 min

29K

Яндекс corporate blogC++*IT Standards*Compilers*Programming*

Работа в комитете по стандартизации языка C++ активно кипит. Недавно состоялось очередное заседание. Как один из участников, поделюсь сегодня с Хабром свежими новостями и описанием изменений, которые планируются в С++26.

До нового стандарта C++ остаётся чуть больше года, и вот некоторые новинки, которые попали в черновик стандарта за последние две встречи:

запрет возврата из функции ссылок на временное значение,
[[indeterminate]] и уменьшение количества Undefined Behavior,
диагностика при =delete;,
арифметика насыщения,
линейная алгебра (да-да! BLAS и немного LAPACK),
индексирование variadic-параметров и шаблонов ...[42],
вменяемый assert(...),
и другие приятные мелочи.

Помимо этого, вас ждут планы и прогресс комитета по большим фичам и многое другое.

Рассмотрим новинки на примерах

+62

119

yafinder Jan 11 2023 at 07:57

Две культуры программирования: почему обе из них важны?

13 min

58K

Яндекс corporate blogAbnormal programming*Programming*Industrial Programming*

Opinion

✏️ Technotext 2023

Уже несколько лет я замечаю, что программисты и программистские инструменты делятся на две разные культуры:

Изначально я человек первой культуры и очень долгое время считал вторую несерьёзной. Пару-тройку лет назад я окончательно понял, что ошибался. Многие «старички» ошибаются в ту же сторону, а в последние годы ещё большее число людей ошибаются в обратную. Знакомство с соседней культурой и понимание, почему дела в ней делаются так, как там принято, превратит вас в лучшего разработчика.

Читать дальше →

+154

107

alizar Dec 12 2022 at 09:00

Величайшие программисты 21 века. Джон-Движок Кармак

Easy

9 min

53K

RUVDS.com corporate blogHistory of ITProgramming*Game development*Development Management*

Technotext 2022

Джон Кармак вместе с тёзкой Джоном Ромеро стали родоначальниками игрового жанра FPS. На слабеньких 486SX, без видеокарт (!) они выдали настоящий 3D-шутер без лагов с эффектом присутствия, что стало бомбой для 1993 года — в эпоху пошаговых стратегий и отсутствия скроллинга. Казалось, тут вмешалась чёрная магия…

В принципе, примерно так и есть. В разработке Wolfenstein 3D, Doom и движка Quake Джон Кармак действительно использовал кучу нестандартных приёмов вроде конверсии указателей или выхода за границы объектов, чтобы в циклах получать доступ к другому объекту, который гарантированно идёт следом.

Уровень программирования Doom и Quake до сих пор считается непревзойдённым образцом хакерских оптимизаций, а сам Джон Кармак — эталон сверхэффективного разработчика. Благодаря высочайшему качеству программирования Doom стал феноменом, который изменил мир.

Читать дальше →

+110

PatientZero Dec 11 2022 at 05:35

Предчувствие будущего: фальшивые книги, победившие настоящий контент

4 min

39K

The future is hereArtificial IntelligenceCryptography*

Translation

В конце прошлого года, на пике ажиотажа вокруг невзаимозаменяемых токенов (non-fungible token, NFT), я приобрёл на Amazon с дюжину книг по NFT с самым высоким рейтингом:

Я поступил так, потому что хотел опубликовать сбалансированную критику NFT, решив, что честнее всего это будет сделать, ознакомившись с самыми красноречивыми аргументами, выдвигаемыми сторонниками этой технологии.

Вскоре я выяснил, что все книги склоняются к одному центральному аргументу: ценность — неотъемлемое следствие дефицита.

Моё опровержение этого аргумента было простым: это исключение, а не правило. Каракули моего ребёнка дефицитны, но в художественной галерее они заработали бы не особо много. Увы, хоть этого было достаточно для твита, для подробного поста оказалось маловато.

Читать дальше →

+198

209

Kelbon Dec 4 2022 at 14:26

Превью профессии «говорящий с нейросетями»

2 min

40K

Abnormal programming*C++*C*Data Engineering*

Все уже слышали, что openAI выпустили в свет свою новую нейросеть-ассистента, так что я решил попробовать на что она способна и описать свой опыт взаимодействия с этим.. Этой... Сущностью.

Разговор будет вестись как с человеком в вежливой форме, так как оказалось, что нейросеть очень хорошо запоминает = )

Начнём с чего-то простого, попросим сгенерировать на языке CMake простую программу

+83

128

AlexeyNadezhin Nov 29 2022 at 09:30

Тест старения светодиодных ламп: 2000 часов

2 min

22K

LampTest corporate blogGadgets

Более восьми месяцев ушло на то, чтобы измерить, как меняются характеристики светодиодных ламп через 500, 1000 и 2000 часов работы.

Читать дальше →

+71

ternaus Oct 26 2022 at 23:34

Ternaus: YOLO V7 bounding boxes

4 min

Python*Image processing*Machine learning*Artificial Intelligence

Месяц назад я написал пост про то, как запили API + сайт демо на сайте Ternaus.com, где можно потыкать мышкой, чтобы оценить качество поиска.

Сейчас, в дополнение к картинкам добавлены bounding boxes и пост об этом.

virtual_explorer Nov 8 2022 at 09:45

Исследователи нашли новое применение для Starlink, но Илон Маск не в восторге

4 min

40K

FirstVDS corporate blogGeoinformation services*Development of communication systems*Popular scienceAstronautics

У Starlink Илона Маска нашлось новое применение, и технологию для этого смогли разработать даже несколько простых исследователей без какого-либо финансирования. Тем не менее сам Илон Маск отказывается от вложения каких-либо средств в это направление, и даже запрещает своей команде как-либо поддерживать развитие подобных новых проектов.

+69

113

exmk Oct 12 2022 at 11:46

Подпись на эллиптических кривых: всё, что нужно знать, чтобы подписать транзакцию в Bitcoin с полного нуля

18 min

37K

Cryptography*Programming*Popular scienceCryptocurrencies

Technotext 2022

Это - полный разбор алгоритма подписи на эллиптических кривых (ECDSA), который является ключевым элементом большинства блокчейнов (типа Bitcoin, Ethereum, ...). С примерами кода и реализацией с полного нуля. Всё сведено к уровню школьной математики, а читать код не обязательно!)

Читать

+83

PatientZero Sep 1 2022 at 12:27

4,2 гигабайта, или как нарисовать что угодно

9 min

43K

Machine learning*Artificial IntelligenceGraphic design*

Translation

В нашем мире мы можем сделать всё, что захотим. Всё что угодно.

— Боб Росс, The Joy Of Painting, сезон 29, эпизод 1

Однажды, когда я наблюдал за ярким закатом в Сиэтле, внезапно включилось моё воображение. Потусторонний оттенок неба пробудил воспоминания о чём-то из научной фантастики. Дымчатый оранжево-сиреневый завораживал.

Я представил огромный инопланетный объект, висящий в горящем оранжевом небе над давно покинутым Сиэтлом, здания которого покрыты зарослями.

Тем же вечером я за несколько часов создал вот такое изображение:

Простите за низкое разрешение — к сожалению, у моего GPU всего 12 ГБ памяти.

Поскольку очевидно, что я талантливый художник, имеющий за плечами буквально десятки минут опыта, мне захотелось поделиться тем, как я создал данный шедевр.

Читать дальше →

+160

Arnak Aug 3 2022 at 08:21

Конец «китайской мечты»: как китайское IT переживает свои худшие времена

8 min

66K

getmatch corporate blogPersonnel Management*IT careerIT-companies

Translation

Правительственные репрессии и экономический спад привели к массовым увольнениям в китайских IT-компаниях. На рынок выбрасываются сотни тысяч специалистов, вплоть до бывших тимлидов и сеньоров. Для некоторых это означает конец карьеры мечты, но другие с облегчением бросают изнурительный труд в стиле «9-9-6».

Читать дальше →

+62

359

Aleron75 Jul 26 2022 at 09:00

Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны

4 min

150K

RUVDS.com corporate blogBig Data*Machine learning*Popular scienceImage processing*

Текст генерации: furry monster with green eyes looking at us, the word «habrahabr» in the background, digital art, blue background, 3d

Привет, чемпион!

Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.

По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.

Нет больше терпения ждать, давайте же опробуем её!

Читать дальше →

+214

817

RationalAnswer Jul 20 2022 at 04:24

Штраф в 150% от стоимости проданной квартиры: ужасы валютных нарушений, и как их избежать

11 min

67K

IT-emigrationLegislation in ITFinance in IT

В июле вступают в действие поправки, которые значительно смягчают наказание за нарушение валютного законодательства РФ – что может быть крайне актуально для любого инвестора или релоцирующегося айтишника. В этой статье мы разбираем леденящие душу кулстори о возникающих из-за валютного регулирования проблемах, а также пытаемся разобраться – насколько нам станет легче жить с новыми поправками?

+187

173

MichaelEk Jun 23 2022 at 07:59

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

10 min

123K

Яндекс corporate blogNatural Language Processing*Open source*Algorithms*Machine learning*

Technotext 2022

^{Больше примеров — в конце поста}

В последние годы большие языковые модели на архитектуре трансформеров стали вершиной развития нейросетей в задачах NLP. С каждым месяцем они становятся всё больше и сложнее. Чтобы обучить подобные модели, уже сейчас требуются миллионы долларов, лучшие специалисты и годы разработки. В результате доступ к современным технологиям остался лишь у крупнейших IT-компаний. При этом у исследователей и разработчиков со всего мира есть потребность в доступе к таким решениям. Без новых исследований развитие технологий неизбежно снизит темпы. Единственный способ избежать этого — делиться с сообществом своими наработками.

Год назад мы впервые рассказали Хабру о семействе языковых моделей YaLM и их применении в Алисе и Поиске. Сегодня мы выложили в свободный доступ нашу самую большую модель YaLM на 100 млрд параметров. Она обучалась 65 дней на 1,7 ТБ текстов из интернета, книг и множества других источников с помощью 800 видеокарт A100. Модель и дополнительные материалы опубликованы на Гитхабе под лицензией Apache 2.0, которая допускает применение как в исследовательских, так и в коммерческих проектах. Сейчас это самая большая в мире GPT-подобная нейросеть в свободном доступе как для английского, так и для русского языков.

В этой статье мы поделимся не только моделью, но и нашим опытом её обучения. Может показаться, что если у вас уже есть суперкомпьютер, то с обучением больших моделей никаких проблем не возникнет. К сожалению, это заблуждение. Под катом мы расскажем о том, как смогли обучить языковую модель такого размера. Вы узнаете, как удалось добиться стабильности обучения и при этом ускорить его в два раза. Кстати, многое из того, что будет описано ниже, может быть полезно при обучении нейросетей любого размера.

Читать дальше →

+164

139

AlexeyNadezhin Mar 29 2022 at 18:44

Золотые лампочки Navigator Supervision

2 min

39K

LampTest corporate blogGadgets

То, чего ждали многие, свершилось — на рынке появились светодиодные лампы с качественным светом, хорошей электроникой, честными параметрами и высокой надёжностью. Но получилось недёшево.

Читать дальше →

+87

151

2 3 ...

39 40