Galymzhan Abdimanap @modernToking

Developer

Профиль Публикации 7Комментарии 9Закладки 56

nkarpov 22 июл 2021 в 13:37

Как улучшить распознавание русской речи до 3% WER с помощью открытых данных

Простой

5 мин

7.9K

Машинное обучение*Искусственный интеллектNatural Language Processing*Голосовые интерфейсы*Блог компании SberDevices

Туториал

Меня зовут Николай, когда в 2009 году я защищал диссертацию по распознаванию речи, скептики мне говорили, что слишком поздно, так как Microsoft и Google уже “всё сделали”. Сейчас в SberDevices я обучаю модели распознавания речи, которые используются в семействе виртуальных ассистентов Салют и других банковских сервисах. Я расскажу, как обучил модель распознавания речи, используя Common Voice и недавно открытый датасет Golos. Ошибка распознавания составила от 3 до 11 % в зависимости от типа тестовой выборки, что очень неплохо для открытой модели.

Не так давно наша команда подготовила и опубликовала общедоступный датасет Golos. Почему встал вопрос об обучении и публикации акустической модели QuartzNet? Во-первых, чтобы узнать, какую точность достигает система распознавания речи при обучении на новом датасете. Во-вторых, обучение само по себе ресурсоёмкое, поэтому сообществу полезно иметь в открытом доступе предобученную модель на русском языке. Полная версия статьи опубликована на сайте arxiv.org и будет представлена на конференции INTERSPEECH2021.

APPKODE 21 июл 2021 в 16:09

Как проджект-менеджеры рулят проектами: руководство для джунов

7 мин

17K

Управление проектами*Agile*

Привет, Хабр! Меня зовут Вадим Кузенков, я руковожу проектным офисом и работаю с командами в компании KODE. За плечами — 18 лет опыта в управлении проектами.

Весной мы проводили первую стажировку по проджект-менеджменту. На первой лекции я рассказывал, что такое проект для настоящего PM и какие методологии нужно использовать, чтобы уверенно им управлять. Решил поделиться материалом с вами.

Чем он может быть полезен? Вы сможете проверить свою осознанность, начать строить мост над пропастью между теорией и практикой, возможно — избавиться от стереотипов. Материал прежде всего ориентирован на джунов в PM, но будет полезен и другим IT-специалистам. Развеем миф, что попугая можно повысить до PM, если научить его говорить «Ну что там?»

MagisterLudi 21 июл 2021 в 19:44

Как бесплатно поступить в Гарвард, Стэнфорд, MIT: опыт Селимжана Чалышкана

8 мин

22K

Учебный процесс в ITОбразование за рубежомНаучно-популярноеИзучение языков

Селимжан Чалышкан выиграл бронзу на международной олимпиаде International Biology Olympiad 2018 в Тегеране, а также взял золото и бронзу на республиканской олимпиаде. В конце 2017 года Селимжан Чалышкан вместе с Любовью Дудченко заняли первое место в номинации «Социально значимые инновации» на республиканском (казахстанском) молодежном конкурсе NURINTECH.

Гарвардский университет предоставляет полную финансовую помощь ученикам, чьи семьи не зарабатывают больше $65 000 в год. Финансирование включает в себя оплату за обучение, за питание, за жилье, за медицинскую страховку и дают кэш на личные расходы.

Вот, что нужно для подачи заявки в университеты:

Application (Common App/Coalition App/Universal App)
ACT or SAT Test Scores (+ SAT Essay)
SAT Subject Test Scores (up to 3 subjects)
Secondary School Transcript (9-12 классы)
Secondary School Report
Teacher Recomendations (1-4)
Application Fee ($75+)
Essays
TOEFL и/или IELTS для иностранных студентов

Revyashko 21 июл 2021 в 08:58

Психи на работе

7 мин

24K

Agile*Карьера в IT-индустрииБлог компании М.Видео-ЭльдорадоЛайфхаки для гиковЗдоровье

Привет, Хабр! Меня зовут Андрей Ревяшко, я СТО сети Эльдорадо. Мы регулярно встречаемся с командой и обсуждаем различные окологиковские темы. Совсем недавно мы говорили про психотипы членов команды разработки и их влияние на общий результат. Поделюсь этим материалом и с вами. Уверен, что часть из вас точно возьмет его на вооружение.

+11

interestedit 15 июл 2021 в 15:15

Из Ташкента в Сан-Франциско: интервью с разработчиком из Google

14 мин

4.6K

Блог компании MWSIT-эмиграцияКарьера в IT-индустрии

Привет, Хабр! Меня зовут Екатерина Юдина. Я руководитель направления контент-маркетинга в #CloudMTS. Мы с вами уже встречались раньше, в статье-интервью с моей давней подругой Марией Шалдыбиной, которая вместе с мужем переехала в США и устроилась на работу в VMware. Если вы пропустили эту статью, советую прочитать её тут: тык. Мы обсуждали особенности миграции, трудоустройство в США и работу внутри крупной технологической компании.

Всегда очень интересно наблюдать за тем, как по-разному строится карьера ИТ-специалистов, даже если они — супруги. Наконец-то мне представилась возможность взять большое интервью у мужа Маши, который уже несколько лет работает в Google.

Под катом — живое интервью с разработчиком, рассказ об устройстве одной из крупнейших ИТ-компаний мира и её корпоративной культуре.

itmo_nsslab 30 мая 2021 в 13:17

Прогнозирование временных рядов с помощью AutoML

16 мин

24K

Open source*Python*Алгоритмы*Машинное обучение*Искусственный интеллект

Хабр, привет!

В лаборатории моделирования природных систем Национального центра когнитивных разработок Университета ИТМО мы активно исследуем вопросы применения автоматического машинного обучения для различных задач. В этой статье мы хотим рассказать о применении AutoML для эффективного прогнозирования временных рядов, а также о том, как это реализовано в рамках open-source фреймворка FEDOT. Это вторая статья из серии публикаций, посвященной данной разработке (с первой из них можно ознакомиться по ссылке).

Все подробности — под катом!

Читать дальше →

itmo_nsslab 23 мая 2021 в 18:22

Как AutoML помогает создавать модели композитного ИИ — говорим о структурном обучении и фреймворке FEDOT

9 мин

8.4K

Машинное обучение*Блог компании ИТМО

В лаборатории моделирования природных систем НЦКР ИТМО мы занимаемся разработкой и продвижением решений в области AutoML. Наши научные сотрудники Николай Никитин, Анна Калюжная, Павел Вычужанин и Илья Ревин рассказывают о трендах и задачах AutoML, плюс — о собственных open-source разработках в этой области.

kesn 2 апр 2021 в 08:00

Собеседование в Яндекс: театр абсурда :/

14 мин

529K

Python*Управление персоналом*Карьера в IT-индустрии

Технотекст 2021

Привет, Хабр!

В прошлой статье меня знатно разбомбили в комментариях, где-то за дело, где-то я считаю, что нет. Так или иначе, я выжил, и у меня есть чем с вами поделиться >:)

Напомню, что в той статье я рассказывал, каким я вижу идеальное собеседование и что я нашёл компанию, которая так и делает - и я туда прошёл, хотя это был адский отбор. Я, довольный как слон, везде отметил, что я не ищу работу, отовсюду удалился и стал работать работу.

Как вы думаете, что делают рекрутеры, когда видят "Alexandr, NOT OPEN FOR WORK"? Правильно, пишут "Алексей, рассматриваете вариант работать в X?" Я обычно игнорирую это, но тут мне предложили попытать счастья с Яндекс.Лавкой, и я не смог пройти мимо - интересно было, смогу ли я устроиться куда-нибудь, когда введут великий российский файерволл. К тому же за последние 3 года я проходил только два интервью, и мне показалось, что я не в теме, что нынче требуется индустрии. Блин, я оказался и вправду не в теме. И вы, скорей всего, тоже - об этом и статья.

+610

1270

snakers4 30 мар 2021 в 06:27

Мы Опубликовали Качественный, Простой, Доступный и Быстрый Синтез Речи

9 мин

65K

Машинное обучение*ЗвукNatural Language Processing*

Технотекст 2021

fiona

Вторая часть — https://habr.com/ru/post/563484/

Вокруг темы синтеза речи сейчас много движения: на рынке есть огромное число тулкитов для синтеза, большое число закрытых коммерческих решений за АПИ (как на современных технологиях, так и на более старых, т.е. "говорилки") от условных GAFA компаний, большое количество американских стартапов, пытающихся сделать очередные аудио дипфейки (voice transfer).

Но мы не видели открытых решений, которые бы удовлетворяли одновременно следующим критериям:

Приемлемый уровень естественности речи;
Большая библиотека готовых голосов на разных языках;
Поддержка синтеза как в 16kHz так и в 8kHz из коробки;
Наличие своих собственных голосов у авторов решения, не нарушающих чужие права и лицензии;
Высокая скорость работы на "слабом" железе. Достаточная скорость работы на 1 потоке / ядре процессора;
Не требует GPU, команды ML инженеров или какой-либо дополнительной тренировки или для использования;
Минимализм и отсутствие зависимостей / использование в 1 строчку / не надо ничего собирать или чинить;
Позиционируется именно как готовое решение, а не очередной фреймворк / компиляция чужих скриптов / тулкитов для сбора плюсиков;
Решение никак не связано и не аффилировано с закрытыми экосистемами и продуктами Гугла / Сбера / Яндекса / вставить нужное;

Мы попытались учесть все эти пункты и представить комьюнити свое открытое некоммерческое решение, удовлетворяющее этим критериям. По причине его публичности мы не заостряем внимание на архитектуре и не фокусируемся на каких-то cherry picked примерах — вы можете оценить все сами, пройдя по ссылке.

+205

229

homm 8 мар 2021 в 09:37

Перегон картинок из Pillow в NumPy/OpenCV всего за два копирования памяти

7 мин

11K

Python*Обработка изображений*

Стоп, что? В смысле «всего»? Разве преобразование из одного формата в другой нельзя сделать за одно копирование, а лучше вообще без копирования?

Да, это кажется безумием, но более привычные методы преобразования картинок работают в 1,5-2,5 раза медленнее (если нужен не read-only объект). Сегодня я покопаюсь в кишках обеих библиотек, расскажу почему так получилось и кто виноват. А также покажу финальный результат, который работает так же, только быстрее. Никаких репозиториев или пакетов не будет, только рассказ и рабочий код в конце. Но давайте обо всём по порядку.

+39

tremp 11 фев 2021 в 02:02

Flutter. Асинхронность (async) <> параллельность (isolate). Совсем

3 мин

5.9K

Dart*Flutter*

Вступление

Недавно с удивлением обнаружил, что у коллег нет полной ясности, что такое асинхронность во Flutter. Почему-то у них было представление, что если асинхронная функция правильно написана, то она не блокирует интерфейс. Пролистав, пару статей не нашел простого, полного и ясного объяснения всей этой кухни (тут все по принципу — «выберите 2 из 3-х»)). В одной статье даже прочитал, что Dart обладает некоей чудесной асинхронностью, которая позволяет отложить выполнения кода, до тех пор, пока поток не будет посвободнее (что на мой взгляд вводит немного в заблуждение) (Примечание: в комментариях nikita_dol указал, что, вероятно, имелось в виду — scheduleTask).

Читать дальше →

fisher85 25 янв 2021 в 20:22

Как самому разработать систему обнаружения компьютерных атак на основе машинного обучения

17 мин

19K

Информационная безопасность*Машинное обучение*

Туториал

На фото – Arthur Lee Samuel, пионер машинного обучения, демонстрирует возможности искусственного интеллекта и играет в шашки с собственной программой Checkers-Playing, одной из первых самообучающихся программ в мире. 1962 год.

Спустя почти 60 лет, я решил познакомиться с машинным обучением и научить свою собственную программу – систему обнаружения компьютерных атак – находить вредоносный трафик в сети.

Как разработчик средств защиты информации я в общих чертах представлял архитектуру такой системы. Но как ML инженер, который должен был научить ее, я мало что знал.

В этом длинном посте я расскажу о своем опыте разработки модели машинного обучения, по шагам: от поиска хороших данных и сокращения признакового пространства до настройки и апробации модели на реальном трафике. С примерами, графиками, открытым кодом.

Dirac 26 янв 2021 в 13:15

Нейронная Сеть CLIP от OpenAI: Классификатор, который не нужно обучать. Да здравствует Обучение без Обучения

18 мин

46K

Python*Программирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Туториал

Можете представить себе классификатор изображений, решающий практически любую задачу, и который вообще не нужно обучать? Это новая нейросеть CLIP от OpenAI. Разбор CLIP из рубрики: Разбираем и Собираем Нейронные Сети на примере Звездных Войн!

Нет данных, нет разметки, но нужен классификатор изображений для конкретной задачи? Нет времени возиться с обучением нейронной сети, но нужно получить классификацию высокой точности? Все это стало возможным. Вам нужно обучение без обучения!

Готов и туториал: Собираем нейросети. Классификатор животных из мультфильмов. Без данных и за 5 минут. CLIP: Обучение без Обучения + код

Подробно и доступно разбираем что такое "обучение без обучения" и саму нейросеть CLIP от OpenAI. Стираем границы между Текстом и Изображением. Внимание: статья подходит под любой уровень: от нулевого до профи. Приятного прочтения!

Поехали!

+28

sxdxfan 15 окт 2020 в 11:28

Open Source распознавание речи SOVA

16 мин

29K

Программирование*Машинное обучение*Блог компании НаносемантикаИскусственный интеллектГолосовые интерфейсы*

Мы в Наносемантике занимаемся виртуальными ассистентами (чат-ботами и голосовыми помощниками) для компаний с большими колл-центрами. Раньше мы использовали распознавание и синтез речи других компаний, а 1.5 года назад решили, что хотим быть самодостаточным вендором.

Если интересно, зачем нам это, что у нас получилось, а также для чего нам выкладывать ASR & TTS в Open Source – добро пожаловать под кат.

+24

Ash666 18 янв 2021 в 19:40

Скрапинг Avito без headless-браузера

2 мин

40K

Python*API*

Туториал

Недавно на хабре вышла статья Скрапинг современных веб-сайтов без headless-браузеров, и в комментариях было высказано мнение, что без headless-браузера не выйдет получить номер телефона из объявления на "авито" или "юле". Хочу это опровергнуть, ниже скрипт на python размером менее 100 строк кода, который успешно парсит "авито" успешно парсит "авито"!

+15

Romfill 23 дек 2020 в 12:01

Как джуниор Python-разработчику стать мидлом за год

12 мин

30K

Python*Программирование*Учебный процесс в ITКарьера в IT-индустрииБлог компании Яндекс Практикум

Привет! Я Рома, менеджер продукта в Яндекс.Практикуме, где развиваю курс «Мидл Python-разработчик». Мы делаем из начинающих разработчиков крепких мидлов с инженерным мышлением. Сегодня хочу поделиться небольшими заметками о том, над чем стоит работать, если вы джуниор, который хочет стать мидлом.

Я не разработчик, поэтому эта статья во многом отражает взгляд со стороны. Ответить на вопрос «Как джуниор Python-разработчику стать мидлом за год?» — не такая простая задача, как может показаться на первый взгляд. Здесь спряталось сразу несколько челленджей:

Ответить на вопрос, кто такой джуниор: определить отправную точку, базу навыков, с которой мы будем рассматривать рост.
Ответить на вопрос, кто такой мидл — финальная точка нашего путешествия. Конечно же, во всех компаниях мидлы разные, а нам нужно какое-то взвешенное среднее, не оторванное от реальности.
Ответить на вопрос, почему рассматриваем рост именно за год. Не ради красивой круглой цифры же, верно?

Ну и это довольно холиварная тема. Не знаю, сколько копий было сломано на этом ристалище, но уж точно не одно.

Читать дальше →

+21

1 2