Wladislav Radchenko @Wladradchenko
Senior Software Developer
Information
Specialization
Web Developer, ML Engineer
Senior
Python
C#
Software development
Algorithms and data structures
Neural networks
Machine learning
Deep Learning
Pytorch
TENSORFLOW
Computer Science
Спасибо
Для удобства, есть видео, как работать с API через Postman для своих проектов. При нажатии F12 отображается структура запроса под каждый модуль, их можно например комбинировать, автоматизируя процесс))
Спасибо большое. К сожалению команды нет, и это сделано одним программистом, но благодаря отзывам и баг репортаж от пользователей))) Вся идея, которая отличает от других проектов, чтобы всё было максимально просто, в один клик, без сложных параметров. Сейчас в Wunjo можно одним клинком иметь собственное серверное приложение и по временным ссылкам делиться им с друзьями и со своими другими устройствами)
Спасибо за предложение, буду знать. На текущий момент приоритет довести до ума клонирование голоса и v2, а дальше посмотрим. До совершенства можно вечно доводить, а с каждым годом появляются всё лучше готовые решения. Оставайтесь в telegram wladblog, чтобы узнавать о статусе разработки. Пока не большой перерыв от Wunjo.
Строчки 221-222, первая модель baseline EAST, вторая веса. Подробнее в репозитории подхода.
Привет. Строчки 402-421 модели для определения текста перед удалением. Используется CNN VGG16. Дело больше не в том, что он плохо выделяет (в редких случаях не выделяет текст), дело в том что он может выделить текст на упаковках, одежде, итд, т.е. где совсем не хочется. Больше поможет доработка логики, чтобы текст выделялся только в фиксированной области. Но это усложнит логику + плюс как мы знаем текст может двигаться из одной области в другую или скрещиваться. Пока не придумал одно решение на всё.
На данный момент, есть параметр delay в секундах, пользователь его выбирает, чтобы за это время открыть директорию, где эти маски хранятся и подправить дефектные маски. Пока универсальное решение такое, оно не усложняет логику, но к сожалению имеет ручной подход.
Возможно, сработала бы идея, если указывать какой именно текст удалять, т.е. поле для текста, пользователь вводить туда текст, и если определенный текст совпал с полем, тогда удаляем. А этом случае надо ещё добавить детекции текста на мульти языки.
Привет. На GPU увеличивается скорость в 10 раз. Новые модели, я не добавляю так, как появилось клонирование голоса. Можно теперь русского мужчину склонировать на английскую речь, а английскую женщину на китайскую, поэтому потребность в обычном TTS пропала. Про планируемые улучшения клонирования речи писал в блоге телеграмм.
Про инструкцию: завел бота на канале, если упомянуть слово Wunjo, он будет отвечать по документации из GitHub wiki и различных видео про Wunjo. Про инструкцию можно его спросить, чтобы не искать информацию))
Привет. Все модели используются локально. Автоматически скачиваются при запуске, потом можно отключить связь с интернетом. Модели и приложение можно носить с собой хоть на флешке.
Никаких сторонних сервисов, внутри не используется, кроме Google Translate бесплатного, чтобы переводить интерфейс на разные языки.
Ссылки на модели есть в моём HuggingFace и GitHub. Часть моделей обучил самостоятельно, часть из open source проектов. Все проекты компоненты, которые модифицированы в Wunjo, в README. На Хабр я обычно пишу, про обновление своих приложений и эксперименты, про то, как работают нейронные сети в моих приложениях или с какими приходилось работать в блоге TenChat.
Нет. Это не так, разберитесь в вопросе сначало.
Первое, где написано, что это обязательно?
Второе, где именно вы нашли, что есть проблемы с работой, кроме как придумали их сами?)
Приложение сделано так, чтобы устанавливаться в один клик. Вам не обязательно устанавливать себе CUDA (про CuDNN вы уже сами придумали). Есть портативная версия, которая не требует установки, и установщик Wunjo AI. Если не установить CUDA, приложение будет работать только на CPU, т.е. будет работать и выдавать результаты без CUDA.
Для ускорения в 10 раз потребуется GPU, в Windows установка CUDA делается одним кликом из установщика и занимает 20 минут. Про Linux мы не говорим, там есть ручные действия для установки CUDA. Все проблемы с которыми сталкивались пользователи при установке уже решены. По этой причине установка CUDA не обязательно, и приложение заведется даже на слабом железе.
Тем не менее, всегда можно написать, по возникающим проблемам.
Вам надо понимать, что если вы хотите использовать нейронные сети в любом проекте на графическом процессоре, вас необходимо ставить CUDA, иначе вы не сможете использовать torch и onnx на нём.
Привет. Что значит тонко настроенная среда? Создаётся venv для проекта отдельно, если собираетесь запускать из кода. Звучит как будто используете глобальный python, не понятно зачем))
Есть установщик, созданный briefcase, он внутри себя содержит свой python, который никак не коррелирует с вашими настройками. Как вы их связывание и зачем для меня истинная загадка
Когда вы создание venv, вы ставите зависимости не на глобальный python, а именно в venv. Не используйте глобальный python для проектов.
Смотрел в первых сезонах. А в какой там серии про голограммы или бессмертного клона в музее было?
Ещё и работать заставят: в фильмах сниматься, озвучивать, лекции в универе читать, итд. Потом студенты будут говорить, что у них Альберт Эйнштейн экзамен по физике принимал))
Даже интересно, можно будет в музеях увидеть голограммы реальных людей, а кино сделать в виде театра. Можно столько всего придумать))
Да, конечно все изменится. Здесь больше интересно когда. Потому что всплеск генеративных сетей и их доступность в этом году был мощный. Развивали то, это все несколько лет, а информационный бум прошел совсем недавно. Возможно вся эта автоматизация будет быстрее, чем мы ожидаем
Было интересная идея в одном из сериалов, что сначало все компания перешли на производство игр нейронными сетями, но через время это приелось, так как результат однотипный, и в итоге подключили людей проводами к нейронным сетям, чтобы люди давали им идеи что и как генерировать.
Вот кстати да. Есть видео, которые я недавно делал нейронными сетями, оно выйдет только в январе на YouTube, качество выше, чем здесь (здесь мое первое видео, с каждым видео удается поднять качество), но там никак не получилось сделать, чтобы выглядело как будто текст набирается, в итоге получились танцующие буквы на экране ноутбука.
Так, что можно ответить, в симс сити играет))
В своё время))
И ещё ролик с музыкой в стиле Neural Heavy Metal. Добавил туда две песни про Хабр.
Привет. Просто даётся тема для ChatGPT, например для песни о Хабре: write a song about habr portal where people can find news about IT and is wonderful community. song has to be in heavy metal style. one verse, one chorus. С русским языком не пробовал и не делал, просто потому что когда знаешь о чем поется не так круто, когда не знаешь))
Например в видео, которое будет в стиле Heavy Metal вы часто услышите слова electric guitar, code, programming, battle, road, night. И если слушать песни на родном языке, где одни и те же слова часто встречаются мне кажется устанешь.
Со временем треков будет больше. В ближайшее время сделаю выпуск на Ютюбе музыки которой есть по Neural Metal со словами