Articles / Profile of Nikuson / Habr

Амелин Никита@Nikuson

Machine Learning. Пишите в телеграмм

ProfileArticles15PostsNewsComments20

Nikuson May 14 2025 at 10:05

Создаем интерактивную симуляцию лесного пожара на Python с использованием клеточных автоматов

Medium

13 min

3.4K

Python * Mathematics * Virtualization *

Tutorial

Лесные пожары – явление столь же древнее, сколь и сама жизнь на суше. Величественные и одновременно ужасающие, они способны за считанные часы превратить гектары зеленого массива в выжженную пустыню, неся угрозу экосистемам, человеческим поселениям и климату планеты. Ежегодно новости пестрят сообщениями о новых очагах возгорания, о борьбе стихии и человека. Но что если мы попытаемся заглянуть в самое сердце этого хаотичного, на первый взгляд, процесса? Что если мы сможем не просто наблюдать, а моделировать, предсказывать и даже экспериментировать с распространением огня, не выходя из-за своего компьютера?

+12

Nikuson May 13 2025 at 09:16

Гравитация: Пишем симулятор на Python

Easy

12 min

14K

Interfaces * Data visualization * Python * Physics

Tutorial

Привет, Хабр! Сегодня мы отправимся в увлекательное путешествие по просторам Вселенной, не вставая из-за компьютера. Задумывались ли вы, как планеты удерживаются на своих орбитах, почему галактики не разлетаются в разные стороны, и что заставляет яблоки падать на землю (да-да, снова этот старина Ньютон)? Ответ один – гравитация! Эта невидимая, но всемогущая сила правит бал во Вселенной, от мельчайших пылинок до гигантских скоплений галактик. Мы разберёмся, как из простых законов рождаются сложные и красивые взаимодействия, напишем код, который оживит наши виртуальные миры, и, возможно, даже почувствуем себя немного демиургами, управляющими судьбами звёзд.

+15

Nikuson Mar 19 2025 at 07:41

Мультимодальные языковые модели: как нейросети учатся видеть и слышать

Hard

6 min

8.2K

Artificial IntelligenceImage processing * Python * Mathematics *

Мультимодальные языковые модели представляют собой самый прогрессивный класс нейросетевых архитектур, объединяющих способность воспринимать и обрабатывать различные типы данных одновременно - текст, изображения, аудио и видео. Это похоже на то, как наш мозг интегрирует информацию из разных органов чувств, чтобы создать полную картину мира. Как сказал философ Марсель Пруст, “Настоящее открытие не в том, чтобы увидеть новые земли, а в том, чтобы иметь новые глаза”.

Nikuson Mar 18 2024 at 08:01

Симуляция миров: как работает нейросеть SORA

Medium

4 min

17K

Timeweb Cloud corporate blogMachine learning * Artificial Intelligence

Review

Видеоконтент стал неотъемлемой частью нашей жизни. ТикТок, Ютуб и прочие платформы с каждым днём всё больше используются людьми как способ отвлечься от повседневности и позволяют ненадолго предаться прокрастинации. Кто бы что ни говорил, но в 2024 году человек не представляет без него жизни, но создание качественного контента это довольно трудоемкая задача. В ней нам может помочь новая нейросеть OpenAI “SORA”.

В этой статье мы рассмотрим, как работает новая революционная нейросеть синтеза видео SORA, пофилософствуем на эту тему и, конечно, помечтаем о AGI.

Читать дальше →

+23

Nikuson Apr 12 2023 at 13:00

Почему открытое письмо против ИИ — не лучшая идея

Easy

6 min

5.8K

RUVDS.com corporate blogMachine learning * Artificial IntelligenceLegislation in ITThe future is here

Opinion

В конце марта на сайте Future of Life появилось письмо, которое вызвало широкий общественный резонанс и дискуссии в СМИ. В письме авторы выражают свою обеспокоенность тем, что технологии искусственного интеллекта, особенно нейросети, могут быть использованы для создания вредоносного или обманного контента и влиять на общественное мнение. Они призывают к более ответственному и безопасному подходу к развитию и применению таких технологий.

Письмо подписали более 2600 независимых исследователей, а также Илон Маск — глава Tesla, SpaceX и Twitter, Эван Шарп — сооснователь Pinterest и Стив Возняк — сооснователь всеми известной компании Apple. Они хотят обратить внимание на то, что нейросети, которые в наше время очень много значат и многим людям облегчают жизнь, также могут иметь негативные последствия, если не контролировать их разработку и использование. Так ли это?

Читать дальше →

+23

Nikuson Apr 9 2023 at 16:26

Лучшая нейросеть в генерации видео GEN-1: хардкорный архитектурный обзор

Hard

4 min

28K

Artificial IntelligenceMachine learning *

Видео - это один из самых популярных и влиятельных видов медиа в современном мире. Однако создание качественного и интересного видео требует много времени, ресурсов и навыков. Как было бы здорово, если бы можно было просто написать или нарисовать, что вы хотите видеть на экране, и получить готовое видео без лишних усилий? Это именно то, что обещает Gen-1 - новая технология для генерации видео с помощью слов и изображений от компании RunwayML. В этой статье вы узнаете что такое Gen-1, как она работает и как её использовать для создания потрясающих видео на любую тему.

Nikuson Apr 8 2023 at 21:09

Infinityformer: новый подход к обработке длинных последовательностей большими языковыми моделями

Hard

4 min

2.6K

Machine learning * Artificial Intelligence

Трансформеры - это отличные нейросети для работы с текстом, речью, изображениями и другими типами данных, но они сталкиваются с проблемой ограниченной длины контекста, к которому они могут обращаться. Чем длиннее последовательность, тем больше вычислений требуется для того, чтобы трансформер мог учитывать все элементы. Это приводит к тому, что трансформеры не могут эффективно моделировать долгосрочные зависимости и запоминать важную информацию из прошлого. Infinityformer решает эту проблему, используя непрерывный механизм внимания, который позволяет обращаться к прошлому контексту как к непрерывному сигналу, а не как к дискретной последовательности.

В этой статье я максимально хардкорно расскажу о том, как работает Infinityformer.

+12

Nikuson Feb 28 2023 at 13:00

Как работает ControlNet. Контролируемая генерация изображений

Hard

5 min

51K

RUVDS.com corporate blogMachine learning * Artificial Intelligence

Нейронные сети прошли долгий путь от генерации странных ЧБ-изображений до фантастических фотореалистичных сцен, которые не поддаются воображению. С помощью всего лишь короткой текстовой подсказки диффузионные нейросети могут создавать потрясающие изображения, неотличимые от обычных. Однако, какими бы впечатляющими ни были эти модели, в них отсутствует важнейший элемент — пользовательский контроль. Представьте, что вы можете указать точную форму, положение и позу объекта на изображении, которое вы хотите создать. Что ж, теперь это возможно благодаря новаторской технологии под названием ControlNet!

Читать дальше →

+59

Nikuson Feb 14 2023 at 09:00

Нейросети в генерации видео: Imagen video и Phenaki

Medium

5 min

30K

RUVDS.com corporate blogArtificial IntelligenceMachine learning *

Мы видели уже большое количество генеративных нейросетей способных превращать текстовые запросы в изображение, но почему все забыли про видео? Разве никто не хочет примерить на себе кресло режиссёра без съёмочной группы и выхода за пределы комнаты с любимым компьютером? Google начал делать первые шаги в этой области, и сейчас мы рассмотрим их нейросети: Imagen video и Phenaki. Приготовьтесь к приключению в глубины машинного обучения, где искусственный интеллект превращает написанное слово в завораживающее зрелище.

Читать дальше →

+53

Nikuson Feb 7 2023 at 13:00

Какой метод генерации аудио лучший? Сравнение GAN, VAE и Diffusion

Hard

6 min

7.2K

RUVDS.com corporate blogPython * SoundMachine learning *

В прошлой статье я затронул тему генерации звука с помощью диффузионной модели. Но какие методы существуют вообще и какой из них сейчас наиболее перспективен? Сегодня мы рассмотрим долгий путь этого направления в машинном обучении. Послушаем результаты, посмотрим метрики и просто взглянем на новые технологии, применяемые в совершенно разных нейросетях для аудиосинтеза.

Читать дальше →

+43

Nikuson Dec 28 2022 at 13:00

Генерация аудио диффузионной нейросетью. Стоит ли использовать обычную диффузию для генерации мел-спектрограмм?

14 min

6.1K

RUVDS.com corporate blogMachine learning * Artificial Intelligence

В уходящем году вы могли видеть множество нейросетей для генерации изображений. Скорее всего, даже ваша бабушка слышала про Stable Diffusion или DALL-E, но эти нейросети объединяет одна очень важная деталь — они основаны на методе обратной диффузии. Этот подход к генерации стал самым популярным в 2022 году. Почему бы не попробовать применить его не для генерации картинок, а для музыки или пения птиц?

В этой статье я расскажу о том, как генерировать аудио с помощью классической диффузионной нейросети, и нюансах этого подхода.

Читать дальше →

+34

Nikuson Dec 21 2022 at 13:00

Как нейросеть MinD-Vis преобразует активность мозга в изображение

7 min

7.6K

RUVDS.com corporate blogArtificial IntelligenceMachine learning * Brain

Расшифровка визуальной информации из активности мозга — это способ узнать больше о том, как работает зрительная система человека, и как заложить основу для создания системы, в которой люди и компьютеры могут общаться друг с другом с помощью сигналов мозга. Однако создать чёткие и точные изображения из записей мозга может быть сложно, потому что сигналы мозга сложны и часто не хватает данных для должного обучения.

В этой статье мы разберём работу MinD-Vis, опубликованную Стэндфордским, Гонконгским и Сингапурским университетами в Ноябре этого года.

Читать дальше →

+30

Nikuson Oct 12 2022 at 09:00

Диффузионные Нейросети — самый актуальный подход к генерации изображений

6 min

34K

RUVDS.com corporate blogMachine learning * Artificial Intelligence

Метод обратной диффузии поистине является самым нашумевшим в этом году методом генерации изображений нейросетями. Его используют: DALLE 2, Midjourney, imagen и другие актуальные модели 2022 года.

В данной статье мы подробно изучим, что под капотом самых современных генеративных моделей и даже напишем небольшую свою.

Под катом будет много кода, программирования, математики, в общем — всё, как вы любите.

Читать дальше →

+40

Nikuson Sep 13 2022 at 13:00

Как работает DALL-E

Medium

9 min

25K

RUVDS.com corporate blogArtificial IntelligenceMachine learning *

Technotext 2022

В Январе 2021 года Open AI показали DALL-E, генерирующую любые изображения по текстовому описанию, на хабре уже успели разобрать тему генерации изображений нейросетями, но мне захотелось разобраться в теме более детально и показать всё в коде.

Сейчас мы разберём, как работает Text2Image нейросеть DALL-E, посмотрим на хардкор математики, а также убедимся, что это сможет повторить каждый, написав реализацию DALL-E почти с нуля.

Читать дальше →

+35

Nikuson Dec 5 2021 at 21:59

Физика в Python с использованием Pymunk

6 min

40K

Python *

From sandbox

Физика. Кто-то её любит, кто-то нет, но определённо это неотъемлемая часть нашего существования. В этой статье мы рассмотрим как самому создавать физические симуляции используя всего 2 библиотеки Python.
К концу статьи мы сделаем интерактивную симуляцию взаимодействия тел и поймём основы использования библиотеки Pymunk.

В этом туториале вы сможете создать симуляцию тел как на гифке сверху!

+38

Создаем интерактивную симуляцию лесного пожара на Python с использованием клеточных автоматов

Гравитация: Пишем симулятор на Python

Мультимодальные языковые модели: как нейросети учатся видеть и слышать

Симуляция миров: как работает нейросеть SORA

Почему открытое письмо против ИИ — не лучшая идея

Лучшая нейросеть в генерации видео GEN-1: хардкорный архитектурный обзор

Infinityformer: новый подход к обработке длинных последовательностей большими языковыми моделями

Как работает ControlNet. Контролируемая генерация изображений

Нейросети в генерации видео: Imagen video и Phenaki

Какой метод генерации аудио лучший? Сравнение GAN, VAE и Diffusion

Генерация аудио диффузионной нейросетью. Стоит ли использовать обычную диффузию для генерации мел-спектрограмм?

Как нейросеть MinD-Vis преобразует активность мозга в изображение

Диффузионные Нейросети — самый актуальный подход к генерации изображений

Как работает DALL-E

Физика в Python с использованием Pymunk

Information

Specialization