Как стать автором
Обновить
0
@vipassaread⁠-⁠only

Пользователь

Отправить сообщение

Съемка видеоинструкции: от идеи к реализации

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров1.8K

Технические писатели создают текстовые документы, но что если для процесса одного текста мало? Тогда приходится учиться монтировать и делать видеоинструкции.

В этой статье я рассказала, как и зачем в Компании «Актив» мы делаем видеоинструкции на примере одного важного кейса: здесь про цели, сценарий, запись звука и программы для монтажа.

Должно быть интересно!

Читать
Всего голосов 13: ↑12 и ↓1+11
Комментарии1

Kandinsky Video — первая российская модель генерации видео по тексту

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров11K

Если несколько предметов, постоянно меняющих форму и положение, будут последовательно возникать перед глазами через очень короткие промежутки времени и на маленьком расстоянии друг от друга, то изображения, которые они вызывают на сетчатке, сольются, не смешиваясь, и человеку покажется, что он видел предмет, постоянно меняющий форму и положение.

Жозеф Плато, август 1833 года

В недавней статье мы рассказали о возможности создания анимированных видеороликов на основе комбинации синтеза изображений и различных способов преобразования этих изображений (сдвиги в стороны, масштабирование и т. д.). Сегодня же речь пойдёт про нашу новую технологию синтеза полноценного видео по текстовому описанию, которую мы назвали Kandinsky Video (для затравки пара примеров приведена на рисунке 1).

Читать далее
Всего голосов 38: ↑37 и ↓1+36
Комментарии11

Kandinsky 3.0 — новая модель генерации изображений по тексту

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров41K

В прошлом году на АI Journey мы представили модель Kandinsky 2.0 — первую диффузионную мультиязычную модель генерации изображений по тексту, которая может генерировать изображения на основе русскоязычного текста. За ней последовали новые версии — Kandinsky 2.1 и Kandinsky 2.2, которые значительно отличались по качеству и своим возможностям от версии 2.0, и стали для нашей команды серьёзными вехами на пути к достижению лучшего качества генерации.

Спустя год после релиза нашей первой диффузионной модели мы представляем новую версию модели генерации изображений по тексту — Kandinsky 3.0! Это результат длительной работы нашей команды, которую мы вели параллельно с разработками версий Kandinsky 2.1 и 2.2. Мы провели много экспериментов по выбору архитектуры и проделали большую работу с данными, чтобы сделать понимание текста и качество генераций лучше, а саму архитектуру — проще и лаконичнее. Также мы сделали нашу модель более «отечественной»: теперь она значительно лучше ориентируется в российском и советском культурном поле.

В этой статье я кратко опишу ключевые моменты новой архитектуры, стратегию работы с данными и, конечно, продемонстрирую возможности нашей модели на примере генераций.

Читать далее
Всего голосов 62: ↑60 и ↓2+58
Комментарии66

Теория игр за 15 минут

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров53K

Многие из вас, я уверен, слышали о теории игр в какой-то момент своей жизни. Если вы хотите выглядеть умным и произвести впечатление на свою девушку — просто упомяните «игру с нулевой суммой» или «эволюционную стратегию», и ваши шансы отвести её домой сегодня вечером только что подскочили на 50%. Или вы можете использовать теорию игр, чтобы принимать решения в инвестировании своих денег (чтобы их полностью потерять и разориться) или, например решая, на какой девушке жениться (что также очень вероятно вас разорит). Как видите, это очень полезная теория.

Чтобы казаться умным - достаточно выучить эти пару выражений, но чтобы на самом деле что-то понимать - придется разобраться. Оказывается, это не так уж сложно и довольно интересно. Давайте посмотрим.

Читать далее
Всего голосов 109: ↑106 и ↓3+103
Комментарии27

Часть 3. Представление вероятности безотказной работы системы в виде ряда Тейлора

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.7K

В технологии логико‑вероятностного моделирования для оценки важности отказов элементов сложных технических систем (СТС) применяются показатели одно, двукратной и к‑кратной значимости. В данной статье представлена вероятность безотказной работы системы в виде ряда Тейлора на основе к‑кратных совместных значимостей.

Представление функции вероятности безотказной работы системы в виде ряда Тейлора является эффективным средством для проведения углубленных исследований надежности, безопасности и живучести сложных технических систем. Функция ВБРС представлена на основе к‑кратных совместных значи‑ мостей, учитывающих влияние ряда отказов элементов на систему в целом. На основе представления ВБРС в виде ряда Тейлора выведен ряд показателей важности («весовых коэффициентов»).

Кроме этого, еще в 1981 году И.А. Рябинин обозначил широкий класс объектов моделирования под названием структурно‑сложных систем, не ограничиваясь сложными техническими системами. Технология логико‑вероятностного моделирования применима для исследования разнообразных объектов, имеющих сложную структуру и организацию. При этом вероятность может быть не только безотказной работы, но и риска возникновения опасного состояния, а также иных показателей: степени принадлежности или предпочтений, например при оценки рисков реализации проектов, кредитования и тому подобное.

In the technology of logic‑probabilistic modeling, to assess the importance of element failures of complex technical systems (CTS), indicators of one, two‑fold and k‑fold significance are used. This article presents the probability of the system's failure‑free operation in the form of a Taylor series based on k‑fold joint significances.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Регулирование ИИ (AI)

Уровень сложностиПростой
Время на прочтение23 мин
Количество просмотров1.6K

Активное развитие искусственного интеллекта (ИИ, AI) приводит к тому, что общество и государства становятся обеспокоенными и думают о том, как его обезопасить. А значит, ИИ будет регулироваться. Но давайте разберемся в этом вопросе детальнее, что происходит сейчас и чего ожидать в будущем.

Читать далее
Всего голосов 6: ↑1 и ↓5-4
Комментарии0

Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

Время на прочтение12 мин
Количество просмотров13K

Обнаружение движущихся объектов широко используется в самых разных приложениях, от видеонаблюдения до мониторинга дорожного движения. Это важнейшая задача в постоянно развивающейся области компьютерного зрения. Библиотека OpenCV с открытым исходным кодом, известная своим полным набором инструментов для компьютерного зрения, предоставляет надежные решения для обнаружения движущихся объектов. В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

Читать далее
Всего голосов 14: ↑13 и ↓1+12
Комментарии8

Что выбрать – самостоятельное обучение, онлайн-курсы или личного ментора?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.7K

Главная проблема тех, кто только хочет начать карьеру в IT — это то, что они не знают с чего начать. Естественно, ниша не будет пустовать, и владельцы курсов предоставили желающим любую IT‑специальность на выбор. За всей этой кричащей рекламой курсов просто не видно других вариантов. По этой причине, люди чаще всего идут по пути обучения в онлайн‑школе. Но другие варианты есть, и мы их рассмотрим в этой статье. После прочтения вы сможете сделать осознанный выбор, отталкиваясь от своих целей и возможностей.

Читать далее
Всего голосов 10: ↑7 и ↓3+4
Комментарии23

Добавляем зрение, слух и голос в свой ChatGPT бот в Telegram

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров16K

Поддержка преобразования речи в текст была в OpenAI API уже давно, а вот из текста в речь, а также распознавание изображений было добавлено совсем недавно. В связи с чем продолжаю свою серию туториалов по разработке собственного ChatGPT бота в Telegram.

Читать далее
Всего голосов 16: ↑15 и ↓1+14
Комментарии9

Как привлечь внимание аудитории: 10 шагов к созданию вирусного контента

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Это Бренды на коне. Контент, который продвигает себя сам — мечта любого маркетолога. А ведь это вполне реально. Такого эффекта можно добиться благодаря так называемому «вирусному» контенту. Это такой контент, который разлетается по сети с бешеной скоростью благодаря тому, что пользователи сами хотят им делиться с другими. Иногда это случается неожиданно для самих создателей. А иногда, такой контент является творением грамотных пиарщиков. Предлагаем не ждать воли случая, а брать дело в свои руки. В данной статье мы собрали для тебя несколько советов для освоения этого бомбического инструмента.

Читать далее
Всего голосов 12: ↑4 и ↓8-4
Комментарии0

Фотограмметрия для создания датасета систем распознавания лиц

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.1K

Качество и объем датасетов играют решающее значение для обучения нейросетей. Разметка данных для датасетов это очень трудоемкая работа, для которой необходим ручной труд тысяч человек. Когда пользоватьель вводит капчу типа «укажите светофоры» на сайтах, он помогает ИТ‑компаниям размечать данные для датасетов. 20 лет назад считалось, что роботы не могут играть в шахматы, писать симфонии и рассказы. Сегодня в 2024 оказалось, что роботы могут писать симфонии, но не могут указать на каких картинках изображены светофоры. Поэтому для разметки датасетов используется люди. Для определения наличия на картинке светофора или пожарного гидранта используется низкоквалифицированная рабочая сила. Для определения признаков заболевания на рентгеновском снимке используются высококвалифицированные врачи. В любом случае используются люди. Поэтому данные для обучения нейросетей получаются очень дорогими. Есть даже поговорка: «Данные‑это новая нефть». Я бы уточнил, что «Размеченные данные‑это новая нефть».

Под катом будет описана методика добычи (или, как говорят нефтянники, дОбычи) относительно недорогих, но объемных датасетов для систем распознавания лиц.

Читать далее
Рейтинг0
Комментарии28

Boximator: ИИ-модуль от ByteDance Research как новая веха в области генерации видео

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.3K

Одной из главных целей в генерации видео с помощью искусственного интеллекта является создание полностью управляемого, а также достоверного движения объектов. С помощью изменения сцен и улучшения качества по заданным критериям на основе предпочтений пользователя генерация контента выходит на совершенно новый уровень. К нему сделала шаг команда ByteDance Research, представив Boximator (box + animator) – новый инструмент для работы с видео на основе ИИ. ByteDance – родитель небезызвестного Tik-Tok, а из этого следует, что в скором времени там следует ожидать больше искусственно генерируемого контента. По-настоящему танцующих девушек или реального липсинка, судя по всему, станет значительно меньше :)

В этой статье вы познакомитесь с новой разработкой, узнаете о её новаторстве, архитектуре и функциях, а также о её преимуществах перед конкурентами.

Приятного прочтения!

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Виртуальные туры в недвижимости: 6 шагов внедрения

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров943

Виртуальные туры трансформируют сферу недвижимости, предоставляя агентствам и владельцам мощный инструмент для демонстрации объектов. Эта технология позволяет заинтересованным сторонам исследовать недвижимость из любой точки мира, добавляя новые измерения в процесс покупки и аренды. Внедрение виртуальных туров в продажные стратегии радикально меняет способ взаимодействия с клиентами, усиливая интерес и создавая более глубокие связи с потенциальными покупателями и арендаторами.

Узнайте, как разработать виртуальный тур!
Всего голосов 7: ↑4 и ↓3+1
Комментарии7

Использование теории игр для повышения прозрачности моделей машинного обучения

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.3K

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии5

Высокоточное измерение ЭКГ. Часть 2

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.3K

В данной статье изложу свою концепцию регистрации и обработки сигналов ЭКГ в носимых устройств для  решения задач обнаружения  опасных состояний сердечно-сосудистой системы человека.

  Далее рассмотрю кратко реальную точность измерения ЭКГ и свой вариант ее повышения, а также расскажу свой вариант накопления и передачи для обработки больших объемов данных в суточных (по Холтеру) регистраторах.

Читать далее
Всего голосов 22: ↑21 и ↓1+20
Комментарии5

Учим большие языковые модели описывать продукты данных

Уровень сложностиСложный
Время на прочтение13 мин
Количество просмотров3.6K

Привет, Хабр! В этой статье мы рассмотрим использование больших языковых моделей на этапе подготовки описания продуктов данных для дальнейшего использования в аналитике. Это может улучшить автоматизацию процесса, предоставляя инструмент для создания описаний продуктов.

Читать далее
Всего голосов 17: ↑15 и ↓2+13
Комментарии0

Эпоха цифровых двойников: как виртуальные модели выводят промышленность на новый уровень

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.1K

Мы обратили внимание, что за последние два года новости о цифровых двойниках стали выходить чаще. Причина понятна: в 2022-ом случился прорыв в изучении и внедрении искусственного интеллекта (ChatGPT и Midjourney), который сильно «взбодрил» сферу. Технологии применяют, чтобы предсказать приток посетителей в гостинице, удаленно отремонтировать автомобиль или выяснить, что будет с небоскребом под внешними агрессивными факторами. Рассмотрим подробнее, как виртуальное моделирование помогает оптимизировать все производственные процессы и не только.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии2

Как мы научили YandexGPT пересказывать видео

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров14K

Порой бывает сложно перематывать длинный ролик в надежде найти хоть что-то интересное или тот самый момент из Shorts. Или иногда хочется за ночь узнать, о чём шла речь на паре научных конференций. Для этого в Браузере есть волшебная кнопка — «Пересказать», которая экономит время и помогает лучше понять, стоит ли смотреть видео, есть ли в нём полезная информация, и сразу перейти к интересующей части.

Сегодня я расскажу про модель, которая быстро перескажет видео любой длины и покажет таймкоды для каждой части. Под катом — история о том, как мы смогли выйти за лимиты контекста модели и научить её пересказывать даже очень длинные видео.

Читать далее
Всего голосов 63: ↑63 и ↓0+63
Комментарии63

Мозг промышленного масштаба или как воплотить мечту в реальность?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.9K

В предыдущей статье мы рассмотрели различные типы нейросетей и обсудили, какие задачи можно решать с их помощью. Теперь рассмотрим задачу искусственного интеллекта с организационной и технической точки зрения.

При работе над сложными проектами обычно вовлечена команда разработчиков и специалистов по обработке данных, у которых сразу возникают вопросы: как управлять проектом, совместно разрабатывать модель машинного обучения (Machine Learning model), проводить ее тестирование, каким образом синхронизировать код и результаты экспериментов? После разработки и оптимизации ML-модели возникает необходимость ее развертывания в промышленной среде. Все эти проблемы могут казаться менее увлекательными, чем решение самой задачи машинного обучения, но они имеют критическое значение для успешной реализации ML-проектов. 

В этой статье мы подробно рассмотрим жизненный цикл ML-сервиса от идеи до разработки и внедрения, а также инструменты и принципы, используемые на каждом этапе. 

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Как мы оцифровывали каждый шаг производства, чтобы завод точно знал, что, как и когда делать

Время на прочтение6 мин
Количество просмотров8.8K
image
Подручный сталевара берёт пробу химсостава металла на установке печь-ковш

Привет с Новолипецкого металлургического комбината! В крупном проекте самое ценное — данные. В нашем случае — технологические карты производства и параметры всех изделий и агрегатов: как и что мы делаем, на чём, как долго, и какие параметры каким образом влияют на результат.

Производство — живая система: возникают новые процессы, изменяются существующие, перестраиваются агрегаты, меняется код. Мы построили процесс так, что, когда что-то начинает производиться, все актуальные данные уже есть в системе. Код и данные не отстают, не опережают, а идут рука об руку.

У нас есть два гипермозга:
  1. Календарное планирование играет в оптимизацию на стороне клиентов. Оно знает, что нужно производить и когда, чтобы отгрузить заказы максимально оперативно и вовремя.
  2. Графикователи же пытаются из этих условий собрать оптимальную загрузку оборудования и, возможно, произвести ещё что-то, что можно присоединить к имеющимся сериям. Они отвечают за максимальную эффективность производства в коротком горизонте.

Обе системы используют огромный модуль маршрутизации технологических процессов. Там хранятся все возможные маршруты всей продукции, технология производства по агрегатам — в общем, путь со всеми переделами, который проделывает металл от входа в сталеплавильное производство до попадания в вагон, который поедет к заказчику. Для этого модуля нам пришлось собрать все данные о производстве, привести их к единому виду, установить общие протоколы обмена данными и договориться со всеми-всеми, что они будут вводить, хранить и использовать данные именно так, как в них указано.

Оцифровка завода из бумажного вида заняла год. Пришлось многое переформатировать, чтобы оно уложилось в понятную логику таблиц и данных. Это было основным и очень трудным челленджем, который вырос в непрерывный процесс и продолжается до сих пор.
Читать дальше →
Всего голосов 42: ↑41 и ↓1+40
Комментарии14
1
23 ...

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность