Статьи / Закладки / Профиль vipassa / Хабр

@vipassa^{read⁠-⁠only}

Пользователь

Профиль Комментарии 94Закладки 522

Czernucka 21 дек 2023 в 09:00

Съемка видеоинструкции: от идеи к реализации

Простой

12 мин

1.8K

Работа с видео*Блог компании «Актив»Контент и копирайтинг*Подготовка технической документации*

Кейс

✏️ Технотекст 2023

Технические писатели создают текстовые документы, но что если для процесса одного текста мало? Тогда приходится учиться монтировать и делать видеоинструкции.

В этой статье я рассказала, как и зачем в Компании «Актив» мы делаем видеоинструкции на примере одного важного кейса: здесь про цели, сценарий, запись звука и программы для монтажа.

Должно быть интересно!

Читать

+11

kuznetsoff87 22 ноя 2023 в 09:00

Kandinsky Video — первая российская модель генерации видео по тексту

Сложный

8 мин

11K

Блог компании СберОбработка изображений*Машинное обучение*Natural Language Processing*Блог компании SberDevices

Обзор

Если несколько предметов, постоянно меняющих форму и положение, будут последовательно возникать перед глазами через очень короткие промежутки времени и на маленьком расстоянии друг от друга, то изображения, которые они вызывают на сетчатке, сольются, не смешиваясь, и человеку покажется, что он видел предмет, постоянно меняющий форму и положение.

Жозеф Плато, август 1833 года

В недавней статье мы рассказали о возможности создания анимированных видеороликов на основе комбинации синтеза изображений и различных способов преобразования этих изображений (сдвиги в стороны, масштабирование и т. д.). Сегодня же речь пойдёт про нашу новую технологию синтеза полноценного видео по текстовому описанию, которую мы назвали Kandinsky Video (для затравки пара примеров приведена на рисунке 1).

+36

ddimitrov 22 ноя 2023 в 08:54

Kandinsky 3.0 — новая модель генерации изображений по тексту

Средний

10 мин

41K

Блог компании СберОбработка изображений*Машинное обучение*Natural Language Processing*Блог компании SberDevices

Обзор

В прошлом году на АI Journey мы представили модель Kandinsky 2.0 — первую диффузионную мультиязычную модель генерации изображений по тексту, которая может генерировать изображения на основе русскоязычного текста. За ней последовали новые версии — Kandinsky 2.1 и Kandinsky 2.2, которые значительно отличались по качеству и своим возможностям от версии 2.0, и стали для нашей команды серьёзными вехами на пути к достижению лучшего качества генерации.

Спустя год после релиза нашей первой диффузионной модели мы представляем новую версию модели генерации изображений по тексту — Kandinsky 3.0! Это результат длительной работы нашей команды, которую мы вели параллельно с разработками версий Kandinsky 2.1 и 2.2. Мы провели много экспериментов по выбору архитектуры и проделали большую работу с данными, чтобы сделать понимание текста и качество генераций лучше, а саму архитектуру — проще и лаконичнее. Также мы сделали нашу модель более «отечественной»: теперь она значительно лучше ориентируется в российском и советском культурном поле.

В этой статье я кратко опишу ключевые моменты новой архитектуры, стратегию работы с данными и, конечно, продемонстрирую возможности нашей модели на примере генераций.

+58

Squirrelfm 22 янв в 05:30

Теория игр за 15 минут

Простой

15 мин

53K

Математика*Научно-популярноеЛогические игрыБлог компании Raft

Туториал

Многие из вас, я уверен, слышали о теории игр в какой-то момент своей жизни. Если вы хотите выглядеть умным и произвести впечатление на свою девушку — просто упомяните «игру с нулевой суммой» или «эволюционную стратегию», и ваши шансы отвести её домой сегодня вечером только что подскочили на 50%. Или вы можете использовать теорию игр, чтобы принимать решения в инвестировании своих денег (чтобы их полностью потерять и разориться) или, например решая, на какой девушке жениться (что также очень вероятно вас разорит). Как видите, это очень полезная теория.

Чтобы казаться умным - достаточно выучить эти пару выражений, но чтобы на самом деле что-то понимать - придется разобраться. Оказывается, это не так уж сложно и довольно интересно. Давайте посмотрим.

+103

vmorozov57 26 янв в 09:46

Часть 3. Представление вероятности безотказной работы системы в виде ряда Тейлора

Средний

7 мин

1.7K

Анализ и проектирование систем*Алгоритмы*Математика*Бизнес-модели*Инженерные системы*

В технологии логико‑вероятностного моделирования для оценки важности отказов элементов сложных технических систем (СТС) применяются показатели одно, двукратной и к‑кратной значимости. В данной статье представлена вероятность безотказной работы системы в виде ряда Тейлора на основе к‑кратных совместных значимостей.

Представление функции вероятности безотказной работы системы в виде ряда Тейлора является эффективным средством для проведения углубленных исследований надежности, безопасности и живучести сложных технических систем. Функция ВБРС представлена на основе к‑кратных совместных значи‑ мостей, учитывающих влияние ряда отказов элементов на систему в целом. На основе представления ВБРС в виде ряда Тейлора выведен ряд показателей важности («весовых коэффициентов»).

Кроме этого, еще в 1981 году И.А. Рябинин обозначил широкий класс объектов моделирования под названием структурно‑сложных систем, не ограничиваясь сложными техническими системами. Технология логико‑вероятностного моделирования применима для исследования разнообразных объектов, имеющих сложную структуру и организацию. При этом вероятность может быть не только безотказной работы, но и риска возникновения опасного состояния, а также иных показателей: степени принадлежности или предпочтений, например при оценки рисков реализации проектов, кредитования и тому подобное.

In the technology of logic‑probabilistic modeling, to assess the importance of element failures of complex technical systems (CTS), indicators of one, two‑fold and k‑fold significance are used. This article presents the probability of the system's failure‑free operation in the form of a Taylor series based on k‑fold joint significances.

Dzhimsher 28 янв в 11:40

Регулирование ИИ (AI)

Простой

23 мин

1.6K

Исследования и прогнозы в IT*Искусственный интеллект

Мнение

Активное развитие искусственного интеллекта (ИИ, AI) приводит к тому, что общество и государства становятся обеспокоенными и думают о том, как его обезопасить. А значит, ИИ будет регулироваться. Но давайте разберемся в этом вопросе детальнее, что происходит сейчас и чего ожидать в будущем.

-4

dimanosov007 15 янв в 09:29

Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

12 мин

13K

Python*Обработка изображений*Машинное обучение*

Туториал

Перевод

Обнаружение движущихся объектов широко используется в самых разных приложениях, от видеонаблюдения до мониторинга дорожного движения. Это важнейшая задача в постоянно развивающейся области компьютерного зрения. Библиотека OpenCV с открытым исходным кодом, известная своим полным набором инструментов для компьютерного зрения, предоставляет надежные решения для обнаружения движущихся объектов. В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

+12

vital_pavlenko 6 дек 2023 в 00:57

Что выбрать – самостоятельное обучение, онлайн-курсы или личного ментора?

Простой

5 мин

5.7K

Я пиарюсь

Мнение

Главная проблема тех, кто только хочет начать карьеру в IT — это то, что они не знают с чего начать. Естественно, ниша не будет пустовать, и владельцы курсов предоставили желающим любую IT‑специальность на выбор. За всей этой кричащей рекламой курсов просто не видно других вариантов. По этой причине, люди чаще всего идут по пути обучения в онлайн‑школе. Но другие варианты есть, и мы их рассмотрим в этой статье. После прочтения вы сможете сделать осознанный выбор, отталкиваясь от своих целей и возможностей.

fettgesicht 11 дек 2023 в 15:12

Добавляем зрение, слух и голос в свой ChatGPT бот в Telegram

Простой

7 мин

16K

Python*Облачные сервисы*Искусственный интеллект

Туториал

Поддержка преобразования речи в текст была в OpenAI API уже давно, а вот из текста в речь, а также распознавание изображений было добавлено совсем недавно. В связи с чем продолжаю свою серию туториалов по разработке собственного ChatGPT бота в Telegram.

+14

BrandHorse 13 дек 2023 в 08:02

Как привлечь внимание аудитории: 10 шагов к созданию вирусного контента

Простой

4 мин

2.8K

Интернет-маркетинг*Контент и копирайтинг*

Это Бренды на коне. Контент, который продвигает себя сам — мечта любого маркетолога. А ведь это вполне реально. Такого эффекта можно добиться благодаря так называемому «вирусному» контенту. Это такой контент, который разлетается по сети с бешеной скоростью благодаря тому, что пользователи сами хотят им делиться с другими. Иногда это случается неожиданно для самих создателей. А иногда, такой контент является творением грамотных пиарщиков. Предлагаем не ждать воли случая, а брать дело в свои руки. В данной статье мы собрали для тебя несколько советов для освоения этого бомбического инструмента.

-4

malyazin_2010 29 янв в 10:04

Фотограмметрия для создания датасета систем распознавания лиц

Простой

6 мин

2.1K

Работа с 3D-графикой*Data Mining*Искусственный интеллект

Качество и объем датасетов играют решающее значение для обучения нейросетей. Разметка данных для датасетов это очень трудоемкая работа, для которой необходим ручной труд тысяч человек. Когда пользоватьель вводит капчу типа «укажите светофоры» на сайтах, он помогает ИТ‑компаниям размечать данные для датасетов. 20 лет назад считалось, что роботы не могут играть в шахматы, писать симфонии и рассказы. Сегодня в 2024 оказалось, что роботы могут писать симфонии, но не могут указать на каких картинках изображены светофоры. Поэтому для разметки датасетов используется люди. Для определения наличия на картинке светофора или пожарного гидранта используется низкоквалифицированная рабочая сила. Для определения признаков заболевания на рентгеновском снимке используются высококвалифицированные врачи. В любом случае используются люди. Поэтому данные для обучения нейросетей получаются очень дорогими. Есть даже поговорка: «Данные‑это новая нефть». Я бы уточнил, что «Размеченные данные‑это новая нефть».

Под катом будет описана методика добычи (или, как говорят нефтянники, дОбычи) относительно недорогих, но объемных датасетов для систем распознавания лиц.

tadzh_nahal 16 фев в 09:30

Boximator: ИИ-модуль от ByteDance Research как новая веха в области генерации видео

Средний

8 мин

1.3K

Работа с видео*Обработка изображений*Машинное обучение*Искусственный интеллектБлог компании BotHub

Обзор

Одной из главных целей в генерации видео с помощью искусственного интеллекта является создание полностью управляемого, а также достоверного движения объектов. С помощью изменения сцен и улучшения качества по заданным критериям на основе предпочтений пользователя генерация контента выходит на совершенно новый уровень. К нему сделала шаг команда ByteDance Research, представив Boximator (box + animator) – новый инструмент для работы с видео на основе ИИ. ByteDance – родитель небезызвестного Tik-Tok, а из этого следует, что в скором времени там следует ожидать больше искусственно генерируемого контента. По-настоящему танцующих девушек или реального липсинка, судя по всему, станет значительно меньше :)

В этой статье вы познакомитесь с новой разработкой, узнаете о её новаторстве, архитектуре и функциях, а также о её преимуществах перед конкурентами.

Приятного прочтения!

KRUTKOOLEG 21 фев в 15:30

Виртуальные туры в недвижимости: 6 шагов внедрения

Простой

5 мин

943

Веб-дизайн*Веб-разработка*Повышение конверсии*Разработка под AR и VR*AR и VR

Туториал

Виртуальные туры трансформируют сферу недвижимости, предоставляя агентствам и владельцам мощный инструмент для демонстрации объектов. Эта технология позволяет заинтересованным сторонам исследовать недвижимость из любой точки мира, добавляя новые измерения в процесс покупки и аренды. Внедрение виртуальных туров в продажные стратегии радикально меняет способ взаимодействия с клиентами, усиливая интерес и создавая более глубокие связи с потенциальными покупателями и арендаторами.

Узнайте, как разработать виртуальный тур!

ArtemEvstafev 24 фев в 16:59

Использование теории игр для повышения прозрачности моделей машинного обучения

Средний

7 мин

4.3K

Математика*Машинное обучение*Искусственный интеллект

Интерпретация современных моделей машинного обучения может быть чрезвычайно сложным делом учитывая, что количество параметров и весовых коэффициентов может идти на тысячи и даже миллионы. Тем не менее это совершенно необходимо, для повышения качества, обеспечения стабильности и предсказуемости работы модели. В этом нам может помочь теория игр, математическая дисциплина позволяющая выделить из сложного взаимодействия факторов модели отдельный вклад каждого в конечное предсказание.

nikolz 6 мар в 04:54

Высокоточное измерение ЭКГ. Часть 2

Простой

5 мин

2.3K

Разработка под Windows*Носимая электроникаЗдоровье

В данной статье изложу свою концепцию регистрации и обработки сигналов ЭКГ в носимых устройств для решения задач обнаружения опасных состояний сердечно-сосудистой системы человека.

Далее рассмотрю кратко реальную точность измерения ЭКГ и свой вариант ее повышения, а также расскажу свой вариант накопления и передачи для обработки больших объемов данных в суточных (по Холтеру) регистраторах.

+20

Sber 27 фев в 06:16

Учим большие языковые модели описывать продукты данных

Сложный

13 мин

3.6K

Блог компании СберМашинное обучение*Natural Language Processing*

Кейс

Привет, Хабр! В этой статье мы рассмотрим использование больших языковых моделей на этапе подготовки описания продуктов данных для дальнейшего использования в аналитике. Это может улучшить автоматизацию процесса, предоставляя инструмент для создания описаний продуктов.

+13

Hanamime 4 мар в 07:15

Эпоха цифровых двойников: как виртуальные модели выводят промышленность на новый уровень

Простой

5 мин

2.1K

Виртуализация*Блог компании СберПромышленное программирование*

Мнение

Мы обратили внимание, что за последние два года новости о цифровых двойниках стали выходить чаще. Причина понятна: в 2022-ом случился прорыв в изучении и внедрении искусственного интеллекта (ChatGPT и Midjourney), который сильно «взбодрил» сферу. Технологии применяют, чтобы предсказать приток посетителей в гостинице, удаленно отремонтировать автомобиль или выяснить, что будет с небоскребом под внешними агрессивными факторами. Рассмотрим подробнее, как виртуальное моделирование помогает оптимизировать все производственные процессы и не только.

avdosev 4 мар в 07:00

Как мы научили YandexGPT пересказывать видео

Средний

14 мин

14K

Блог компании ЯндексБраузерыМашинное обучение*Искусственный интеллектNatural Language Processing*

✏️ Технотекст 2023

Порой бывает сложно перематывать длинный ролик в надежде найти хоть что-то интересное или тот самый момент из Shorts. Или иногда хочется за ночь узнать, о чём шла речь на паре научных конференций. Для этого в Браузере есть волшебная кнопка — «Пересказать», которая экономит время и помогает лучше понять, стоит ли смотреть видео, есть ли в нём полезная информация, и сразу перейти к интересующей части.

Сегодня я расскажу про модель, которая быстро перескажет видео любой длины и покажет таймкоды для каждой части. Под катом — история о том, как мы смогли выйти за лимиты контекста модели и научить её пересказывать даже очень длинные видео.

+63

AlexeySushkov 17 мар в 11:30

Мозг промышленного масштаба или как воплотить мечту в реальность?

Простой

8 мин

2.9K

IT-инфраструктура*Машинное обучение*Управление проектами*DevOps*Искусственный интеллект

В предыдущей статье мы рассмотрели различные типы нейросетей и обсудили, какие задачи можно решать с их помощью. Теперь рассмотрим задачу искусственного интеллекта с организационной и технической точки зрения.

При работе над сложными проектами обычно вовлечена команда разработчиков и специалистов по обработке данных, у которых сразу возникают вопросы: как управлять проектом, совместно разрабатывать модель машинного обучения (Machine Learning model), проводить ее тестирование, каким образом синхронизировать код и результаты экспериментов? После разработки и оптимизации ML-модели возникает необходимость ее развертывания в промышленной среде. Все эти проблемы могут казаться менее увлекательными, чем решение самой задачи машинного обучения, но они имеют критическое значение для успешной реализации ML-проектов.

В этой статье мы подробно рассмотрим жизненный цикл ML-сервиса от идеи до разработки и внедрения, а также инструменты и принципы, используемые на каждом этапе.

AndreyBolotov1989 14 мар в 07:00

Как мы оцифровывали каждый шаг производства, чтобы завод точно знал, что, как и когда делать

6 мин

8.8K

Анализ и проектирование систем*Промышленное программирование*Управление проектами*Блог компании Группа НЛМК

Подручный сталевара берёт пробу химсостава металла на установке печь-ковш

Привет с Новолипецкого металлургического комбината! В крупном проекте самое ценное — данные. В нашем случае — технологические карты производства и параметры всех изделий и агрегатов: как и что мы делаем, на чём, как долго, и какие параметры каким образом влияют на результат.

Производство — живая система: возникают новые процессы, изменяются существующие, перестраиваются агрегаты, меняется код. Мы построили процесс так, что, когда что-то начинает производиться, все актуальные данные уже есть в системе. Код и данные не отстают, не опережают, а идут рука об руку.

У нас есть два гипермозга:

Календарное планирование играет в оптимизацию на стороне клиентов. Оно знает, что нужно производить и когда, чтобы отгрузить заказы максимально оперативно и вовремя.
Графикователи же пытаются из этих условий собрать оптимальную загрузку оборудования и, возможно, произвести ещё что-то, что можно присоединить к имеющимся сериям. Они отвечают за максимальную эффективность производства в коротком горизонте.

Обе системы используют огромный модуль маршрутизации технологических процессов. Там хранятся все возможные маршруты всей продукции, технология производства по агрегатам — в общем, путь со всеми переделами, который проделывает металл от входа в сталеплавильное производство до попадания в вагон, который поедет к заказчику. Для этого модуля нам пришлось собрать все данные о производстве, привести их к единому виду, установить общие протоколы обмена данными и договориться со всеми-всеми, что они будут вводить, хранить и использовать данные именно так, как в них указано.

Оцифровка завода из бумажного вида заняла год. Пришлось многое переформатировать, чтобы оно уложилось в понятную логику таблиц и данных. Это было основным и очень трудным челленджем, который вырос в непрерывный процесс и продолжается до сих пор.

Читать дальше →

+40

2 3 ...

24 25