Статьи / Закладки / Профиль Volkov

@Volkov_Timm^{read⁠-⁠only}

Пользователь

ПрофильЗакладки107

Hanamime 14 июн 2024 в 07:40

Ваш путеводитель по дипфейкам: осведомлён — значит вооружён

Простой

7 мин

5.3K

Блог компании СберОбработка изображений * Работа с видео * Машинное обучение *

Мнение

Даже если вы не знаете, что такое дипфейки, вы наверняка с ними сталкивались. Хотя изменённые и поддельные медиа не являются чем-то новым, дипфейки выводят их на совершенно новый уровень, используя искусственный интеллект для создания изображений, видео и аудио, которые кажутся реальными, но на самом деле таковыми не являются. Дипфейки (DeepFake) — это синтетические медиа, в которых человек на существующем изображении, видео или записи заменяется чьим-либо подобием. Технология DeepFake представляет собой одно из самых интригующих и противоречивых достижений в сфере ИИ. Поскольку дипфейки становятся всё доступнее, а их качество растёт, они создают серьёзные проблемы и в то же время дают новые возможности развития в различных сферах жизни человека.

+18

ayushindin 14 июн 2024 в 09:45

«Я стал тимлидом и боюсь». Что почитать и зачем

Простой

8 мин

35K

Блог компании «Лаборатория Касперского»Информационная безопасность * Управление проектами * Управление разработкой * Учебный процесс в IT

Мнение

Стресс, связанный с переходом на менеджерскую роль, способен пошатнуть любые, даже самые крепкие нервы. А если ваше решение стать руководителем желанное и осознанное, то вы легко можете загнать себя в ловушку из двух стен: тревожности и перфекционизма.

Меня зовут Александр Шиндин, я — технический менеджер мобильных продуктов Kaspersky Password Manager и Kaspersky Who Calls. Я так сильно хотел проявить себя в роли руководителя, что внутренних обучающих курсов, которые дает в таких случаях компания, мне не хватало, — и лучшим дополнением к теории стали книги. Они ускорили мое погружение в мир менеджмента, помогли быть готовым к еще большему числу нестандартных ситуаций и придали уверенности в принимаемых решениях.

В этой статье поделюсь своим личным топом книг, которые оказались в свое время полезны мне и, я уверен, будут полезны и вам как будущим или начинающим техническим менеджерам.

Читать дальше →

+52

egaoharu_kensei 14 июн 2024 в 16:47

Метрики оценки качества моделей и анализ ошибок в машинном обучении. Подробное руководство

Средний

32 мин

34K

Python * Data Mining * Математика * Машинное обучение * Искусственный интеллект

Туториал

Одним из критически важных шагов при создании хорошей модели является правильный выбор метрики для оценки её качества, поскольку неправильный выбор может привести к неверным выводам и, как следствие, к принятию не самых оптимальных решений. Поэтому на сегодняшний день существует большое количество метрик, подходящих для самых разных задач и ситуаций.

В данном туториале будут рассмотрены популярные метрики для задач классификации, регрессии и кластеризации, а также инструмент для анализа ошибки модели, известный как bias-variance decomposition. Помимо этого, для большей части метрик будут представлены ручные расчёты и реализация с нуля на Python, а в конце вы сможете найти дополнительные источники для более глубокого ознакомления.

+11

luffity 9 июн 2024 в 19:51

Слушаем события в Selenium с помощью Listeners. Как реагировать на события без тонны кода

Средний

8 мин

3.5K

Python * Тестирование IT-систем * Тестирование веб-сервисов * Программирование *

Туториал

Привет!

Работа с веб-приложениями с использованием Selenium зачастую требует выполнения различных действий и обработки многочисленных событий. В стандартном подходе это может привести к написанию большого количества кода для логирования, обработки ошибок и выполнения других задач. В этой статье мы рассмотрим, как можно значительно упростить этот процесс, используя Listeners в Selenium.

Alex_Mer5er 10 июн 2024 в 02:28

Мега-Учебник Flask Глава 13: I18n и L10n (издание 2024)

Средний

16 мин

3.8K

Веб-разработка * Python * Flask *

Туториал

Перевод

Это тринадцатая часть серии мега-учебника Flask, в которой я собираюсь рассказать вам, как расширить Microblog для поддержки нескольких языков. В рамках этой работы вы также узнаете о создании собственных расширений CLI для команды flask.

Начать изучение

yakvenalex 10 июн 2024 в 03:00

Telegram Боты на Aiogram 3.x: Первые Шаги

Простой

14 мин

105K

Блог компании AmveraPython * PostgreSQL * SQL *

Туториал

Привет, друзья!

За свою практику программирования я успел написать множество малых, средних и крупных проектов, преимущественно в формате Telegram-ботов. Моя история началась с популярной на то время версии aiogram 2.24 (тех, кто в теме, поймут), а сейчас я полностью перешел на версию 3.x, о чем нисколько не жалею.

В этом посте я хочу начать делиться с вами своим опытом разработки Telegram-ботов через библиотеку aiogram. Сейчас вы читаете вводный пост по этой обширной, но на самом деле не такой уж и сложной теме. Если я увижу положительный отклик, то пойму, что эта информация вам полезна, и мы будем углубляться в разработку ботов все дальше и дальше.

Сегодня мы научимся:

ru_vds 3 июн 2024 в 13:00

Как я постепенно избавляюсь от контроля Google

Простой

9 мин

63K

Блог компании RUVDS.comOpen source * Геоинформационные сервисы * Информационная безопасность * Облачные сервисы *

Обзор

Перевод

В течение последних нескольких лет я пытаюсь постепенно ограничивать пользование продуктами и сервисами Google или вообще избавиться от них. В некоторых категориях отказаться от продуктов Google было сложно, в некоторых других — почти невозможно. В этой статье я представлю список сервисов, альтернативы для которых я пытался найти, поговорю о простоте (или трудности) поиска удовлетворительной альтернативы и поделюсь своим опытом.

Мне кажется, прежде, чем приступать, нужно дать важное предисловие. Во-первых, эти заметки сделаны по личному опыту, это не подробный обзор альтернатив сервисам Google, сравнения альтернативных решений можете поискать где-нибудь ещё. Во-вторых, для использования некоторых из упомянутых в статье альтернатив требуется настройка своего сервера, что для многих людей станет ограничивающим требованием.

Читать дальше →

+69

201

evg_dc 3 июн 2024 в 18:57

Как подружить Llama-3.1 и YouTube имея всего 40 строк кода

Простой

2 мин

Python *

Туториал

Сделаем Телеграм бота которому можно кинуть ссылку на YouTube видео и поговорить с ним о содержимом этого видео.

badcasedaily1 4 июн 2024 в 06:15

Кратко про Seq2Seq-модели

Средний

9 мин

4.3K

Блог компании OTUSPython * Программирование * Машинное обучение *

Обзор

Привет, Хабр!

Seq2Seq модели — это архитектуры ML, предназначенные для задач, связанных с последовательными данными, типо машинного перевода, суммирования текста, создания описаний к пикчам и прочие задачи, где требуется преобразование одной последовательности в другую.

В этой статье в общих деталях рассмотрим то, как реализуются Seq2Seq модели.

binary_file 4 июн 2024 в 09:22

Как писать требования и документацию к проекту. Полный гайд с шаблоном документации и примерами заполнения

Простой

12 мин

47K

Блог компании Альфа-БанкАнализ и проектирование систем * Управление проектами * Аналитика мобильных приложений * Подготовка технической документации *

FAQ

Хабр, привет!

Меня расстраивает несправедливость в мире IT: для новичков-разработчиков есть куча пошаговых инструкций, о там, как разработать API или мобильное приложение. Хочу немного уровнять баланс вселенной, поэтому я написал небольшой гайд для аналитиков для составления документации.

В прошлой статье я представил шаблон, а теперь заполнил его для фичи «Экспресс-доставка товара в маркетплейсе». Моя цель – показать, как можно вести документацию и как правильно заполнять этот шаблон.

+53

PatientZero 4 июн 2024 в 10:39

Укрощаем суммы с плавающей запятой

Простой

9 мин

10K

Программирование * Алгоритмы * Компиляторы * Математика * Rust *

Туториал

Перевод

Допустим, у нас есть массив чисел с плавающей запятой, и мы хотим их суммировать. Можно наивно подумать, что их достаточно просто сложить, например, на Rust.

Однако это запросто может привести к произвольно большой накопленной погрешности. Давайте проверим:

naive_sum(&vec![1.0; 1_000_000]) = 1000000.0 naive_sum(&vec![1.0; 10_000_000]) = 10000000.0 naive_sum(&vec![1.0; 100_000_000]) = 16777216.0 naive_sum(&vec![1.0; 1_000_000_000]) = 16777216.0

Ой-ёй… Что произошло? Проблема в том .что следующее 32-битное число с плавающей запятой после 16777216 — это 16777218. Так что при вычислении 16777216 + 1, значение округляется до ближайшего числа с плавающей запятой, имеющей чётную мантиссу, то есть снова до 16777216. Мы зашли в тупик.

К счастью, есть более совершенные способы суммирования массива.

+37

patapum_gg 4 июн 2024 в 10:47

ML в OCR: зачем и как

Простой

5 мин

2.8K

Блог компании SL SoftОбработка изображений * Машинное обучение *

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно появилась еще одна — мы назвали ее ML‑локатор. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

avshkol 4 июн 2024 в 21:25

Справочник по применению GPU в машинном обучении

Средний

35 мин

13K

Машинное обучение * ГаджетыКомпьютерное железо

Туториал

Перевод

Это перевод популярного лонгрида Тима Детмерса "Выбор графического процессора для глубокого обучения: мой опыт и советы".

Глубокое обучение (Deep learning, DL) - область с высокими вычислительными требованиями, и выбор графического процессора будет в корне определять ваши возможности в этой сфере. Какие характеристики важны при выборе нового GPU? Оперативная память GPU, ядра, тензорные ядра, кэш? Как сделать экономически эффективный выбор? Мы рассмотрим эти вопросы, заодно разберемся с распространенными заблуждениями, разберемся в характеристиках GPU, дадим советы, которые помогут вам сделать правильный выбор.

+26

dalv_happy 5 июн 2024 в 12:06

От идеи до продукта: Как я создал и запустил свой собственный IT стартап один [Part 1]

Простой

9 мин

21K

Анализ и проектирование систем * Интерфейсы * Подготовка технической документации * Прототипирование * Управление продуктом *

Из песочницы

Всем привет, меня зовут Влад и я запилил собственный IT стартап в одиночку потратив $100. Я давно хотел проверить свои силы и показать самому себе на что я способен, смогу ли я дойти от: создания идеи, проработки ui/ux, разработки frontend & backend, до публикации продукта и его маркетинга.

Для общего понимания я постараюсь кратко описать свой background. В 14 лет я увлёкся веб разработкой поскольку у меня была команда по игре counter strike и для того чтобы заявляться на турниры, нам требовался сайт, по мере его поддержания, я освоил исскуство владения фотошопом. Этот сайт я начал монетезировать и смотрел как его можно продвигать.

Дальше был универ, где я много писал код на c++, python, c#, писал свои нейронки, программировал роботов, проходил алгоритмы и структуры данных. В это самое время вместе с друзьями начали развивать ивент стартап, который помогал пользователям узнавать расписание, изменения, следить за интересными спикерами. Я занимался ui/ux проектированием и frontend разработкой. В это самое время я изучил первые в своей жизни методологии дизайна: google material design guidelines and Apple Human Interface Guidelines.

Писал диплом на тему: примерка мебели в дополненой реальности на свифте.

Потом был момент, когда мы с партнёрами открыли it outsource компанию на 40 человек разработки, где я был CTO и следил за технологиями в компании на стеке: JS, Typescript, React, Vue, Php, python, nodejs, reactnative.

И весь свой накопленный опыт я хотел применить для создания продукта.

+13

Sivchenko_translate 5 июн 2024 в 12:35

Сверхскоростные связные списки

14 мин

10K

Rust * Алгоритмы * Программирование * Высоконагруженные системы *

Перевод

На курсах по программированию связные списки преподаются как одна из фундаментальных структур данных, но на самом деле такие списки чаще встречаются на технических собеседованиях, чем в реальных проектах.

В этом посте будет продемонстрирован практический пример, в котором связный список существенно обгоняет Vec. Мы напишем простую библиотеку для валидации данных, которая будет показывать, где именно находится ошибка в невалидном вводе. Здесь будет наглядно показано, как можно использовать связные списки при обходе графа.

В этом посте отражены в основном собственные изыскания и ошибки автора, имевшего дело с крейтами jsonschema, поэтому пост не претендует на полное руководство по связным спискам, а скорее призван донести идею о том, как они могут использоваться на практике.

Мы начнём с азбучной реализации, а потом будем постепенно её оптимизировать и рассматривать, как это отразится на производительности.

От читателя поста ожидается, что он на базовом уровне понимает Rust, обычные структуры данных, а также концептуально представляет, как выделяется память (в стеке и куче).

Дополнение (14.05.2024): Я учёл поступившую обратную связь и подчеркнул, какие идеи объективно плохи, прояснил некоторые отступления и удалил идею о imbl.

Чтобы было проще прослеживать этапы реализации и исследовать код, отсылаю вас к репозиторию, сопровождающему этот пост.

+17

spectr_dev 5 июн 2024 в 12:58

Магия динамического маппинга. Реализация универсальной обработки файлов нефиксированной структуры на Python

Средний

15 мин

2.7K

Блог компании SpectrВеб-разработка * Python * Django * IT-инфраструктура *

Туториал

Привет! На связи Никита Ильин из Spectr, Backend-разработчик с опытом более 5 лет.

Один из проектов, с которым мы работаем, — IBP-платформа для планирования и прогнозирования спроса и продаж в ритейле. В статье поговорим о конкретной реализации для одной из задач в рамках этой платформы на Python и Django. При этом сама концепция может быть реализована абсолютно на любом фреймворке или платформе: Spring, .NET, Laravel.

Узнать о магии больше

uberkinder 5 июн 2024 в 13:02

Мечтает ли GPT-4o о сегментации картинок...?

Простой

10 мин

9.4K

Яндекс API * Машинное обучение * Искусственный интеллект

Кейс

Всем привет, Меня зовут Богдан, Я фаундер Vibe AI – это AI Dating Copilot для парней и девушек, который помогает в переписке на сайтах знакомств и в мессенджерах (в сервисе зарегистрировано уже 13,000+ пользователей).

Сегодня Я расскажу, как мы заставили GPT-4o работать с детекцией объектов на изображении (выделять координаты объекта на изображении) на примере задачи распознавания сообщений по скриншоту, которая лежит в основе нашего приложения.

Обсудим, какие ограничения у Vision-модулей в языковых моделях, как происходит обработка картинок, где теряется информация и как преодолеть эти лимиты.

+15

troitskii 6 июн 2024 в 07:05

Как работает самая популярная у дата саентистов модель машинного обучения: градиентный бустинг (XGBoosting) на пальцах

Средний

4 мин

8.2K

Искусственный интеллектBig Data * Data Engineering *

Из песочницы

Привет, Хабр! Меня зовут Александр Троицкий, я автор канала AI для чайников, и сегодня я расскажу про самую популярную у дата саентистов модель машинного обучения - градиентный бустинг.

suburg 6 июн 2024 в 08:40

DIY: Личная электронная медицинская карта

Простой

11 мин

3.2K

Визуализация данных * Статистика в ITЗдоровье

Кейс

Всем привет!

Как говорит народная мудрость, «коли болен — лечись, а здоров — берегись». Долгое время я ощущал себя здоровым человеком (хоть и были некоторые хронические заболевания), и не посещал регулярно врачей. Но всё когда-нибудь кончается, и в 41 год я понял, что ощущение здоровья улетучивается как спирт из открытой тары. С этим запросом я пошёл к лекарю – понять какие у меня есть проблемы и что нужно сделать, чтобы вернуться в состояние здоровья.

Как обычно, на приёме был назначен ряд лабораторных и инструментальных исследований, а также были даны направления на консультации к другим узким специалистам. Те, в свою очередь, назначили другие исследования. В рюкзаке стали копиться направления, протоколы приёмов, результаты анализов, диски с результатами исследований. Попытки систематически разложить их в отдельные папки успехом не увенчались – непонятно какой должен быть принцип. Хронологический? Или по системам организма? Или по врачам? Любой вариант в каких-то сценариях неудобен.

Поскольку я всё же ИТшник, то было принято решение систематизировать материалы и сделать свою «электронную медицинскую карту» - с которой лично мне было бы удобно работать. А поскольку я не разработчик (хоть иногда и пишу код), то использовал для этого Excel. В статье хочу поделиться опытом использования Excel для ведения личной электронной медицинской карты – что я там веду, почему именно это и почему именно в такой форме.

+11

Barseadar 6 июн 2024 в 14:30

До AGI и ASI осталось 20 лет: почему до восстания ИИ ещё далеко

Простой

11 мин

14K

Блог компании СЕРВЕР МОЛЛМашинное обучение * Исследования и прогнозы в IT * Производство и разработка электроники * Искусственный интеллект

Аналитика

Помните ту фольклорную фразу?

"До управляемого термоядерного синтеза осталось 20 лет."

И сколько бы лет не прошло, мы находимся всё в тех же 20 годах от него.

Однако модели ИИ прогрессируют крайне быстро. Далёкие от технологий люди уже задумались о сюжетах Матрицы и Терминатора. Чуть более продвинутые технооптимисты ждут AGI или сингулярность, чтобы получать безусловный базовый доход и не работать, а технофобы консерваторы говорят, что всё нужно ограничить и запретить (ха-ха). Локальные запреты в отдельных странах усилят их глобальное отставание, а страны без запретов получат преимущество. Так что процесс развития нейросетей необратим.

Дропдаун

+11

3 4

Ваш путеводитель по дипфейкам: осведомлён — значит вооружён

«Я стал тимлидом и боюсь». Что почитать и зачем

Метрики оценки качества моделей и анализ ошибок в машинном обучении. Подробное руководство

Слушаем события в Selenium с помощью Listeners. Как реагировать на события без тонны кода

Мега-Учебник Flask Глава 13: I18n и L10n (издание 2024)

Telegram Боты на Aiogram 3.x: Первые Шаги

Как я постепенно избавляюсь от контроля Google

Как подружить Llama-3.1 и YouTube имея всего 40 строк кода

Кратко про Seq2Seq-модели

Как писать требования и документацию к проекту. Полный гайд с шаблоном документации и примерами заполнения

Укрощаем суммы с плавающей запятой

ML в OCR: зачем и как

Справочник по применению GPU в машинном обучении

От идеи до продукта: Как я создал и запустил свой собственный IT стартап один [Part 1]

Сверхскоростные связные списки

Магия динамического маппинга. Реализация универсальной обработки файлов нефиксированной структуры на Python

Мечтает ли GPT-4o о сегментации картинок...?

Как работает самая популярная у дата саентистов модель машинного обучения: градиентный бустинг (XGBoosting) на пальцах

DIY: Личная электронная медицинская карта

До AGI и ASI осталось 20 лет: почему до восстания ИИ ещё далеко

Информация

Специализация