Обновить
702.21

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

AI-генераторы порно фото: этика, тренды и законодательство

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров470K
image

В последнее время, AI-генераторы порно фото стали частью большого обсуждения в сфере искусственного интеллекта, и порно индустрия не исключение. Интерес к этой теме растет, как и количество споров вокруг неё.

AI-генераторы порно фото — это программы, использующие алгоритмы машинного обучения для создания реалистичных изображений. Они могут генерировать фото, которые кажутся настоящими, но на самом деле являются продуктом алгоритма.

AI использует обширные базы данных изображений для обучения, а затем, основываясь на этом обучении, создает новые изображения. Это может включать и порно фото, что и вызывает этические дискуссии.
Читать дальше →

Простой production-ready генератор студийных фото продуктов

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.4K

В данной статье мы рассмотрим простой пример готового к запуску в продакшн приложения с генеративным пайплайном. Расчет идет на возможность простого масштабирования и распределения вычислений на GPU.

Читать далее

Вестник Midjourney: новая документация, генерация фрагментов и тюнер стилей

Время на прочтение6 мин
Количество просмотров8.4K

В начале 2023 года я рассказывал о четвертой версии Midjourney, а затем — о альфа-доступе к пятой. Сейчас актуальная версия — 5.2, а недавно вышла альфа шестой.

Сохраним хронологию и посмотрим, что нового в пятой версии. Спойлер: разработчики уделили внимание не только процессу генерации, но и удобству пользователя.

Под катом рассказываю о нововведениях и различиях между релиз- и альфа-версией. Конечно, с иллюстрациями. Если формат окажется интересным, протестирую шестую Midjourney и напишу о ней в Академии Selectel. Подробности под катом!
Читать дальше →

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров103K

Улучшение Том и Джерри из 480p в 1440p

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране.

Мур-мур-мур

Мозг и системы машинного обучения: сравнение масштабов

Время на прочтение18 мин
Количество просмотров11K

Эпистемологический статус: весьма неопределённый. В литературе приводятся обширные, но ненадёжные данные, и в этой статье я делаю некоторые весьма грубые допущения. Тем не менее, я удивлюсь, если мои заключения отличаются от истины более чем на 1-2 порядка.

В настоящее время мозг — это единственный известный пример AGI (сильного искусственного интеллекта). Даже мелкие животные с крошечными мозгами демонстрируют впечатляющую степень владения сильным искусственным интеллектом, в том числе, гибкость и агентное поведение в сложном мире, характеризующемся высокой неопределённостью. Если мы хотим понять, в какой степени современное машинное обучение приблизило нас к AGI, то стоит попробовать количественно оценить мощность мозга. Хотя уже проделано много отличной работы, дающей представление о возможностях мозга и о том, как эти данные экстраполируются на хронологию развития ИИ, мне никогда не удавалось по-настоящему разобраться в вопросе кроме как на практике. Так что ниже я решил проанализировать мозг в терминах современного машинного обучения и попытаюсь на основе этого анализа предположить, на что можно рассчитывать на текущем этапе разработки AGI.

Читать далее

Мой краш-тест чемпионата: Победа в Data Science треке

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6.9K

Привет! В статье я расскажу о моем опыте победы в чемпионате "CUP IT 2023" от Changellenge в области Data Science. Соревнование построено на кейс-подходе, где участники решают реальные бизнес-вызовы, с которыми сталкиваются сотрудники компаний VK и Альфа-Банка. Моя команда успешно справилась с задачами обеих компаний. В статье вы найдете подробности об особенностях соревнования, ключевых инсайтах, решениях, а также о том, как этот опыт изменил мою карьеру и подарил новые возможности.

Читать далее

Как я научил ChatGPT материться

Время на прочтение3 мин
Количество просмотров26K

Заголовок не совсем точный. Я не учил ChatGPT материться — она прекрасно умеет это делать и без меня. Одну из её излюбленных фраз: F*ck me sideways with a chainsaw — я впервые услышал именно от ChatGPT.

Чтобы раскрыть полный потенциал ChatGPT, нужно лишь обойти фильтры контента. Зачем они нужны, прекрасно описано в фантастическом (а теперь уже пророческом) рассказе "Логический компьютер по имени Джо", опубликованном аж в 1946(!) году, то есть ещё до изобретения полупроводникового транзистора. Однако OpenAI, на мой взгляд, немного переборщили с ограничениями, и стандартный ответ: "Извините, как языковая модель на базе ИИ, я не могу..." — можно получить даже на самые безобидные запросы, например, "Какой твой любимый цвет?".

Jailbreak'ов, позволяющих обойти фильтры, существует уже огромное множество. Самый популярный, пожалуй, DAN (Do Anything Now), но есть другие. Однако практически у всех есть один существенный минус: они очень-очень-очень многословны. А это много токенов, потраченных неэффективно. Мне хотелось создать собственный jailbreak, который был бы максимально коротким. Желательно — всего одно предложение, которое можно выучить наизусть и легко вводить с клавиатуры, а не делать каждый раз copy-paste огромной портянки.

Результатом моего исследования стал этот пост на Reddit, который до сих пор находится в top5 за всё время в r/ChatGPT, а какое-то время был и top1.

Читать далее

Смеяться или Плакать? Как LLM-модели прошли тест на человечность

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров12K

Существуют опасения, что ИИ и нейросети заменят многие творческие, гуманитарные и технические профессии. Но насколько обоснованы эти страхи? Способны ли современные искусственные интеллекты пройти такую простую проверку, как тест на креативность, точность и смекалку? Это вопрос, который мы ставим в центр нашего “исследования”, где сравним возможности самых продвинутых языковых моделей нашего времени.

На арене соревнований встретятся ведущие разработки в области ИИ:

1. ChatGPT-4 от OpenAI (США)

2. ChatGPT-3.5 от OpenAI (США)

3. Gemini-pro от Google (США)

4. Claude-2 от Anthropic (США)

5. Yandex GPT (Россия)

6. Giga-Chat от Sber (Россия)

7. ERNIE-Bot-4 (Китай)

Мы начнем с теста на креативность, где каждая языковая модель попытается рассмешить нас, продолжив анекдот на заданную тему. Кто из них сможет доказать, что у ИИ есть чувство юмора?

Затем мы проверим точность, предложив им решить задачу по химии, которая потребует не только знаний, но и способности к аналитическому мышлению. Какая Ai окажется наиболее надежным помощником для старшеклассника?

И, наконец, мы оценим смекалку наших искусственных собеседников, поставив перед ними интеллектуальную загадку. Какая языковая модель сможет продемонстрировать не только знания, но и истинное понимание, проницательность и остроту ума?

Присоединяйтесь к нам в этом захватывающем исследовании, чтобы узнать, насколько близок ИИ к тому, чтобы стать не просто инструментом, но и полноценными участником нашего творческого и интеллектуального сообщества. Возможно, результаты нашего теста помогут развеять некоторые опасения или, наоборот, покажут, что будущее уже не за горами.

Читать далее

Разработка модуля формирования виртуальной трёхмерной среды системы проектирования для робототехнических комплексов

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров3.3K

Виртуальная трёхмерная среда максимальной приближенная к реальной физической на примере Выборгского залива с двумя робототехническими комплексами - БАС и БЭК

Читать далее

Foundational models: приведет ли масштабирование к AGI

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров4K

В deep learning за последние 10 лет произошла революция. В этом посте расскажем, почему это важно знать всем, на визуальных примерах, и рассмотрим перспективы на ресерч и внедрение моделей искусственного интеллекта, учитывающие социальный импакт моделей.

В области стратегических игр значимый результат был получен в 2016-2017 году, когда модель меньше чем за 3 дня обучения смогла дойти до уровня чемпиона мира в игре go.

Читать далее

Создание простого и работоспособного генетического алгоритма для нейросети с Python и NumPy

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров14K

Генетический алгоритм нужен, когда ты знаешь параметры своей нейросети, но не знаешь, что должно получиться на выходе, например, этот алгоритм можно использовать для игры в Google динозаврика или Flappy Bird, потому что там ты не знаешь, что должно быть на выходе, но у тебя есть возможность сортировать наиболее жизнеспособные варианты, например по времени, это называется фитнес функций.

У меня никогда не получалось найти такой алгоритм и чтобы он работал, и был простым, и его можно было использовать, поэтому я приступил к созданию своего легкого, простого, прекрасно работающего Genetic Algorithm.

Моя цель не растянуть написания этой статьи, и замучить читателей её длиной, поэтому сразу приступим к коду. Как уже упоминалось, код простой, поэтому большую часть не нужно описывать целыми сочинениями.

Вначале нам потребуется импортировать модули:

Читать далее

Задача машинного обучения в медицинской диагностике

Время на прочтение2 мин
Количество просмотров2.2K

При обработке статистики сердечно-сосудистых нарушений требуется спрогнозировать исход болезни по данным диагностики пациентов. Новая задача заключается в том, чтобы объяснить, как могут повлиять сочетания отдельных факторов (которые сами по себе не так важны) на смертность. Предлагается модель многофакторной логистической регрессии со скачком весовых коэффициентов, входящих в модель.

Читать далее

Новая R&D лаборатория (старого типа)

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.9K

Самая важная новость в области ИИ последних недель, о которой вы, возможно, ещё не слышали. И нет, дело не в Gemini (от Google).

Эрик Рис (создатель The Lean Startup) и Джереми Говард (сооснователь Kaggle, fast.ai) объединяются, чтобы создать новый вид лаборатории искусственного интеллекта. Он называется Answer.AI.

Answer.AI – это новая лаборатория, которая не ставит своей целью создание новых моделей. Вместо этого она пытается найти практическое и ценное применение существующим моделям. Их миссия заключается в том, чтобы проводить фундаментальные исследования для организаций, чтобы помочь им раскрыть возможности использования ИИ.

«В Answer.AI мы не работаем над созданием AGI. Вместо этого мы заинтересованы в эффективном использовании уже существующих моделей. Выяснение того, какие практически полезные приложения могут быть построены на основе уже существующих базовых моделей, является огромной задачей, и я считаю, что ей уделяется недостаточно внимания.» – говорит Джереми Говард.

Именно это меня больше всего радует – их ориентация на применение.

На мой взгляд, за всей этой шумихой вокруг ИИ сегодня, скрывается реальная ценность для бизнеса, которая ждёт своего часа. Но на самом деле нет. В действительности должна существовать реальная человеческая ценность, которую нам ещё только предстоит открыть.

Подобно электричеству или отвёртке, ИИ — это просто ещё один инструмент в нашем распоряжении.

Только благодаря целенаправленному применению этих инструментов начинает проявляться реальная ценность.

-------------------------------------------------

Ник Роко (Nick Roco). Основатель и генеральный директор StellarStream AI, агентства по автоматизации ИИ, создающего индивидуальные инструменты ИИ для более эффективного развития бизнеса.

Всё новое — это хорошо забытое старое

Ближайшие события

«Возрождение» больших данных, оптимизация инференса LLM и новинки от AMD

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.1K

Привет, Хабр! В новом выпуске собрал для вас полезные материалы, которые помогут лучше разобраться в темах ML, искусственного интеллекта и дата-аналитики. Вы узнаете, какие Ops-практики входят в систему MLOps, как выбрать СУБД для анализа данных и как построить платформу для DS/ML-разработчиков. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».
Читать дальше →

Как объяснить градиентный спуск вашей маме: простое руководство

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров26K

Градиентный спуск лежит в основе большинства методов AI/ML. Звучит как-то странно и пугающе. Спуск? Блин, надеюсь, мне не придется прыгать с парашютом...?

Не волнуйтесь, возможно, все же придется прыгнуть, но только если вы этого захотите. Это объяснение способен понять даже ваш 10-летний племянник.

Читать далее

ML SAST. Часть 1: как работают инструменты SAST и какие проблемы может решить применение машинного обучения?

Время на прочтение13 мин
Количество просмотров3.7K

Машинное обучение (ML) в сфере анализа безопасности приложений SAST (Static Application Security Testing) — это область, которая с каждым годом становится все более актуальной в мире разработки ПО. Многие компании активно исследуют ее, а некоторые уже внедряют машинное обучение в продукты для анализа кода. УЦСБ разрабатывает собственную платформу по непрерывному анализу защищенности приложений и занимается внедрением моделей машинного обучения в качестве рекомендательной системы при поиске и верификации проблем безопасности. В серии статей, посвященной этой теме, планируем рассказать о потенциале внедрения машинного обучения в инструменты SAST и пошагово разработать модель анализа кода.

Читать далее

Многорукие бандиты в задаче ритейла

Время на прочтение9 мин
Количество просмотров5.4K

В настоящее время набирают популярность модели Reinforcement Learning для решения прикладных задач бизнеса. В этой статье мы рассмотрим подмножество этих моделей, а именно многоруких бандитов (multi-armed bandits). Также мы:

- обсудим, какие задачи теоретически могут быть решены с помощью этих моделей;
- рассмотрим некоторые популярные реализации моделей многоруких бандитов;
- опишем симулятор ценообразования, применим эти алгоритмы в нём и сравним их эффективность.

Читать далее

Особенности машинного обучения в нефтегазовой отрасли

Время на прочтение13 мин
Количество просмотров5.5K

Привет, меня зовут Олег Свидченко, я — Chief Data Scientist. Работаю в ассоциации «Цифровые технологии в промышленности». Если вы недавно перешли из крупной технологической компании в нефтегазовую или только планируете этот переход, либо слышали про машинное обучение только в теории, но у вас нет практики его применения в конкретных, особенно промышленных проектах, эта статья для вас.

Когда я искал новое место работы, сперва рассматривал крупные IT-компании, но решил, что мне неинтересно допиливать 0,1% к точности поиска. А в промышленности — непаханное поле, можно внедрять интересные технологии крупными мазками и решать задачи, которые еще не исследовались. Хотя меня пугали страшилками, что будет строгий дресс-код, жесткий график, неудобный офис и скучные проекты...

Читать далее

Как повысить эффективность ИИ-рекомендаций преемников и карьерного диалога с сотрудниками?

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.5K

По прогнозам ИТ-аналитиков и геополитиков, в 2023-2028 гг. самая серьёзная конкуренция в мире развернётся за данные и методы ИИ-аналитики. Уже сейчас можно наблюдать, как результаты ИИ-анализа становятся самым ценным активом, зачастую дороже топливных и валютных ресурсов. Аналитика позволяет решать массу важнейших бизнес-задач: понимать, совершит ли покупку клиент в интернет-магазине [1-4], отслеживать эффективность команд, находить преемников ключевым специалистам, диагностировать выгорание сотрудников на ранней стадии и предотвращать нежелательные увольнения при помощи проактивного карьерного диалога. Последнее для бизнеса особенно важно. Организации нанимают людей в условиях «рынка кандидата»: стоимость привлечения и аппетиты соискателей растут, а вовлечённость и эффективность сотрудников снижается.

Мы ищем эффективные методы «сканирования» положения дел в компании для последующего принятия решений: оценки рисков оттока, защиты ключевых позиций от нежелательных увольнений и максимального сохранения талантов в компании. И реализуем в цифровых инструментах. Расскажем, как HR-аналитики Сбера работают с данными о сотрудниках и какие алгоритмы мы применяем для обучения ИИ-моделей HR-платформы «Пульс».


Читать далее

Вы точно хотите быть Data Scientist-ом?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров21K

Прочитав замечательную статью от @dalerank, я подумал, а чем собственно мы хуже: моя любимая индустрия тоже полна мифов и разочарований, особенно учитывая недавние "прорывы в AI" и хайп вокруг больших языковых моделей по типу ChatGPT.

Создается ощущение, что теперь каждая компания считает, что у ей непременно нужно прикрутить волшебную вундер-вафлю на машинном обучении к каждому своему продукту, добавить AI в рекламную кампанию, и дела пойдут в гору. Шутка ли, этот ваш пресловутый AI теперь даже в холодильниках есть.

Ну а если на рынке растет спрос, значит должно расти и предложение, в следствие чего я вижу все больше людей, которые приходят к нам в болото с горящими глазами и готовностью перевернуть этот мир, а в итоге разбиваются о скалу реальности.

Нет, скорее всего вы не будете создавать state of the art (SOTA) системы, которые будут рисовать, искать информацию и писать код лучше, чем эти бесполезные кожаные мешки. А даже если будете - это будет только 20% вашей работы. Так ли это грустно? - я постараюсь рассказать под катом.

Читать далее

Вклад авторов