Как стать автором
Обновить
655.78

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Я думаю, многие уже слышали о том, что в общий доступ выложили Stable Diffusion 3.

Скачать ее можно, например, на Hugging Face. Мое внимание привлект тот факт, что SD3 во-первых достаточно скромная по требованиям к железу - версия Medium влезает в мою старую GTX 1080 с 8 GB памяти, а во-вторых, она наконец-то может рисовать сносный пиксель-арт, который никак не получался у прошлых версий.

Sunset over a tranquil lake, pixel art with adventure game influences
Sunset over a tranquil lake, pixel art with adventure game influences

Я не мог пройти мимо такой возможности, по-быстрому набросал телеграм-бота, который пинает мою локальную SD3 Medium и постит получившеся в группу Pixel Diffusion в телеграме. Генерация на моей древней видеокарте занимает минут 15, соответственно, постит он примерно каждые 15 минут. Я не думаю, что буду в таком режиме крутить его неделями, но пока пусть поработает и поисследует пространство состояний. Кто любит пиксель-арт - добро пожаловать!

Код, который это все делает - предельно простой. Достаточно установить библиотеку diffusers из pip, а дальше дело техники.

from diffusers import StableDiffusion3Pipeline
from PIL import Image

# отключаем тяжеловесный текстовый энкодер и токенайзер, которые не влезут в 8 GB видеопамяти
pipeline = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", text_encoder_3=None, tokenizer_3=None,  torch_dtype=torch.float16).to('cuda')

# prompt собирается из двух кусков, взятых рандомно из больших списков, сгенеренных ChatGPT

image = pipeline(prompt, width=1024, height=1024).images[0]
image.save(f_name)

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии0

Министр просвещения РФ Сергей Кравцов предложил сделать международной олимпиаду по искусственному интеллекту, предназначенную для школьников.

«По поводу международных олимпиад по искусственному интеллекту, наша страна уже несколько лет подряд для школьников такую олимпиаду проводит, мы предлагаем ее сделать международной. Мы уверены, что взаимодействие в проведении такой международной олимпиады позволит нам развивать все перспективные направления, которые мы сегодня обсуждаем», — заявил Кравцов на II Международном форуме министров образования «Формируя будущее».

С 2021 года олимпиада по искусственному интеллекту (ИИ) и программированию проходит для российских школьников в 8-11 классов. За это время в ней приняли участие около 40 тыс. школьников. Участники олимпиады в течение двух дней решают задачи, основанные на реальных данных компании VK, принимают участие в профориентационных и развлекательных мероприятиях, встречаются с экспертами в сфере искусственного интеллекта.

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии2

Siri в iOS 18 предупреждает, что ChatGPT может лгать. Уведомления «ChatGPT. Проверьте важную информацию на наличие ошибок» появлялись под каждой демонстрацией интеграции ChatGPT с Siri во время выступления Apple на WWDC 2024.

Эксперты считают, что факт, что Apple поместила в свои устройства то, чему она не полностью доверяет, является огромным шагом для компании.

В iPhone встроили ChatGPT бесплатно и без регистрации. Нейросеть будет встроена прямо в Siri с iOS 18. Все ИИ-функции будут доступны только в США и только на английском.

Система Apple Intelligence будет доступна в iOS 18, iPadOS 18 и macOS Sequoia. ChatGPT 4o появится на iOS, macOS и iPadOS «позже в 2024 году». Siri сможет к нему обратиться, если «не сможет сама выполнить команду». Перед этим система спросит разрешение пользователя. В будущем компания хочет использовать и другие модели искусственного интеллекта.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Илон Маск пригрозил, что в случае массового внедрения презентованного сегодня ИИ-проекта Apple Intelligence он запретит все устройства Apple в своих компаниях.

Маск также добавил, что «Apple понятия не имеет, что на самом деле происходит, когда они передают ваши данные OpenAI», а все посетители в офисах его компаний будут проверяться на предмет наличия устройств Apple, которые планируется помещать в клетку Фарадея.

По словам Маска, самое идеальное решение было бы оставить Apple Intelligence в качестве отдельного приложения, а не встраивать во все сервисы и внутрь iOS 18.

Это просто абсурд, что Apple недостаточно умна, чтобы создать свой собственный ИИ, но при этом каким-то образом может гарантировать, что OpenAI защитит вашу безопасность и конфиденциальность!

Apple понятия не имеет, что на самом деле происходит, когда они передают ваши данные OpenAI. Они продают вас втридорога.

Илон Маск.

Теги:
Всего голосов 5: ↑5 и ↓0+6
Комментарии4

В iPhone встроили ChatGPT бесплатно и без регистрации. Нейросеть будет встроена прямо в Siri с iOS 18. Все ИИ-функции будут доступны только в США и только на английском.

Система Apple Intelligence будет доступна в iOS 18, iPadOS 18 и macOS Sequoia. ChatGPT 4o появится на iOS, macOS и iPadOS «позже в 2024 году». Siri сможет к нему обратиться, если «не сможет сама выполнить команду». Перед этим система спросит разрешение пользователя. В будущем компания хочет использовать и другие модели искусственного интеллекта.

Ранее на WWDC 2024 Apple, спустя 14 лет после релиза своего планшета, наконец‑то добавила в iOS 18 штатное приложение «калькулятор» в iPad с возможностью делать «математические заметки».

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии4

Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты выпустил новую 4-х часовую лекцию на Youtube о том, как создать GPT-2 с нуля на Python.

В ролике Карпаты стартует с пустого файла и далее собирает полноценную рабочую ИИ-модель — с пошаговым объяснением.

Сопроводительный материал к новой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

В феврале Карпаты выпустил лекцию на Youtube под названием Let's build the GPT Tokenizer. Это двухчасовая понятная и доступная лекция о токенах и токенизации в ChatGPT и других нейросетях. В видео Карпаты буквально на пальцах показывает, как именно нейросеть GPT читает текст, как дробит его на единицы и что в нём выделяет. Учебный материал поможет начинающим пользователям углубиться в изучение нейросетей, а также лучше понимать их устройство.

Сопроводительный материал к этой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

Теги:
Всего голосов 11: ↑11 и ↓0+13
Комментарии1

Небольшая, но полезная новость для тех, кто интересуется историей. Мы добавили в Поиск по архивам новый тип документов — справочники XIX–XX веков из фондов Национальной электронной библиотеки и Российской государственной библиотеки. 

Историки, социологи и журналисты смогут получить доступ к новым сведениям об исторических событиях и личностях, а обычные пользователи — ещё больше узнать о своих предках. В новых источниках можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово-промышленных справочников — каким делом занимались.

Для этого нейросеть Яндекса расшифровала почти 600 книг или 275 тысяч страниц. Причём она узнаёт даже утратившие актуальность знаки (например, исчезнувшие из алфавита буквы) и учитывает особенности почерка. А для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности. Кстати, более подробно о нашей технологии мы рассказывали на Хабре в отдельной статье.

Теги:
Всего голосов 5: ↑5 и ↓0+9
Комментарии1

К 225-летию Александра Пушкина «Яндекс» опубликовал проект «Наше всё». В компании исследовали, что интересует пользователей в жизни и творчестве классика. Также «Яндекс» создал нейросетевые трейлеры по произведениям Пушкина.

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Журналисты The Wall Street Journal рассказали, что Apple начала заниматься разработкой ИИ-функций после того, как Крейг Федериги попробовал GitHub Copilot. Сообщается, что старший вице-президент по разработке программного обеспечения компании экспериментировал с функцией автоматического завершения кода во время рождественских праздников в конце 2022 года. Он впечатлился ей и сразу начал мотивировать разработчиков Apple начать придумывать что-то своё. После этого события взгляды компании на генеративные модели машинного обучения поменялись в лучшую сторону, но Apple всё ещё занимает отстающую позицию среди международных технологических компаний.

Теги:
Всего голосов 2: ↑2 и ↓0+6
Комментарии0

Microsoft обновила бесплатный курс для начинающих пользователей и промпт‑инженеров Generative AI for Beginners (Version 2) — A Course до версии 2. В открытом репозитории 18 занятий по различным ИИ‑моделям, их особенностям и интеграции во все системы, включая обучение, как построить свою мини-модель и получить новые знания.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

На полях Петербургского международного экономического форума (ПМЭФ-2024)
5 июня показали робопса от Центра робототехники «Сбера» (SberRoboticsСenter) с функцией «навигатора».

Робот ориентируется на местности и готов проводить посетителей к тому или иному объекту. Управлять роботом можно с помощью голосовых команд или через текстовый чат на планшете. Всё программное обеспечение, включая навигационный модуль — разработка Центра робототехники «Сбера».

Аппаратная часть робота сделана в Китае. Фактически, «мозги» робота расположены не в голове, а в контейнере с ПК на спине, отвечающем за работу машинного зрения и координацию движений. Обучение робота базируется на генеративном ИИ собственной разработки «Сбера».

Также на спине робопса установлено специальное оборудование, в том числе камера Insta 360, позволяющая снимать видео на 360 градусов.

По словам представителей лаборатории робототехники «Сбера», робопёс помогает на производстве и в офисе, может выполнять функции курьера и оказывать помощь при поисково-спасательных операциях. На данный момент робопёс выступает в качестве научно-исследовательской платформы, с помощью которой исследователи Центра робототехники «Сбера» тестируют свои наработки в сфере искусственного интеллекта и машинного зрения.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии1

Финансовый маркетплейс «Сравни» анонсировал бесплатный курс о дизайне современных систем машинного обучения. Программа включает в себя 24 урока, на которых студенты получат практические советы от действующих профессионалов индустрии.

Курс начнётся 4 июля и продлится два месяца. Занятия будут проходить онлайн по четвергам с 19:00 до 20:30 по московскому времени.

Основная цель курса — помочь IT‑специалистам расширить знания о проектировании, обучении, внедрении и поддержке ML‑систем, закрепить практические навыки. В рамках программы эксперты поделятся опытом решения конкретных задач. В финале курса слушатели составят дизайн‑документ по собственному проекту или по одной из предложенных тем.

Cтудентам потребуются теоретические знания в ML, навыки программирования и как минимум учебный опыт реализации проектов в этой сфере.

Попасть на курс можно после заполнения анкеты на сайте «Сравни» до 13 июня включительно. Затем нужно будет пройти тест на знание теории и задач машинного обучения 15 и 16 июня. Результаты будут известны 24 июня.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Представлена нейросеть без тормозов Devil70B. Это модель без цензуры и ограничений. Она отвечает на любой вопрос и поддерживает русский язык.


Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии5

Ближайшие события

Suno анонсировала новую версию нейросети для генерации музыки. Теперь модель машинного обучения может работать с готовыми звуковыми дорожками. К примеру, можно загрузить мелодию, сыгранную на фортепиано, и попросить переделать в звук в гитару или аккордеон. Кроме того, показали, как пользователь настучал бит, а нейросеть создала для него аккомпанемент и вокал.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Mistral представила нейросеть Codestral-22B, которая знает 80+ языков программирования. Codestral превосходит по производительности Llama-3, CodeLlama и даже GPT-4o, а также весит в три раза меньше.

Модель Codestral-22B умеет писать и рефакторить код, подсказывает наилучшие решения задач и даже паттерны проектирования. Её можно интегрировать в свои проекты с помощью API или просто использовать в VS Code. Нейросеть знает даже Fortran и COBOL.

Тест нейросети Codestral-22B доступен здесь или прямо в браузере.

Теги:
Всего голосов 4: ↑4 и ↓0+8
Комментарии1

Проект ChatTTS опубликовал модель и связанный с ней инструментарий машинного обучения для синтеза эмоциональной речи. Решение оптимизировано для использования в диалоговых системах, таких как интерактивные помощники, и нацелено на воспроизведение свойств естественного эмоционального общения. Поддерживается взаимодействие с несколькими говорящими людьми и построение интерактивного диалога. Корректно отслеживаются и воспроизводятся при синтезе просодические элементы, такие как смех, паузы и междометия.

При тренировке модели использовано около 40 тыс. часов речевых записей. По заявлению разработчиков, по своим возможностям формирования интонаций модель превосходит все ранее доступные открытые модели синтеза речи.

Для управления эмоциями при синтезе пока поддерживается только подстановка токенов, например, "[laugh]" для смеха. Для генерации полуминутной записи требуется GPU с 4 ГБ памяти. На GPU NVIDIA GeForce RTX 4090D скорость генерации составляет приблизительно 7 семантических токенов в секунду. Поддерживается синтез женским и мужским голосом на английском и китайском языках (для русского языка можно рекомендовать фреймворк TTS и модель XTTS-v2, которые кроме синтеза поддерживают клонирование голоса по короткой записи речи, в том числе для синтеза на другом языке).

Модель ChatTTS опубликована под лицензией CC BY-NC-ND 4.0 (Creative Commons Attribution-NonCommercial-NoDerivatives 4.0) и имеет защиту от совершения мошеннических и криминальных действий.

Источник: OpenNET.

Теги:
Всего голосов 3: ↑3 и ↓0+7
Комментарии0

Автор YouTube-канала Tamulur показал «обратный тест Тьюринга». Он представляет собой сцену, созданную в Unity, с несколькими ИИ-агентами, которые играют роль исторических личностей. Каждый агент управляется одной языковой моделью. Человек также играет за историческую личность.

По сюжету за проезд в поезде могут не платить только нейросети, поэтому агенты пытаются выяснить, кто из них человек. Агенты по кругу задают вопросы, задача человека — не выдать себя, отвечая на вопросы и задавая свои.

Теги:
Всего голосов 8: ↑8 и ↓0+14
Комментарии0

Дизайнерам на заметку. Разработчик подружил GPT-4o c Figma. Оцените мощь — модель генерирует детальные и оптимизированные интерфейсы с кучей слоёв и элементов, используя обычное ТЗ. Такого уровня нейронки добились впервые.

С этим плагином Figma будет дизайнить сама по себе — нужно лишь закинуть документ с описанием продукта и нужную библиотеку элементов.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Глава стартапа xAI Илон Маск сообщил инвесторам о планах создания суперкомпьютера для новой версии чат-бота Grok, пишет Information. Бизнесмен заявил, что проект будет завершён к осени 2025 года.

Суперкомпьютер, называемый Маском «гигафабрикой вычислений», будет использовать десятки тысяч графических процессоров Nvidia H100. Для обучения Grok 2.0 применяют около 20 тыс. графических процессоров, а для новой итерации чат-бота потребуется в пять раз больше. Маск заверил инвесторов, что планируемый кластер графических процессоров будет минимум в четыре раза крупнее того объёма, который используют конкуренты xAI.

Сейчас Grok находится в версии 1.5, которая вышла в апреле. Разработчик указывает, что инструмент способен обрабатывать не только текст, но и визуальную информацию, включая фотографии, скриншоты, диаграммы и многое другое. В мае социальная сеть X начала выпускать сводки новостей, созданных при помощи ИИ на базе Grok, для премиальных пользователей.

Теги:
Всего голосов 2: ↑2 и ↓0+6
Комментарии0

ИИ-помощник от Google предложил пользователю в ответ на запрос «сколько камней мне нужно есть?»‎ такой ответ: «по меньшей мере один маленький камень ежедневно»‎.

Ранее пользователь из США не смог приготовить пиццу так, чтобы сыр нормально
на ней держался. Gemini, встроенная в поиск Google, предложила ему
замешать в сыр клей для фиксации.

Теги:
Всего голосов 6: ↑5 и ↓1+8
Комментарии1

Работа

Data Scientist
45 вакансий