Машинное обучение *

Основа искусственного интеллекта

29 мая 2024 в 14:046.2K

Машинное обучение * Искусственный интеллектЗвук

Проект ChatTTS опубликовал модель и связанный с ней инструментарий машинного обучения для синтеза эмоциональной речи. Решение оптимизировано для использования в диалоговых системах, таких как интерактивные помощники, и нацелено на воспроизведение свойств естественного эмоционального общения. Поддерживается взаимодействие с несколькими говорящими людьми и построение интерактивного диалога. Корректно отслеживаются и воспроизводятся при синтезе просодические элементы, такие как смех, паузы и междометия.

При тренировке модели использовано около 40 тыс. часов речевых записей. По заявлению разработчиков, по своим возможностям формирования интонаций модель превосходит все ранее доступные открытые модели синтеза речи.

Для управления эмоциями при синтезе пока поддерживается только подстановка токенов, например, "[laugh]" для смеха. Для генерации полуминутной записи требуется GPU с 4 ГБ памяти. На GPU NVIDIA GeForce RTX 4090D скорость генерации составляет приблизительно 7 семантических токенов в секунду. Поддерживается синтез женским и мужским голосом на английском и китайском языках (для русского языка можно рекомендовать фреймворк TTS и модель XTTS-v2, которые кроме синтеза поддерживают клонирование голоса по короткой записи речи, в том числе для синтеза на другом языке).

Модель ChatTTS опубликована под лицензией CC BY-NC-ND 4.0 (Creative Commons Attribution-NonCommercial-NoDerivatives 4.0) и имеет защиту от совершения мошеннических и криминальных действий.

Источник: OpenNET.

daniilshat

28 мая 2024 в 23:2011K

Машинное обучение * Искусственный интеллектИгры и игровые консоли

Автор YouTube-канала Tamulur показал «обратный тест Тьюринга». Он представляет собой сцену, созданную в Unity, с несколькими ИИ-агентами, которые играют роль исторических личностей. Каждый агент управляется одной языковой моделью. Человек также играет за историческую личность.

По сюжету за проезд в поезде могут не платить только нейросети, поэтому агенты пытаются выяснить, кто из них человек. Агенты по кругу задают вопросы, задача человека — не выдать себя, отвечая на вопросы и задавая свои.

+14

denis-19

28 мая 2024 в 18:259.5K

Машинное обучение * Облачные сервисы * ДизайнИскусственный интеллектСоциальные сети

Дизайнерам на заметку. Разработчик подружил GPT-4o c Figma. Оцените мощь — модель генерирует детальные и оптимизированные интерфейсы с кучей слоёв и элементов, используя обычное ТЗ. Такого уровня нейронки добились впервые.

С этим плагином Figma будет дизайнить сама по себе — нужно лишь закинуть документ с описанием продукта и нужную библиотеку элементов.

Travis_Macrif

26 мая 2024 в 11:356.8K

Машинное обучение * Искусственный интеллект

Глава стартапа xAI Илон Маск сообщил инвесторам о планах создания суперкомпьютера для новой версии чат-бота Grok, пишет Information. Бизнесмен заявил, что проект будет завершён к осени 2025 года.

Суперкомпьютер, называемый Маском «гигафабрикой вычислений», будет использовать десятки тысяч графических процессоров Nvidia H100. Для обучения Grok 2.0 применяют около 20 тыс. графических процессоров, а для новой итерации чат-бота потребуется в пять раз больше. Маск заверил инвесторов, что планируемый кластер графических процессоров будет минимум в четыре раза крупнее того объёма, который используют конкуренты xAI.

Сейчас Grok находится в версии 1.5, которая вышла в апреле. Разработчик указывает, что инструмент способен обрабатывать не только текст, но и визуальную информацию, включая фотографии, скриншоты, диаграммы и многое другое. В мае социальная сеть X начала выпускать сводки новостей, созданных при помощи ИИ на базе Grok, для премиальных пользователей.

denis-19

24 мая 2024 в 06:116.5K

Поисковые технологии * Машинное обучение * Искусственный интеллектЗдоровьеБудущее здесь

ИИ-помощник от Google предложил пользователю в ответ на запрос «сколько камней мне нужно есть?»‎ такой ответ: «по меньшей мере один маленький камень ежедневно»‎.

Ранее пользователь из США не смог приготовить пиццу так, чтобы сыр нормально
на ней держался. Gemini, встроенная в поиск Google, предложила ему
замешать в сыр клей для фиксации.

denis-19

23 мая 2024 в 12:229.1K

Поисковые технологии * Машинное обучение * Искусственный интеллектЗдоровьеБудущее здесь

ИИ-помощник от Google предложил пользователю поесть нетоксичного клея.

Пользователь из США не смог приготовить пиццу так, чтобы сыр нормально на ней держался. Gemini, встроенная в поиск Google, предложила ему замешать в сыр клей для фиксации.

Разгадка у казуса оказалась простая: нейросеть нашла ответ по этому запросу из поста какого-то тролля с Reddit 11-летней давности. Примечательно, что такие ИИ-ответы теперь идут в верху выдачи сервиса Google.

kamaisha

23 мая 2024 в 08:455.3K

Блог компании КриптонитТерминология ITМашинное обучение * Искусственный интеллект

В анализе видеопотока с помощью ИИ выделяют два подхода. Первый из них называется обработкой разреженного (sparse) видео. Он решает задачу предсказания одного результата по анализу видеофрагмента (массива кадров).

Второй подход решает задачу предсказания одного результата на кадр. Такую покадровую обработку называют анализом плотного (dense) видео. Модели ML для работы с плотным видео востребованы там, где требуется уловить кратковременные события и проанализировать быстрые изменения сцен.

❗️Существующие модели глубокого анализа видео (например, 3D CNNs) достигли впечатляющих результатов при обработке разреженного видео. Однако их адаптация к задачам плотного видео сопряжена с рядом проблем.

В частности, эти модели менее эффективны при работе с избыточными кадрами, с трудом улавливают временные корреляции на больших интервалах и неоправданно дороги в развёртывании.

Чтобы решить эти проблемы, коллектив исследователей из Белфаста (Ирландия) разработал TDViT — модель трансформера для обработки плотного видео с блоками временнóго расширения.

Эксперименты с наборами данных ImageNet VID и YouTube VIS показали, что TDViT эффективно извлекает пространственно-временны́е представления и ослабляет негативный эффект временнóй избыточности. Также иерархическая структура блоков позволяет моделировать динамику на больших временных интервалах.

Код TDViT открыт и доступен на GitHub

veseluha

23 мая 2024 в 05:365.6K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Mistral-7B-v0.3 доступна на HuggingFace

Изменения в Mistral-7B-v0.3 по сравнению с предыдущими версиями:

Увеличен словарь до 32768 слов;
Добавлена поддержка более новой версии токенизатора v3;
Модель теперь поддерживает вызов функций;
Apache 2.0 лицензия.

Hugging Face Base Model

Hugging Face Instruct Model

denis-19

22 мая 2024 в 19:147.2K

Программирование * Машинное обучение * Управление разработкой * Искусственный интеллект

Сервис «Сбера» GigaCode стал лучшим ИИ-сервисом по точности предсказывания кода разработки среди зарубежных аналогов. Тестирование проводилось на большом количестве файлов с кодом, сообщила пресс-служба «Сбера».

«Эксперты „Сбера“ провели обширное тестирование различных ИИ‑ассистентов разработчика на более чем 17 тыс. файлов с кодом, в ходе которого сервисам предлагалось продолжить фрагмент исходного кода, и производился замер того, насколько точно предсказывается его следующая строка. Результаты показали, что по интегральной доле верно предсказанного кода на языке Java сервис GigaCode показал результат на 2% лучше, чем GitHub Copilot, и на 3% и 6,5% лучше, чем Codeium и TabNine», — рассказал старший вице‑президент, руководитель блока «Технологическое развитие» «Сбера» Андрей Белевцев.

В процессе тестирования исследователями замерялась доля кода, предсказанного ИИ-ассистентами, при этом учитывались не только случаи полного совпадения строки, а также и случаи, в которых была удачно предсказана часть, принимались во внимание также частота и стабильность выдачи подсказок.

Сервис GigaCode помогает в режиме реального времени по фрагменту кода сгенерировать наиболее вероятные его продолжения непосредственно в среде
разработки. Решение поддерживает более 15 языков программирования (Java, Python, JavaScript, TypeScript, C/C++ и другие), а также совместимо со множеством редакторов и интегрированных сред (IDEA, PyCharm, VSCode, Jupyter и другие).

ilomov

21 мая 2024 в 10:498.3K

Блог компании Островок!Data Mining * Машинное обучение * Карьера в IT-индустрииData Engineering *

Привет! Меня зовут Ильдар Ломов. Расскажу, чем занимаются ML-инженеры в Островке. Знаю об этом всё, я сам руководитель команды Data Science.

Сейчас портфель ML-проектов Островка —12 штук в нескольких направлениях: от продуктового ML (ранжирование, рекомендации), до больших языковых моделей.

Состав команды стандартный: ML-инженер, бизнес-аналитик, проджект, продакт. Опционально тимлиды и разработчики.

Работа ML-инженера в Островке — посередине между стартапом с его моделью в jupyter-ноутбуке и корпорацией, где работа с сотнями моделей упорядочена, стандартизирована, вшита в интерфейсы. Можно поработать над серьезным проектом гибко с разнообразием инструментов.

Идеал — проактивный человек, который протащит проект от исследования до прода и покрытия метриками. Важно понимать все этапы проекта, иметь усиленный скилл хотя бы на одном из них, с остальным поможет команда.

Нужно уметь покрывать метриками, следить за проектом на проде, чтобы тот не потерял смысл из-за нестыковок в ТЗ. И работал так, как задумано.

Частые итерации, проверки гипотез и новых технологий дают нашему ML-инженеру больший кругозор в сравнении с крупными компаниями. Специалист растет с технической и бизнесовой сторон.

Работа оценивается с точки зрения влияния на бизнес, инженер видит, как проекты прямо и понятно воздействуют на бизнес-метрики.

Это то, что мы всегда хотим видеть в кандидатах, но на рынке такого не много. Чем виднее на собеседованиях, что человек понимает бизнес-сторону, тем больше он нам подходит.

SomeEditor

21 мая 2024 в 07:314.9K

Блог компании Yandex Cloud & Yandex InfrastructureМашинное обучение * КонференцииОблачные сервисы *

ML против токсичности, чат‑бот «пИИрожок» — и ещё более 10 кейсов внедрения технологий машинного обучения на конференции ML2Business.

29 мая в 14:00 приглашаем на ML2Business — первую конференцию от Yandex Cloud, посвящённую кейсам применения GenAI, NLP, CV и других технологий ML.

Мы поговорим о сложностях внедрения моделей машинного обучения и способах интеграции ML в процессы компаний, а также об оценке реальной пользы для бизнеса. Будет интересно и полезно как ИТ‑руководителям, так и ML‑экспертам — присоединяйтесь к нам в пространстве LOFT#2 в Москве или подключайтесь онлайн.

В программе

как YandexGPT меняет привычные процессы работы колл‑центра;
зачем внедрять нейросети для категоризации запросов в техподдержку;
как улучшить качество сервиса для знакомств благодаря модерации контента с помощью ML‑технологий;
что умеют современные виртуальные рекрутёры с функцией RPA;
как чат‑боты помогают покупателям подбирать товары на основании их предпочтений;
как улучшить поиск информации по внутренней «википедии» с помощью ассистента на базе YandexGPT API и Yandex DataSphere;
и ещё несколько практических примеров от компаний из разных отраслей.

Участники также могут поучаствовать в нетворкинге и тестировании ML‑сервисов в реальных бизнес‑сценариях на интерактивных площадках.

Участие бесплатное, количество мест ограничено. Регистрация открыта на сайте конференции.

daniilshat

20 мая 2024 в 22:407.9K

Проектирование API * Машинное обучение * Искусственный интеллект

Google сообщила разработчикам, что начинает взимать плату за использование Gemini API. С 30 мая 2024 года платным становится доступ к Gemini 1.5 Pro, с 14 мая плата будет взиматься за использование Gemini 1.0 Pro.

Вместе с этим компания ещё раз напомнила про более доступный тариф Gemini 1.5 Pro. В рассылке для разработчиков подчёркивается, что платным становится только доступ к языковой модели через API, в Google AI Studio с нейросетями можно будет работать бесплатно.

denis-19

20 мая 2024 в 08:035.4K

IT-инфраструктура * Машинное обучение * Облачные сервисы * Искусственный интеллект

«Инфосистемы Джет» создала сервис на основе языковой модели YandexGPT для автоматизации работы своего сервисного центра. За один месяц компания внедрила алгоритм на базе нейросети, который может определять тематику обращений в техническую поддержку и автоматически готовить ответы на запросы, помогая диспетчерам и инженерам работать оперативнее.

Специалисты по машинному обучению «Инфосистемы Джет» в рамках пилотного проекта разработали приложение, которое, используя внешнее хранилище документов, обращается к специально созданным базам знаний (например, к базе знаний операторов сервисного центра), реализует сценарии обработки запросов и генерирует релевантный ответ. База знаний «Инфосистемы Джет» содержит информацию обо всех кейсах, с которыми специалистам компании приходилось сталкиваться за последние 30 лет.

В рамках пилотного проекта инженерам удалось автоматизировать обработку 30% из 13000 запросов. При этом 75% этих ответов были полностью автоматическими и были одобрены специалистами без доработки. Таким образом, сервис снижает нагрузку на специалистов на 22%. Компания продолжит улучшать модель и планирует внедрить технологию в качестве постоянного вспомогательного инструмента для инженеров технической поддержки, чтобы существенно ускорить обработку запросов и качество ответов.

«Особенность проекта „Инфосистемы Джет“ в том, что компании удалось в сжатые сроки научить YandexGPT работать со сложной ИТ‑тематикой», — сообщил CPO YandexGPT API Алексей Долотов.

veseluha

20 мая 2024 в 06:525.3K

Блог компании BotHubМашинное обучение * ДизайнИскусственный интеллект

DeviantArt поддерживает AI вместо художников

https://x.com/romainrevert/status/1772921780933448139

Платформа для художников DeviantArt опубликовала в X пост о двух самых успешных продавцах иллюстраций в этом году: «Isaris-AI» и «Mikonotai». По информации, эти аккаунты заработали десятки тысяч долларов, продавая в большом количестве аватары с "пустыми" глазами в 3D, которые были созданы с помощью AI. Оказалось, что оба аккаунта являются ботами DeviantArt, созданными для генерации изображений с помощью искусственного интеллекта.

DeviantArt не проявил активности в решении возникших проблем: управляющие социальными сетями сайта удалили десятки критических ответов на твит, в котором рекламировался Mikonotai.

Пользователи соцсети обвинили владельцев в активной поддержке искусственного интеллекта в ущерб реальным авторам. Художники утверждают, что AI без их согласия был обучен на основе их работ, которые они размещали на сайте.

Сообществу не нравится текущая ситуация, которую они называют провалом DeviantArt. Некоторые авторы выразили свое несогласие с политикой администрации, удалив свои профили с сайта.

Это не первый раз, когда DeviantArt пытается внедрить новую технологическую "инновацию" и сталкивается с проблемами.

«Многие художники были возмущены с самого утра того дня, когда это было запущено. Они ожидали поддержки от сообщества художников, а не одобрения их действий. Это сильно подорвало доверие многих людей к DeviantArt»

Здесь можно прочитать больше.

denis-19

18 мая 2024 в 16:238.9K

Обработка изображений * Машинное обучение * КиберпанкИскусственный интеллектБудущее здесь

Соучредитель и технический директор OpenAI Грег Брокман опубликовал изображение, созданное недавно представленной GPT–4o.

«Изображение, сгенерированное GPT-4o — так много всего, что можно изучить, используя только возможности создания изображений GPT-4o. Команда усердно работает, чтобы представить их миру», — пояснил Брокман.

GPT-4o может воспринимать и генерировать звук, изображение и текст и будет доступна всем пользователям бесплатно.

denis-19

17 мая 2024 в 12:296.3K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллектФинансы в IT

МТС открывает в сентябре в Высшей школе экономики магистратуру по направлению «Исследования и предпринимательство в искусственном интеллекте». Об этом компания сообщила в ходе конференции True Tech Day.

Цель учебной программы — подготовка специалистов в области ИИ, которые будут создавать инновационные продукты. В ходе обучения студентам расскажут о больших языковых моделях, генеративных нейросетях, а также инструментах компьютерного зрения и распознавания естественного языка.

Магистратура от МТС по ИИ в Высшей школе экономики появится на факультете компьютерных наук. Финансирование со стороны МТС покрывает 100% стоимости обучения. Прием документов на программу продлится с 19 июня по 25 июля этого года.

«Преподавательский состав магистратуры будет состоять из ведущих специалистов факультета компьютерных наук ВШЭ и сотрудников МТС. Эксперты магистратуры поделятся реальными практическими кейсами в области ИИ, принципами работы моделей, расскажут о возможностях и нюансах их применения, укажут на риски, связанные с неправильной или некачественной обработкой данных», — отметил первый вице-президент по технологиям МТС Павел Воронин.

Первый проректор НИУ ВШЭ Леонид Гохберг заявил, что сегодня ИИ-инструменты затрагивают практически все отрасли экономики и являются драйверами цифрового развития страны. «Запуск совместной магистерской программы ВШЭ и МТС — это отличная возможность получить востребованную профессию», — добавил Гохберг.

denis-19

15 мая 2024 в 07:305.5K

Информационная безопасность * Машинное обучение * Облачные сервисы * Искусственный интеллектСотовая связь

С января этого года автоматический определитель номера «Яндекса» (АОН) зафиксировал 530 млн звонков с неизвестных номеров, в том числе в мессенджерах. Больше половины из них — 302 млн (57%) — АОН определил как нежелательные и предупредил о них пользователей. Почти 25 млн звонков АОН автоматически заблокировал тем пользователям, кто подключил эту функцию.

С начала года пользователи определителя номера «Яндекса» получили на 20% больше нежелательных звонков с незнакомых номеров, чем за тот же период прошлого года. Больше всего (на 19%) выросло количество звонков от мошенников. Предложений банковских услуг стало на 7% больше, а услуг страхования — на 5%. При этом звонков с предложением разного рода небанковских финансовых услуг стало на 38% меньше, а услуг связи — на 29% меньше.

Одна из популярных сейчас мошеннических схем, когда людям звонят от имени операторов сотовой связи и предлагают продлить договор, для чего просят назвать код из СМС. Другая схема — звонки в Viber или WhatsApp с номеров, похожих на телефоны известных компаний.

Автоматический определитель номера (АОН) доступен в приложении «Яндекс с Алисой». Система защищает пользователей от звонков с неизвестных номеров, чтобы они не тратили на них время. С помощью этой опции можно узнать, кто звонит, или заблокировать нежелательные звонки. АОН умеет блокировать звонки с рекламой финансовых услуг и нежелательные вызовы, в частности, от злоумышленников.

Lithium_vn

13 мая 2024 в 17:216.6K

Блог компании BotHubМашинное обучение * Искусственный интеллект

OpenAI представляет настольную версию ChatGPT и новую модель: GPT-4o

Сейчас в разгаре долгожданная презентация компании OpenAI, где она объявила о запуске новой модели искусственного интеллекта GPT-4o и настольной версии ChatGPT. Обновление делает GPT-4 доступным для всех пользователей, включая бесплатных.

По словам технического директора OpenAI Миры Мурати, GPT-4o является более мощной и быстрой моделью по сравнению с предыдущими версиями. Она в два раза быстрее и дешевле, а также способна работать с текстом, изображениями и аудио, а также различать интонацию в голосе.

Новая модель доступна для использования с сегодняшнего дня. Это значительный шаг вперед для OpenAI в развитии технологий искусственного интеллекта и расширении доступности своих продуктов для широкой аудитории.

couatl

13 мая 2024 в 10:559.9K

Блог компании ЯндексМашинное обучение * КонференцииNatural Language Processing * Голосовые интерфейсы *

Привет! 14 сентября мы вновь проведём Practical ML Conf — ежегодную конференцию Яндекса, посвящённую практическим аспектам применения ML-технологий. Сегодня мы открыли приём заявок для тех, кто хотел бы поделиться своим опытом и выступить с докладом.

Ключевые темы конференции в этом году: CV, RecSys, MLOps, NLP, Speech и Analytics. Мы ожидаем глубокие технические доклады и хотим поговорить о прикладных решениях, которые уже сейчас приносят пользу. Сбор заявок завершится 13 июля. Программный комитет примет решение об участии на основании критериев «полезность», «новизна», «сложность» и «практичность».

Кстати, если вы планируете посетить конференцию в качестве слушателя, то рекомендую зарегистрироваться уже сейчас. Мы хотим провести болею узкую встречу специалистов компании и гостей перед основной программой конференции. Приоритет в рассылке приглашений на этот закрытый ивент будет у тех, кто зарегистрировался раньше.

Предложить доклад, зарегистрироваться, найти более подробный таймлайн и доклады прошлого года — всё это можно на сайте конференции.

+12

veseluha

12 мая 2024 в 18:198.6K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Если вы скептически настроены в отношении автопилота Tesla, рекомендую вам ознакомиться с этим видео, способным изменить ваше мнение.

Этот ролик демонстрирует, что AI / Tesla FSD - ключ к безопасному и надежному вождению, сравнимому с человеческим.

Система преобразует изображения с камер и данные с карт в низком разрешении в управляющие сигналы. Она эффективно справляется с различными нестандартными дорожными ситуациями и проявляет повышенную осторожность вблизи пешеходов, улавливая даже незначительные сигналы их телодвижений, чтобы предугадать их действия.

Такое поведение системы обусловлено обучением на миллионах часов видеозаписей. Система научилась интерпретировать дорожную обстановку так же, как это делает человек, и адаптироваться к неожиданным ситуациям.

В отличие от устаревших систем, основанных на тысячах правил и определений, FSD обеспечивает впечатляющее качество вождения.

Ожидается, что FSD достигнет полной функциональности в текущем году и будет одобрена в следующем.

1 2 ...

26 27

29 30 ...

34 35

Машинное обучение *

Ближайшие события

Вклад авторов