Крупные технологические компании, включая Microsoft, Amazon и Google, намерены вложить около $1 трлн в развитие искусственного интеллекта. Значительная часть этих затрат обусловлена расчётом, что генеративный ИИ станет следующей крупной технологией, которая сможет изменить многие отрасли, как это ранее сделали облачные вычисления, пишет Business Insider.
Машинное обучение *
Основа искусственного интеллекта
Новости
Mozilla разрабатывает функцию локального перевода аудио в текст
Команда Mozilla Ocho, которая разрабатывает экспериментальные функции браузера Firefox, сейчас занимается технологией локального перевода аудио в текст. Проект построен на базе Llamafile — другой разработки Mozilla, предназначенной для простого распространения моделей машинного обучения в виде всего одного файла.
Microsoft выпустила семейство моделей Phi-3.5, которые превосходят конкурирующие ИИ-модели
Microsoft выпустила семейство моделей искусственного интеллекта Phi-3,5, которая включает Phi-3.5-vision, Phi-3,5-MoE и Phi-3.5-mini. Все они построены на основе синтетических данных и отфильтрованных общедоступных сайтов. Линейка ИИ-моделей поддерживает контекст длиной 128 тыс. токенов. Три модели доступны на платформе Hugging Face по лицензии MIT.
Второе место на Data Fusion Contest 2024
В начале апреля завершилось ежегодное соревнование по машинному обучению с призовым фондом в 2 миллиона рублей — Data Fusion Contest 2024. Основных задач было две, и команда наших аналитиков-исследователей из Лаборатории ИИ заняли второе место в решении задачи по моделям оттока!
Истории
Нейросети помогли «Яндексу» заблокировать 197 тыс. рекламных аккаунтов мошенников за полгода
За первую половину 2024 года «Яндекс» заблокировал 197 тыс. аккаунтов недобросовестных рекламодателей, которые пытались разместить объявления в «Директе». Это на треть больше, чем в предыдущем полугодии. Определять мошенников «Яндексу» помогают нейросети. Они учитывают более тысячи различных признаков того, как рекламодатели размещают свои объявления, рассказали Хабру в компании.
Релиз Ideogram 2.0
21 августа 2024 года состоялся релиз Ideogram 2.0. Проект позволяет выполнять генерации читаемого текста внутри изображения, например, надписей на знаках и логотипах, а также умеет создавать типографику в разных цветах, шрифтах, размерах и стилях (3D-рендеринг, кинематографический стиль, живопись, иллюстрации, концептуальное искусство и другие направления).
Midjourney запустила веб-приложение для генерации изображений
Разработчики Midjourney запустили веб-приложение для генерации и редактирования изображений. Кроме того, пользователям вернули доступ к бесплатному пробному режиму, который позволяет создать 25 изображений.
Nvidia «оживит» NPC в игре Mecha Break с помощью нейротехнологии ACE
Nvidia сообщила в блоге, что первой игрой с поддержкой нейротехнологии ACE (Avatar Cloud Engine) станет Mecha Break, релиз которой запланирован на 2025 год. С его помощью диалоги для NPC будут генерироваться с помощью небольшой языковой модели.
Alibaba представила мультимодальную нейросеть, которая может за четыре секунды проанализировать двухчасовое видео
Инженеры китайской компании Alibaba представили мультимодальную модель машинного обучения mPLUG-Owl3. С её помощью можно анализировать текст, изображения и видео. Разработчики делают упор именно на скорость работы нейросети, отмечая, что на обработку двухчасового видео уйдёт всего четыре секунды.
Авторы подали в суд на Anthropic за обучение ИИ с использованием пиратских книг
Языковая модель GPT-4o теперь открыта для файнтюнинга
OpenAI сообщила, что теперь разработчики могут дообучать языковую модель GPT-4o на собственных данных. Это позволит адаптировать нейросеть под специфические сценарии использования. Доступ к файнтюнингу открыт для всех платных тарифных планов. Кроме того, 1 млн бесплатных токенов для обучения в день до 23 сентября могут получить все корпоративные пользователи.
Aider: большие языковые модели хуже пишут код, если требовать ответ в формате JSON
В начале августа организация OpenAI представила улучшенные функции структурирования ответов своих больших языковых моделей. Обещалось, что теперь модели будут точнее следовать формату JSON в ответах. Проект Aider сравнил качество кода в различных форматах ответов и пришёл к выводу, что любые БЯМ пишут код лучше, если отвечать нужно в plain text.
Anthropic представила функцию кэширования запросов Claude для API
Разработчикам, использующим Anthropic API, стала доступна функция кэширования промптов. Благодаря этому можно сократить количество запросов напрямую к нейросети, снизить затраты до 90% и уменьшить задержки в ответах до 85%. Кэширование промптов пока доступно в публичной бета-версии Claude 3.5 Sonnet и Claude 3 Haiku. Также поддержка появится в Claude 3 Opus.
Ближайшие события
YandexGPT научат переводить текст с изображений, аудио- и видеофайлов
Нейросеть YandexGPT будут учить распознавать и переводить текст с изображений, аудио- и видеофайлов. Это следует из описания вакансии AI-тренера, опубликованной на сайте «Яндекса», пишут «Ведомости». Кандидат должен знать английский язык и обладать профессиональными навыками перевода, необходимыми для обучения больших языковых моделей. Представитель компании подтвердил, что «Яндекс» ищет AI-тренеров для улучшения текстовых переводов, но детали раскрыть отказался.
Google анонсировала Imagen 3 — нейросеть для генерации изображений по текстовому описанию
На портале arXive команда исследователей Google анонсировала модель машинного обучения Imagen 3, предназначенную для генерации изображений по текстовому описанию. Она заменит собой прошлую версию и будет доступна в сервисе ImageFX.
Свыше половины американских компаний из списка Fortune 500 считают ИИ угрозой для своего бизнеса
Порядка 56% крупнейших американских компаний из списка Fortune 500 заявили, что искусственный интеллект потенциально угрожает их бизнесу, пишет Financial Times со ссылкой на исследование корпоративных документов платформы Arize AI. Эта работа подчёркивает то, как новая технология может привести к масштабной промышленной трансформации. В 2022 году 9% компаний называли ИИ риском для своей деятельности.
Роботакси Waymo продолжают гудеть на парковках и поблизости, хотя разработчики выпустили против этого бага уже два фикса
Жители Сан-Франциско продолжают жаловаться, что роботакси Waymo по ночам гудят на подъездах к городским парковкам, когда сдают задним ходом, едут гуськом и паркуются или выезжают с паркинга. Это всё ещё происходит глубокой ночью, шум клаксонов, которыми роботакси сигналят другим роботакси, будит жителей Сан-Франциско и мешает людям спать.
Семья из Британии отравилась грибами, купив пособие для начинающих грибников, не зная, что книгу написала нейросеть
Семья из Британии отравилась грибами из-за информации от ChatGPT. Пострадавшие купили на Amazon недорогое пособие для начинающих грибников, не зная, что текст и картинки в книге создала нейросеть.
Специалисты из T-Bank AI Research создали новую архитектуру быстрых языковых моделей
Специалисты из лаборатории исследований искусственного интеллекта (ИИ) T‑Bank AI Research создали новую архитектуру быстрых языковых моделей. Об этом событии в компании рассказали Хабру. Нейросеть сокращает расходы на вычислительные мощности и ускоряет работу с длинным текстом. Разработчики проекта пояснили, что в перспективе это позволит шире применять языковые модели в бизнесе и поможет сократить выбросы парниковых газов за счёт меньшего энергопотребления.
В Geekbench появился тест производительности ИИ-систем на ПК
Geekbench представил новый тест производительности ИИ-систем на ПК под названием Geekbench AI. Это набор для бенчмаркинга с методологией тестирования для машинного обучения, глубокого обучения и рабочих нагрузок, ориентированных на ИИ, который предлагает кроссплатформенность и показатели реальной рабочей нагрузки.
Вклад авторов
ZlodeiBaal 1678.0snakers4 1607.0Leono 1346.8alizar 1318.2BarakAdama 1244.3stalkermustang 1006.03Dvideo 958.0averkij 771.0man_of_letters 723.0m1rko 694.0