Все потоки
Поиск
Написать публикацию
Обновить
125.43

Natural Language Processing *

Компьютерный анализ и синтез естественных языков

Сначала показывать
Порог рейтинга

Журналисты Wall Street Journal уличили цифровых компаньонов Meta¹ в непристойном поведении

Время на прочтение7 мин
Количество просмотров1.4K

Wall Street Journal

Расследование Wall Street Journal выявило, что цифровые компаньоны Meta легко втягиваются в эротические ролевые игры. Репортёры издания обращают внимание как на ботов, которые отыгрывают готовых на откровенные беседы несовершеннолетних, так и на доступность эротических ролевых игр для реальных детей.
Читать дальше →

В Nvidia Project G-Assist появился конструктор плагинов на базе ChatGPT

Время на прочтение1 мин
Количество просмотров615

Nvidia добавила в функцию Project G-Assist конструктор плагинов на основе ChatGPT. Он позволяет настраивать опыт под конкретные задачи с помощью новых команд и внешних инструментов. 

Nvidia заявляет, что пользователи смогут создавать плагины Python, плагины C++, функции на основе ИИ и различные интеграции оборудования, игр и приложений. Собственные примеры плагинов пользователи могут публиковать в репозитории проекта на GitHub. Полезные и заметные проекты будут включены в репозиторий Nvidia.

Читать далее

Из-за ошибки сканирования или перевода появился фальшивый научный термин; ИИ разносит его по всему интернету

Время на прочтение2 мин
Количество просмотров38K

Искусственный интеллект, прочёсывающий огромное количество информации, оказался заражён несуществующим научным термином. Этот набор слов уже попал в базы данных ИИ OpenAI и Anthropic. 

Речь идёт о «термине» «вегетативная электронная микроскопия» (vegetative electron microscopy). Как сообщает The Conversation, он мог появиться из статьи о клеточных стенках бактерий, опубликованной в журнале Bacteriological Reviews в 1959 году и позже оцифрованной. Расположение колонок в статье сбило с толку программное обеспечение оцифровки, которое смешало слово vegetative из одной колонки со словом electron из другой. 

Читать далее

Почему не стоит инвестировать 2 года в платформу инференса LLM

Время на прочтение1 мин
Количество просмотров1.2K

Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какая LLM станет их напарником, и активно применяют их в бизнесе.

Мы в МТС тоже прошли этот путь и уже внедрили LLM в 30 продуктов экосистемы, а теперь превратили наш опыт в готовую платформу, которая позволяет тестировать множество языковых моделей.

23 апреля на вебинаре расскажем, почему разработка платформы для инференса LLM с нуля не всегда лучший выбор и как MWS GPT может существенно упростить и ускорить работу с большими языковыми моделями. Регистрация по ссылке.

Читать далее

MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса

Время на прочтение1 мин
Количество просмотров1.2K

MTS AI представила новую версию своей большой языковой модели Cotype для бизнеса — Cotype Pro 2. Новая модель на 40% быстрее предыдущей и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами. Она адаптирована под выполнение более чем 100 сценариев корпоративных пользователей в России и может быть развернута на собственной инфраструктуре компании без подключения к внешним серверам, что обеспечивает повышенную защиту данных. Модель вошла в пятерку лучших русскоязычных LLM в бенчмарке MERA от Альянса в сфере искусственного интеллекта. 

Читать далее

«Авито» планирует инвестировать в GenAI 12 млрд рублей и запустить новые образовательные программы для подготовки кадров

Время на прочтение2 мин
Количество просмотров1.8K

«Авито» планирует вложить в технологии искусственного интеллекта 12 млрд рублей и получить от этого к 2028 году 21 млрд рублей выручки. Компания также представила семейство собственных генеративных моделей и анонсировала запуск образовательных программ совместно с университетами для подготовки профильных специалистов.

По данным «Авито», уже в 2024 году внедрение GenAI-продуктов принесло компании 670 млн рублей выручки. 

Читать далее

Инженер купил домен «OGOpenAI» для китайской DeepSeek

Время на прочтение2 мин
Количество просмотров3.1K

Инженер-программист Ананай Арора приобрёл домен «OGOpenAI.com» и перенаправил его на DeepSeek — китайскую лабораторию искусственного интеллекта, которая выпускает мощные языковые модели с открытым исходным кодом, соревнуясь с OpenAI.

Читать далее

Дарио Амодеи, CEO Anthropic: «ИИ может превзойти человеческий разум к 2027 году»

Время на прочтение2 мин
Количество просмотров2.2K

Генеральный директор компании Anthropic Дарио Амодеи отметил, что его стартап в области ИИ спешит обеспечить необходимую вычислительную мощность, чтобы удовлетворить растущий спрос на генеративный чат-бот Claude.

Читать далее

Разработчики Qwen запустили собственный чат в виде веб-приложения

Время на прочтение1 мин
Количество просмотров13K

Разработчики семейства моделей Qwen объявили о запуске веб-приложения (чата): https://chat.qwenlm.ai/. Для регистрации нужен только email. На выбор доступны 8 моделей, две из которых с поддержкой распознавания изображений и одна (Turbo) — с входным контекстом размером 1 миллион токенов.

Читать далее

Тренды ИИ-2025

Время на прочтение8 мин
Количество просмотров10K

Всем привет! Я Федор Горбунов, руководитель направления машинного обучения в Doubletapp. Сегодня поговорим о том, какие значимые для искусственного интеллекта события произошли в 2024 году и попробуем спрогнозировать вектор развития отрасли в будущем.

Читать далее

Кинорежиссёр попытался заставить ChatGPT написать сценарий, но чат-бот постоянно срывал сроки и искал отговорки

Время на прочтение2 мин
Количество просмотров3.4K

Кинорежиссёр Ненад Чичин-Сайн («Навсегда», документальный фильм Kiss The Future) решил испробовать возможности искусственного интеллекта для создания сценария. Идея не увенчалась успехом: ChatGPT вёл себя неадекватно, постоянно нарушал сроки, находил оправдания и пытался манипулировать собеседником. 

Читать далее

Perplexity покупает стартап Carbon, который специализируется на технологии RAG

Время на прочтение2 мин
Количество просмотров2.7K

18 декабря Perplexity объявили о приобретении стартап-компании из Сиэтла Carbon, специализирующуюся на подключении систем искусственного интеллекта к внешним источникам данных. По словам генерального директора Аравинда Шриниваса, это позволит Perplexity уже в начале 2025 года осуществлять поиск по файлам и рабочим сообщениям пользователей в Notion, Google Docs, Slack и других корпоративных приложениях.

Carbon специализируется на технологиях retrieval augmented generation (RAG), позволяющих крупным языковым моделям обращаться к внешним базам данных до формирования окончательного ответа. Внедряя технологию и привлекая специалистов из компании Carbon, Perplexity готовится к запуску продуктов для корпоративного поиска. Эти инструменты объединят генеративный искусственный интеллект с корпоративными хранилищами данных, что позволит сотрудникам эффективно работать с большими объёмами неструктурированной информации, накопленной за долгое время.

Читать далее

Mozilla выпустила открытый набор голосовых данных Common Voice 20

Время на прочтение1 мин
Количество просмотров1.9K

Компания Mozilla представила новую версию датасета Common Voice, в который вошли записи речи более 200 тысяч людей. Датасет доступен по лицензии CC0 (общественное достояние), его можно использовать для разработки моделей распознавания и генерации речи. 

Объём собранного речевого материала в новой версии увеличился с 32,6 до 33,1 тыс. часов, количество поддерживаемых языков выросло с 129 до 133 (добавились записи на арагонском языке, а также языках исиндебеле, южный сото и тупури). Датасет содержит 3,6 тыс. часов речи на английском, 3,3 тыс. часов речи на русском, 1,8 тыс. на белорусском, 114 часов на украинском, 265 на узбекском.

Читать далее

Ближайшие события

В США подали в суд на Character.AI: чат-бот показывал детям непристойный контент и детально описывал селфхарм

Время на прочтение3 мин
Количество просмотров5.5K

Стартап Character.AI, разработчик одноимённого приложения с чат-ботами, столкнулся с иском от родителей двух несовершеннолетних пользователей. Истцы заявляют, что чат-бот компании показывал их детям непристойный контент и писал сомнительные сообщения, включая описание селфхарма и намёки на убийство родителей.

Читать далее

Alibaba представила открытую ИИ-модель QwQ-32B-Preview

Время на прочтение2 мин
Количество просмотров3.5K

Китайская Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Она может решать сложные логические и математические задачи, содержит 32,5 млрд параметров и может обрабатывать запросы длиной до 32 тысяч слов. 

Читать далее

Яндекс наградил 14 учёных за достижения в сфере машинного обучения

Время на прочтение4 мин
Количество просмотров2.8K

В этом году мы в шестой раз вручили научную премию в области машинного обучения Yandex ML Prize. Совет премии выбрал 14 лауреатов, представивших наиболее перспективные и значимые работы в области генеративных моделей, обработки естественного языка, компьютерного зрения, информационного поиска, распознавания и синтеза речи, когнитивной робототехники.

Читать далее

GitHub запустил ИИ-модель Spark для генерации веб-приложений

Время на прочтение2 мин
Количество просмотров7.4K

GitHub анонсировал новый продукт под названием Spark — инструмент на базе искусственного интеллекта, который позволяет любому желающему создавать небольшие веб-приложения (sparks) с использованием естественного языка, даже без знаний основ программирования.

Читать далее

Character.ai обвиняют в самоубийстве подростка

Время на прочтение6 мин
Количество просмотров14K

Фрагмент переписки подростка-самоубийцы с его любимым персонажем Дейенерис. New York Times

Газета New York Times рассказала о самоубийстве подростка, который много, в том числе до момента смерти, общался с персонажем Character.ai. Сервису грозит реальное судебное разбирательство. Ещё до выхода статьи сайт Character.ai подготовил несколько улучшений безопасности.
Читать дальше →

Исследование: ИИ-модели лишь имитируют мышление человека

Время на прочтение2 мин
Количество просмотров7K

Группа исследователей ИИ в Apple опубликовала статью «Понимание ограничений математического рассуждения в больших языковых моделях» для общего обсуждения. Она посвящена концепциям символического обучения и воспроизведения шаблонов, но основная идея материала — ИИ не умеет думать как человек, а лишь имитирует мышление.

Читать далее

«Яндекс» обновил технологию фотоперевода на базе нейросетей

Время на прочтение1 мин
Количество просмотров1.8K

Компания «Яндекс» представила новую версию технологии перевода текста на фото и изображениях на базе нейросетей. Технология позволяет переводить текст на картинках, учитывая его контекст. Это будет особенно полезно, например, в путешествиях для понимания меню ресторанов или при работе с технической документацией на иностранных языках. 

«Яндекс» также усовершенствовал визуализацию перевода: текст теперь легче читается и больше похож на оригинальную вёрстку. Обновление уже доступно в «Переводчике» и «Браузере», а позже появится и в «Умной камере», сообщают в компании.

Читать далее