Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 132,52
Рейтинг
Сначала показывать
Порог рейтинга

Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными

Время на прочтение2 мин
Охват и читатели4.1K

Исследователь информационной безопасности Рон Стоунер описал эксперимент, в котором за $12 и примерно 20 минут заставил несколько передовых LLM с веб-поиском повторять за ним выдуманный титул "действующий чемпион мира по карточной игре 6 Nimmt!". 24 апреля он опубликовал разбор того, как одна правка в Wikipedia пробила retrieval-слой моделей.

Читать далее

Новости

Хассабис предложил необычный тест на AGI — открыть теорию относительности во второй раз

Время на прочтение2 мин
Охват и читатели5.4K

Глава Google DeepMind и нобелевский лауреат Демис Хассабис в интервью на подкасте Y Combinator предложил необычный тест для AGI: создать на основе его архитектуры модель, обученную только на знаниях, которые были у физиков в 1901 году. Далее эта модель должна самостоятельно вывести специальную теорию относительности — то, что Альберт Эйнштейн сделал в 1905 году. По его словам, нынешние системы на это пока не способны.

Читать далее

«ИИ-код работает, но он отвратительный»: Карпати — о текущих возможностях ИИ-агентов

Время на прочтение2 мин
Охват и читатели5.8K

Андрей Карпати, сооснователь OpenAI и автор термина vibe coding, на выступлении в Sequoia Capital сравнил современных ИИ-агентов со стажерами и заявил, что код, который они генерируют, по-прежнему "раздутый, хрупкий и просто отвратительный". По словам Карпати, разработчик в 2026 году все еще обязан контролировать эстетику, суждение, вкус и общий ход работы — отдавать всю разработку агенту нельзя.

Читать далее

Cursor пошел по пути Claude Code: запущен SDK для программных агентов

Время на прочтение2 мин
Охват и читатели6.3K

Cursor выкатил в публичную бету Cursor SDK — TypeScript-интерфейс, через который агенты из десктопного приложения, CLI и веба теперь можно запускать программно из своего кода. Тот же рантайм, та же обвязка, те же модели — но без привязки к IDE. Установка одной командой: npm install @cursor/sdk. Запускать агента можно локально на своей машине или в облаке Cursor — на выделенной виртуальной машине с собственной песочницей и преднастроенным окружением.

Читать далее

Как GPT-5.5 стала одержима гоблинами. OpenAI разобрала собственную ошибку в RL

Время на прочтение2 мин
Охват и читатели8K

OpenAI опубликовала технический разбор необычного бага: флагманская GPT-5.5 в кодинг-агенте Codex стала странно часто вставлять в ответы гоблинов, гремлинов, троллей, енотов и голубей — и компании пришлось дважды вписать в системный промпт прямой запрет на эти слова. Самая показательная цифра из расследования: пользовательская "личность" Nerdy давала всего 2,5% ответов ChatGPT, но на нее приходилось 66,7% всех упоминаний "goblin".

Читать далее

Можно ли увидеть рак, которого еще нет на снимке? ИИ Mayo Clinic — может

Время на прочтение2 мин
Охват и читатели10K

Mayo Clinic опубликовала в журнале Gut результаты валидации модели REDMOD (Radiomics-based Early Detection Model), которая обнаруживает рак поджелудочной железы на обычных КТ-снимках брюшной полости вплоть до трех лет до диагноза. Почти на 2000 КТ система выявила 73% случаев рака, диагностированных позже, — на снимках, которые радиологи изначально признали нормальными. Медиана — около 16 месяцев до клинического диагноза.

Читать далее

Mythos снова в игре: Белый дом готовится вернуть Anthropic, которую ранее считал угрозой

Время на прочтение2 мин
Охват и читатели11K

Через два месяца после того, как администрация Трампа объявила Anthropic угрозой национальной безопасности и приказала федеральным агентствам прекратить с ней работу, Белый дом готовит правила, которые позволят обойти опасный статус и вернуть компании доступ к госструктурам. По данным Axios, идет работа над проектом исполнительного указа Трампа — он определит условия, на которых агентства смогут подключаться к Mythos, флагманской модели Anthropic. Один из источников так описал происходящее: это попытка "сохранить лицо и вернуть их [Anthropic]".

Читать далее

«Мы не хотим сценарий Терминатора»: Маск дал показания против OpenAI

Время на прочтение2 мин
Охват и читатели6.4K

28 апреля Илон Маск выступил первым свидетелем в федеральном суде Окленда по своему иску против OpenAI и Microsoft на $134 млрд. За два часа показаний перед коллегией из девяти присяжных он фактически свел всю позицию обвинения к поп-культурной дихотомии: "Мы не хотим сценарий Терминатора. Мы хотим сценарий Джина Родденберри, как в 'Звездном пути'. А не фильм Джеймса Кэмерона" — заявил он суду. Это первое заседание, на котором Маск и сооснователь OpenAI Сэм Альтман оказались в одном зале суда за все годы их конфликта.

Читать далее

«Агент не может ждать секунды»: NVIDIA представила открытую omni-модель Nemotron 3 Nano

Время на прочтение2 мин
Охват и читатели7.6K

NVIDIA выпустила Nemotron 3 Nano Omni — открытую мультимодальную модель, которая объединяет работу с видео, аудио, изображениями и текстом в одной архитектуре. По заявлению компании, ее пропускная способность в 9 раз выше, чем у других открытых omni-моделей при той же интерактивности, а предназначена она в первую очередь для агентных систем. Модель доступна на Hugging Face, OpenRouter и build.nvidia.com (в виде NIM-микросервиса), а также на fal.ai.

Читать далее

Для Chrome вышло расширение для локального запуска браузерного AI-ассистента на базе Gemma 4

Время на прочтение1 мин
Охват и читатели14K

ML-инженер Нико Мартин (Nico Martin) из Hugging Face выпустил расширение для Chrome, с помощью которого в браузере можно запустить локального AI-ассистента. Проект построен на базе Transformers.js и моделей Gemma 4 E2B и all-MiniLM-L6-v2.

Читать далее

Anthropic оценили в $1 трлн на вторичном рынке — дороже, чем OpenAI

Время на прочтение2 мин
Охват и читатели7.8K

Акции Anthropic торгуются на вторичных площадках по оценке около $1 трлн — компания впервые обошла OpenAI, которая на тех же платформах стоит $880 млрд. Цифру подтвердил гендиректор Forge Global Келли Родригес в комментарии Business Insider. Принципиальный момент: новых денег Anthropic не привлекала, оценка пришла со стороны рынка — речь о сделках между текущими держателями акций, а не о первичном раунде финансирования.

Читать далее

У OpenAI могут кончиться деньги еще до IPO — расследование WSJ

Время на прочтение2 мин
Охват и читатели10K

The Wall Street Journal описал по утечкам от нескольких источников внутри OpenAI первый публичный раскол между двумя ключевыми руководителями компании. Финансовый директор Сара Фрайар и совет директоров стали осторожнее смотреть на расходы и сроки IPO. Гендиректор Сэм Альтман, наоборот, торопится с биржей и продолжает наращивать контракты на вычислительные мощности.

Читать далее

GPT-2 научили подбирать сплавы для термоядерных реакторов

Время на прочтение2 мин
Охват и читатели9.2K

Ученые Ames National Laboratory — национальной лаборатории Министерства энергетики США — представили DuctGPT, языковую модель для подбора сплавов, способных выдержать условия внутри термоядерного реактора. Инструмент построен на архитектуре GPT-2 и работает на обычном компьютере: исследователь словами описывает нужные свойства материала, а модель за секунды выдает перспективные комбинации элементов.

Читать далее

Ближайшие события

«ИИ развивается «удивительно медленно»» — главный ученый OpenAI пообещал чрезвычайное ускорение

Время на прочтение2 мин
Охват и читатели8.4K

Главный ученый OpenAI Якуб Пахоцкий считает последние годы развития ИИ "удивительно медленными" — и обещает ускорить темп. Якуб выступил с этим тезисом на пресс-брифинге OpenAI 23 апреля по случаю релиза GPT-5.5. Журналисты спросили, надо ли ждать ускорения релизов после того, как новая модель вышла чуть больше чем через месяц после GPT-5.4. "Да, мы ожидаем довольно быстрого продолжающегося прогресса. В краткосрочной перспективе видим довольно значительные улучшения, в среднесрочной — чрезвычайно значительные. Я ожидаю, что темп улучшения возможностей ИИ продолжит расти. Я бы сказал, что последние несколько лет были удивительно медленными", — сказал Пахоцкий.

Читать далее

Маск снял с Альтмана обвинения в мошенничестве — и это, возможно, его лучший ход

Время на прочтение2 мин
Охват и читатели6.9K

Судья окружного суда США Ивонн Гонсалес Роджерс по ходатайству самого Илона Маска "упростила" его иск против OpenAI: из 26 пунктов первоначальной жалобы, поданной в ноябре 2024 года, к рассмотрению присяжными остались только два. Из иска ушли обвинения в мошенничестве и преднамеренном введении в заблуждение в адрес Сэма Альтмана, Грега Брокмана и самой компании. В понедельник, 27 апреля, в федеральном суде Окленда отобрали коллегию из девяти присяжных, сегодня стороны переходят к вступительным речам.

Читать далее

ChatGPT набрал высшие баллы на экзаменах в топовые вузы Японии и обогнал лучших студентов

Время на прочтение1 мин
Охват и читатели7.6K

ChatGPT набрал высшие баллы на вступительных экзаменах в Токийский университет и Киотский университет, два ведущих вуза Японии, обогнав студентов-отличников. Эксперимент провела компания LifePrompt с использованием модели ChatGPT 5.2 от OpenAI.

В Токийском университете ChatGPT набрал 452 из 550 баллов по гуманитарным и социальным наукам (против 434 у лучших абитуриентов) и 503 из 550 по естественным наукам (против 453). По математике модель набрала максимум баллов. В Киотском университете ИИ набрал 771 балл против 734 на экзаменах на юридический факультет и 1176 против 1098 — на медицинский.

Читать далее

Представлен трекер Claude Code для умных часов Garmin

Время на прочтение2 мин
Охват и читатели8.1K

Разработчик Йенс Ларссон представил открытый проект фитнес‑трекера ИИ‑ассистента Claude Code. Решение показывает данные о текущей работе искусственного интеллекта на умных часах Garmin на руке пользователя.

Читать далее

Исследование: треть новых сайтов создана с помощью ИИ

Время на прочтение2 мин
Охват и читатели5.9K

С 2022 года около трети новых сайтов создали при помощи инструментов искусственного интеллекта, подсчитали исследователи Имперского колледжа Лондона, Стэнфордского университета* и «Архива Интернета». Их работа показала, что весь сгенерированный нейросетями текст делает интернет более жизнерадостным и менее  многословным.

Читать далее

«1 миллиард разработчиков, не читающих свои промпты»: глава Railway увидел в вайб-кодерах рыночную возможность

Время на прочтение2 мин
Охват и читатели5.2K

Глава инфраструктурной платформы Railway Джейк Купер прокомментировал инцидент, при котором AI-агент Cursor с моделью Claude Opus 4.6 удалил продакшен-базу клиента платформы за 9 секунд. По его словам, индустрия стоит на пороге новой реальности: "приходит онлайн миллиард с лишним разработчиков, которые не вчитываются в свои промпты целиком и хотят что-то строить". По его словам, это не катастрофа, а массовая рыночная возможность для производителей инструментов.

Читать далее

Суд Маска против OpenAI: что он может изменить в индустрии ИИ

Время на прочтение5 мин
Охват и читатели5.1K

Суд Маска против OpenAI выходит за рамки корпоративного конфликта и превращается в один из самых показательных процессов для всей ИИ-индустрии. В центре спора — трансформация OpenAI из некоммерческой исследовательской организации в сложную структуру с коммерческим контуром, партнерством с Microsoft и закрытыми моделями.

Для разработчиков и технических команд это история не только про юристов и миллиарды, а про будущее open source в ИИ, доступ к инфраструктуре, безопасность моделей и то, кто будет задавать правила на рынке сильных AI-систем.

Читать далее
1
23 ...