Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

avetissian 4 ноя в 16:05

Когда данные говорят на разных языках: как LongCat-Flash-Omni объединяет текст, звук и видео

Простой

5 мин

8.9K

Машинное обучение *

Обзор

Recovery Mode

Автор: Денис Аветисян

Очередной "прорыв", конечно. 560 миллиардов параметров, "синергия модальностей", "реверс-инжиниринг реальности"... Знакомая песня. Как будто кто-то снова решил, что если сложить достаточно много кирпичиков, то получим не только стену, но и осознание бытия.

Впрочем, гибридный параллелизм и потоковая предварительная загрузка – это, безусловно, приятно. Как хорошо отлаженный "Запорожец" на автобане – вроде и не гонка, но едет, и даже довольно бодро. Главное, вовремя смазать.

Вопрос, как всегда, в интерпретации. Машина "понимает" или "имитирует"? Да какая разница, если результат устраивает? Главное, чтобы "Запорожец" доехал до пункта назначения, а там уж пусть сам разбирается, что он там увидел.

И да, очередной Human-in-the-Loop. А как иначе? Все эти "нейронные сети" – это просто очень сложные способы делегировать скучную работу человеку. Просто теперь он делает вид, что это машина работает.

🤔

Читать далее

-1

andre_dataist 4 ноя в 15:09

Как ИИ-браузер ChatGPT Atlas разгадал судоку за пару минут, но проиграл в Flappy Bird

4 мин

9.8K

Искусственный интеллектМашинное обучение *

Обзор

ИИ умеет пользоваться браузером: видеть веб-страницы и решать на какую клавишу нажать. Но может ли ИИ играть в браузерные игры?

ChatGPT Atlas прошёл это испытание. Он быстро справился с судоку, не делая ни одной ошибки. Зато во Flappy Bird он также быстро проиграл, не набрав ни одного очка.

Что мешает браузерным агентам полноценно играть в игры? Разбираемся в новом обзоре.

Читать далее

+1

antipov_dmitry 4 ноя в 11:39

Тело AI-агентов: технический обзор робота 1X Neo

11 мин

10K

Искусственный интеллектМашинное обучение * РобототехникаАнализ и проектирование систем *

На днях по AI пабликам завирусился робот 1X Neo, который заявляется разработчиками как человекоподобный робот для помощи по дому. Мне стало жутко интересно покопаться в устройстве и начинке этого робота, потому что скрещивание VLM и механизмов может привести к огромному прорыву в индустрии и новым большим изменениям.

Поговорим про устройство робота, железо и софт на борту, прикладные задачи и ближайшее будущее.

Читать далее

+2

mr-pickles 4 ноя в 11:05

Можно ли научить ИИ писать более качественные тексты?

Средний

7 мин

8.6K

Блог компании Wunder FundМашинное обучение * Искусственный интеллектАлгоритмы * Программирование *

Перевод

Эпоха больших языковых моделей (LLM, Large Language Model) снова и снова ставит перед нами вопрос о том, что отличает великую прозу от просто хорошей.

Отвечая на этот вопрос, обычно довольно расплывчато рассуждают о «стиле»: о неуловимом, мистическом качестве, которое свойственно таким людям, как Хемингуэй, Вулф или Вудхаус. Это — как один судья сказал о порнографии: мы узнаём её, когда видим. Мы способны узнать стиль текста, мы даже можем его сымитировать. Но можем ли мы его измерить? Можем ли мы создать для него производственную функцию?

Большинство современных LLM выдаёт хорошие тексты. Даже — грамотные. Но — тексты это стандартные. Стилистически безвкусные. И что — так будет всегда? Этот вопрос меня тревожит с тех самых пор, как я начал пользоваться LLM. Они созданы из слов, и при этом не могут как следует словами пользоваться. Почему мы не способны создать ИИ, который пишет хорошие тексты?

Тут совершенно естественным образом возникает такой вопрос: можем ли мы задать какие-то (или хоть какие-нибудь) количественно измеримые, эмпирические «сигнатуры» хороших текстов? Если это возможно — значит такие вот «характеристики» можно использовать для обучения моделей, которые смогут лучше писать. Так случилось, что этот вопрос завёл меня, так сказать, в кроличью нору, породив проект, который я называю Horace.

Я выдвинул гипотезу, в соответствии с которой, приближённо говоря, волшебство текстов, написанных людьми, уместно сравнивать не с понятием «статистическое среднее», а с понятием «дисперсия». Полагаю, эту мысль нельзя назвать строгим правилом, но она, как мне кажется, ближе к истине, чем альтернативные идеи. Магия человеческих текстов заключается в осознанном, целенаправленном отступлении от ожидаемого. Речь идёт о ритме (rhythm), о темпе (pace), о музыкальности (cadence) текста.

Читать далее

+11

andre_dataist 3 ноя в 22:49

Децентрализованный ИИ: как рой нейросетей побеждает большие модели

4 мин

12K

Искусственный интеллектМашинное обучение *

Обзор

ИИ становятся все умнее, но когда дело доходит до практического применения, энтузиасты и ученые обнаруживают, что некоторые ИИ-модели не справляются с отдельными задачами.

Казалось бы, мы все время увеличиваем размеры моделей; посмотрите только на LLM которые сжигают все больше энергии, чтобы получить крошечное улучшение производительности на некоторых задачах, сохраняя при этом уязвимость ко всем видам атак. Однако по мере того, как растет стоимость, растут и требования к их надежности и стабильности.

Вот неожиданный поворот: недавние исследования показывают, что успех ИИ-систем часто определяется не размерами моделей, а тем, как различные модели объединяются или, что еще более важно, как они приходят к консенсусу или «договариваются» между собой. Фактически, небольшой рой разнородных ИИ-моделей, который умеет сравнивать решения между собой, часто может превзойти отдельную большую модель и, как правило, гораздо более устойчив к промт-инъекциям и другим видам атак.

Итак, как устроена эта коллективная мыслительная система и почему организации, стремящиеся создать децентрализованный ИИ, могут обратить на нее внимание?

Читать далее

+11

python_leader 3 ноя в 13:50

Meta и исследователи из OpenAI: новые подходы к защите LLM от prompt injection

Простой

5 мин

14K

Машинное обучение * Искусственный интеллектБудущее здесьИнформационная безопасность * Natural Language Processing *

Репортаж

Перевод

Команда AI for Devs подготовила перевод краткой выжимки свежих статей о безопасности LLM. Meta предлагает «Правило двух» — архитектурный принцип, ограничивающий права AI-агентов, чтобы защитить их от prompt injection. А исследователи из OpenAI, Anthropic и Google DeepMind показывают: все существующие защиты легко обходятся адаптивными атаками.

Читать далее

+3

kucev 3 ноя в 11:00

GDPval: измерение производительности AI-моделей на реальных задачах

15 мин

7.8K

Data Engineering * Big Data * Машинное обучение * Искусственный интеллектData Mining *

Перевод

Наша миссия — обеспечить то, чтобы искусственный общий интеллект (AGI) приносил пользу всему человечеству. В рамках этой миссии мы стремимся максимально прозрачно освещать прогресс того, как AI-модели учатся помогать людям в реальной жизни. Именно поэтому мы представляем GDPval — новую систему оценки, разработанную для отслеживания того, насколько эффективно наши модели и модели других разработчиков справляются с задачами, имеющими экономическую ценность и практическое значение. Мы назвали эту метрику GDPval, потому что она вдохновлена концепцией валового внутреннего продукта (ВВП, англ. GDP) как ключевого экономического индикатора, а набор задач основан на типичных ролях в индустриях, которые вносят наибольший вклад в ВВП.

Люди часто рассуждают о масштабном влиянии AI на общество, но самый наглядный способ понять каков его потенциал, это посмотреть на то, что модели уже умеют делать на практике. История показывает, что крупным технологиям, от интернета до смартфонов, требовалось более десяти лет, чтобы пройти путь от изобретения до массового внедрения. Такие оценки, как GDPval, помогают приземлить разговоры о будущем ИИ на факты, а не на догадки, и дают возможность отслеживать прогресс моделей во времени.

Читать далее

+2

full_moon 3 ноя в 10:32

Sora 2 и Veo 3.1 борются за лидерство, Маск воюет с Википедией: главные события октября в ИИ

27 мин

9.5K

Блог компании Magnus TechИскусственный интеллектМашинное обучение * Исследования и прогнозы в IT *

Дайджест

Октябрь отметился интересным сдвигом: компании перестали фокусироваться на том, насколько умной может быть модель, и переключились на вопрос, что она может делать самостоятельно. Computer Use от Google, SDK и другие агентные инструменты от OpenAI и Anthropic — индустрия наконец решила, что пора переходить от умных ответов к автономным действиям. Не обошлось и без новой порции корпоративных драм, куда теперь без них.

А ещё вышли Sora 2 и Veo 3.1, две новые версии Claude 4.5, Мира Мурати показала первые продукты своего стартапа, а Китай продолжил выпускать опенсорс быстрее, чем все остальные вместе взятые. Но не будем вываливать всё сразу. Начнем с релизов, а драмы и открытия традиционно оставим на десерт.

Читать далее

+16

master_program 3 ноя в 06:16

Ученые из МФТИ выяснили, сколько данных нужно для ИИ

Средний

6 мин

9.4K

Искусственный интеллектМашинное обучение * Математика * Научно-популярное

Одна из фундаментальных проблем при создании эффективных моделей машинного обучения – определение необходимого и достаточного количества данных для их обучения. Слишком мало данных – модель будет неточной, слишком много – неоправданные затраты времени и ресурсов на сбор и обработку информации.

Коллектив ученых из Московского физико-технического института предложил два новых метода для решения этой задачи, основанных на анализе функции правдоподобия с использованием техники бутстрэпа. Работа опубликована в журнале Computational Mathematics and Mathematical Physics.

Читать далее

+2

andre_dataist 2 ноя в 20:32

ИИ в белом халате: как он учится ставить диагнозы в виртуальной клинике

4 мин

9.7K

Машинное обучение * Искусственный интеллект

Обзор

ИИ уже достаточно давно научился искать симптомы, отвечать на вопросы из учебников и угадывать диагнозы на тестах, кажется, что следующий рубеж уже совсем близко и они смогут заменить врачей-диагностов. Однако, на более сложных и приближённых к реальности задачах, когда нужно самому принимать решения по ходу, многие из существующих ИИ-моделей почему-то оказываются не способны рассуждать на уровне врача-эксперта: они часто не могут понять, когда стоит остановиться, не знают какие анализы назначить или попросту действуют по шаблону.

Новое исследование, наоборот, утверждает, что всё о чём мы думали раньше вообще не важно — и размер модели и количество данных — всё это практически не влияет на итог, а самое главное это то, как именно ИИ учится рассуждать и стратегически мыслить. Авторы помещают ИИ в виртуальную клинику, где каждое действие имеет значение, а решение о неправильном выборе будущего анализа повлияет на конечный диагноз. При этом, ИИ получает обратную связь не только за финальный точный диагноз, но и за всю цепочку принятых решений.

Давайте разберёмся, почему для успеха ИИ недостаточно просто «знать правильный ответ» из учебника и почему обучение на реалистичных медицинских сценариях позволяет делать рассуждения ИИ похожими на врачебные. Всё это меняет не только подход к диагностике, но и то, как вообще следует использовать ИИ в медицине.

Читать далее

+3

andre_dataist 1 ноя в 18:39

Будущее программирования — мультимодальное: как JanusCoder научился видеть интерфейс, который сам создает

4 мин

13K

Машинное обучение * Искусственный интеллект

Обзор

ИИ уже давно умеет генерировать код. Однако если попросить его построить интерактивный график или сгенерировать анимацию, он часто не справляется с задачей.

По большому счёту, он игнорирует то, как будет визуализироваться код, и в итоге результат приходится дорабатывать вручную. Почему ИИ-модели для генерации кода плохо справляются с этим?

Свежее исследование показывает, что ключ к решению заключается в создании модели, которая умеет и изучить задачу, и написать код, и посмотреть на результат как на картинку, чтобы доработать его.

Сегодня мы рассмотрим, как обучали такую модель и почему её появление может изменить то, как разработчики создают интерфейсы, аналитики визуализируют данные, а ИИ-агенты начинают по-настоящему понимать, что именно они программируют.

Читать далее

0

thealexkjr 1 ноя в 12:17

Интернет будущего: в сеть выходят не люди

Средний

7 мин

8K

Информационная безопасность * Машинное обучение *

Аналитика

Мы создали интернет, чтобы иметь быстрый доступ к библиотеке человеческого знания из любой точки земного шара...Интернет создал агентов — чтобы мы перестали в него заходить.

Интернет больше не ждёт ваших кликов — теперь он сам отвечает на них.

С выходом Atlas начинается эпоха, где сайты читают не люди, а нейросети.

Что это значит для нас, для безопасности и для самого веба — читайте в статье о том, как интернет перестаёт быть человеческим.

Читать далее

-2

ai-talent 1 ноя в 09:34

Эволюция и применение диффузионных моделей

Средний

18 мин

6.8K

Машинное обучение * Учебный процесс в IT

Обзор

Хотите понять, как работают современные генеративные модели, как именно они устроены, где применяются и куда движутся в 2025 году? В этой статье вы получите:

• простое объяснение, как работают диффузионные модели — от шума до архитектур U-Net и cross-attention
• разбор, как управлять генерацией с помощью ControlNet, T2I-адаптеров и LoRA
• обзор экосистемы: Stable Diffusion, Midjourney, DALL·E 3 и новые направления
• кейсы: от медицины и робототехники до музыки и биологии
• главные тренды: ускоренная генерация, мультимодальность, world-models
• риски: ресурсы, предвзятость, авторское право и дипфейки

Читать далее

0

BiktorSergeev 1 ноя в 07:05

Amazon переводит ИИ на энергию атома: как модульные реакторы меняют дата-центры

5 мин

8.1K

Блог компании МТСМашинное обучение * Энергия и элементы питания

Дата-центры растут быстрее, чем энергетика успевает за ними. Особенно это актуально для ИИ-отрасли, где обучение моделей требует постоянных мощностей и бесперебойного питания. Возобновляемые источники не дают нужной стабильности, а городские сети часто работают на пределе. Amazon решила развивать собственную генерацию и сделать ставку на атомную энергию, чтобы дата-центры не зависели от внешних поставщиков. Для этого компания использует малые модульные реакторы. Их производят на заводах и монтируют на месте за месяцы вместо лет. Первый такой проект под названием Cascade Advanced Energy Facility появится в Вашингтоне — о нем сегодня и поговорим.

Читать далее

+15

andre_dataist 31 окт в 18:11

Как ИИ-агенты учатся параллелить задачи с помощью графа размышлений

4 мин

8K

Искусственный интеллектМашинное обучение *

Обзор

Часто ИИ-агенты не справляются даже с самыми простыми прикладными задачами: не могут забронировать отель на нужную дату или сделать коммит в нужную ветку в гите. В чем же дело и почему столь умные системы не работают там, где человеу понадобится всего пара минут?

Исследователи утверждают: всё дело в том, как модель организует своё мышление. Оказывается, если вместо классического пошагового подхода построить нечто вроде графа размышлений, на которые нужно разбить задачу, то получается гораздо лучше и быстрее.

В этом обзоре мы разберём, как агенты учатся думать над задачами и почему будущее ИИ лежит в умении строить правильную структуру размышлений.

Читать далее

+3

Andrey_Gromov 31 окт в 14:20

Production AI сервер за ₽0: полный гайд по сборке ML-станции для Stable Diffusion на б/у комплектующих

Средний

8 мин

12K

Искусственный интеллектМашинное обучение * Python *

Из песочницы

Собрал production ML-сервер на двух RTX 2060 из хлама за ₽0. PyTorch + CUDA 11.8 + Stable Diffusion генерируют 512x512 за 38 секунд. YOLOv8 работает параллельно на второй GPU. Вот полный гайд: от BIOS настроек до первого теста. Никакого облака, только локальное железо.

Читать далее

+6

Gazinformservice 31 окт в 13:28

Будущее NGFW, 7 шагов защиты и финал конкурса стартапов: как прошёл бизнес-день форума GIS DAYS. Часть 2

12 мин

9.1K

Блог компании ГазинформсервисИнформационная безопасность * Развитие стартапаИскусственный интеллектМашинное обучение *

Обзор

В предыдущей части мы начали рассказывать вам, как прошёл бизнес-день форума GIS DAYS. Сегодня мы завершим обзор и представим не менее интересные выступления, прошедшие 3 октября в московском кинотеатре «Октябрь».

Подробнее

+3

CatrineNice 31 окт в 13:16

Нажал кнопку – художник? Как нейросети меняют законы об авторском праве

Простой

18 мин

9.3K

Искусственный интеллектМашинное обучение * ДизайнНаучно-популярноеБудущее здесь

Из песочницы

В 2022 году случился «нейросетевой бум» – генеративные модели вроде Midjourney вышли из лабораторий и стали доступны широкому кругу людей. Уже несколько лет нейросети являются одной из самых популярных тем для обсуждения в арт-сообществе, вызывая волну споров, страхов и мифов.

В этой статье я хочу разобраться во всем этом и разложить по полочкам – отделить мифы от реальности, обсудить популярные аргументы сторонников ИИ, например, сравнение с фотографией, обсудить возможность охраны промпта авторским правом, а также проанализировать ситуацию с обучением моделей и «добросовестным использованием».

Я старалась углубиться в проблему и разобрать позиции всех сторон, чтобы статья вышла объективной насколько это возможно ^^

Читать далее

+8

Neurosonya 31 окт в 12:43

Cursor 2.0: многоагентная AI-IDE и собственная модель Composer — что это меняет для разработчиков

Простой

6 мин

17K

DevOps * Git * Машинное обучение * Программирование * Текстовые редакторы и IDE *

Обзор

Recovery Mode

В конце октября 2025 Anysphere представила Cursor 2.0 — крупное обновление AI-IDE с параллельными агентами и новой моделью Composer. Идея проста: вы ставите цели, а агенты пишут и проверяют код, тестируют и готовят диффы, а разработчик смещается к роли менеджера ИИ-процесса. В статье разбираемся, что именно появилось, на чем это работает и какие ограничения важно учесть.

Читать далее

+10

Tutufa 31 окт в 12:22

GR00T N1.5: архитектура, данные и эволюция VLA-моделей

Средний

3 мин

6.2K

Машинное обучение * Робототехника

Обзор

Начинаем серию разборов современных Vision-Language-Action (VLA) моделей для манипуляции. Несмотря на то, что им всего около года (π₀ была представлена ровно год назад — 31 октября 2024), текущие системы уже можно считать вторым поколением VLA-подходов. Их ключевое отличие — появление дополнительного модуля action head, который представляет собой не просто голову над представлениями, а отдельный диффузионный трансформер, обучаемый по задаче flow matching.

Сегодня — разбор GR00T от NVIDIA, который с момента релиза N1 уже успел обновиться до версии N1.5, а на днях ожидается N1.6.

Концепция VLA и постановка задачи

VLA-модель — это end-to-end система, принимающая на вход «сырые» сенсорные сигналы различных модальностей (видео, текст, состояния сочленений робота) и напрямую предсказывающая управляющие действия, без внешнего планировщика или постобработки.

Для человекоподобного робота входные данные включают:

Читать далее

+4

1 2 ...

15

16 17 ...