Все потоки

Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

VladKochetov007 5 ноя в 13:15

Почему ЭТО — не трейдинг

Простой

7 мин

14K

Искусственный интеллектМашинное обучение * Криптовалюты

Из песочницы

Наверняка многие из вас уже видели такие скриншоты на просторах интернета. СМИ разных оттенков жёлтого поголовно твердят: «DeepSeek зарабатывает деньги! ChatGPT в минусе».

В этом посте хочу донести, почему эти утверждения очень натянуты — через критику как дизайна эксперимента, так и его конкретной реализации.

Читать далее

+18

pincaglinch 5 ноя в 10:15

Как я внедрил пилотный проект системы компьютерного зрения на производстве, пока станки простаивали, при 7000 в неделю

Средний

7 мин

10K

Машинное обучение *

Кейс

Из песочницы

Я улыбнулся. В тот момент я и сам чувствовал себя таким помятым.
Станки простаивали уже четвёртый месяц. Зарплата в простое была символической. Пришлось искать дополнительные источники финансирования — в ход пошли даже старые запасы «железа».

Я тогда продал последний монитор — просто чтобы дожить до пятницы.

И в этих условиях я решил: не ждать заказов, а создавать ценность самому. Так родился мой модуль компьютерного зрения для контроля брака.

Читать далее

+22

Jonnyfer 5 ноя в 07:14

ML глазами практика и препода. Часть 2. Границы роста и цена энергии

Средний

15 мин

8.9K

Блог компании MWS AIБлог компании МТСИскусственный интеллектМашинное обучение * Будущее здесь

Мнение

Всем привет! Это вторая часть моего лонгрида о том, как ИИ меняет ИТ и не только. Тут я размышляю на тему no-code-моды, физических ограничениях и энергетической цены нынешнего ИИ-бума, а также о трансформациях, которые происходят в науке и медицине благодаря нейросетям.

Если вы не читали первую часть, то вам сюда.

Читать далее

+32

stas-clear 5 ноя в 06:26

Как агенты на базе LLM становятся практичнее: подход Anthropic к выполнению кода в MCP

Средний

3 мин

7.6K

Машинное обучение *

Обзор

С ростом числа MCP-инструментов в реальных агентах стало заметно ограничение: модель начала получать слишком много промежуточных данных. Это увеличивает количество токенов и время отклика, а в сложных цепочках действий приводит к ошибкам. Anthropic предложила решение: вынести выполнение операций в отдельную среду исполнения кода, сохранив за моделью только роль планировщика.

Читать далее

+7

mahairod 4 ноя в 21:41

Я спросил у ясеня… (закуётся ли он в железо)

Средний

20 мин

11K

Машинное обучение * Искусственный интеллектИсследования и прогнозы в IT * Производство и разработка электроники * Схемотехника *

Аналитика

Точнее спросил у ChatGPT. Спросил я его, что он думает по поводу моего намерения распластать его логику по кремниевой пластине, то есть развернуть логику инференса в большую предопределённую цепь. Надо сказать, ChatGPT очень сносно стал рассуждать, да и выдал в итоге такой результат, что в принципе потянет на полноценную статью, причём почти без редактирования.

Читать далее

-6

avetissian 4 ноя в 16:05

Когда данные говорят на разных языках: как LongCat-Flash-Omni объединяет текст, звук и видео

Простой

5 мин

8.9K

Машинное обучение *

Обзор

Recovery Mode

Автор: Денис Аветисян

Очередной "прорыв", конечно. 560 миллиардов параметров, "синергия модальностей", "реверс-инжиниринг реальности"... Знакомая песня. Как будто кто-то снова решил, что если сложить достаточно много кирпичиков, то получим не только стену, но и осознание бытия.

Впрочем, гибридный параллелизм и потоковая предварительная загрузка – это, безусловно, приятно. Как хорошо отлаженный "Запорожец" на автобане – вроде и не гонка, но едет, и даже довольно бодро. Главное, вовремя смазать.

Вопрос, как всегда, в интерпретации. Машина "понимает" или "имитирует"? Да какая разница, если результат устраивает? Главное, чтобы "Запорожец" доехал до пункта назначения, а там уж пусть сам разбирается, что он там увидел.

И да, очередной Human-in-the-Loop. А как иначе? Все эти "нейронные сети" – это просто очень сложные способы делегировать скучную работу человеку. Просто теперь он делает вид, что это машина работает.

🤔

Читать далее

-1

andre_dataist 4 ноя в 15:09

Как ИИ-браузер ChatGPT Atlas разгадал судоку за пару минут, но проиграл в Flappy Bird

4 мин

9.8K

Машинное обучение * Искусственный интеллект

Обзор

ИИ умеет пользоваться браузером: видеть веб-страницы и решать на какую клавишу нажать. Но может ли ИИ играть в браузерные игры?

ChatGPT Atlas прошёл это испытание. Он быстро справился с судоку, не делая ни одной ошибки. Зато во Flappy Bird он также быстро проиграл, не набрав ни одного очка.

Что мешает браузерным агентам полноценно играть в игры? Разбираемся в новом обзоре.

Читать далее

+1

antipov_dmitry 4 ноя в 11:39

Тело AI-агентов: технический обзор робота 1X Neo

11 мин

10K

Искусственный интеллектМашинное обучение * РобототехникаАнализ и проектирование систем *

На днях по AI пабликам завирусился робот 1X Neo, который заявляется разработчиками как человекоподобный робот для помощи по дому. Мне стало жутко интересно покопаться в устройстве и начинке этого робота, потому что скрещивание VLM и механизмов может привести к огромному прорыву в индустрии и новым большим изменениям.

Поговорим про устройство робота, железо и софт на борту, прикладные задачи и ближайшее будущее.

Читать далее

+2

mr-pickles 4 ноя в 11:05

Можно ли научить ИИ писать более качественные тексты?

Средний

7 мин

8.7K

Блог компании Wunder FundМашинное обучение * Искусственный интеллектАлгоритмы * Программирование *

Перевод

Эпоха больших языковых моделей (LLM, Large Language Model) снова и снова ставит перед нами вопрос о том, что отличает великую прозу от просто хорошей.

Отвечая на этот вопрос, обычно довольно расплывчато рассуждают о «стиле»: о неуловимом, мистическом качестве, которое свойственно таким людям, как Хемингуэй, Вулф или Вудхаус. Это — как один судья сказал о порнографии: мы узнаём её, когда видим. Мы способны узнать стиль текста, мы даже можем его сымитировать. Но можем ли мы его измерить? Можем ли мы создать для него производственную функцию?

Большинство современных LLM выдаёт хорошие тексты. Даже — грамотные. Но — тексты это стандартные. Стилистически безвкусные. И что — так будет всегда? Этот вопрос меня тревожит с тех самых пор, как я начал пользоваться LLM. Они созданы из слов, и при этом не могут как следует словами пользоваться. Почему мы не способны создать ИИ, который пишет хорошие тексты?

Тут совершенно естественным образом возникает такой вопрос: можем ли мы задать какие-то (или хоть какие-нибудь) количественно измеримые, эмпирические «сигнатуры» хороших текстов? Если это возможно — значит такие вот «характеристики» можно использовать для обучения моделей, которые смогут лучше писать. Так случилось, что этот вопрос завёл меня, так сказать, в кроличью нору, породив проект, который я называю Horace.

Я выдвинул гипотезу, в соответствии с которой, приближённо говоря, волшебство текстов, написанных людьми, уместно сравнивать не с понятием «статистическое среднее», а с понятием «дисперсия». Полагаю, эту мысль нельзя назвать строгим правилом, но она, как мне кажется, ближе к истине, чем альтернативные идеи. Магия человеческих текстов заключается в осознанном, целенаправленном отступлении от ожидаемого. Речь идёт о ритме (rhythm), о темпе (pace), о музыкальности (cadence) текста.

Читать далее

+11

andre_dataist 3 ноя в 22:49

Децентрализованный ИИ: как рой нейросетей побеждает большие модели

4 мин

12K

Машинное обучение * Искусственный интеллект

Обзор

ИИ становятся все умнее, но когда дело доходит до практического применения, энтузиасты и ученые обнаруживают, что некоторые ИИ-модели не справляются с отдельными задачами.

Казалось бы, мы все время увеличиваем размеры моделей; посмотрите только на LLM которые сжигают все больше энергии, чтобы получить крошечное улучшение производительности на некоторых задачах, сохраняя при этом уязвимость ко всем видам атак. Однако по мере того, как растет стоимость, растут и требования к их надежности и стабильности.

Вот неожиданный поворот: недавние исследования показывают, что успех ИИ-систем часто определяется не размерами моделей, а тем, как различные модели объединяются или, что еще более важно, как они приходят к консенсусу или «договариваются» между собой. Фактически, небольшой рой разнородных ИИ-моделей, который умеет сравнивать решения между собой, часто может превзойти отдельную большую модель и, как правило, гораздо более устойчив к промт-инъекциям и другим видам атак.

Итак, как устроена эта коллективная мыслительная система и почему организации, стремящиеся создать децентрализованный ИИ, могут обратить на нее внимание?

Читать далее

+11

python_leader 3 ноя в 13:50

Meta и исследователи из OpenAI: новые подходы к защите LLM от prompt injection

Простой

5 мин

14K

Информационная безопасность * Будущее здесьИскусственный интеллектМашинное обучение * Natural Language Processing *

Репортаж

Перевод

Команда AI for Devs подготовила перевод краткой выжимки свежих статей о безопасности LLM. Meta предлагает «Правило двух» — архитектурный принцип, ограничивающий права AI-агентов, чтобы защитить их от prompt injection. А исследователи из OpenAI, Anthropic и Google DeepMind показывают: все существующие защиты легко обходятся адаптивными атаками.

Читать далее

+3

kucev 3 ноя в 11:00

GDPval: измерение производительности AI-моделей на реальных задачах

15 мин

7.9K

Data Engineering * Big Data * Машинное обучение * Искусственный интеллектData Mining *

Перевод

Наша миссия — обеспечить то, чтобы искусственный общий интеллект (AGI) приносил пользу всему человечеству. В рамках этой миссии мы стремимся максимально прозрачно освещать прогресс того, как AI-модели учатся помогать людям в реальной жизни. Именно поэтому мы представляем GDPval — новую систему оценки, разработанную для отслеживания того, насколько эффективно наши модели и модели других разработчиков справляются с задачами, имеющими экономическую ценность и практическое значение. Мы назвали эту метрику GDPval, потому что она вдохновлена концепцией валового внутреннего продукта (ВВП, англ. GDP) как ключевого экономического индикатора, а набор задач основан на типичных ролях в индустриях, которые вносят наибольший вклад в ВВП.

Люди часто рассуждают о масштабном влиянии AI на общество, но самый наглядный способ понять каков его потенциал, это посмотреть на то, что модели уже умеют делать на практике. История показывает, что крупным технологиям, от интернета до смартфонов, требовалось более десяти лет, чтобы пройти путь от изобретения до массового внедрения. Такие оценки, как GDPval, помогают приземлить разговоры о будущем ИИ на факты, а не на догадки, и дают возможность отслеживать прогресс моделей во времени.

Читать далее

+2

full_moon 3 ноя в 10:32

Sora 2 и Veo 3.1 борются за лидерство, Маск воюет с Википедией: главные события октября в ИИ

27 мин

9.6K

Блог компании Magnus TechИскусственный интеллектМашинное обучение * Исследования и прогнозы в IT *

Дайджест

Октябрь отметился интересным сдвигом: компании перестали фокусироваться на том, насколько умной может быть модель, и переключились на вопрос, что она может делать самостоятельно. Computer Use от Google, SDK и другие агентные инструменты от OpenAI и Anthropic — индустрия наконец решила, что пора переходить от умных ответов к автономным действиям. Не обошлось и без новой порции корпоративных драм, куда теперь без них.

А ещё вышли Sora 2 и Veo 3.1, две новые версии Claude 4.5, Мира Мурати показала первые продукты своего стартапа, а Китай продолжил выпускать опенсорс быстрее, чем все остальные вместе взятые. Но не будем вываливать всё сразу. Начнем с релизов, а драмы и открытия традиционно оставим на десерт.

Читать далее

+16

master_program 3 ноя в 06:16

Ученые из МФТИ выяснили, сколько данных нужно для ИИ

Средний

6 мин

9.4K

Искусственный интеллектМашинное обучение * Математика * Научно-популярное

Одна из фундаментальных проблем при создании эффективных моделей машинного обучения – определение необходимого и достаточного количества данных для их обучения. Слишком мало данных – модель будет неточной, слишком много – неоправданные затраты времени и ресурсов на сбор и обработку информации.

Коллектив ученых из Московского физико-технического института предложил два новых метода для решения этой задачи, основанных на анализе функции правдоподобия с использованием техники бутстрэпа. Работа опубликована в журнале Computational Mathematics and Mathematical Physics.

Читать далее

+2

andre_dataist 2 ноя в 20:32

ИИ в белом халате: как он учится ставить диагнозы в виртуальной клинике

4 мин

9.7K

Искусственный интеллектМашинное обучение *

Обзор

ИИ уже достаточно давно научился искать симптомы, отвечать на вопросы из учебников и угадывать диагнозы на тестах, кажется, что следующий рубеж уже совсем близко и они смогут заменить врачей-диагностов. Однако, на более сложных и приближённых к реальности задачах, когда нужно самому принимать решения по ходу, многие из существующих ИИ-моделей почему-то оказываются не способны рассуждать на уровне врача-эксперта: они часто не могут понять, когда стоит остановиться, не знают какие анализы назначить или попросту действуют по шаблону.

Новое исследование, наоборот, утверждает, что всё о чём мы думали раньше вообще не важно — и размер модели и количество данных — всё это практически не влияет на итог, а самое главное это то, как именно ИИ учится рассуждать и стратегически мыслить. Авторы помещают ИИ в виртуальную клинику, где каждое действие имеет значение, а решение о неправильном выборе будущего анализа повлияет на конечный диагноз. При этом, ИИ получает обратную связь не только за финальный точный диагноз, но и за всю цепочку принятых решений.

Давайте разберёмся, почему для успеха ИИ недостаточно просто «знать правильный ответ» из учебника и почему обучение на реалистичных медицинских сценариях позволяет делать рассуждения ИИ похожими на врачебные. Всё это меняет не только подход к диагностике, но и то, как вообще следует использовать ИИ в медицине.

Читать далее

+3

andre_dataist 1 ноя в 18:39

Будущее программирования — мультимодальное: как JanusCoder научился видеть интерфейс, который сам создает

4 мин

13K

Машинное обучение * Искусственный интеллект

Обзор

ИИ уже давно умеет генерировать код. Однако если попросить его построить интерактивный график или сгенерировать анимацию, он часто не справляется с задачей.

По большому счёту, он игнорирует то, как будет визуализироваться код, и в итоге результат приходится дорабатывать вручную. Почему ИИ-модели для генерации кода плохо справляются с этим?

Свежее исследование показывает, что ключ к решению заключается в создании модели, которая умеет и изучить задачу, и написать код, и посмотреть на результат как на картинку, чтобы доработать его.

Сегодня мы рассмотрим, как обучали такую модель и почему её появление может изменить то, как разработчики создают интерфейсы, аналитики визуализируют данные, а ИИ-агенты начинают по-настоящему понимать, что именно они программируют.

Читать далее

0

thealexkjr 1 ноя в 12:17

Интернет будущего: в сеть выходят не люди

Средний

7 мин

8K

Информационная безопасность * Машинное обучение *

Аналитика

Мы создали интернет, чтобы иметь быстрый доступ к библиотеке человеческого знания из любой точки земного шара...Интернет создал агентов — чтобы мы перестали в него заходить.

Интернет больше не ждёт ваших кликов — теперь он сам отвечает на них.

С выходом Atlas начинается эпоха, где сайты читают не люди, а нейросети.

Что это значит для нас, для безопасности и для самого веба — читайте в статье о том, как интернет перестаёт быть человеческим.

Читать далее

-2

ai-talent 1 ноя в 09:34

Эволюция и применение диффузионных моделей

Средний

18 мин

6.8K

Машинное обучение * Учебный процесс в IT

Обзор

Хотите понять, как работают современные генеративные модели, как именно они устроены, где применяются и куда движутся в 2025 году? В этой статье вы получите:

• простое объяснение, как работают диффузионные модели — от шума до архитектур U-Net и cross-attention
• разбор, как управлять генерацией с помощью ControlNet, T2I-адаптеров и LoRA
• обзор экосистемы: Stable Diffusion, Midjourney, DALL·E 3 и новые направления
• кейсы: от медицины и робототехники до музыки и биологии
• главные тренды: ускоренная генерация, мультимодальность, world-models
• риски: ресурсы, предвзятость, авторское право и дипфейки

Читать далее

0

BiktorSergeev 1 ноя в 07:05

Amazon переводит ИИ на энергию атома: как модульные реакторы меняют дата-центры

5 мин

8.1K

Блог компании МТСМашинное обучение * Энергия и элементы питания

Дата-центры растут быстрее, чем энергетика успевает за ними. Особенно это актуально для ИИ-отрасли, где обучение моделей требует постоянных мощностей и бесперебойного питания. Возобновляемые источники не дают нужной стабильности, а городские сети часто работают на пределе. Amazon решила развивать собственную генерацию и сделать ставку на атомную энергию, чтобы дата-центры не зависели от внешних поставщиков. Для этого компания использует малые модульные реакторы. Их производят на заводах и монтируют на месте за месяцы вместо лет. Первый такой проект под названием Cascade Advanced Energy Facility появится в Вашингтоне — о нем сегодня и поговорим.

Читать далее

+15

andre_dataist 31 окт в 18:11

Как ИИ-агенты учатся параллелить задачи с помощью графа размышлений

4 мин

8K

Искусственный интеллектМашинное обучение *

Обзор

Часто ИИ-агенты не справляются даже с самыми простыми прикладными задачами: не могут забронировать отель на нужную дату или сделать коммит в нужную ветку в гите. В чем же дело и почему столь умные системы не работают там, где человеу понадобится всего пара минут?

Исследователи утверждают: всё дело в том, как модель организует своё мышление. Оказывается, если вместо классического пошагового подхода построить нечто вроде графа размышлений, на которые нужно разбить задачу, то получается гораздо лучше и быстрее.

В этом обзоре мы разберём, как агенты учатся думать над задачами и почему будущее ИИ лежит в умении строить правильную структуру размышлений.

Читать далее

+3

1 2 ...

18

19 20 ...