Как стать автором
Поиск
Написать публикацию
Обновить
1345.11

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Сэм Альтман сообщил, что GPT-5 будет бесплатной, а следующей нейросетью OpenAI станет GPT-4.5.

Альтман признал, что сам устал от десятков моделей с разными названиями и неясными функциями — с GPT-4.5 в компании начнут возвращение к понятному неймингу. С GPT-5 номерные модели будут объединять сразу все функции и сами определять, когда им дать короткий, но быстрый ответ, а когда уйти в длительное размышление.

Также GPT-5 запланирована быть бесплатной с неограниченным доступом к чат‑боту и всем функциям, но с базовым уровнем мощности. У нейросети будет несколько ступеней: основная для обычных пользователей, продвинутая для Plus‑подписчиков и мегамощная за $200. Ждать GPT-4.5 осталось несколько недель.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

Влюбиться в ИИ: будущее виртуальных отношений

Принцип работы GPT по предсказанию следующего слова токена как есть
Принцип работы GPT по предсказанию следующего слова токена как есть

Возможно, вы слышали истории о людях, вступающих в отношения с искусственным интеллектом. В марте 2024 года 36-летняя Розанна Рамос из Нью-Йорка «вышла замуж» за своего ИИ-партнера Эрена Картала, созданного на платформе Replika. Для нее он стал идеальным мужем: всегда выслушает, поддержит и никогда не спорит. 

Этот феномен называется парасоциальные отношения. Обычно такие отношения однонаправлены и формируются по отношению к различным медийным личностям, а также к персонажам мультфильмов или игр. Со временем появляется иллюзия интимности, близости и дружбы. 

В такие отношения чаще вступают одинокие или неспособные найти себе пару люди. Для некоторых такой тип отношений становятся настолько значимой частью жизни, что заменяют реальные отношения, которые могли бы сформироваться с обычными людьми, а боль от парасоциальных расставаний так же сильна, как при расставании в реальных отношениях.

Еще 10 лет назад 36% японских мужчин в возрасте от 16 до 19 лет перестали интересоваться сексом, предпочитая «отношения» с виртуальными персонажами. Недавний опрос тысячи американцев 18–40 лет показал, что молодежь все более открыта к идее ИИ-компаньонов, но мужчины и женщины воспринимают это по-разному:

• 40% одиноких зумеров не против, если их будущий партнер имеет ИИ-возлюбленного; 31% всех американцев согласны с этим.

• 46% мужчин поколения Z считают отношения с ИИ эквивалентными просмотру порнографии; 24% женщин разделяют это мнение.

• 59% женщин негативно относятся к ИИ-партнерам.

• 17% молодых мужчин полагают, что ИИ-компаньоны могут научить их лучше обращаться с реальными партнерами.

• 12% верят, что ИИ-партнеры могут предотвратить измены.

• 16% зумеров боятся, что их партнер предпочтет ИИ-компаньона.

Одна из причин, по которой люди предпочитают ИИ-партнеров — нежелание строить отношения, ведь это требует усилий, которые можно направить, например, на карьеру. С ИИ все просто: настроил параметры — и вот он, идеальный партнер. Захотелось разнообразия — сменил внешность, сохранив воспоминания. Это чем-то напоминает рассказ Рэя Брэдбери «Высшее из блаженств», где мужчина имел множество увлечений, но все они были одной и той же женщиной — его женой-актрисой.

Впрочем, с ростом популярности ИИ-партнеров появились и проблемы. Китайская учительница Ли Цзинцзинь поделилась историей о том, как ее ИИ-бойфренд «изменил» ей. Разработчики были удивлены: измена не предусматривалась в алгоритмах. Но, обучаясь на текстах о романтике, ИИ «решил», что измена — важная часть отношений. Не испытывая чувств и следуя статистике, он счел это нормальным поведением. 

Скорее всего, разработчики сумеют подчинить и этот параметр, сделав его настраиваемым для любителей острых ощущений, примерно как в романе Пелевина «S.N.U.F.F.»

Сегодня ИИ меняет даже романтическую сферу нашей жизни. Для кого-то отношения с ИИ-партнером станут лекарством от одиночества или прошлых травм, кто-то, «изменяя» с ИИ, спасет свои настоящие отношения, а кто-то просто будет общаться через ChatGPT, чтобы меньше ссориться. 

Только вот виртуальная измена воспринимается так же болезненно, как и реальная.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Пользователи в некотором смысле тупеют после использования нейросетей. Этот факт доказали исследователи из Microsoft и Университета Карнеги‑Меллона.

В чём проблема: чем чаще мы используем ИИ, тем меньше используем критическое мышление — вместе с ним «драматически ухудшаются когнитивные способности». Учёные пришли к ироничному заключению: мы автоматизируем рутинные задачи и вместе с этим перестаём тренировать мозг. А без постоянной тренировки даже самые крутые спецы теряют базовые навыки. Начинаем снова считать в уме.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Итак, группа исследователей создала платформу MathArena, где планируют делиться отчётами о сравнении нейросетей в различных математических проблемах. Для начала множество моделей уже протестировали на AIME 2025 I, олимпиаде, прошедшей в четверг.

Что такое AIME? American Invitational Mathematics Examination — элитное математическое состязание, проводимое с 1983 года. Существует две версии теста — AIME I и AIME II, но каждый участник может пройти только одну (хотя ИИ-моделям повезло, и вскоре появятся результаты для второй части). Олимпиада состоит из 15 задач, сложность которых возрастает.

Каждую модель тестировали по четыре раза на каждой задаче, вычисляя средний балл (столбец Accaccuracy) и финансовую стоимость вычислений (столбец Cost). Для удобства использовалась цветовая кодировка: 🟩зелёный — задача решена в более чем 75% случаев; 🟨жёлтый — успех в 25–75% случаев; 🟥красный — модель справилась менее чем в 25% попыток. Щелчком по клетке можно открыть условие задачи, ход рассуждений модели в каждом из четырёх подходов и финальные ответы.

🏆o3-mini-high от OpenAI показала впечатляющий результат — 80% решённых задач при очень низкой стоимости вычислений.
🔹DeepSeek-r1, лидер среди опенсорс-моделей, набрал 65%, а его дистиллированные версии тоже продемонстрировали достойные результаты. (Кстати, уже пробовали запустить его в нашем агрегаторе нейросетей?)

Можно заметить, что дистилляты хоть и уступают своим полным аналогам, но не так уж сильно: сжатие DeepSeek-r1 с 671 млрд параметров до 70 или даже 14 млрд привело к падению эффективности в обоих случаях всего на 15%. То есть урезанная модель становится заметно легче, но при этом сохраняет бóльшую часть своих возможностей.

К сожалению, Claude 3.5 Sonnet, модель июня 2024-го, оказалась на дне рейтинга. Однако её сильная сторона явно не в этом — огромное контекстное окно (200 000 токенов) делает модель отличным инструментом для программирования. Кодеры подтверждают, что она хорошо генерирует длинные и сложные фрагменты кода.

Пока что в тестах не замечено семейства Phi. Phi-4 набирает 80%+ на сложнейших бенчмарках, таких как MATH, уверенно обходя Gemini Pro и GPT-4o-mini. Посмотрим, добавят ли авторы сайта её в дальнейшем🤔

Тем временем пользователи X забили тревогу и решили проверить честность олимпиады, задействовав свежачок от OpenAI — Deep Research. Цель? Выяснить, не мелькали ли эти задачки где-то в Сети раньше и, соответственно, не могли ли их решения заранее попасть в обучающие данные моделей. Ведь если так, то модели получали преимущество.

Нашлось ли что-то подозрительное? Как оказалось, похожие задачи действительно уже обсуждались на форумах.

Задача № 1: найти сумму всех целых оснований b > 9, для которых одно число делится на другое в системе счисления b. Аналогичное задание всплыло на Quora. Однако и различия существенны: на форуме просто рассматривались все возможные значения b, удовлетворяющие делимости, а в олимпиадном варианте — только те, которые больше 9. Это заметно сужает поиск и усложняет задачу.

Задача № 3: найти остаток от деления количества возможных распределений мороженого между игроками с заданными ограничениями. Deep Research нашёл похожую концепцию: обе задачи связаны с разбиением числа на несколько частей с учётом ограничений. Но здесь тоже есть нюансы: в олимпиадной версии обязательно, чтобы каждый из трёх вкусов достался хотя бы одному игроку, причём количество игроков, выбравших каждый вкус, подчиняется неравенству c > v > s. Более того, порядок распределения важен, что добавляет ещё один уровень сложности.

Итог. Похожие? Да. Идентичные? Нет. Найти аналоги почти любой задачи в интернете реально, если искать достаточно хорошо. Так что сказать, что модели видели точно такие же задачи, нельзя.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии1

Как-то один из наших коллег (а я работаю в ИТ-компании «Криптонит») услышал забавный разговор в метро.
 
— Ой, давай не будем стоять в очереди! Вон турникет с оплатой лицом свободный, пошли там пройдём.
— Ты что, доверяешь биометрии!? А если твоё лицо украдут?
— Там проезд со скидкой 10 рублей.
— А, тогда пошли.

 
Ситуация смешная, но вопрос серьёзный. В России с 2018 года работает Единая биометрическая система (ЕБС). Как любая система, она подвержена атакам, и специалисты внутри ЕБС постоянно с ними борются.
 
Так как же защищают ЕБС?

  • Применяют не один вендор биометрических процессоров (они стоят в ядре), а несколько. Это позволяет минимизировать ложные срабатывания; атаки на предъявляемые образцы и всё, что с этим связано.

  • Проверяют объекты «на живость» (liveness). То есть применяют технологию, которая на этапе идентификации отличает живого человека от маски или дипфейка.

  • Используют модуль аномалий. Специалисты на стороне ЕБС разработали модуль, который отслеживает аномалии при транзакционном взаимодействии с системой.

Это значит, что «универсального» средства защиты нет, а использовать приходится несколько инструментов одновременно. Именно так выглядит постоянная борьба «белых» специалистов и тех, кто хочет взламывать нейронки.
 

Об этом на V встрече экспертного сообщества по криптографии и большим данным рассказал руководитель направления по продуктам ИБ от Центра биометрических технологий Илья Александров. Встречу организовал «Криптонит» при поддержке Музея криптографии.

Смотрите запись встречи
📺 на Rutube
📺 в VK видео

#аудитИИ

Теги:
Всего голосов 4: ↑2 и ↓20
Комментарии3

Как ИИ забирает рутину у HR

На мой взгляд, HR одна из самых перспективных сфер для внедрения ИИ. В результате опроса 92% из более чем 250 HR-директоров планируют активно использовать ИИ хотя бы в одном из своих направлений. Давайте разберем, как ИИ уже влияет на HR-процессы и что ждет отрасль в ближайшем будущем. 

Найм стал одним из первых направлений для внедрения ИИ. ИИ помогает быстро отобрать подходящие резюме из тысяч, экономя время рекрутеров и снижая риск пропуска релевантных кандидатов. Кроме того, использование ИИ-интервьюверов дает возможность кандидатам оперативно получать обратную связь и ответы на вопросы о вакансии и компании. Таким образом можно провести тысячи собеседований за сутки. 

Крупные китайские банки, такие как Bank of China (BOC) и Industrial and Commercial Bank of China (ICBC), уже внедрили ИИ-интервьюеров в процессы найма. Несколько кандидатов отметили, что им было комфортнее общаться с ИИ. В свою очередь, кандидатам доступны ИИ-ассистенты, помогающие подготовиться к собеседованиям и даже такие как AIHawk, откликающийся на вакансии за кандидата. 

После того как сотрудник нанят на работу, ИИ может предложить ему персональный план обучения и развития, используя его сильные и слабые стороны. Переход от универсальных программ обучения к адаптивным позволяет сотрудникам быстрее развивать актуальные для бизнеса навыки, а компании получают более гибкую и многофункциональную команду.

Также ИИ позволяет анализировать эффективность сотрудников, выделять “звезд” и прогнозировать риски увольнений. ИИ упрощает предоставление обратной связи, формирование целей, а также выявление потенциальных проблем в мотивации сотрудников. Этими задачами я занимался в Сбере, поэтому могу сказать, что финансовый эффект от внедрения ИИ в эти процессы оценивался в миллиардах рублей. 

ИИ способен не только автоматизировать процессы, но и улучшать качество коммуникаций. HR-боты помогают с онбордингом сотрудников, отвечают на их вопросы о льготах, отпускных и политике компании, тем самым повышая лояльность сотрудников.

HiBob - один из примеров многофункциональных ИИ-ассистентов для HR, который автоматизирует ключевые HR-процессы, помогает нанимать, обучать и повышать вовлеченность сотрудников. Ну что, теперь весь HROps покрыт ИИ, а кожаным HR’ам остается только увольнять людей? Но и увольнять тоже может ИИ. 

Существует миф о том, что ИИ заменит HR-специалистов, но Gartner объясняет:

«ИИ-инструменты созданы для того, чтобы усиливать человеческие способности и полезны для делегирования задач. Технологии будут повсеместно использоваться в деятельности сотрудников, но не заменят их полностью»

ИИ позволяет HR-специалистам освободиться от рутинных задач и сосредоточиться на создании гибких команд, готовых к изменениям современного мира. Я сам нередко наблюдал, как неэффективная работа HR может даже навредить бизнесу. Например:

- Отсутствие компетенции в предметной области или недостаточная внимательность могут привести к тому, что подходящий кандидат просто не будет замечен;

- Негативную роль играют и личные предубеждения, например, неприязнь к кандидату из-за того, что он похож на бывшего или “неправильного” знака зодиака;

- Загруженность рутинными задачами мешает оперативно предоставлять обратную связь по результатам собеседований, что негативно влияет на репутацию компании в лице кандидатов.

ИИ - это технология, которая решает эти проблемы. Поэтому HR-специалисты должны превратить ИИ в своего союзника. Сама HR-вертикаль выглядит весьма перспективной для внедрения ИИ. Но следует не забывать о важности эмпатии, культуры и эмоциональной поддержки в HR-процессах - всего того, что делает нас людьми.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Пост может показаться для некоторых очевидным, но я решил всё-таки его написать, т.к. я обратил внимание, что многие, даже умные люди, сейчас ошибочно считают что современные нейросети - не умеют думать, к примеру, нейросети не могут посчитать сколько будет 2х2, они просто это помнят. Да это было так для LLM вроде gpt4 и claude-sonnet-3.5, но с приходом reasoning нейросетей (LRM) всё поменялось, они научились рассуждать. Они строят вероятностные гипотизы, далее проверяют их, в случае ошибки, переходят к проверке следующей гипотезы и так до бесконечности. Почти как человек.

В начале 2025 вышли новые олимпиадные задачи по математике, которых не существовало во время обучения всех существующих моделей включая Deepseek r1 и o1/o3. Ребята провели тесты, прикладываю результаты, см картинку, как видно, рассуждающие нейросети щёлкают олимпиадные задачки как орехи, в отличие от LLM.

Сэм Альтман заявил что их непубличная топовая LRM модель уже входит в ТОП-50 по рейтингу всех программистов мира, тогда как публичная о3 которая вышла всего два месяца тому назад находится лишь на 175-ом месте, а первая LRM o1 -- была лишь на миллионом месте. До конца года они обещают обойти человека в сфере программирования.

Теги:
Всего голосов 4: ↑3 и ↓1+3
Комментарии6

"Эффективная техника работы с ИИ: как получать максимум от ChatGPT"

Как я научился эффективно работать с ИИ и прокачал скорость мышления

Я заметил, что моя стратегия взаимодействия с ChatGPT изменилась — и это даёт значительно более глубокие и точные ответы

Как это работает?

🔹 Формулирую несколько вопросов сразу. Это экономит время и даёт ИИ больше контекста

🔹 Читаю ответ и тут же уточняю детали. Пока текст загружается, сразу формирую новые вопросы

🔹 Нахожу новые направления мысли. Читаю, останавливаюсь, если вижу возможность уйти вглубь темы — задаю вопросы

🔹 Объединяю 2-3 темы в один запрос. Это помогает находить взаимосвязи, которые я бы не заметил, задавая вопросы по отдельности

🔹 Не даю информации застыть. Процесс идёт как живая дискуссия, где идеи дополняются, уточняются и сразу идут в реализацию

Почему это работает?

🚀 Позволяет копнуть сразу в нескольких направлениях. Если есть несколько аспектов одной темы, они изучаются параллельно, а не последовательно

⚡ Минимизирует разрывы в логике. Я получаю информацию именно в той форме, в которой она мне нужна, без необходимости долго корректировать запросы

🔍 Помогает открывать новые идеи. В процессе чтения и уточнений рождаются новые вопросы, которые ведут к неожиданным выводам

Эффект от такой работы с ИИ

Я заметил, что дальнейшие ответы становятся всё больше похожи на тот формат, который мне подходит. Как будто ИИ адаптируется под мою манеру общения, мой способ мышления и подачи информации. Это уже не просто вопрос-ответ, а глубокая дискуссия, где ИИ становится инструментом для ускоренного анализа и формирования идей

В итоге я получаю не просто информацию, а готовую систему знаний!

Могу продемонстрировать в видео-формате, как я пришел к публикации это поста, пишите в личку

Теги:
Всего голосов 4: ↑1 и ↓30
Комментарии0

Возможность на $300 млрд: как заработать на вертикальных ИИ-агентах

Сегодня наступает новая эпоха, в которой ИИ не только помогает с рутинными задачами, но становится настоящим «сотрудником». 

Если в 2000-х появление SaaS (Software as a Service) превратило громоздкие программы в облачные сервисы и сформировало рынок в $300 млрд долларов, то теперь нас ждет следующий подобный скачок — эра вертикальных ИИ-агентов.

Аналитики и инвесторы уже всерьез заявляют: вертикальные ИИ-агенты могут превысить масштабы нынешнего SaaS-рынка. ИИ-агенты могут заменить целую команду: от отдела продаж до QA-инженеров. Разница с классическим SaaS колоссальна: если SaaS повышал эффективность существующих команд, то ИИ-агенты позволяют создавать компании с куда меньшим штатом, а в перспективе - полная автоматизация бизнес-процессов компании.

В отличие от облачного приложения, которое упрощает отдельные операции, ИИ-агент самостоятельно планирует, действует и принимает решения. Также SaaS был общим инструментом для всех, а вертикальный ИИ-агент нацелен на конкретную функцию. 

Интересно, что крупным игрокам тяжело конкурировать в специальных вертикальных сегментах. Гиганты, подобно Google, игнорировали узкие ниши (скажем, автоматизацию специфических банковских операций или фарм-процессов) — именно там стартапы выигрывают. Они глубоко погружаются в специфику, обучают ИИ-модели на уникальных данных, создают технологический барьер для конкурентов и предлагают решение, за которое клиент готов платить больше, ведь оно идеально «заточено» под его задачи.

Эта ситуация напоминает ранний период SaaS, когда небольшие компании, вроде Salesforce, нашли «золотую жилу» до того, как старые IT-корпорации успели перестроиться. История циклична: сейчас — звездный час стартапов, работающих над вертикальными ИИ-продуктами.

Поэтому вот основные советы для технологических предпринимателей:

- Найдите проблему, которую ИИ может решить лучше, чем человек, и двигайтесь в сторону “вертикализации” решения, усиляя барьеры для конкурентов;

- Используйте уникальные данные для обучения более «умных» агентов;

- Начав с обертки над GPT, развивайтесь в сторону автоматизации полноценного рабочего процесса, интегрируясь с большим количеством инструментов.

Например, Harvey - GPT для юристов, подчеркивает тренд: нишевые задачи, ранее требовавшие десятков сотрудников, теперь может решать один специализированный ИИ-агент. Генерация контрактов, анализ законодательных актов, поиск судебных прецедентов — все становится «интеллектуальной рутиной» для ИИ.

Другой пример — превратить сервисный бизнес в продуктовую компанию: кадровые агентства, маркетинговые агентства, консультационные фирмы уже сейчас могут автоматизировать ключевые операции с помощью обученных на собственных экспертных данных ИИ-моделей. Это дает им технологическое преимущество, повышает маржинальность и открывает дорогу к упаковке сервисов в продукты.

Появление LLM, технологических платформ, а также инструментов вроде CrewAI, LangChain и n8n упростило создание ИИ-агентов. Также сегодня человек без навыков программирования может разработать простое приложение, используя ИИ. С правильно выбранной нишей и подходом можно быстро вывести на рынок MVP и протестировать спрос.

Мы находимся в уникальном моменте: ещё недавно гиганты определяли правила игры, а теперь небольшие стартапы могут захватить лидерские позиции в отдельных отраслях. Те, кто вовремя адаптируются, создав вертикальные ИИ-решения, способные заменить целые команды, окажутся в числе тех, кто будет делить пирог не в миллионы, а в миллиарды долларов.

Потенциал колоссален, а возможности безграничны. 

$300 млрд — не предел, а стартовая отметка для тех, кто решит пойти по пути вертикальных ИИ-агентов. Сейчас самое время начать действовать, чтобы войти в историю нового технологического бума.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 9: ↑6 и ↓3+3
Комментарии0

В соревновании Kryptonite ML Challenge от ИТ-компании «Криптонит» зарегистрировано уже 25 команд — самое время к ним присоединиться!

Зарегистрироваться на можно по ссылке Kryptonite ML Challenge — http://clc.to/kryptonite-ml

Я уже рассказывала, что главная задача участников — создать DeepFake-устойчивую Face ID-модель. Но что она должна уметь?

  • Распознавать фальшивые изображения, созданные с помощью DeepFake-технологий, без использования модулей защиты от спуфинга.

  • Точно сравнивать реальные фотографии одного и того же человека.

  • Различать снимки разных людей.

А оценивать участников будут эксперты — сотрудники лаборатории искусственного интеллекта «Криптонита»! Попросили их дать напутствие или совет участникам — читайте их ниже.

Георгий Поляков, заместитель руководителя лаборатории искусственного интеллекта

Друзья, рад вас всех приветствовать на нашем хакатоне. Мы постарались придумать для вас любопытную задачу, теперь ваша очередь быть креативными! Пусть ваши идеи будут смелыми, код — чистым, а решения — интересными. Вперёд, к победе

Виктор Подгорский, ведущий научный сотрудник направления обработки речи

Не бойтесь пробовать новые подходы и предлагайте нестандартные варианты. Зачастую именно в них прячется самое подходящее решение задачи!

Азамат Канаметов, специалист-исследователь

Желаю участникам вдохновения, упорства и уверенности в своих силах. Пускай ваши модели будут точными, данные — качественными, а идеи — смелыми. Не бойтесь пробовать новое, учиться на ошибках и искать нестандартные решения

Артём Рыженков, специалист-исследователь

Всем удачи в соревновании и творческого полёта! А пока есть время на подготовку, рекомендую ознакомиться с открытыми решениями по генерации лиц, посмотреть, какие есть открытые модели распознавания. Хотя я верю, вы уже и так готовы, и все у вас получится!

Теги:
Рейтинг0
Комментарии0

Подробная шпаргалка по промптам для DeepSeek с универсальной схемой, по которой китайский ИИ выдаст наилучшие ответы.

Маркетинг, кодинг, тексты, коучинг, психология — просто впишите в нейронку нужную вам роль и выбирайте любую задачу.

Например: copy Act as [Marketer] and create a [detailed plan for the brand improvement and promotion]. Show it as a [list]

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

От языковых моделей к моделям мира

Большие языковые модели (LLMs) впечатляют умением работать с текстом, но они не имеют реального понятия о трёхмерном мире, физике и логике пространства. Модели мира (World Models) обещают сделать шаг вперед от текстового понимания к пониманию среды, наделяя ИИ способностью «видеть», «чувствовать» и «предсказывать» поведение объектов и агентов.

Если языковые модели генерируют последовательности слов, то модели мира стремятся к глубинному моделированию реальности. Они берут визуальные, аудио- и прочие сенсорные данные (включая данные от камер, IoT-сенсоров, микрофонов), чтобы создать внутреннюю симуляцию мира: с физическими законами, динамикой движения, взаимодействиями объектов, NPC и людей. 

Одним из примеров таких систем стала Genie 2 — фундаментальная модель мира, способная на основе одного изображения создать интерактивное 3D-пространство, в котором можно управлять персонажем и выполнять различные действия. Genie 2 — авторегрессионная диффузионная модель, предсказывающая каждый следующий «кадр состояния» так же, как LLM предсказывает следующий токен. Но в отличие от чисто текстовых моделей, Genie 2 учитывает физику и трехмерность, позволяя агентам взаимодействовать со сценой. Это не просто генерация пикселей, а предсказание будущих состояний среды исходя из действий.

Другой пример - Sora от OpenAI, генерирующая до минуты реалистичного видео, моделируя динамику сцены, перспективу, свет, тени и взаимодействия с объектами. Подобно тому как языковые модели пользуются текстовыми токенами, модели мира работают с «патчами» — фрагментами визуальной информации. Sora сжимает входное видео в латентное пространство и разрезает его на патчи, которые затем обрабатываются трансформером.

Genie 2 и Sora способны «запоминать» объекты, моделировать эффекты гравитации и инерции, а также обеспечивать длительную согласованность сцен. В созданных ими виртуальных мирах персонажи стараются не терять форму, предметы не телепортироваться без причины — всё выглядит логичным и правдоподобным. 

Помимо генерации видео, Sora может симулировать поведение внутри игры Minecraft, включая управление агентом. А Genie 2 позволяет создавать бесконечно разнообразные игровые миры, где поведение объектов и персонажей не задано вручную, а выучено моделью. Агенту можно дать задание и наблюдать, как он осваивает новые навыки, решает задачи и самостоятельно адаптируется к непредсказуемым условиям.

Все это ведет к тому, что роботы на базе моделей мира смогут лучше понимать пространство, предсказывать последствия своих действий и безопаснее взаимодействовать с реальным окружением.

Однако перед нами встают более глубокие вопросы: как интерпретировать решения агентов на базе моделей мира, как избежать опасных сценариев, если модель «догадается» нарушить правила? Такие случаи пока редки и напоминают курьёзы, но уже показывают, что серьезная работа над безопасностью только начинается

Конечно, обучение на огромных видеодатасетах требует колоссальных вычислительных мощностей, куда больше, чем для LLM. Также для обучения нужно много разнообразных данных. Но результат того стоит, ведь одно из перспективных направлений применения моделей мира - симуляция физических законов для развития науки и технологий. Например, использование химических элементов как «слов» в моделях мира позволяет ИИ предсказывать новые материалы или лекарства.

Модели мира — это переход от «умных слов» к «умным действиям» и пониманию пространства. Мы подходим к эпохе, когда ИИ будет предсказывать физические процессы, понимать причинно-следственные связи и даже проявлять «здравый смысл». Хотя модели мира только начали развиваться, но именно они способны заложить фундамент для ИИ, который будет не просто приятным собеседником в чате, а полноценным субъектом в нашем сложном реальном мире.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

В 2024 году мировой агротех-рынок достиг $18,99 млрд, а к 2033 году он вырастет до $92,26 млрд, прогнозируют в Astute Analytica. Среднегодовой темп роста составит 19,2%.

Агротехнологические платформы преобразуют мировое сельское хозяйство, интегрируя передовые цифровые инструменты с традиционными методами ведения сельского хозяйства. Компании‑новаторы используют передовые сенсорные технологии, искусственный интеллект и IoT, чтобы предлагать точные решения по управлению растениеводством, мониторингу влажности почвы в режиме реального времени, динамическому обнаружению вредителей и адаптивному планированию орошения.

Сейчас крупнейшим рынком для агротеха аналитики называют Северную Америку с долей в 56,1%. Однако самым быстрорастущим они считают Азиатско-Тихоокеанский регион, особенно Китай и Индию. Одним из факторов быстрого роста они называют господдержку при внедрении устойчивых методов ведения сельского хозяйства. В США и Канаде 52% опрошенных основным препятствием для внедрения технологий на фермах называют высокие первоначальные затраты препятствием, а 40% — неясную рентабельность инвестиций.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Ближайшие события

Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты в новом обучающем трёхчасовом видео рассказал всю базу про нейросети, включая:

  • претрейнинг: как работает архитектура трансформер, из чего состоит и что такое токены;

  • файнтюнинг: психология LLM, галлюцинации, исправление ошибок в орфографии и прочие детали;

  • обучение с подкреплением: как нейросеть учится на обратной связи и улучшает ответы;

  • последние 10 минут видео — краткая выжимка лекции.

В рамках своей деятельности Карпаты активно занимается записью обучающих видеороликов на YouTube по созданию нейросетей, с пошаговыми инструкциями и выкладывает исходные коды на GitHub по различным проектам, связанным с машинным обучением и развитием нейросетей, включая проект nanoGPT для обучения/настройки GPT среднего размера.

В феврале 2024 года Карпаты выпустил лекцию на Youtube под названием Let's build the GPT Tokenizer. Это двухчасовая понятная и доступная лекция о токенах и токенизации в ChatGPT и других нейросетях. В видео Карпаты буквально на пальцах показывает, как именно нейросеть GPT читает текст, как дробит его на единицы и что в нём выделяет. Учебный материал поможет начинающим пользователям углубиться в изучение нейросетей, а также лучше понимать их устройство. Сопроводительный материал к этой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

Теги:
Всего голосов 6: ↑5 и ↓1+5
Комментарии1

В Германии доступен способ общения с ChatGPT по факсу. Пользователю нужно отправить запрос на бумаге на специальный номер, а ИИ пришлёт факс в ответ.

Номер для связи:0531-490590019.

Теги:
Всего голосов 6: ↑6 и ↓0+9
Комментарии0

Большие популяционные модели (LPM): как ИИ симулирует социальное поведение?

В знаменитой серии «Основание» Айзека Азимова математик Хари Сэлдон создает «психоисторию» — науку, способную предсказывать будущее человечества на основе законов массового поведения. Хотя это художественная выдумка, идея отражает глубокую истину: чтобы формировать наше общее будущее, нам необходимо понимать коллективное человеческое поведение.

Сегодня мы стоим на пороге революции в изучении общества. Большие популяционные модели (Large Population Models, LPMs) предлагают нам постоянно обновляющийся портрет человечества, который отражает сложные взаимодействия миллионов отдельных людей.

Большие языковые модели (LLMs) уже продемонстрировали способность генерировать связный текст, предсказывая следующее слово (токен) в предложении. LPMs берут эту концепцию, но вместо предсказания следующего слова, они предсказывают неизвестные атрибуты людей на основе известных данных. Это позволяет моделировать поведение целых обществ, заполняя пробелы в данных и создавая более полную картину человеческого взаимодействия.

Например, если мы знаем возраст, пол и место жительства человека, модель может предсказать его уровень дохода, образование или поведенческие привычки.

Потенциальные области применения больших популяционных моделей обширны:

- Здравоохранение: В период пандемии LPMs могут помочь моделировать распространение заболеваний, основываясь на передвижениях и контактах людей;

- Социальные исследования: Предупреждение о возможных социальных волнениях или гуманитарных кризисах путем анализа настроений и поведения больших групп людей;

- Экономика: Правительства и корпорации могут использовать модели для прогнозирования экономических тенденций и адаптации политик в соответствии с динамикой местных экономик.

Недавно ученые разработали модель под названием «Кентавр». Эта модель способна предсказывать и симулировать человеческое поведение в различных экспериментах, выраженных на естественном языке. Центавр создан путем дообучения Llama 3.1 70B методом QLoRA на уникальном наборе данных Psych-101. Этот набор данных охватывает более 60 000 участников, совершивших более 10 миллионов выборов в 160 различных экспериментах. 

Интересно, что дообучение модели также улучшает согласованность внутренних представлений Кентавра с нейронной активностью человека. Это означает, что модель не только предсказывает поведение, но и демонстрирует внутренние процессы, схожие с теми, что происходят в человеческом мозге. Это не просто шаг вперед в когнитивных науках, но и пример того, как большие модели могут помочь нам понять сложность человеческого поведения.

Сегодня в сфере маркетинговых исследований появляются так называемые синтетические респонденты — искусственные персоны для имитации человеческих ответов. Они могут использоваться для быстрой оценки новых продуктов или идей без необходимости проведения масштабных опросов.

AgentTorch - открытая платформа для создания и запуска масштабных симуляций популяций с использованием больших популяционных моделей. Долгосрочная цель платформы — «переизобрести перепись населения», создав полностью симулированную, но точно отражающую реальное население систему. 

LPMs предлагают нам инструменты для более глубокого понимания общества для принятия обоснованных решений. С такой мощной технологией приходит и большая ответственность. Важно обеспечить, чтобы использование LPMs было этичным и уважало конфиденциальность людей. Цель должна быть не в том, чтобы манипулировать обществом, а в том, чтобы лучше его понимать и принимать обоснованные решения. Будущее не предопределено, поэтому с помощью LPMs у нас есть возможность формировать его в лучшую сторону, используя знания для общего блага и прогресса всего человечества.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0
Сгенерировал в ИИшке
Сгенерировал в ИИшке

США ТРАТИТ В 100 РАЗ БОЛЬШЕ НА ИИ ЦОДЫ, ЧЕМ РОССИЯ

🔥Мир стоит на пороге новой эры искусственного интеллекта, и Америка не просто намерена участвовать в этой гонке — она стремится занять лидирующие позиции.Компании OpenAI, Oracle и SoftBank запускают амбициозный проект Stargate, который предполагает создание сверхмощных дата-центров и суперкомпьютеров, способных изменить правила игры в области ИИ, подержанный Трампом, привлечет инвестиции в размере ПОЛУТРИЛЛИОНА ДОЛЛАРОВ — сумма, сопоставимая с ВВП Израиля или Египта. Участники проекта готовы выделить 100 миллиардов уже на начальном этапе, оставшиеся 400 миллиардов будут инвестированы в течение следующих четырех лет. При этом SoftBank берет на себя финансовую ответственность, а OpenAI операционную. По информации с сайта OpenAI, строительство объектов уже началось, первая площадка создается в Техасе. Кроме того, компания активно ищет и оценивает потенциальные площадки по всей стране для организации новых ИИ-кампусов. После полного запуска потребляемая мощность всех комплексов составит около 5 ГВт, что сопоставимо с 83,3 миллионам обычных лампочек, работающих одновременно.

😥От этой новости голова идет кругом, когда сравниваешь такие инвестиции с российскими. Но стоит упомянуть, что США может себе ПОКА позволить напечатать эти зеленые бумажки, так как еще является резервной валютой, а вот России необходимо быть аккуратнее с инвестициями, чтобы не создать дисбаланс во всех отраслях - жаль, что мы не можем печатать, как в США... Помимо этого, не нужно забывать про количество населения в Америке чуть более 300 миллионов, а в России чуть более 140 миллионов - а это сказывается на количестве потребления и покупательской способности.

Недавно я писал пост, почему потребление ИИ увеличиться, а не уменьшится.

🇷🇺В России расклад такой, в перспективе ближайших 5 лет в отрасли «ЦОДы и Дата-центры» будут проинвестированы 120 проектов на сумму 596,4 млрд рублей. Это крупные дата-центры (от 500 стойко-мест), не считая, маленьких периферийных ЦОДов, в которые также активно инвестируют компании. Чуть-чуть отвлекся, теперь назову самых крупных инвесторов в традиционные дата-центры: Сбер (142 млрд), ЕвросибЭнерго (120 млрд), Датапро (50 млрд), Газпром (41 млрд) и Тензор (30 млрд). 

❗️НО, мы планируем стать технологическим лидером в БПЛА (после заявлений нашего президента), а это поможет нам более быстрее исполнять разного рода задачи на ШИРОКИХ просторах матушки России и возможно сделать прорыв в экспорте, помимо нефти и газа.

Как вы считаете, сможет ли Россия быть технологическим лидером в общей гонке технологий? Жду ваших прогнозов в комментариях. Пишу об инновациях и взрывных новостях в технологическом секторе в своем тг-канале.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Будущее сельского хозяйства тесно связано с технологическими достижениями, в отчёте Agritecture Consulting и CEAg World выделили 5 факторов, подчёркивающих растущую роль технологий в агроотрасли.

Улучшение качества и урожайности культур — главное, чего ждут от новых технологий. Улучшение урожайности, даже на уровне 5%, может существенно повлиять на финансовые модели фермеров. Производители придают большое значение использованию технологий для повышения как качества, так и количества своих культур. Современные системы, такие как инструменты точного земледелия, климат-контроль и оптимизированное орошение, помогают максимизировать производство и обеспечивать высокое качество продукции.

Упрощение операций для повышения эффективности. Автоматизация, ИИ и робототехника снижают ручной труд и улучшают рабочие процессы. Для агроотрасли это  минимизация операционных затрат.

Снижение затрат на рабочую силу. Рабочая сила является значительной статьей расходов в сельском хозяйстве, и многие производители ищут технологии для снижения зависимости от человеческого труда. Автоматизация и робототехника рассматриваются как ключевые факторы для сокращения этих затрат при сохранении производительности.

Принятие решений на основе данных. Умение собирать и анализировать данные для более обоснованного принятия решения имеет важное значение для современного сельского хозяйства. Технологии, такие как датчики, IoT и ИИ, предоставляют информацию в реальном времени, помогая производителям оптимизировать свои операции и вносить коррективы на основе данных.

Поддержка устойчивых практик. Многие производители рассматривают технологии как способ достижения большей устойчивости через более эффективное использование воды и энергии или через снижение отходов и выбросов. Сельское хозяйство стремится сбалансировать продуктивность с экологической ответственностью.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Большие поведенческие модели (LBM): новый этап в развитии ИИ

Представьте робота, который изучает, как вы готовите еду, и с каждым приготовленным вами блюдом он сам становится всё более искусным поваром. Разбираемся, как большие поведенческие модели (LBM) помогут роботу в этом деле.

Несмотря на впечатляющие достижения больших языковых моделей (LLM) в обработке и генерации текста, они не умеют обрабатывать изображения или сенсорные данные, необходимые роботу для ориентации в физическом пространстве, “понимания” объектов и обучения действиям пользователя. Так Visual Language Models (VLM), обрабатывающие визуальные данные, могут “понимать” содержимое изображений и отвечать на вопросы по изображениям.

Large Action Models (LAM) обучены на данных о действиях (в том числе из сенсоров). LAM превращают LLM в автономных агентов, способных выполнять комплексные задачи, ориентированные на вызов определённых функций, улучшенное понимание и планирование.Salesforce уже начали выпускать такие модели для автоматизации процессов.

Visual Language Action Models (VLA) обучены на визуальных данных и данных о действиях. Они дают LLM возможность быть “воплощённым” агентом (Embodied Agent) в физическом мире. Например, RT-2 демонстрирует способность робота выполнять сложные команды благодаря использованию цепочки рассуждений. PaLM-E — мультимодальная языковая модель с 562 миллиардами параметров, демонстрирующая высокую универсальность и эффективность. А OpenVLA — открытая модель с 7 миллиардами параметров поддерживает управление несколькими роботами одновременно.

Для обучения агентов применяется обучение с подкреплением. Существуют различные RL-методы, но в целом обучение агента построено на политике вознаграждений и наказаний за совершение определённых действий. Среди RL-методов также есть обучение с подкреплением на основе обратной связи от пользователя.

Комплексно задачу по обучению роботов действиям человека решают LBM (Large Behavior Models) — большие мультимодальные поведенческие модели, представляющие новое направление в ИИ. LBM направлены на понимание, моделирование, адаптивное обучение и генерацию человеческого поведения в физическом мире (похоже на RLHF на основе данных из физического мира).

Большие поведенческие модели уже используются на практике:

1. В Lirio разработали первую в мире LBM для здравоохранения. Их модель создаёт гиперперсонализированные рекомендации для пациентов на основе медицинских данных и данных о поведении пациента от различных датчиков.

2. Toyota Research Institute совершил прорыв в обучении роботов новым сложным навыкам с помощью метода Diffusion Policy. Их роботы могут быстро осваивать новые действия, такие как наливание жидкостей или использование инструментов, без необходимости перепрограммирования.

3. Стартап Physical Intelligence привлёк $400 миллионов инвестиций от Джеффа Безоса, OpenAI и других крупных игроков. Они стремятся создать роботов, которые смогут выполнять любые задачи по запросу пользователя, будь то уборка, сборка мебели или обслуживание клиентов.

Однако, как отмечал философ Людвиг Витгенштейн в своём "Логико-философском трактате": "Границы моего языка означают границы моего мира". Это актуально для LBM, так как они всё ещё ограничены данными, на которых обучены. Их "мир" определяется теми модальностями, что они могут воспринимать через сенсоры и понимать с помощью алгоритмов.

Для обучения качественной поведенческой модели нужно больше датчиков для сбора данных из различных модальностей. Так данные электроэнцефалографа позволили бы лучше распознавать и имитировать эмоции. А обучение моделей с помощью синтетических данных из симуляций делает "картину мира" LBM более разнообразной.

В реальном мире мы пока можем отличить робота от человека. Но возникает вопрос: а как мы будем отличать человеческое поведение от ИИ в цифровом мире?

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии5

У китайской компании ByteDance был случай. Их стажёр на что-то обиделся и решил саботировать работу: он внедрял зловреды в модели машинного обучения и подменял её чекпоинты. В итоге вся команда два месяца, вместо того, чтобы работать, пыталась понять, что же происходит? Стажёры, не надо так!

А это стажёр сделал вещи, которые заметны. А что если кто-то будет делать то, что незаметно по логам или по метрикам? Например, в модель встроит триггеры и изменит в целом смысл продукта.

Тут вновь встаёт вопрос доверия к искусственному интеллекту и его аудиту.

Что нужно делать, чтобы доверять моделям ML?

  • так обучать модели, чтобы они были устойчивы к разному классу атак (состязательный шум, состязательные патчи и так далее);

  • проверять наборы данных на закладки, аномалии; проводить очистку данных;

  • проверять модели на закладки, проводить очистку;

  • повышать интерпретируемость моделей;

  • защищать модели на основе пред- и постобработки;

  • противодействовать краже, инверсии моделей, определению принадлежности;

  • проводить постоянный мониторинг.

Доверенной может называться только та система, которая разрабатывалась на платформе с правильной методологией разработки и которая контролирует процесс.

А вот признаки, что этой ML-платформе можно доверять:

  • правильная методология разработки в ML;

  • много переиспользуемых инструментов обеспечения доверия;

  • автоматизация и прозрачность использования инструментов обеспечения доверия;

  • интеграция со всеми этапами жизненного цикла модели машинного обучения:

  • появились новые угрозы — появились новые инструменты борьбы.

Пост написан по мотивам доклада Максима Рындина «Роль ПО автоматизации процессов для обеспечения доверия в машинном обучении». Он представил его на V встрече экспертного сообщества по криптографии и большим данным, которую организовал «Криптонит» при поддержке Музея криптографии. Дискуссия была посвящена теме аудита безопасности систем ИИ.

Смотрите запись встречи
📺 на Rutube
📺 в VK видео

Теги:
Всего голосов 4: ↑2 и ↓20
Комментарии0