Все потоки
Поиск
Написать публикацию
Обновить
1112.59

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Vision Language World Model: язык как картина мира

Время на прочтение4 мин
Количество просмотров465

До сих пор искусственный интеллект воспринимает мир как набор пикселей. Но что, если научить ИИ понимать смысл увиденного, а не только картинки? Один из свежих подходов — VLWM: модель, которая переводит реальность в слова и смыслы, позволяя роботам строить осмысленные планы на будущее. В этой статье разбираемся, как агенты научились планировать, проверять гипотезы внутри своей модели мира и выбирать самый разумный вариант.

Читать далее

Решить задачу с помощью AI-помощника, «прожарить» резюме и выиграть мерч: как прошла IT-конференция GoCloud Tech 2025

Время на прочтение5 мин
Количество просмотров372

Привет! С вами снова Дима Юдин — технический лидер по развитию искусственного интеллекта и ведущий трека про AI&ML. Как и обещал, делюсь подробностями, новостями и обновлениями с нашей IT-конференции GoCloud Tech 2025, которая состоялась в эту среду 3 сентября. На ней мы попробовали объединить AI, облачные технологии и данные. И вот что из этого получилось.

Читать далее

От Excel до ИИ: зачем бизнесу переходить на Smart Analytics

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.6K

Вы когда-нибудь открывали папку «Архив_2017», чтобы среди файлов вроде «отчет_финал_второй_финал.xls» найти нечто, от чего зависит судьба проекта? А бывало в вашей компании такое, когда директора спорили на совещаниях: «Интуиция подсказывает — этот клиент уйдёт» — «А у нас цифры говорят, что останется»?

Читать далее

Не «ты — эксперт », а «думай так» — альтернативный промтинг для LLM

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров11K

А что если давать ИИ не роль, а задать правила мышления? Рассматриваю альтернативный способ работы с LLM — архитектурный промтинг. В отличие от классической схемы («роль, контекст, формат, пример»), он смещает акцент на логику рассуждений и встроенные критерии проверки. Мне такой подход помогает снизить количество "галлюцинаций" и не терять интересные идеи в исследовательских и творческих задачах.

Читать далее

Большие языковые модели как новый уровень абстрагирования

Время на прочтение3 мин
Количество просмотров1.9K

Как и большинство серьёзных спикеров в IT, я внимательно слежу за тем, какую роль могут сыграть в разработке ПО системы генеративного искусственного интеллекта. Думаю, возникновение больших языковых моделей (LLM) повлияет на разработку ПО примерно в той же степени, что и переход с ассемблера на первые высокоуровневые языки программирования. Чем дальше развиваются языки и фреймворки, тем сильнее абстрагируется наш код и, соответственно, возрастает продуктивность, но такие изменения пока не касаются самой природы программирования. При применении LLM – уже касаются, но я хочу поговорить о том, что LLM не только повышают уровень абстракции. Пользуясь ими, приходится учитывать, как выглядит программирование с использованием недетерминированных инструментов.

Как я уже говорил, высокоуровневые языки программирования вывели нас на совершенно новый уровень абстракции. Работая с ассемблером, я думаю о наборе инструкций для конкретной машинной архитектуры. Мне приходится продумывать даже самые простые действия, размышляя, как я буду осуществлять те или иные последовательности действий, записывая данные в нужные регистры. Но при работе с высокоуровневыми языками появилась возможность обдумывать программу как последовательность команд, в которой предусмотрены условные операторы, чтобы выбирать альтернативы для продолжения. Также в программе есть итерации, чтобы раз за разом применять команды к наборам значений данных. Многие элементы кода можно именовать, чтобы было ясно, что именно понимается под теми или иными значениями. Ранние языки программирования явно были в чём-то ограничены. Я начинал программировать на Fortran IV, где у операторов «IF» не было условия «ELSE». Поэтому мне приходилось как-то запоминать мои целочисленные переменные, и я начинал их с букв от «I» до «N».

Читать далее

Три сказа о построении RAG: От выбора модели до форматирования базы знаний

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров6.6K

Привет! Меня зовут Александр Золотых, уже два года я работаю во ВкусВилле разработчиком ИИ-решений. В этой статье хочу рассказать, как мы сделали карманного консультанта по клиентократии — и зачем вообще он понадобился.

ВкусВилл работает по клиентократии — модели управления, которую развивает и распространяет система управления  Beyond Taylor. Основная особенность клиентократии — фокус на клиенте, когда все процессы компании выстраиваются для удовлетворения его потребности. Модель инновационная: погружаешься, и возникает множество вопросов. Конечно, лучше спросить и узнать, чем не спросить и не узнать, но не всем и не всегда это просто. Значит, нужно снижать порог входа и сделать описание модели ближе к изучающему.

Именно из этого понимания у нашей команды и появилась идея карманного консультанта — инструмента, который готов отвечать на все «глупые» и каверзные вопросы. Мы поделились замыслом с коллегами из Beyond Taylor, получили их поддержку и приступили к реализации. Так родилась наша первая задача с тем, что сейчас называется RAG (Retrieval-Augmented Generation).

Конечно, есть готовые решения (Notebook LM, Нейроэксперт), но они имеют несколько минусов:

Читать далее

Забудьте о chatGPT, следите за Niantic

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров20K

Когда сегодня говорят про искусственный интеллект, почти всегда имеют в виду GPT-модели. Кажется, что весь рынок инноваций свёлся к чатам с нейросетями. Но это  искажение. Пока внимание сосредоточено на OpenAI, рядом существует компания, которая делает не менее масштабную революцию, но в другой плоскости.

Niantic — та самая студия, подарившая миру Pokémon Go. Для многих это всего лишь игра с покемонами в дополненной реальности. Но на самом деле Niantic годами выстраивает совершенно другой бизнес: она превращает миллионы игроков в добровольных картографов, которые собирают уникальные данные о мире. И эти данные становятся основой для геопространственных ИИ-моделей — того самого «пространственного интеллекта», который завтра будет управлять роботами, строить 3D-карты городов и задавать новые стандарты AR.

Читать далее

How I Learned to Stop Worrying and Love the… BDSM

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров743

Это публикация‑опрос. Поэтому и такой заголовок :-) Отсылку поймут не только лишь все, но главная цель — привлечь внимание народа к опросу.

В принципе, публикацию можно даже и не читать. Она просто поясняет, откуда взялись два варианта между которыми нужно выбирать по итогу — какое из двух названий лучше применить в технической документации.

Буду благодарен всем, кто поучаствует в голосовании.

Читать далее

PCW — новая метрика продуктивности разработчиков с ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров560

Команда AI for Devs подготовила перевод статьи о метрике Percentage of Code Written (PCW) от Windsurf. Эта метрика показывает, какой процент кода в проекте реально пришёл от ИИ. Авторы утверждают: PCW надёжнее привычных показателей вроде acceptance rate и отражает, насколько продукт действительно помогает разработчикам. А как вы думаете — можно ли измерить ценность ИИ в цифрах?

Читать далее

Мир после GPT-5: как одна презентация обрушила веру в технологическое чудо

Уровень сложностиПростой
Время на прочтение22 мин
Количество просмотров3.5K

Презентация GPT-5, ожидавшаяся как революция, обернулась разочарованием. Это событие вызвало споры о пределах возможностей LLM. В статье анализируется, почему технология, названная Ноамом Хомским «Т9 на стероидах», пока не способна на научные открытия. Что ждет индустрию дальше? Рассматриваются технические барьеры, гонка за вычислительными мощностями и фундаментальные вопросы о будущем ИИ. Создаем ли мы помощника или цифрового бога в надежде решить все проблемы человечества.

Читать далее

Создание Системы генерации ответов на истории тикетов поддержки (часть 1)

Время на прочтение5 мин
Количество просмотров859

Привет, Хабр!

Меня зовут Анатолий, занимаюсь диалоговыми системами, автоматизацией бизнес-процессов, применением Искусственного Интеллекта в бизнесе.

Кейсовая задача - создать ассистента оператора службы поддержки, используя существующую историю тикетов.

Читать далее

Почему Text-to-SQL до сих пор ломается и как это исправить

Время на прочтение3 мин
Количество просмотров3.5K

Если вы когда-нибудь пытались получить нужный отчет из базы данных с помощью ИИ — скорее всего, столкнулись с забавной загадкой: почему-то даже продвинутые языковые модели то спотыкаются на связях между таблицами, то забывают ключевую фильтрацию, то просто возвращают не тот ответ. Формально запрос работает, а по сути — совсем не то. Почему так происходит? И можно ли научить ИИ писать правильный SQL, а не гадать до бесконечности?

В новой статье исследователи предлагают необычный подход: они учат модель распознавать собственные ошибки и исправлять логику, а не просто механически менять структуру запроса. Заодно выясняем, насколько такая система помогает избежать классических промахов и что изменится для пользователей, которым важно получать не просто рабочий код, а действительно осмысленный результат.

Читать далее

Хроники хроноскопа

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров1.2K

Приведём здесь найденные в архивах древних записей сохранившиеся сведения о древнем чуде света (в буквальном смысле) - хроноскопе. Записи датируются 1177 годом текущей эры. Предположительно, эти сведения были составлены в соавторстве с некоей египетской Фантазией.

Вперёд в прошлое

Ближайшие события

Насколько безопасно загружать свои фотографии в ChatGPT?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров7.1K

Загружая фото в ChatGPT или другие ИИ-сервисы, мы редко задумываемся, что отдаем куда больше данных, чем кажется на первый взгляд. Метаданные, детали фона, лица посторонних людей или даже случайно попавшие в кадр документы могут превратиться в ценный набор информации для компаний и потенциальных злоумышленников. Эксперты по кибербезопасности предупреждают: снимок, который вы считаете безобидным, может продолжить существовать и использоваться компаниями и системами ИИ даже после того, как вы завершите с ним взаимодействие.

Читать далее

Внедрение структурированных данных для ИИ-ассистентов: FAQPage, HowTo, таблицы сравнений

Время на прочтение6 мин
Количество просмотров1.4K

Всем привет! Меня зовут Андрей Попов, я SEO-специалист в AGIMA. Сегодня поговорим на тему, которая в 2025 году становится критически важной для любого бизнеса, работающего в диджитал. Поисковые системы и ИИ-ассистенты вроде Алисы, Gemini или ChatGPT меняют правила игры: они теперь не просто ищут страницы, а сами «понимают» контент, анализируют его и выдают готовые ответы пользователям.

Классическое SEO уже не работает без глубокого внедрения структурированных данных. Именно микроразметка превращает ваш сайт в «язык», который понимают машины. FAQPage, HowTo, таблицы сравнений — это не просто технические теги, а прямые мосты между вашим контентом и ИИ. В этой статье разберем, как сделать сайт читаемым для искусственного интеллекта и при этом полезным для живых людей.

Читать далее

Секрет идеального звука в Veo 3: анализ успешных промптов

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.9K

Давайте поговорим о самом недооценённом навыке в генерации видео. Нет, это не подбор оформления «в стиле Миядзаки» и не магия идеального освещения. Это — звук. Именно он создаёт то самое неповторимое настроение, ту самую магию, которая заставляет зрителя досмотреть ваш шедевр до конца, а не закрыть через три секунды.

Суть в том, чтобы не перечислять звуки, а погружать нейросеть в атмосферу, описывать мир вокруг так, как будто вы сами в нём находитесь. И знаете, это сработало! Veo 3 оказался куда более чутким слушателем, чем я думал.

Читать далее

Нейро-дайджест: ключевые события мира AI за 1 неделю сентября 2025

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.9K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной: xAI выкатила Grok Code Fast 1, Microsoft показала первую LLM. Громкий релиз nano-banana, Anthropic тестирует Claude в Chrome, Krea показывает реалтайм-видео, а YouTube тихо апскейлит ролики.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Google Veo 3: как оживить картинку или фото (со звуком)

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров12K

Спустя пару месяцев после релиза, в самом конце июля, разработчики Google Veo 3 добавили ту самую кнопочку Загрузить изображение. Я обожал эту фишку в Veo 2, но в третьей версии нейросеть просто взлетела по качеству. В общем, в этой статье — полный разбор, как оживить со звуком всё что угодно: от вашего кота до стрит‑арта Бэнкси.

Читать далее

80% хайпа, 20% выхлопа: что не так с генеративным ИИ в бизнесе

Время на прочтение7 мин
Количество просмотров2.6K

Последнее время про генеративный ИИ не говорит и не пишет только ленивый (я вот, например, точно не ленивый). Причем это последнее время тянется уже минимум года 2–3 — с тех пор, как, собственно, OpenAI прогремели с ChatGPT 3. И скажу даже больше, если посмотреть на профильные ИИ‑конференции, то 80-90% докладов будет про генеративный ИИ. А если посмотреть на отраслевые конференции, то 80-90% докладов про применение ИИ в той или иной отрасли.

Честно скажу — такое засилье генИИ меня несколько удивляет. Складывается ощущение, что никакого другого ИИ уже не существует и все уже забыли про видеоаналитику, предиктивку и вот эти все непонятные слова.

Что любопытно, если посмотреть на оценки экономического эффекта от внедрения генИИ, то он достаточно скромен — 20%, по данным исследования «Яков и Партнеры». Вот и получается — 80% шума дает нам ИИ, который на самом деле принесет только 20% денег. Такой «принцип Парето» наоборот получается. И эти цифры меня заставили задуматься — а в чем же причина такой популярности генеративного ИИ, и почему так много шума из‑за не самой полезной темы?

Читать далее

Semantic RAG – как научить AI-ассистентов понимать, а не угадывать

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров6.8K

Одна из самых распространённых задач для AI-ассистента — поиск ответов на вопросы. Пользователи ожидают, что он сможет находить информацию во внутренних wiki, базах знаний техподдержки, Word-документах, Excel-файлах и других корпоративных источниках.

Сегодня такой поиск чаще всего реализуется с помощью подхода Retrieval-Augmented Generation (RAG). Суть проста: сначала ассистент находит фрагменты документов, которые кажутся релевантными запросу, и уже на их основе формирует связанный ответ.

На первый взгляд схема выглядит логичной. Но на практике у классического RAG есть целый ряд ограничений, которые быстро дают о себе знать при реальных внедрениях. В этой статье мы разберём основные проблемы и покажем, как можно их обойти.

Читать далее

Вклад авторов