Обновить
1363.49

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Путешествие токена: что конкретно происходит внутри трансформера

Время на прочтение7 мин
Охват и читатели7.7K

Из этой статьи вы узнаете о том, как трансформеры преобразуют входные данные в контекстно-зависимые представления и, в итоге, выдают вероятности, влияющие на выбор слов, которые генерируют большие языковые модели.

Читать далее

Агенты Купер, Смит или Джеймс Бонд: какие виды ИИ-агентов бывают и какой подходит тебе

Время на прочтение6 мин
Охват и читатели5.7K

ИИ-агенты на пике хайпа и обсуждений, пускай многие сомневаются, что этот тренд надолго. Согласно исследованию нашей команды Research & Insights Центра стратегии цифровых продуктов МТС, вкладываться в эту технологию и использовать ее в мире будут всё больше/чаще/активнее/быстрее/мощнее. 

В полном тексте исследования проанализировали ситуацию, тренды и возможные сценарии. Разбор основных тезисов мы уже публиковали. В этой части расскажем про виды агентов — какие они бывают и для чего применяются.

Читать далее

Один чип вместо тысяч серверов, или глобальный конкурент Nvidia

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели22K

Пока все обсуждали, насколько мощнее стали новые GPU, возникла другая проблема: большие модели не помещаются туда, где их пытаются запускать. Дата-центры дорожают, пропускные сети упираются в физические пределы, а зависимость от облака становится стратегическим риском. О компании, которая предлагает альтернативную инфраструктуру для ИИ.

Читать далее

Галлюцинации ИИ — это не баг, а фича разработчика. Почему вайб-кодинг не заменит программистов

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели9.1K

Недавно провели стрим, где собрались специалисты, у которых ИИ не в презентациях, а в production. Провели разговор про галлюцинации моделей и про будущее разработки с ИИ. Ниже основные мысли — получился материал про три уровня работы с ИИ (вайб-кодинг, ИИ-ассистированная разработка и промышленный конвейер), про экономику вопроса и про то, почему галлюцинации — это не приговор, а управляемый риск.

Читать далее

Почему токсичные эксперты больше никому не нужны — и при чём тут ИИ

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели7.4K

ИИ фактически обнулил модель «эксперта, который знает всё». Почему исчез поток джун-вопросов, куда делась токсичность и что теперь считается настоящей экспертностью — разбираю на примерах.

Читать далее

Мы заглянули в «мозг» нейросети и поняли, почему она не способна предсказывать будущее

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.7K

Недавние исследования намекают, что большие языковые модели (LLM) становятся всё лучше в предсказании будущего. И хотя меня это не удивляет, я скептически отношусь к тому, что их успехи смогут превзойти лучшие человеческие прогнозы. Я уж точно не ожидаю, что LLM смогут предсказать траекторию человеческой истории с точностью физика.

Причина в том, что наблюдения LLM фундаментально ограничены анализом языка. И, как я покажу, этого недостаточно для надёжного долгосрочного прогнозирования.

Читать далее

Анализ оценки проекта с помощью искусственного интеллекта: как выявлять ошибки до начала проекта

Время на прочтение8 мин
Охват и читатели5.5K

Давайте предположим, что мы уже подготовили оценку проекта и впереди ее защита. В идеале, чтобы защита прошла максимально гладко, ее должен предварительно проверить опытный и независимый эксперт, чтобы выявить ошибки, пропущенные требования, непонятные места, риски и другие слабые моменты. Сегодня эту роль может выполнить искусственный интеллект: он способен проанализировать структуру оценки, подсветить проблемные зоны и указать на то, что требует дополнительного внимания.

Читать далее

xAI провела 24-часовой хакатон: как инженеры использовали Grok в играх, рекрутинге и кибербезопасности

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели5.5K

Компания xAI представила результаты 24-часового внутреннего хакатона, на котором команда разработчиков создавала прототипы на базе Grok - AI-модели, тесно интегрированной с платформой X. Формат был простым: сутки непрерывной работы и полная свобода экспериментировать с агентами, обработкой данных и интеграциями. Но именно эта «сжатость» хорошо показала, как быстро Grok превращается в инструмент для прикладных задач, а не просто чат-модель.

Читать далее

Роскомнадзор пытается заблокировать ВСЁ, а также красный уровень тревожности в OpenAI

Время на прочтение9 мин
Охват и читатели74K

Самые интересные новости финансов и технологий в России и мире за неделю: РКН заблокировал FaceTime, Snapchat и Roblox, безвиз с Китаем и Саудовской Аравией, Россию внесли в черный список отмывания денег ЕС, в Южной Корее взломали домашние камеры наблюдения, Твиттер Маска оштрафовали в Европе, а также слухи о «чесночной» модели от OpenAI.

Читать далее

Логический компас для искусственного интеллекта

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.6K

Международный коллектив ученых из Сколковского института науки и технологий, МФТИ, Института исследований искусственного интеллекта (AIRI) и Университета Париж-Сите разработал новый, элегантный метод для проверки логических способностей больших языковых моделей (LLM). Вместо того чтобы судить о правильности рассуждений нейросети лишь по ее финальному ответу, исследователи научились заглядывать внутрь ее механизма «внимания» и находить там скрытые паттерны, отвечающие за проверку логики. Этот подход, названный QK-score, позволяет с высокой точностью определять, следует ли модель законам логики на каждом шаге своих рассуждений, делая ее работу более прозрачной и надежной. Результаты исследования, открывающие путь к созданию более предсказуемого и безопасного ИИ, были приняты на main track of EMNLP 2025, и опубликованы в виде препринта на портале arXiv.

Читать далее

Фактчекинг за $0.09: GPT-5-mini + Perplexity sonar-pro в продакшене

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели12K

35–40 фактчеков в день. $110 в месяц. 30 секунд на проверку вместо часа.
Это не маркетинговые обещания — это наш production за два месяца. Рассказываю, как мы построили автоматический фактчекинг для новостного пайплайна: почему Perplexity, а не LLM + web_search; какие параметры поиска реально работают; и почему пришлось писать свой клиент вместо SpringAI.

Читать далее

Искусственный интеллект без иллюзий: как не сжечь бюджет компании на хайпе (Часть 2)

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.1K

Это вторая часть цикла публикаций, где мы говорим не о теории искусственного интеллекта, а о суровой реальности его внедрения в бизнес. В первой части мы обсуждали стратегические ловушки, а теперь настал черед уровня данных, который оказался для нас минным полем.

Читать далее

Насколько полезны объяснения кода от SourceCraft?

Уровень сложностиПростой
Время на прочтение28 мин
Охват и читатели10K

Недавно на Хабре появилась функция "Объяснить код с SourceCraft", реакция на которую была неоднозначна из-за довольно странного решения сделать эту функцию обязательной, а не опциональной. Мусолить эту тему особо желания нет, а вот пройтись по существу хотелось бы, потому что как мы все знаем LLMки довольно хороши в коде, который уже миллион раз был выложен в открытый доступ, но вот со всякими редкими штуками есть проблемы, а еще они позвиздеть любят. В этой статье распишу как я прошёлся по сниппетам кода в двух своих статьях на хабре, попросил SourceCraft пояснить сломанные варианты этих сниппетов, и что из этого вышло. Спойлер: результат лучше, чем я предполагал, штука определённо полезная если использовать с умом.

Дисклеймер. За эту статью мне никто не платил, в ней есть сгенерированный контент, он явно обозначен и спрятан под спойлеры, а я вообще скептик относительно AI, но стараюсь трезво и честно оценивать его.

Читать далее

Ближайшие события

Как написать код в два счёта: впрягаем Codex с GPT

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели11K

В предыдущих статьях я показывал, как собрать вокруг GitHub Copilot полноценный рабочий процесс и как делать «снимки» проектов в JSON для ИИ. В этот раз — ещё один режим: двухшаговая разработка с GPT и Codex, где я сначала вместе с моделью оформляю нормальное ТЗ, а потом отдаю его Codex как «старшему разработчику». Без сложных агентов, с минимальным количеством действий, но с понятным результатом в коде.

Читать далее

Опыт использования нейросетей в практике врача терапевта

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели10K

Практический опыт использования нейросетей практикующими врачами определяется сложным взаимодействием трех ключевых осей: технической эффективности (повышение точности и скорости), операционной интеграции (бесшовная встройка в рабочий процесс) и регуляторной среды (доверие, этика и юридическая защищенность). Отсутствие гармонии в любой из этих осей неизбежно приводит к сопротивлению внедрению и нивелирует потенциальную клиническую пользу.

Читать далее

Олимпиады — всё?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели23K

Думаю, что среди читательской аудитории Хабра многих бывших (а возможно, и действующих) олимпиадников, поэтому решил поделиться с сообществом наблюдениями и размышлениями об актуальных проблемах олимпиадного движения в стране. Коротко о том, какое я имею отношение к олимпиадному движению и почему считаю себя в праве публично высказываться на эту тему: я сам бывший олимпиадник (призёр Всероса по информатике), 15 лет веду кружки по информатике и программированию и, в том числе, готовлю школьников к выступлению на олимпиадах, среди моих учеников призёры Всероса по информатике, ВКОШП и других олимпиад по информатике и программированию, кроме того вот уже 10-ый год подряд я участвую в подготовке и проведении школьного и муниципального этапа ВсОШ по информатике в своём регионе.

Позавчера после опубликования результатов муниципального этапа по информатике этого года мама одного из участников прислала мне сообщение: "Я хочу сказать вам спасибо за дисквалы. Потому что списывание достигло какого-то маразма. И по другим предметам вообще ничего не боятся и ничего не стесняются". Речь идёт о том, что мы дисквалифицировали большое количество участников муниципального этапа за списывание друг у друга и за использование искусственного интеллекта при решении задач. В олимпиадах по информатике всё, что делает участник, фиксируется в тестирующей системе, и мы, жюри, имеем возможность анализировать это и на основании определённых критериев делать вывод о несамостоятельности выполнения работы. В силу специфики профессии мы, информатики, во-первых, имеем технические возможности бороться со списыванием, а, во-вторых, воспринимаем сложившуюся ситуацию как некий вызов, которому интересно попытаться что-то противопоставить. Но ситуация постепенно ухудшается. Ниже статистика дисквалификаций на муниципальном этапе ВсОШ по информатике по 9-11 классам по нашему региону:

Читать далее

Как LLM-вендоры обращаются с вашими данными: подробный разбор безопасности и конфиденциальности

Уровень сложностиПростой
Время на прочтение20 мин
Охват и читатели11K

Привет, Хабр! Я Андрей Яковлев, исследователь в области информационной безопасности. Работаю с корпоративными AI‑сервисами и активно внедряю технологии искусственного интеллекта в продукты Positive Technologies.

2025 год перевернул привычные ожидания и практики, связанные с конфиденциальностью больших языковых моделей (LLM) Представьте ситуацию: вы технологическая компания, которая несколько лет использует ChatGPT для быстрого прототипирования и поддержки клиентских запросов. Раньше казалось, что раз диалог удалён — значит, данные исчезают навсегда. Но в мае 2025 года федеральный суд США в рамках искового дела The New York Times к OpenAI поставил точку в этом заблуждении — OpenAI обязали бессрочно хранить все пользовательские данные (включая удалённые через пользовательский интерфейс).

В этой статье я разберу различные LLM-ки и расскажу, как их разработчики решают проблему конфиденциальности. Предупреждаю – достанется всем :)

Исследование охватывает западных вендоров (OpenAI, Anthropic, Google AI, GitHub Copilot), российские решения (GigaChat, YandexGPT), китайскую платформу DeepSeek, а также ключевых провайдеров-агрегаторов (OpenRouter, Cursor, Windsurf). Анализ включает детальное сравнение политик для частного и корпоративного использования, документированные случаи утечек данных и их последствия, а также практические рекомендации по выбору решений в зависимости от требований к безопасности данных.

Читать далее

Обзор на Gemini 3 Pro

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели16K

Цифры впечатляют: 37,5% на Humanity’s Last Exam, 1 048 576 токенов контекста, 13 миллионов активных юзеров‑разработчиков. За ними стоит Gemini 3 Pro — новая вершина в линейке ИИ‑моделей Google.

Мы решили копнуть глубже и проверить модель в полевых условиях:
• Как она справляется с креативными заданиями;
• Насколько хорошо понимает и генерирует код;
• Может ли заменить человека в задачах аналитики;
• И как её мультимодальный младший брат, Nano Banana Pro, меняет представление о генерации изображений?

Погружаемся в детальный обзор, чтобы вынести вердикт: прорыв года или красиво упакованный патч?

Читать далее

Используем несколько нейронок безопасно и через единый интерфейс. Инструкция по внедрению LiteLLM

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели12K

Есть несколько очевидных проблем с LLM: утечка конфиденциальных данных и кода, компрометация токенов, зависимость от внешних провайдеров. О них знают все, но это никого не останавливает. Даже если руководитель решит перестраховаться и не выделит деньги на LLM, сотрудники купят подписку сами и продолжат ими пользоваться, потому что это удобно. Есть и менее очевидные сложности: например, одна команда может потратить все токены, и их придется докупать.

Привет, я Павел Мохляков. Вообще я Data Science-инженер в Cloud.ru, но сегодня решил, почему бы не рассказать как с помощью LLM-шлюза можно использовать несколько LLM через один API и при этом снизить риск утечки данных, контролировать расходы и соблюдать требования №152-ФЗ. Кроме того, покажу пример тестового подключения и объясню, что делать на каждом этапе.

Сразу оговорюсь, что статья будет полезна, скорее всего, инженерам, архитекторам, да и просто человекам-оркестрам из средних и малых компаний, которым нужно относительно быстро и безопасно внедрить у себя LLM. А вот для крупного бизнеса или, например, КИИ явно нужно что-то другое — посерьезнее и понадежнее.

Читать далее

Я задолбался читать про АИ

Время на прочтение4 мин
Охват и читатели35K

Больше, чем сам АИ, меня бесят только топы АИ‑компаний, которые дуют щёки и втирают, что сейчас АГИ уже вот‑вот за углом, что вот‑вот они заменят всех программистов, суппортов и прочих бесполезных проедателей денег за свой псевдоинтеллектуальный труд, который, очевидно (!), сводится к генерации текста. Как же эти негодяи рисуются и втирают, что они решают проблемы масштаба всего человечества! В то время как на самом деле все проблемы, которые они решают — это набивание собственных карманов.

Больше топов меня бесят только коллеги, которые дуют щёки и говорят, что вот они‑то познали искусство промтинга, и теперь они — 10х программеры, потому что вместо того, чтобы делать задачи самим, они запускают пяток‑другой агентов, и те пишут код лучше, чем они.

Во‑первых, ребята, если агенты правда пишут код лучше, чем вы — у меня для вас плохие новости...

Читать далее

Вклад авторов