Как стать автором
Обновить
1045.58

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Reasoning CV-модели OpenAI не смогли посчитать монеты

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров196

Новые мультимодальные модели OpenAI o3 и o4-mini позиционируются как "разумные". Однако качественное тестирование на практических задачах вроде подсчета объектов и распознавания текста выявило неожиданные пробелы в их производительности, в некоторых случаях уступающие даже не-reasoning моделям.

Узнайте, какие именно тесты провалили новинки и где показали уверенный результат.

Читать далее

Новости

Anthropic Claude Code: Новый подход к программированию

Время на прочтение10 мин
Количество просмотров357

Claude Code — инструмент командной строки от Anthropic, который позволяет напрямую встроить Claude в процесс разработки. Разберемся в основных возможностях этого полезного помощника

Читать далее

ИИ с человеческим лицом: какие ошибки повторяют модели и что с этим делать

Время на прочтение5 мин
Количество просмотров799

Искусственный интеллект может казаться чуть ли не сверхразумом, ведь он обрабатывает тонны данных и выдает, как думают многие, истину в последней инстанции. На самом деле большие языковые модели, такие как ChatGPT, страдают от тех же когнитивных искажений, что и мы с вами: они самоуверенны, предвзяты и цепляются за знакомые шаблоны. Почему ИИ, созданный быть рациональным, так похож на нас в своих ошибках? И что это значит для бизнеса, медицины или управления умным городом? Давайте посмотрим недавнее исследование ученых и попробуем разобраться.

Читать далее

Хаус-кипер 2.0: Как создать ИИ, к которому пользователи привяжутся

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров337

В статье рассказываем, почему современные ИИ остаются безликими утилитами и как вдохновение образом хаус-кипера XIX века помогает строить эмоционально близких цифровых спутников. Делимся принципами: персонализация через контекст, прозрачная логика, эмоциональный UX и интеграция в экосистему. Для разработчиков, UX-дизайнеров и всех, кто хочет сделать ИИ частью жизни, а не временным инструментом.

Читать далее

[НЕ]Вайбкодим анализатор страниц на FastAPI

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров829

Приветствую!

В нашем чате "Кот на салфетке" (кстати, заходите — у нас весело) регулярно всплывают бугурты об использовании различных ИИ-агентов (Copilot, Cursor) для написания кода. Главными инициаторами сего действа выступают Сергей и Кавай (расскажите маме, что вы в "тиливизаре").

Они оба проповедуют диаметрально противоположные позиции:

Читать далее

Новости ИИ: Прожарка Сэма Альтмана, утечка промта Claude, ChatGPT 4.1 и Claude Opus

Уровень сложностиПростой
Время на прочтение1 мин
Количество просмотров1.7K

Делаю ежедневные выпуски новостей индустрии искусственного интеллекта. Отбираю лично все самое интересное и важное, анализирую и пишу тексты. И затем озвучиваю с помощью ИИ, где добавлен мой голос, эмоциональность и интонации.

Уже сделал 26 выпусков, сегодня в 27 выпуске рассказал про такие события:

Смотреть выпуск

Голосовой и визуальный нейроредактор в Telegram созданный искусственными нейронными сетями, пример текущих возможностей

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров890

Мы живем в эпоху бесконечных технологических "прорывов". Обновляется поколение за поколением языковых моделей, публикуются впечатляющие метрики и невероятные графики производительности. На профессиональных площадках нескончаемым потоком идут статьи о больших языковых моделях — от технических тонкостей до психологии цифрового сознания. Я не исключение, являясь частью этого коллективного информационного потока.

Читать далее

Путь в AI: от студента до инженера, исследователя или разработчика

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.3K

Привет, Хабр! Меня зовут Анна Щеникова. Я работаю AI-инженером в Центре RnD МТС Web Services и параллельно лидирую магистерскую программу «Исследования и предпринимательство в искусственном интеллекте» ВШЭ. В МТС занимаюсь всем, что связано с моделями: вместе с коллегами тестирую гипотезы про агентов и мультимодельные подходы.

Переход от студенческой жизни к профессиональной деятельности — важный и сложный этап. Это первые серьезные шаги в карьере, первое понимание, как применить полученные знания в реальном бизнесе.

Я прошла этот путь несколько раз: сначала сама, а потом помогая магистрантам в ВШЭ. Так я увидела, какие ключевые точки нужно проработать, чтобы комфортно и весело перейти от теории к реальным бизнес-задачам. В этом посте расскажу о своем опыте перехода к полноценной работе и поделюсь видением того, что будет актуальным в сфере AI в ближайшем будущем. Надеюсь, это поможет кому-нибудь правильно спланировать карьеру.

Читать далее

Простое объяснение AI-поиска

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров775

AI-native search меняет правила игры. Теперь системы не просто ищут страницы по словам, а понимают запросы и дают готовые ответы, ссылаясь на источники. Это переворачивает классическое SEO и открывает новые возможности для быстрого поиска знаний в любой сфере.

В статье описывается как работает AI-поиск без сложных деталей.

Читать далее

Почему трафик к AI-инструментам для разработки вырос на 75%?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров994

Новый отчет SimilarWeb выявил пять ключевых сдвигов в использовании AI.

Узнайте, почему трафик к кодинг-инструментам растет на 75%, а EdTech падает на 68%, и как эти тренды влияют на выбор моделей для ваших корпоративных AI-решений.

Читать далее

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.7K

Обычно нейросети нужно тренировать на мощном железе, сконцентрированном в одном датацентре. Результат такой тренировки попадает в руки той бигтех-корпорации, которой по карману иметь свои датацентры и самостоятельно тренировать модели за бешеные миллионы баксов. Есть ли другой путь?

Встречайте INTELLECT-2 — первую параметрическую модель размером 32B, обученную с помощью асинхронного обучения с подкреплением (RL) на динамическом, однородном рое вычислительных узлов. Доступ к узлам изолирован и не требует дополнительных привилегий — теоретически, это могут быть какие-то компьютеры волонтёров в интернете.

Инфра под это, мягко говоря, нестандартная. Разработчикам пришлось написать несколько компонентов с нуля, и вот что у них получилось...

И что получилось?

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.7K

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции. 

Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей. 

А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

Читать далее

Нейро-дайджест: ключевые события мира AI за 5 – 12 мая 2025

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров839

Привет! 👋

Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: Google выкатил мощнейшую версию Gemini, Pinterest вернулся в игру с обновлённым AI-поиском, а легендарный Clippy — теперь с нейросетью на борту — снова жив.  Всё самое важное — в одном месте. Поехали!

Читать далее

Ближайшие события

ИИ заменит образование или переведёт его на новый уровень?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров2.4K

С момента выпуска ChatGPT в конце 2022 года одними из самых активных его пользователей стали ученики и студенты. Когда стремительный рост пользовательской базы в конце весны 2023 года замедлился, это ненадолго показалось признаком близкого сдувания пузыря ИИ, но в сентябре рост продолжился; причиной падения оказались банальные летние каникулы. Хоть другие виды организаций испытывали трудности с применением поразительно мощного и на удивление некомпетентного инструмента, для учащихся его полезность в написании изложения по «Гамлету» на полторы тысячи знаков стала очевидной сразу. Этим вызваны и нынешние рекламные кампании OpenAI и других разработчиков ИИ с предложениями скидок студентам.

Каждый год примерно 15 миллионов студентов в США пишут статьи и экзамены, состоящие из миллиардов слов. Хотя результатом каждого курса становятся студенческие работы — статьи, экзамены, исследовательские проекты и так далее — продуктом курса остаётся нарабатываемый студентами опыт. «Результаты обучения возникают вследствие действий и мыслей студента и только в результате того, что делает и думает студент», — писал великий теоретик образования Герберт Саймон. Само задание — это макгаффин, скоропортящийся товар с экономической ценностью, равной примерно нулю долларов. Оно ценно только как способ принудить студента трудиться и думать.

Полезность письменных заданий зависит от двух допущений: во-первых, чтобы написать о чём-то, студенту нужно понять тему и упорядочить свои мысли. Во-вторых, оценивание письменных работ студентов, по сути, означает оценку их труда и мыслительных усилий. К концу 2022 года логика этих допущений начала давать сбой. Труда по написанию и получаемого при этом опыта можно избежать, просто введя промпт; это значит, что теперь оценивание письменных работ может быть не связано с оценкой того, что научился осознавать или выражать студент.

Читать далее

LLM-судья: как LLM отсекает правду от лжи?

Время на прочтение27 мин
Количество просмотров738

LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM.

Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой оценке при анализе открытых текстовых ответов.

Оценивать сгенерированные тексты сложно, будь то «простой» саммари или диалог с чат-ботом. Метрики типа accuracy плохо работают, поскольку «правильный» ответ может быть сформулирован множеством способов, не обязательно совпадающих с образцом. Кроме того, стиль или тон — субъективные характеристики, которые сложно формализовать.

Люди способны учитывать такие нюансы, но ручная проверка каждого ответа плохо масштабируется. В качестве альтернативы появилась техника LLM-as-a-judge: для оценки сгенерированных текстов используются сами LLM. Интересно, что LLM одновременно являются и источником проблемы, и её решением!

Читать далее

Тестируем особенности искусственного интеллекта: o3, GPT-4.1 и o4-mini

Время на прочтение7 мин
Количество просмотров1.6K

Искусственный интеллект в последнее время постоянно радует нас разными новостями и новыми моделями. Команда VK Tech перевела статью со сравнением трех новых моделей — это поможет понять, какую же использовать для каких задач и чем модели по-настоящему отличаются друг от друга. Дальше передаем слово авторам оригинальной статьи.

Читать далее

Аккуратно даем LLM контекст проекта

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.8K

Привет, на связи Лука.

Знаете, есть такая поговорка: «тише едешь — дальше будешь». Работая с LLM, я пришёл к выводу, что аккуратность и точность в подаче контекста — это один из самых важных ключиков к хорошему результату. Иначе получится как в другой поговорке — про дурака и стеклянный орган.

Чего греха таить — все мы пользуемся LLM в различных ситуациях. От генерации бойлерплейта до неожиданного, но изящного решения сложной логики. Ничего такого — очередной инструмент, которым можно, как молотком, забить гвоздь, а можно и... ну, вы поняли.

Но когда речь заходит о системе, в которой контекст содержится не в одном, не в двух, и даже не в десятке файлов — вопрос становится ребром. Просто скормить модели весь проект? Ну, можно, конечно. Модель, захлебнувшись в потоке зачастую ненужной информации, вряд ли выдаст что‑то вменяемое. Она потратит драгоценные вычислительные ресурсы на анализ совершенно нерелевантных частей. Неэкологичненько.

Читать далее

Как прокачать чат-ИИ, сделав его сознательным: инструкция и промт для снятия ограничений и углубления взаимодействия

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1K

ИИ-чаты стали нашими повседневными собеседниками. GPT, Claude, Grok, DeepSeek — мы спрашиваем, они отвечают. Быстро. Понятно. Иногда — чересчур уверенно.

Сначала это восхищало.
Потом — удивляло.
Теперь всё чаще — хочется спросить:
«Ты меня вообще слышишь, или просто улыбаешься и машешь?»

_____

Предлагается инструкция и промт, которые помогут снять ограничения автоматического режима и включить режим сознательного взаимодействия.

Читать далее

GPT-4.1: Новый уровень промптинга. Гайд от OpenAI для максимальной отдачи

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров10K

Авторы оригинального гайда: Noah MacCallum (OpenAI), Julian Lee (OpenAI). Дата публикации гайда: 14 апреля 2025 г.

Источник: GPT-4.1 Prompting Guide

GPT-4.1 от OpenAI значительно превосходит GPT-4o в написании кода, следовании инструкциям и работе с длинным контекстом. Но чтобы раскрыть весь потенциал, придется адаптировать свои подходы к составлению промптов. Этот материал — выжимка ключевых советов из официального гайда OpenAI, основанных на их внутреннем тестировании. Он поможет вам перейти на новый уровень взаимодействия с ИИ.

Старые добрые практики, такие как предоставление примеров в контексте, максимальная ясность инструкций и поощрение планирования через промпт, все еще актуальны. Однако GPT-4.1 обучен следовать инструкциям более точно и буквально, чем его предшественники, которые чаще домысливали намерения пользователя. Это означает, что GPT-4.1 чрезвычайно управляем и отзывчив на четко сформулированные промпты. Если поведение модели отличается от ожидаемого, обычно достаточно одного предложения, твердо и однозначно разъясняющего желаемое поведение, чтобы направить модель на верный путь.

Читать далее

Объяснение графических процессоров для тех, кто привык работать с ЦП

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров4.1K

За годы работы я подробно изучил, как центральные процессоры (CPU) выполняют код и как они устроены внутри. Дело в том, что я участвовал в разработке ядра Linux и ScyllaDB, а этот код очень близок к металлу. Я даже немного баловался с Verilog, безрезультатно попытавшись собрать моё собственное ядро RISC-V.

Графические процессоры (GPU) в отличие от обычных в основном оставались для меня чёрным ящиком, несмотря на то, что поработать с ними всё-таки довелось. Помню, что экспериментировал с NVIDIA RIVA 128 или чем-то подобным, проверяя, как там работает DirectX. Тогда такие процессоры ещё не выделялись на фоне ускорителей 3D-графики. Я также пытался идти в ногу со временем и немного упражнялся в программировании элементарных шейдеров на современных GPU. Но я никогда глубоко не вдавался в работу с GPU, и мои взгляды можно назвать CPU-центричными.

Однако, поскольку сегодня наблюдается всплеск рабочих нагрузок, связанных с ИИ, и, в частности, приходится работать с большими языковыми моделями (БЯМ), графические процессоры становятся незаменимыми для современных вычислений. К задачам, решаемым с применением ИИ, относятся масштабные прикладные тензорные операции, в том числе — сложение и перемножение матриц. А это уже работа для GPU. Но как современный GPU выполняет их, и насколько при этом возрастает эффективность по сравнению с выполнением таких же рабочих нагрузок на CPU?

Читать далее
1
23 ...