Обновить
1151.65

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

«Общество не допустит» — иллюзия в эпоху ИИ

Уровень сложностиПростой
Время на прочтение21 мин
Количество просмотров2.6K

Мы привыкли думать, что «общество не допустит» появления опасного ИИ. Но что, если это иллюзия - такая же, как вера Германии в 1940-м, что атомная бомба невозможна? История показывает: технологии не ждут морального одобрения. Они распространяются тогда, когда становятся возможными - независимо от этики, запретов и «общественного мнения».

Сегодня ИИ уже здесь. Он открыт, глобален и децентрализован. Llama 3, Mistral, Qwen - доступны любому студенту. А миллионы решений о кредитах, найме и даже приговорах уже принимаются алгоритмами без участия человека.

Но главная угроза - не в «восстании машин». Она в том, что мы сами перестаём думать, делегируя всё больше решений системам, которые «знают лучше». И даже те, кто имеет доступ к самым продвинутым ИИ, часто не понимают, как они работают. Это не сознание - это статистическая интуиция, «инопланетный разум», который эффективен, но непрозрачен.

В статье мы разбираем:

почему «подпольный ИИ» - худший сценарий, а открытость - единственный шанс на контроль;

как формируется эпистемологическое неравенство: массовый ИИ для всех, а элитный - для избранных;

почему даже CEO не понимают, как работает их собственный ИИ;

и как избежать судьбы «ученика Герострата» - человека, который разрушил будущее, не осознавая, что делает.

Это не призыв к запретам. Это призыв к ответственности: развивать не только ИИ, но и наш собственный разум, чтобы научиться понимать то, что мы не понимаем.

Потому что наивность - роскошь, которую человечество не может себе позволить в эпоху ИИ.

Читать далее

Разработал чат бота для программистов BayLang AI

Время на прочтение1 мин
Количество просмотров932

Привет Хабр! Меня зовут Ильдар. Я создал чат бота помощника для программистов.

Я сделал видео обзор этого чат бота

Читать далее

VLM vs IDP (хайп vs конвейер): кто выигрывает в гонке за точностью и эффективностью

Время на прочтение7 мин
Количество просмотров621

Еще десять лет назад автоматизация обработки документов опиралась на OCR и жесткие шаблоны. Сегодня в этой сфере все активнее заявляют о себе VLM — технологии, способные понимать контекст и быстро адаптироваться к новым задачам. Но меняют ли они правила игры полностью или лишь дополняют существующие? 

Мы провели исследование и выяснили, что правила изменились, но говорить о полном забвении классических IDP-решений рано. Более того, будущее будет за гибридом, который сочетает эффективность IDP с новыми возможностями VLM.

Читать далее

Когда важна каждая миллисекунда: оптимизация съёмки для CV и AR

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров2.4K

2ГИС Ситискан — это мобильное приложение для автоматизированной съёмки городской среды. Оно устанавливается на смартфон, закреплённый в автомобиле, и во время движения делает снимки, собирает координаты, скорость и другие параметры. Эти данные обрабатываются с помощью ИИ, чтобы находить проблемы в инфраструктуре: ямы, мусор, повреждённые объекты и другое.

Одна из ключевых задач приложения — снимать изображения с высокой частотой, особенно при объездах сложных участков. Но на практике оказалось, что стандартный метод съёмки takePicture во Flutter может занимать до 3 секунд на один кадр. Это делает невозможной съёмку даже 1 кадра в секунду, не говоря уже о 4 кадрах, которые нам нужны для точного анализа.

В этой статье мы — Руслан Цицер и Арген Жукеев @zhukeev— расскажем, как исследовали узкие места, перепробовали разные подходы — от RepaintBoundary до нативной обработки на C и Java — и в итоге добились стабильной съёмки с минимальной задержкой. Наш кейс будет полезен Flutter-разработчикам, которым необходима высокая частота съёмки (до 4 fps и выше) для своих приложений и инженерам в области компьютерного зрения и машинного обучения или разработчики AR/VR-решений на Flutter, где важны каждая миллисекунда и каждый пиксель.

Читать далее

Сгенерировано ИИ: прятать или показывать у себя в продукте

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров666

За последние пару лет в интерфейсах появился новый паттерн — ✨. Магическая искорка сигналит, что здесь работает ИИ. Но с маркировкой сгенерированного контента всё сложнее. Нет единого стандарта: кто-то прячет информацию, кто-то показывает крупный дисклеймер, кто-то вообще не маркирует. Я столкнулась с подобной задачей в Контуре.

Читать далее

Cursor — джун или сеньор? Какой грейд у ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров9.8K

Cursor сделали программисты для программистов. Это не очередной чат-бот, это полноценная среда разработки. Он очень неплохо интегрирован с возможностями больших языковых моделей. 

Но насколько он хорош? Сможет ли сочинить симфонию, написать картину… то есть, конечно, сможет ли заменить живого разработчика? Мы его потыкали, протестировали и теперь хотим рассказать, на какой грейд он мог бы рассчитывать в российской ИТ-компании

Читать дальше

Эпоха автономных аналитиков: как ИИ меняет науку о данных

Время на прочтение4 мин
Количество просмотров2.7K

Мы думали, что аналитика с помощью ИИ сможет освободить нас от рутинных задач, но она оказалась бессильна перед неожиданными ситуациями. Даже самые совершенные ИИ-агенты не справляются, когда дело касается задач, выходящих за рамки заранее установленных сценариев. Агенты сталкиваются с трудностями при выполнении задач, требующих адаптивности и самостоятельного мышления. В то время как разговорные модели демонстрируют впечатляющие успехи, «автоматический дата саентист» почему-то не может преодолеть этот барьер и достичь полной самостоятельности.

Последнее исследование привнесло неожиданный поворот: эффективность не определяется размером модели или набором жестких правил, а обусловлена самой конструкцией ее рассуждений. Модель освоила не просто последовательное выполнение отдельных задач, но и гибкое управление анализом данных. Она научилась понимать ход событий, планировать действия, корректировать подход в процессе, экспериментировать с новыми подходами, допускать ошибки и учиться на собственном опыте, при этом все меньше полагаясь на вмешательство человека.

Что лежит в основе этой «встроенной интуиции»? Давайте разберемся в возможностях модели DeepAnalyze-8B и методах ее обучения, а также рассмотрим, как это может повлиять на сферу продвинутой аналитики и искусственного интеллекта.

Читать далее

Искусственный интеллект в консалтинге: почему методология важнее технологии

Время на прочтение10 мин
Количество просмотров626

Сегодня искусственный интеллект (далее — ИИ) проникает во все сферы бизнеса, беря на себя всё больше задач — от анализа данных до оптимизации процессов. Он может быть использован как для решения локальных задач (наиболее востребованное направление), так и для работ, связанных с системными улучшениями.  Но настоящая эффективность ИИ раскрывается только там, где есть четкая методология, разграничивающая зоны ответственности: что остаётся за экспертом с его опытом и интуицией, а что можно смело доверить ИИ.

Читать полностью

ChatGPT Atlas: пока ещё не торт для тестировщиков

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.6K

OpenAI представила ChatGPT Atlas - новый уровень интеграции искусственного интеллекта в браузер. По задумке, Atlas превращает привычный ChatGPT в универсального помощника, встроенного прямо в веб-страницы. Теперь чат можно вызвать в любой момент: он суммирует статьи, сравнивает контент, объясняет непонятное и даже может взаимодействовать с сайтами от имени пользователя.

На первый взгляд - мечта QA-инженера, но не торт.

Читать далее

Большое сравнение архитектур LLM

Уровень сложностиСложный
Время на прочтение33 мин
Количество просмотров15K

Это перевод классной статьи с детальным обзором архитектур главных опенсорсных LLM: очень структурировано, доходчиво и с изумительными картиночками. И такой обзор просто обязан быть на русском языке. Поговорим про DeepSeek V3/R1, OLMo 2, Gemma 3, Mistral Small 3.1, Llama 4, Qwen3, SmolLM3, Kimi K2, GPT-OSS, Grok 2.5, GLM-4.5, Qwen3-Next.

Ну а дальше слово автору:

Прошло семь лет с момента разработки оригинальной архитектуры GPT. На первый взгляд, оглядываясь назад на GPT-2 (2019) и вперед на DeepSeek-V3 и Llama 4 (2024-2025), можно удивиться тому, насколько структурно похожими остаются эти модели.

Однако я считаю, что все еще есть большая ценность в изучении структурных изменений самих архитектур, чтобы увидеть, чем занимаются разработчики LLM в 2025 году.

Читать далее

Как мы искали лучшие способы классификации

Уровень сложностиСредний
Время на прочтение26 мин
Количество просмотров345

Всем привет!

В предыдущих статьях мы уже рассказывали о том, какими метриками можно пользоваться для оценки ответов AI-продуктов.

В большом количестве метрик для решения такой задачи предварительно надо оценить, к какой категории относится тот или иной ответ.

В этой статье мы преследовали две цели:

1. На примере показать, как применяются такие метрики и как с помощью них можно оценить качество работы модели.

2. Провести небольшое исследование по различным AI-продуктам с целью выявления наиболее оптимальных для решения задач классификации.

Читать далее

Вышел браузер ChatGPT Atlas: тестируем нейропоиск и пробуем онлайн-покупки в агентском режиме

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров17K

OpenAI выпустила браузер ChatGPT Atlas с интегрированными языковыми моделями. Приложение уже можно скачать на macOS, а позже появятся версии для Windows и мобильных платформ. В этой статье проверяем, что умеет очередной ИИ-браузер и пробуем заказать товар в онлайн-магазине с помощью агента.

Читать далее

12 неожиданных фактов об Open WebUI, которые стоит знать всем

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров5.4K

У меня есть привычка — собирать в одном интерфейсе все инструменты, которые я использую ежедневно. Когда в этом списке оказались три разные нейросети, каждая со своим API и интерфейсом, стало ясно: нужен единый пульт управления. Мой поиск привел меня к Open WebUI, и это оказалось именно тем, чего мне не хватало. Хочу поделиться открытиями, которые я сделал за несколько месяцев активного использования.

В этом обзоре вы узнаете:

Как установить Open WebUI в Windows, Linux и macOS;
• Можно ли прикрепить прошлые диалоги в качестве контекста;
• Поддерживает ли Open WebUI диаграммы Vega;
• Как сделать суммаризацию YouTube‑видео по ссылке прямо из промпта;
• Сколько сплит‑чатов поддерживает Open WebUI одновременно;
• Что нужно установить, чтобы запустить Python и HTML+JS прямо из сгенерированного ответа (спойлер: ничего);
• ...И другие полезные штуки.

Хочу узнать

Ближайшие события

Что именно ИИ-чатботы делают «под капотом»

Время на прочтение10 мин
Количество просмотров3.6K

Среди друзей я пользуюсь репутацией «ты ж программист», поэтому у меня нередко интересуются, как именно работают «под капотом» такие известные инструменты как ChatGPT, Claude, Grok или DeepSeek. Со временем я отточил ответ на этот вопрос — и потому, что нашёл способы лучше на него отвечать, и потому, что научился сам создавать большую языковую модель с нуля. Поэтому и сам понимать большие языковые модели я стал гораздо лучше.

В этой статье я попытаюсь простыми словами описать, что именно в них происходит. Пост состоит из серии объяснений, причём каждое последующее из них основано на предыдущих, но немного уточняет их. Так мы постепенно дойдём до такого объяснения, которое будет совершенно строгим и верным, но могло бы немного вас ошеломить, если выдать его без подготовки.

Если вы — технарь, и читаете эту статью, чтобы больше узнать об ИИ, то настоятельно рекомендую вам дочитать её до конца. Если вы открыли ссылку просто из интереса, то можете смело читать до тех пор, пока вам будет интересно. Возможно, вы станете более уверенно понимать, что происходит в трансформерах, даже если не уловите всех мелких деталей.

Читать далее

Дракончик учится летать: Brain-like Dragon Hatchling простыми словами

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров1.4K

Искусственные нейросети научились распознавать лица и писать тексты, но до сих пор не умеют учиться на лету. Что если создать ИИ, который адаптируется к новому опыту прямо во время работы — как живое существо?

Менее месяца назад несколько инженеров и ученых выпустили научную статью по машинному обучению и нейросетям, предложив интересные идеи для изменения существующих архитектур. А говоря проще, они предложили новую архитектуру искусственной нейронной сети.

Читать далее

Comet — браузер будущего с ИИ-ассистентом, который реально работает за вас

Время на прочтение5 мин
Количество просмотров14K

В эпоху искусственного интеллекта браузеры остаются почти неизменными — мы всё так же вручную кликаем, заполняем формы и переключаемся между вкладками. Но что, если браузер мог бы делать всё это за вас? Comet от Perplexity — это не просто очередной браузер на базе Chromium, а настоящий агентный браузер с AI-ассистентом, способным автономно выполнять сложные задачи в интернете.

Читать далее

Агент на Kotlin без фреймворков

Уровень сложностиСредний
Время на прочтение28 мин
Количество просмотров2.2K

Статья является продолжением Пишем агента на Kotlin: KOSMOS, но может читаться независимо. Мотивация к написанию — сохранить читателю время на возьню с фреймворками для решения относительно простой задачи.

Автор подразумевает у читателя теоретическое понимание того, что такое агент. Иначе лучше прочесть хотя бы начало предыдущей части.

В статье хочу показать, как самостоятельно написать аналог Koog или Langchain4j. У вас не будет всех их фичей, зато будет очень простая и расширяемая система.

Читать далее

Какие они, типичные DS-специалисты, и как часто ИИ пишет за них код: результаты совместного опроса Хабра и Авито

Время на прочтение10 мин
Количество просмотров22K

Хабр и технологическая платформа Авито решили заглянуть в мир ИИ и понять, кто всё это создаёт. Мы провели опрос среди пользователей Хабра, чтобы лучше узнать, кто такие современные дата-сайентисты и какие у них привычки, есть ли у них ИИ-любимчики, какие ИИ-инструменты они используют в работе. Около 500 разработчиков в сфере ML/DS ответили на самые разные вопросы — не только про свою профессиональную деятельности и нейросети, но и про увлечения и общение с родственниками.

Заглянуть в мир ИИ

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Уровень сложностиСложный
Время на прочтение10 мин
Количество просмотров2.5K

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала!

Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting. Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке

Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим).

Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

Читать далее

Как ИИ-очки предсказывают ваши желания прежде чем вы о них подумаете

Время на прочтение3 мин
Количество просмотров934

ИИ-ассистенты уже достаточно эволюционировали, но есть ньюанс: даже самые умные ассистенты чаще всего остаются пассивными наблюдателями. Они ждут команды от человека и не берут на себя инициативу. Так почему ИИ до сих пор не угадывает наши желания? 

Исследователи нашли ответ на этот вопрос: дело не в “прокачанности” нейросетей, а в самом подходе к взаимодействию с ИИ. Они научили ИИ-очки не просто реагировать, а чувствовать ситуацию — вмешиваться ровно тогда, когда помощь действительно уместна, и делать это почти незаметно. В результате получилась система, которая не раздражает бесконечными подсказками, а помогает точно в момент сомнения — будь то партия в блэкджек или выбор свитера в магазине.  

В этом обзоре — как работает проактивный ассистент и почему именно способность заговорить вовремя способна перевернуть представление о будущем ИИ-интерфейсов.

Читать далее

Вклад авторов