Обновить
1172.08

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

От GPT-2 к gpt-oss: анализ достижений архитектуры

Уровень сложностиПростой
Время на прочтение21 мин
Количество просмотров4.5K

📝 Описание

На этой неделе разбираем релиз GPT-OSS — первых полностью открытых моделей OpenAI с момента GPT-2 в 2019 году. Две модели: gpt-oss-20b и gpt-oss-120b представляют собой современные LLM с архитектурой MoE (Mixture of Experts), оптимизированные для рассуждений и способные работать на одном GPU благодаря квантованию MXFP4.

Читать далее

Курсы психолога онлайн в 2025 году: Обучение на психолога дистанционно с дипломом гособразца

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.4K

В 2025 году учиться на психолога можно спокойно и без суеты: дистанционный формат, нормальная нагрузка, понятные документы. Тем, кто хочет получить психологическое образование и не выпасть из работы, подойдут курсы психолога онлайн и обучение психологии онлайн с получением диплома. Это хороший старт для тех, кто планирует поступить на психолога позже, и рабочий инструмент для тех, кто уже в помогающей сфере.

В статье я сравниваю разные траектории: профессиональная переподготовка и повышение квалификации, «психология с нуля» и практико-ориентированные курсы психологии. Отбираю программы, где прозрачно заявлены часы, формат, итоговая аттестация и тип документа — от сертификата до диплома государственного образца. Особое внимание — вариантам, где доступно обучение на психолога дистанционно и курсы по психологии дистанционно с дипломом: это помогает начать без переезда и ночных пар.

Читать далее

Как ИИ меняет поиск людей и построение социальных связей

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1K

Сегодня - о новом подходе к поиску людей и построению социальных связей через искусственный интеллект.

В качестве примера в этой статье я использую наш проект Linkeon. Воспринимать его как единственно возможное решение, конечно, не стоит.

Проблема: поверхностность современных социальных сетей

Современные социальные сети и сервисы знакомств решают задачу соединения людей через примитивные критерии: возраст, внешность, геолокацию, общие интересы. Но эти критерии не отражают глубинные ценности и намерения людей.

Когда мы ищем партнера для бизнеса, единомышленника для проекта или просто близкого по духу человека, нам важны не хобби и внешность, а то, что движет человеком изнутри. Его ценности, убеждения, жизненные цели и намерения.

Классическая проблема: мы тратим месяцы на общение с людьми, которые на первый взгляд подходят нам, но в итоге оказываются на совершенно другой "частоте". Разные ценности, разные цели, разные представления о жизни.

Особенно остро это проявляется в профессиональной сфере:

В своей предыдущей статье о ключевых качествах сотрудников я писал, что для меня критически важными являются мотивация и обучаемость. Но посмотрите на любую платформу поиска работы - hh.ru, LinkedIn, SuperJob. Там вообще нет полей для этих качеств!

Система ищет по навыкам, опыту, образованию — но не по тому, что действительно определяет успех сотрудника в долгосрочной перспективе. В итоге HR‑менеджеры тратят кучу времени на собеседования, пытаясь понять, подходит ли кандидат по «мягким» навыкам, которые невозможно оценить по резюме.

Читать далее

Как я переделал свой мини-ПК и зачем мне это было нужно

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров18K

Здравствуйте, дорогие друзья!
Купил я тут себе компутер. Выбирал, как водится, долго и мучительно — хотел мини-ПК, потому что давно проникся этим форм-фактором: компактный, экономичный, да и по цене приятнее, чем здоровенные системники.

В момент выбора, конечно, руководствовался главным критерием — ценой.
Мой взгляд пал на чудо инженерной мысли шэньжэньского производства — Gmtec mini pc K-6. За свои деньги он предлагает вполне бодрые характеристики, особенно если руки не из коробки, а из плеч.

Читать далее

Запускаем Qwen3-VL-30B на 48GB VRAM

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.7K

Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

Запустим эту модель на Ubuntu

Как жить с галлюцинациями ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.4K

Эта небольшая статья лишь попытка подытожить свой опыт работы с ИИ в части галлюцинаций. 

Честно говоря, чем дольше я общаюсь с ИИ, тем больше я удивляюсь не галлюцинациям, а тому, что LLM вообще способно отвечать относительно связно и в рамках вопроса. Хрупкость того, что я вижу в ответах моделей, заставляет меня задуматься, как на этом фундаменте из миллиардов самозависимых элементов, вообще возможно строить вменяемый бизнес, доверять ИИ своё здоровье, свои деньги, своё будущее. Но разработчики полны оптимизма, а пользователи верят в ИИ,  и, как говорится,  вот на этом невысказанном предположении и держится весь хрупкий механизм нашего молодого народовластия… 

Читать далее

Как выжать максимум смысла из тысяч строк кода

Время на прочтение4 мин
Количество просмотров2.6K

Сколько смыслов можно уместить в тысяче строк кода? Этот вопрос становится совсем не теоретическим, когда к делу подключаются современные LLM — им всё чаще приходится разбираться в огромных проектах, где важно не просто “прочитать всё”, а вытащить из бесконечного кода именно то, что нужно. При этом стандартные методы экономят время и память… но нередко теряют самую суть, упуская важные связи между частями программы.

В свежей работе исследователи предлагают неожиданно простой трюк: вместо того чтобы скармливать модели лишние мегабайты, они аккуратно выжимают из репозитория только те фрагменты, которые реально двигают модель к правильному ответу. При этом смысл сохраняется, а мусор уходит.

Оказалось, даже совсем не обучая модель и не вникая во внутренности LLM, можно кратно повысить скорость и снизить стоимость анализа длинного кода — и иногда добиться даже лучшего качества. Как это работает, почему эффект оказался внушительным и к каким деталям тут всё сводится — разбираемся на примере LongCodeZip.

Читать далее

Как я пытался сделать нейросеть аналитиком: провалы и уроки

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров7.8K

Наверняка многим знакома ситуация: у тебя есть куча данных, отчетов, KPI, а команда тонет в Excel‑таблицах и Jira‑тикетах. И вот тебе кажется, что решение простое: «Давайте посадим нейросеть на аналитику».

Я решил попробовать. И вот что из этого вышло.

Читать далее

Призрак в машине: ИИ-подделка и аура в эпоху алгоритмической воспроизводимости

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.1K

В данном случае отсылки в заголовке к знаменитой работе Вальтера Беньямина 1936 года «Произведение искусства в эпоху его технической воспроизводимости» отнюдь не случайно. Мы окружены подделками и поделками. Крупные издательства выпускают научно-популярные и художественные книги российских авторов под видом зарубежных (недавно про наиболее вопиющие случаи писали СМИ, без ИИ тут явно не обошлось). Дипфейки известных актеров и политиков заливаются в сеть сотнями каждый день. Нейротворчество выдают за созданное человеком. На Хабре появилась целая когорта пользователей, пытающихся отделить человеческие статьи от машинных.  

В мае 2025 года я опубликовал статью на Хабре «Аркадий Стругацкий против Deepseek и ChatGPT: как ИИ повлияет на художественный перевод», тогда разгорелась нешуточная дискуссия о роли переводчика в эпоху искусственного интеллекта. Я решил продолжить дискуссию, на этот раз поговорить о той самой ауре, которой должны обладать произведения искусства и тексты. 

Читать далее

«LLVM для AI». Крис Латтнер и язык программирования Mojo

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров6.5K

Крис Латтнер (Chris Lattner) — создатель CPU-компилятора LLVM и соавтор Swift — предложил новый язык программирования Mojo, спроектированный для одновременного программирования CPU, GPU и TPU (тензорные ядра, оптимизированные для матричного умножения, а это и есть инференс LLM), без всяких лишних библиотек типа CUDA, ROCm и XLA.

Mojo — это надмножество Python с производительностью С и потенциальная замена Rust. Код на нём легко переносится между различными GPU, при этом платформа Modular быстрее обновляется под новые модели GPU, чем сама Nvidia выпускает обновления для своего софта (новые attention kernels).

Простой и мощный язык для написания и деплоя LLM-приложений независимо от оборудования (AMD, Nvidia, Intel и проч.), с метапрограммированием во время компиляции и прочими штуками. Что-то вроде единой «LLVM для AI». Унифицированная программная платформа, которая запускается на любом железе. Это ещё и самый простой способ ускорить Python-приложение в 10−1000 раз, не переписывая его фрагменты на Rust или C++ (что по сути делают NumPy и PyTotch).

Читать далее

Topical Authority на практике: как стать экспертом в глазах Google (и почему одна статья никогда не ранжируется)

Уровень сложностиСложный
Время на прочтение13 мин
Количество просмотров1.8K

Ко мне пришел клиент с блогом о кофе. Он показал статью на 4500 слов про методы заваривания эспрессо. Текст написан бариста с двенадцатилетним стажем. Фотографии профессиональные. Техническая оптимизация безупречна.

Позиция в Google? 47-е место.

Я открыл топ-3 по тому же запросу и увидел картину, которая повторяется в моей практике. Статьи слабее по глубине, без экспертного авторства, с посредственными иллюстрациями. Но эти материалы были частью сайтов, где про кофе написано всё — от истории напитка до химии экстракции кофеина, от обзоров профессиональных кофемашин до детальных гайдов по выбору зёрен из разных регионов произрастания. Google воспринимает эти ресурсы как экспертные источники по всей теме "кофе". А блог моего клиента остаётся точечным игроком. Одна статья. Пусть даже гениальная.

Вот в чём суть проблемы, которую я наблюдаю последние три года работы с клиентами из разных ниш. Алгоритмы больше не ранжируют отдельные страницы в изоляции. Они оценивают сайты как целостные источники знаний по топику. Согласно обновленным Google Search Quality Rater Guidelines от декабря 2024 года, раздел 3.3 явно указывает на важность демонстрации expertise через "объём и глубину контента по теме, созданного квалифицированными авторами".

Цифры это подтверждают жестко. Исследование Ahrefs, проанализировавшее 1.8 миллиарда страниц в 2024 году, показало шокирующую закономерность — сайты с высоким топикальным авторитетом получают на 53% больше органического трафика, чем ресурсы с разрозненным контентом при одинаковом профиле обратных ссылок. Вдумайтесь. Одинаковые ссылки, но в полтора раза больше трафика только за счёт комплексного покрытия темы.

Читать далее

Заметки по результатам участия в круглом столе «Современные вызовы в безопасности AI и пути их решения» на KDW — 2025

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров425

Привет! Я Чернышов Юрий, к.ф.-м.н., доцент УрФУ, руководитель исследовательского центра UDV Group (компания разработчик ПО для ИБ в Екатеринбурге).

17-19 сентября меня пригласили принять участие в круглом столе “Современные вызовы в безопасности AI и пути их решения”, который являлся частью международного форума “Kazan Digital Week - 2025” в Казани. Совместно с коллегами из фонда «Сколково», «Яндекса», «Телеком Интеграции», Банка ПСБ, компании «Фишман» и компании «Аватек» обсудили актуальные вопросы безопасности инновационных технологий и решений с применением ИИ. Участников было много, по сути я ответил только на пару вопросов ведущего (ниже). Слушая коллег и обсуждая уже после мероприятия эту важную тему — фиксировал мысли и заметки, которые, после незначительного оформления оставлю здесь.

Читать далее

Плохая waifu (и при чем тут Пушкин, Горбачев и математика). О современных нейронках для ролевых игр на Русском языке

Уровень сложностиПростой
Время на прочтение51 мин
Количество просмотров2K

Тебе приходилось когда-нибудь ролить с чат-ботами? Если ты этим страдаешь уже давно, то знаешь, что если ролевку ведешь на Русском, то ответы тебя удовлетворят, ну только если у тебя мозги восьмиклассника или IQ меньше 85. Но стоит переключиться на Английский и происходит МАГИЯ: боты становятся намного живее и сообразительнее.

Но в чем причина? Кто тот колдун, что навел порчу на великий и могучий? И была ли эта порча вообще? Именно это и я постараюсь понять в данной статье. Спойлер: да, порча была и наслали мы ее сами. Виноваты: Пушкин, Горбачев и математика.

Читать далее

Ближайшие события

ИИ и развёртка в фотонику

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.5K

Всем очевидно: индустрия ИИ стремительно развивается. Но здесь появляется одно гигантское слоноподобное НО. В последнее десятилетие лидеры ИИ предпочли развиваться экстенсивно - то есть, например, ЛЛМ максимизируют объём моделей. Это в свою очередь тянет за собой целую цепочку гигантских затрат: от электростанций до передовых числодробилок. Из последнего - xAI готовится запустить вычислительную фабрику мощностью 1 ГВт с 500-ми тысячами видеоускорителей! Можно по разному относиться к хайпу вокруг ИИ, но очевидно одно - есть много желающих вкладываться по полной программе в эти технологии. И, возможно, впоследствии экстенсивный рост перейдёт в интенсивный, то есть количество перейдёт в качество. Проблема только в том, что на низком уровне - уровне железа - техника подходит к физическим пределам. И если не сменить парадигму и физическую основу, то поддерживать развитие индустрии никакими средствами кроме масштабирования не получится.

Читать далее

От доминирования на поле боя к доминированию на рынке: чему бизнес может научиться у военных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.5K

Следующий этап эволюцииИИ — агентные системы. Что это и почему это важно для вашего бизнеса?

2025 год называют «годом AI‑агентов», но что это на самом деле? Большинство путает их с продвинутыми чат‑ботами или RAG‑системами. Однако настоящий агентный ИИ — это следующий шаг: система, которая не просто отвечает на вопросы, а самостоятельно анализирует, планирует и действует для достижения цели.

В своей новой статье я сделал выжимку из материала военного журнала Small Wars Journal, где эта концепция раскрывается на примере современной армии. Они называют это «доминированием в принятии решений».

Что внутри:

Четкое разделение: где хайп, а где реальность агентного ИИ в 2025 году.

Таблица, показывающая, как агентные системы меняют 4 ключевых этапа управления: Понимание, Визуализация, Направление и Оценка.

Практический чек-лист для оценки готовности вашей компании к технологиям завтрашнего дня.

Читать далее

ESP32 + LD2410: Архитектуры нейронных сетей для классификации движений

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров14K

Микроконтроллеры давно перестали быть простыми устройствами для управления датчиками и исполнительными механизмами. Сегодня, благодаря библиотекам вроде TensorFlow Lite, даже компактный ESP32 способен выполнять инференс нейросетей в реальном времени. В этой статье я расскажу о серии экспериментов по классификации движений человека с помощью радарного датчика LD2410 и различных базовых архитектур машинного обучения, таких как полносвязная, свёрточная, рекуррентная нейронные сети и трансформер (механизм внимания).

Каждый из подходов я реализовал и проверил на практике. В итоге получилась серия видеоуроков и репозиториев с кодом, но здесь я соберу все в одну статью, чтобы показать эволюцию решений и сравнить их эффективность.

Ознакомиться

Снижаем стоимость инференса. Часть 2. IBM KServe ModelMesh, vLLM Production Stack и что внутри у нашего решения

Уровень сложностиСложный
Время на прочтение24 мин
Количество просмотров579

Привет, Хабр! На связи снова Данила Гудынин, DevOps-инженер направления Evolution ML Inference в Cloud.ru.

В прошлой статье про снижение стоимости инференса мы пробежались по теории того, что и на каких уровнях стека можно подкрутить, чтобы повысить утилизацию своих GPU. Там вы могли определиться, какой подход в принципе подходит для ваших задач.

В этой части мы нырнем в практически-технический хар дкор и расскажем, как оптимизировать работу своих графических процессоров с KServe ModelMesh или vLLM Production Stack, подсветим, где разбросаны грабли в этом деле, а еще заглянем под капот к Cloud.ru Shared GPU и объясним, как именно он позволяет нам ставить цены на уровне западных облаков при кратно более дорогом железе в РФ.

ML-инженеры, DevOps и MLOps-архитекторы, можете сразу добавлять в закладки, чтобы возвращаться и списывать нужные конфиги. Наливайте бочку чая или чего покрепче, постарался изложить все сугубо по делу, много кода спрятал в «раскрывашки», так что не пугайтесь обозначенного выше времени чтения.

Читать далее

Видеоаналитика в реальном времени: что делать, если нет GPU

Время на прочтение16 мин
Количество просмотров2.5K

Когда у вас несколько десятков моделей компьютерного зрения, тысячи камер на заводах по всей стране и только несколько секунд, чтобы успеть оповестить оператора — важна каждая миллисекунда.

Но что делать, если вы работаете не в IT-гиганте с дата-центрами и парком GPU, а в промышленной компании с изолированными сетями, ограниченными ресурсами и жёсткими требованиями к отказоустойчивости?
Рассказываю:

— почему разработка видеоаналитики в промышленности отличается от БигТеха;

— какие ограничения приходится учитывать: отсутствие GPU, изолированные сети и жёсткие требования к отказоустойчивости;

— как удалось оптимизировать пайплайн и сохранить стабильность его работы;

— какие локальные оптимизации реально работают (а какие дают минимальный прирост);

— как архитектурные изменения увеличили производительность в 28 раз;

— с какими вызовами команда сталкивается сегодня и что предстоит решать дальше.

Идеи из этой статьи будут полезны при разработке как продуктов видеоаналитики, так и других систем со множеством источников данных и обработчиков.

Подробный кейс с деталями

Три пути к 4K: выбираем свой инструмент для нейросетевой реставрации видео

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.7K

Превратить старое видео из 480p в кристально чистое 4K сегодня может каждый. Но какой ценой? Пока одни инструменты подкупают простотой и мощными моделями вроде Starlight, другие предлагают безграничную гибкость open-source, а третьи — ультимативную скорость обработки, требуя взамен технических знаний.

В этом большом сравнении мы сталкиваем лбами три разных подхода к AI-апскейлингу, а также даём несколько практических советов.

Читать далее

Как написать нейросеть для бизнеса на Python

Время на прочтение12 мин
Количество просмотров8.4K

Привет, Хабр! Сегодня мы разберем, как нейросети автоматизируют рутинные безнес‑процессы на реальном примере — классификации заявок в службу поддержки. Даже простые нейросети способны значительно разгрузить сотрудников и ускорить обработку данных.

Читать далее

Вклад авторов