Обновить
2181.92

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели2.5K

3 дня борьбы с ROCm, RX580 и Ollama: как я запустил LLM на домашней видеокарте

Я попытался запустить LLM inference на старой AMD RX580 через ROCm и Ollama в Kubernetes. GPU определялся, VRAM занималась, контейнеры запускались — но inference падал с ошибками hipMemGetInfo, а иногда просто выдавал бессмысленный текст.

В статье — полный инженерный разбор:как диагностировать реальный GPU compute (а не просто VRAM usage), почему Vulkan помог найти root cause, какие версии ROCm и kernel оказались рабочими, и как добиться стабильной генерации ~42 tokens/sec на RX580.

Читать расследование

Новости

Первый в мире коммерческий мозговой имплант: Китай обошел Neuralink в нейротехнологической гонке

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели2.1K

Китайский регулятор выдал первую в мире лицензию на коммерческое использование инвазивного интерфейса «мозг-компьютер». Разрешение получило устройство NEO, которое позволяет парализованным пациентам силой мысли управлять роботизированной перчаткой.

Это решение переводит нейротехнологии из стадии экспериментальных клинических испытаний, на которой сейчас находятся американские аналоги вроде Neuralink, в статус легального серийного медицинского продукта. Выдача лицензии спровоцировала резкий скачок акций профильных биотехнологических компаний на азиатских биржах.

Читать далее

Подробный технический разбор реализации Autoresearch, ИИ-исследователя Андрея Карпаты

Уровень сложностиСредний
Время на прочтение71 мин
Охват и читатели4.1K

Это несколько текстов, основной из которых — Autoresearch: Минимальный «агентский цикл» Карпаты для автономного экспериментирования с LLM . Пытаемся подробно разобраться в работе минималистичного ИИ-агента для исследований, предложенного Андреем Карпаты в начале марта. Это веха в истории ML, показывающая один из путей (хотя и не идеальный — и об этом тоже есть в статье) совершенствования ИИ. Бонус! Анализируем также весь python-код и инструкции агенту. Для всех, кто перешагнул уровень "спроси у ChatGPT" и задумывается о чём-то большем, но не знает, с чего начать...

Читать далее

Собрал EdTech-платформу за неделю. Разбираю свой workflow по шагам

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели5.4K

В марте 2023 я написал статью «ChatGPT: новый инструмент в борьбе с багами». Показал как нейросеть генерирует тест-кейсы, ищет XPath-локаторы и пишет SQL-запросы. 40 000+ просмотров. Первая статья на эту тему в рунете.

Ты сейчас подумал «ну и что, таких статей теперь тысячи». И ты прав. Но подожди.

За 3 года я прошёл путь от «вау, ChatGPT написал мне 10 тест-кейсов» до «я один собрал образовательную платформу за неделю». И это НЕ кликбейт.

В этой статье — мой путь, мой стек, мой workflow, конкретные цифры по деньгам и времени, и ошибки, которые я сделал, чтобы ты их не повторял.

Читать далее

Как Пентагон случайно изобрел будущее демократии

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6K

В мае 2001 года DARPA разослала запрос предложений под сухим названием «Electronic Market‑Based Decision Support». Суть: покажите нам, что рынки предсказаний работают для задач разведки. К декабрю две фирмы получили гранты. Проект назвали FutureMAP, а его публичную часть — Policy Analysis Market — задумали как биржу фьючерсов на политические события Ближнего Востока.

Перевороты, удары, смены режимов. Трейдеры ставят деньги, агрегированная цена дает оценку вероятности — честнее, чем отчет аналитика, который пишет то, что хочет услышать начальник.

28 июля 2003-го сенаторы Дорган и Уайден вытащили проект на пресс‑конференцию. На демо‑скриншотах кто‑то из разработчиков для красоты вписал примеры контрактов: «убийство Арафата», «ракетный удар КНДР». Заголовок написал себя сам — «федеральный тотализатор на терактах». Пентагон свернул всё за сутки. Глава подразделения Джон Пойндекстер подал в отставку.

Это был первый случай, когда идея prediction markets столкнулась не с логической, а с моральной стеной. Экономически PAM был абсолютно здрав — Университет Айовы к тому времени годами предсказывал выборы через торговлю фьючерсами точнее любых опросов. Но оказалось, что существуют решения, которые общество отказывается отдавать рынку не потому, что рынок ошибётся, а потому что сама постановка вопроса в формате ставки — непристойна. Политическая гигиена победила эпистемическую эффективность.

Идеи, которые лежали в основе PAM, принадлежали Робину Хансону из Джорджа Мейсона. Он пошёл дальше спецслужб и в 2000-м сформулировал футархию — систему, где голосованием выбирают только цели, а способ достижения определяет рынок. Хочешь рост ВВП? Открой два условных рынка: «ВВП через год при политике А» и «ВВП через год при политике Б». Где цена выше — то и делаем.

Читать далее

Какая нейросеть лидирует в генерации текста сейчас? ChatGPT vs Gemini vs Claude

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.7K

С каждой неделей наш мир пополняется новой нейросетью. Вспомните, каким был февраль, который принес нам новые модели от Claude, OpenAI и Gemini. Март перехватил эстафету, хотя эта неделя выдалась без особых новшеств. Небольшой клочок спокойствия за последний один-два месяца.

В своей предыдущей статье я сравнил последние новинки от компаний, названных в абзаце выше. Сравнение происходило не во всех сферах, а затрагивало только программирование. В размышлениях я подумал: а почему не столкнуть модели в еще одном варианте задач? Речь идет о генерации текста, наверное, одно из наиболее популярных направлений при работе с нейросетями.

Сегодня будет сравнение ChatGPT 5.4, Gemini 3.1 Pro и, конечно же, Claude Opus 4.6 в задачах, которые связаны с текстом. Принимайте стратегически удобное положение, ну а я начинаю свое повествование. 

Читать далее

Universität или Fachhochschule: что выбрать для бакалавриата по CS/AI в Германии

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели8.1K

Я работаю в классическом немецком университете и каждый год вижу одну и ту же картину: русскоязычные абитуриенты рассматривают исключительно классический Universität как место возможного получения высшего образования, не зная, что в Германии существует и другая модель образования — Fachhochschule. Не потому что она хуже, а просто потому, что про нее российские студенты и абитуриенты просто не знают. Я постараюсь это исправить и немного поговорить о том, в чем же сходство и различие этих двух высших учебных заведений. Сразу оговорюсь: ниже речь именно о бакалавриате по Computer Science (CS) и Artificial Intelligence (AI).

Читать далее

Ваш CLAUDE.md делает агента тупее. Исследование на 138 репозиториях это доказало

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.9K

Я написал CLAUDE.md на 200 строк. Исследование ETH Zurich на 138 репозиториях говорит: мой агент стал от этого тупее на 3%, а я плачу на 20% больше за токены. Разбираюсь, что пошло не так.

Читать далее

Психоистория Азимова как техническое задание: как я построил мультиагентный AI-прогнозатор

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели7.5K

Короче, я прочитал «Основание» Азимова лет в четырнадцать и с тех пор не мог отделаться от одной мысли. Гэри Селдон придумал психоисторию – науку, которая предсказывает поведение больших групп людей статистически, как физик предсказывает поведение газа, не зная ничего про отдельную молекулу.

Фантастика, понятно, хоть и годная. Но позавчера я поймал себя на том, что у нас уже есть все кубики. LLM-ы, которые умеют анализировать текст, потоки новостей в реальном времени, байесовская статистика и самое главное – у нас теперь есть вайбкодинг! Это почти, как родная шаурма в Белграде – неожиданно и приятно.

Ну и я подумал, а что если попробовать? Не как метафору, а буквально. Взять психоисторию как техзадание и посмотреть, что получится.

У меня получился Seldon Vault – сайт, который каждый день генерирует прогнозы о том, что произойдёт в мире, и потом честно считает, сколько раз угадал. Бесплатный, конечно же.

Семь аналитиков, скептик и арбитр

Архитектура Seldon устроена как аналитическое бюро, а не как один всезнающий оракул.

Каждый день система собирает сигналы из десятка открытых источников – RSS-ленты мировых СМИ, Reddit, Telegram, Bluesky, предсказательные рынки (Polymarket, Metaculus), макроэкономика (FRED, Fear & Greed Index), базы конфликтов (ACLED, UCDP), катастрофы (GDACS) и геополитические события (GDELT). Первым их обрабатывает процессор сигналов – дешёвая модель (DeepSeek), которая классифицирует: это немедленная новость или структурный тренд? Важно или шум?

Дальше отфильтрованные сигналы уходят параллельно семи аналитикам. Каждый смотрит на одни и те же данные через свою оптику:

Читать далее

Когда AI становится частью мышления: что происходит с мозгом при потере инструмента

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.2K

На прошлой неделе заблокировали уже 5-й аккаунт в любимом Сlaudе, в основном через который работал с AI. Claude Code — десктоп, терминал и VS Code. В основном менеджерские задачи и прототипирование. Сейчас большая часть рабочих задач у меня проходит через AI-интерфейсы. И вместе с аккаунтом улетела часть рабочего контекста: проекты, истории диалогов, наработки за несколько месяцев. И это коснулось не только меня — заблокировали десятки аккаунтов у коллег по компании. Целая команда разом потеряла рабочий инструмент, кратно повышающий эффективность.

Формально не всё пропало. Часть файлов лежат локально, прошлые блокировки научили. Но пропала связность. Всё превратилось в набор разрозненных кусков, с которыми заново нужно учиться работать.

Попробовал переключиться на ChatGPT и Codex — вроде тоже AI, что-то умеет. Но результаты оказались довольно посредственными. Другая логика, другой контекст, нет привычных наработок с агентными структурами. По факту — всё равно снижение продуктивности. Даже наличие альтернативы не спасло, когда глубоко встроил конкретный инструмент в свой рабочий процесс.

Читать далее

Производство теряло деньги каждую смену. До внедрения видеоаналитики с ИИ никто не знал где

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели11K

Привет! На связи Олег Чебулаев, CEO Mad Brains. Хочу поделиться историей из практики — как обучить модель YOLO, запустить видеомониторинг на пищевом производстве и через неделю обнаружить кое-что, о чём на заводе предпочитали не говорить вслух.

Читать далее

OpenAI размещает рекламу в ChatGPT, Oracle тонет в долгах, а SoftBank точит когти. Что происходит со Stargate?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7.8K

Как бы ни старались бенефициары ИИ-пузыря прятать противоречия, разрывающие его изнутри, — правда вылезает наружу. Буквально на днях The Information оглушил всех очередным тревожным отчётом: между главными участниками проекта Stargate — OpenAI, SoftBank и Oracle — возникли серьёзные разногласия, которые могут похоронить весь проект.

Читать далее

Архитектура вместо синтаксиса: CodeSpeak — язык разработки следующего поколения, использующий силу LLM спецификаций

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели15K

Команда разработчиков под руководством Андрея Бреслава, российского разработчика и автора языка программирования Kotlin, представила публичную альфа-версию нового инструмента для разработчиков — CodeSpeak. Платформа позиционируется как язык программирования нового поколения, в котором инженеры пишут спецификации на английском языке, а нейросети берут на себя генерацию, тестирование и рефакторинг исполняемого кода. Полноценное внедрение инструмента позволяет сократить объем кодовой базы в проектах в пять-десять раз. Технология поддерживает интеграцию в существующие сложные проекты на Python.

ИИ-язык, созданный для людей

Ближайшие события

Неофициальный Python-клиент для alphaxiv: как мы нашли скрытый API и упаковали его в пакет

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели7.7K

У alphaxiv.org есть API — но найти его было непросто: публичная документация появилась совсем недавно, а до этого единственный способ разобраться в том, как он работает, — DevTools и живой трафик браузера. POST-запрос к api.alphaxiv.org/assistant/v2/chat, SSE-поток в ответе, модель aurelle-1.

На основе этого исследования мы собрали aurelle-py — Python-пакет для программного доступа к AI-ассистенту alphaxiv: задавать вопросы по arXiv-статьям, стримить ответы, встраивать в исследовательские пайплайны. Мы не первые, кто занялся этой темой, — но постарались сделать решение аккуратным и хорошо задокументированным.

Что внутри: синхронный и асинхронный клиенты, SSE-парсер с независимым юнит-тестированием, Pydantic v2 для валидации, типизированные исключения (AuthError, RateLimitError), MCP-сервер для интеграции с Claude Desktop и Claude Code.

pip install aurelle-py

В статье — как мы нашли эндпоинт, разобрали формат запроса и ответа, какие ограничения выявили опытным путём и как устроен пакет внутри.

GitHub: https://github.com/center4aai/aurelle-py

Читать далее

Облачные модели Ollama в задачах code review — честное сравнение на примерах

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели11K

AI всё чаще используется в разработке: генерация кода, автодополнение, агентные IDE. Но возникает логичный вопрос - можно ли доверить LLM полноценный code review?

В этой статье я решил проверить это на практике. Я сравнил несколько моделей, доступных через Ollama Cloud - Qwen 3.5, GPT-OSS и DeepSeek v3.1 - и дал им проанализировать реальные Pull Request из легаси-проекта на Python.

Спойлер: некоторые модели показали неожиданно хороший результат.

Читать далее

Дело ФИТ v. Сбер на 1,44 млрд руб: нейросети дали Сбербанку 67% на победу в кассации

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8K

Пока юридическое сообщество бурно обсуждало виражи громкого дела № А40-166729/2024 в Суде по интеллектуальным правам, мы решили сменить оптику. Почему бы не добавить к ним немного тензорных вычислений?

неШемяка! хладнокровно оценил перспективы обжалования с позиции ответчика и измерил шансы Сбера на отмену миллиардного взыскания в кассации. Спойлер - нейросети попали в яблочко!

Читать далее

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.9K

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT — быстрее, дешевле, без vendor lock‑in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

Читать далее

Этот ИИ ведёт дневник, заводит баг-репорты, избегает сложных задач, а существует всего 5 дней

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.3K

Сейчас расскажу историю, от которой немного сносит крышу.

Разработчик по имени Лиюаньхао сел и написал 200 строк кода на Rust.

Всё. Крошечный, голый скрипт.

Но то, что произошло после нажатия кнопки «запустить», — из тех вещей, которые перечитываешь дважды, чтобы убедиться, что тебе не показалось.

Он назвал проект yoyo — самоэволюционирующий кодинг-агент. А потом — и вот это то, что по-настоящему цепляет — полностью отошёл. Убрал руки с клавиатуры.

Дал одну-единственную инструкцию: эволюционируй, пока не сравняешься с Claude Code. И просто сел смотреть.

Знаете это чувство — когда ткнёшь семечко в землю, напрочь забудешь про него, а потом проходишь мимо и видишь, как из земли лезет живое, настоящее растение? Вот примерно это и случилось. Только это растение не просто выросло. Оно проснулось и начало само заводить баг-репорты.

Читать далее

Что такое ИИ-агенты для бизнеса: Понятное руководство для селлеров на маркетплейсах

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.6K

Адаптация статьи Anthropic «Building Effective Agents» специально для селлеров и предпринимателей торгующих на маркетплейсах.

Читать далее

Claude Cowork в браузере: 10 сценариев для автоматизации рутины

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели8.5K

Большую часть рабочего дня мы проводим в браузере: ищем информацию, заполняем формы, сравниваем цены. Все это - рутина, которую теперь можно делегировать.

Я разобрала, как с помощью ИИ-агента Claude Cowork и расширения для Chrome автоматизировать работу в браузере и освободить время для более важных задач.

Внутри - 10 готовых сценариев, которые можно применить уже сегодня.

Читать далее
1
23 ...