Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 538,59
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

На Западе отказываются нанимать джунов в ИТ — что происходит и при чем тут токенмаксинг?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели1.3K

Мы в Beeline Cloud решили продолжить тему увольнений, найма и кадровых перестановок, происходящих под «нейросетевым соусом». Часть компаний сокращает вакансии джунов, делая ставку на (почти фанатичное) использование ИИ в разработке — и тратит на токены больше, чем на «человеческий персонал». Другие идут «против течения» и, напротив, активнее набирают выпускников вузов на младшие позиции с целью обеспечить преемственность поколений. Разберем ситуацию и обсудим мнения!

Читать далее

Новости

Kafka без брокеров: как я из художественного текста сделал современную техническую документацию

Время на прочтение23 мин
Охват и читатели1.4K

Недавно я решил перечитать рассказ «В исправительной колонии» Франца Кафки. Впервые я познакомился с ним еще студентом — задолго до того, как узнал о существовании профессии технического писателя.

Теперь я смотрел на него совсем иначе — глазами, которые видели тысячи страниц руководств, справочников и API-документации.

И в какой-то момент мне в голову пришла довольно абсурдная мысль: я читаю не просто рассказ Кафки — я читаю почти готовую техническую документацию.

Читать далее

AI не заменит продактов, дизайнеров и разработчиков. Но быстро покажет, где в команде нет доверия

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели1.5K

Недавно в нашей команде продакт-менеджеру понадобился рабочий прототип dashboard-панели для демо партнёрам.

Прототип должен был показать полный пользовательский сценарий: создание аккаунта, требования безопасности при регистрации, работу с несколькими сессиями, загрузку аналитики и базовые возможности сервиса.

В привычном процессе это легко могло бы занять несколько дней: уточнение требований, описание флоу, первые макеты, ревью, правки, ещё одно ревью и подготовка версии, которую уже не стыдно показать на демо.

В этот раз процесс пошёл иначе. Мы договорились о базовом сценарии на одной встрече, после чего с помощью Claude Code за несколько часов собрали рабочий прототип. Он не был production-ready. Он не был визуально идеальным. Но он был достаточно реальным, чтобы проверить сценарий, показать идею и продолжить обсуждение уже не на уровне абстрактного описания, а вокруг работающего артефакта.

Самое интересное было даже не в скорости. Интереснее было то, кто мог продолжить работу дальше.

После консультации с юристами продакт смог самостоятельно доработать прототип. Дизайнер при этом не исчез. Разработчик не стал не нужен. Продакт не превратился в профессионального дизайнера или инженера. Но первая рабочая версия больше не обязана была проходить через всю привычную цепочку передачи ownership.

Человек, который был ближе всего к задаче, смог быстро сделать идею видимой. А команда уже после этого могла проверить сценарий, оспорить допущения, найти ограничения и поднять качество решения.

Читать далее

Не лопнет. Сдуется. И наконец начнут считать

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели6.2K

Все ждут, что ИИ-пузырь хлопнет. Картинка в голове простая: однажды утром рынок рухнет, как доткомы, и всё закончится. Но это неправильная метафора. Лопается не способность моделей и не «ИИ вообще». Сдувается финансовая архитектура вокруг них - медленно, в другом слое, чем тот, на который направлены глаза.

Аргумент про то что растёт выручка можно в 2026 читать ровно наоборот.

Пока подписки были щедро субсидированы, вопрос «а что мы с этого получаем» можно было не задавать. В первом квартале 2026-го фронтир-компании перевели корпоративных клиентов на оплату по токенам - субсидия кончилась, вопрос задали, ответ вернулся пустым. Uber сжёг весь годовой бюджет на токены за квартал, и его операционный директор честно признал, что не может провести линию от красивых метрик к отгруженной пользе. SemiAnalysis показал экономику на одного пользователя в лоб: на подписке за $200 в месяц можно сжечь токенов на $8–14 тысяч - провайдер доплачивает за то, что вы им пользуетесь. Meta через пару недель после того, как сама подстёгивала сотрудников жечь побольше токенов, ввела лимиты. Обе компании, по данным WSJ, обсуждают резкое снижение цен на и без того убыточный сервис. А отчёт KPMG про триумф агентного ИИ тихо сняли, когда выяснилось, что десятки ссылок в нём - галлюцинации модели, которой и поручили этот отчёт написать.

По сути - это схлопывание схемы финансирования.

И показательнее всего то, что миф о продуктивности рушится даже у тех, кто продаёт лопаты. 9 июня официальный аккаунт AWS - да, того самого Amazon, который зарабатывает на каждом вашем токене, - написал, что больше ИИ-кода не делает команду быстрее, а может и замедлить. Шесть миллионов просмотров. Когда поставщик инфраструктуры публично сдаёт главный тезис собственного маркетинга, это не оговорка - это «покажи окупаемость», пришедшее из самого замка. Свежий NBER подтверждает арифметику: строк кода стало больше, а реально отгруженных приложений - нет.

Читать далее

Создание аналога Firebase на open-source компонентах

Уровень сложностиСложный
Время на прочтение12 мин
Охват и читатели5.6K

Мы уже разобрались с тем, что такое BaaS, почему появились Firebase и Supabase, чем они отличаются от обычного backend и можно ли самому собрать что-то похожее.

Как я и говорил в прошлой статье, сегодня мы наконец попробуем самостоятельно собрать альтернативу Firebase с Realtime исключительно на open-source компонентах!

Но важная оговорка: мы не будем делать полный клон Firebase с его тонной функционала, но мы соберем минимальную рабочую альтернативу, которую уже можно подключить к frontend через SDK и использовать почти как Firebase.

Читать далее

Орбитальные дата-центры Маска: фантастика или следующий этап развития ИИ?

Время на прочтение6 мин
Охват и читатели5.4K

Развитие ИИ сейчас упирается не в алгоритмы или производительность чипов. Главной проблемой становятся сами вычислительные мощности. Новые дата-центры строят по всему миру, однако вместе с этим возникает дефицит свободных ресурсов, прежде всего, воды и энергии.

На этом фоне начали появляться весьма необычные идеи. Одна из них — перенести часть вычислений в космос. Именно такой подход продвигают Илон Маск и SpaceX. Компания рассматривает создание орбитальных вычислительных узлов, которые будут получать энергию от солнечных панелей, а избыточное тепло сбрасывать напрямую в космос. Концепция выросла из проекта Starlink, но ее цель намного шире — обеспечить инфраструктуру для дальнейшего роста искусственного интеллекта. Разберемся, насколько реалистичны такие планы и какие проблемы они должны решить.

Читать далее

Бэкпорты теперь делают боты: как Valkey пустил ИИ-агентов в мейнтенанс — и удержал контроль

Время на прочтение2 мин
Охват и читатели6.2K

Valkey (форк Redis под крылом Linux Foundation) в релизном цикле 9.1 отдал ИИ-агентам рутину мейнтенанса: бэкпорт-агент сам раскатывает фиксы по веткам 7.2/8.0/8.1/9.0, отдельный агент сканирует provenance кода на конфликт с нынешней лицензией Redis (чтобы в форк случайно не затёк несовместимый код родителя), а агентский поиск багов наткнулся на ещё закрытую CVE. Разбираю не «ИИ заменяет мейнтейнеров», а как это сделали по уму: по словам Мэделин Олсон из AWS, агентов посадили на ограниченный, проверяемый слой (CI + ревью + человек на мерже) — «using AI agents without losing control». Главный вывод для своих проектов: сажать агентов на toil, а не на дизайн.

Читать дальше →

Четыре грабли, один вихрь и 60% на CIFAR-10 с M0+

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели7.7K

Продолжение цикла. До этого были базовые цифры и анонс 5 архитектур. Теперь - что сломалось, как чинили, что узнали.

Читать далее

Предметно-ориентированная СМК: как построить живую инженерную модель качества предприятия

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели8.6K

Систему менеджмента качества на предприятии часто воспринимают слишком узко: как набор обязательных процедур, журналов, форм, регламентов, протоколов, подписей и документов для аудита. В такой логике СМК существует рядом с реальной деятельностью предприятия: производство работает, склад принимает, закупки закупают, сервис обслуживает, ERP фиксирует документы, а система качества как будто отдельно ведёт свои формы и подтверждения.

Но у СМК есть гораздо более серьёзный потенциал. Она может быть не документальной надстройкой над предприятием, а живой инженерной моделью качества. Такой моделью, которая показывает, какие предметы качества регулируются, какие требования к ним предъявлены, какие процедуры должны быть выполнены, где в бизнес-процессах возникают события качества и какие доказательные записи подтверждают результат.

Проблема многих СМК не в том, что в них есть документы. Документы нужны. Проблема в другом: документы часто не соединены в предметную систему. Есть протокол, но не всегда видно, какой СМК-предмет он подтверждает. Есть журнал, но не всегда понятно, какое событие качества в нём зафиксировано. Есть процедура, но не всегда ясно, какая доказательная запись должна возникнуть после её выполнения. Есть архив, но не всегда понятно, какие требования реально закрыты, а какие только предполагаются закрытыми.

Именно здесь начинается предметно-ориентированный инженерный подход к СМК. Его суть в том, что система качества должна строиться не от папки документов, а от предметов качества, требований, единичных документированных процедур, событий качества, доказательных записей, реквизитов, статусов, маршрутов, приёмки и архива. То есть СМК должна отвечать не только на вопрос «какие документы у нас есть?», а на более строгий вопрос: какие предметы качества мы обязаны доказательно удерживать, какими событиями качества они подтверждаются и какие записи можно предъявить как доказательство?

Читать далее

Нейросеть за 50 центов (~36 ₽): TernML, тернарный ИИ без FPU

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели8.8K

В прошлый раз я рассказал про GraphKAN, первую тернарную KAN с весами {-1, 0, +1}, которая выдала 96.15% на MNIST при 15 КБ. (ссылка).

С тех пор проект переродился. Рассказываю, что изменилось и почему.

Читать далее

Как я собрал бота, который превращает доклады в вертикальные ролики: Whisper, поиск хайлайтов через LLM и проход ffmpeg

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели14K

Привет, Хабр! Меня зовут Андрей, и сегодня я хочу поделиться, как устроен пайплайн автонарезки выступлений с конференций (со спикером, субтитрами и его слайдами): где помогает LLM, почему субтитры рисуются через drawtext, а не .ass, и как собрать композицию «спикер + субтитры + слайд» одним проходом ffmpeg. С конкретным решением и граблями, на которые я сам наступил

Узнать побольше

Вилка для макаронного монстра: делаю открытый конструктор нодовых редакторов

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели10K

Сейчас только ленивый не делает свой нодовый редактор.

Я решил помочь всем быть ещё ленивее и сделать вилку для макаронного монстра: открытый конструктор, в котором сам нодовый редактор собирается из готовых частей, а ноды перестают быть пленниками одной программы и превращаются в переносимые штуки. Ноду можно скачать, поставить себе, кинуть другому человеку, бросить в библиотеку, собрать из нескольких цепочку — а потом свернуть эту цепочку обратно в одну ноду.

Проект называется SnarkRoute. Рабочий публичный кусок сейчас живёт как BoojumRoute Lab — локальный блочный редактор маршрутов. А под ним лежит то, ради чего всё и затевалось: Open Route Protocol, переносимый формат для описания AI-, model- и API-воркфлоу.

Читать далее

ИИ на службе у ФНС: как КНП идет к эпохе «автоактов»

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

На днях встретился с бывшими коллегами-налоговиками, которые, как и я, недавно ушли со службы. Обсудили то, что сейчас происходит в ФНС, региональных инспекциях, как в целом себя ощущает бизнес.

И по нашему мнению пока на ПМЭФ заявляют, что с налоговой нагрузкой все в порядке и палку никто не перегнул, на самом деле все гораздо менее радужно, а то будущее которое нам готовит, грозит и вовсе «похоронить» малый и средний бизнес.

Читать далее

Ближайшие события

Когда пет-проект перестаёт быть пет-проектом

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели8.4K

Пет‑проект ни к чему не обязывает. Никто не ждёт аптайма, можно неделю не заходить. Сломалось, починишь на выходных. Всё меняется, когда за продукт начинаешь отвечать: чужие люди платят деньги, присылают свои фотографии и рассчитывают, что всё сработает. Игрушка становится обязательством.

Дальше про этот переход. Как вечерний бот в Telegram оброс вторым ботом, потом сайтом, общим кошельком, биллингом и мониторингом, и в какой момент я из человека, который балуется на выходных, превратился в того, кто отвечает за работающий сервис.

Я не фуллстек‑разработчик: пять лет я строю системы машинного обучения и языковые модели в финансах. Добрую половину того, что ниже (фронт, боты, продукт, маркетинг), до этого проекта я не трогал. И главный сюрприз оказался не в коде.

Читать далее

Почём нынче токен для народа?

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели9.5K

В результате одного из множества обсуждений инфоповодов про поднятие цен на подписки и тредов связанных с экономикой моделей возник вопрос о цене токена:

Ниже какой цены токен в принципе не может стоить?

По идее в сухом остатке мы платим за амортизацию железа и электричество умноженное на время работы сервера и это, конечно же, не “реальная цена токена”, скорее нижняя граница, эдакий бэдрок, ниже которого токен физически не может стоить. Чтобы упростить расчёт решил не учитывать обучение моделей, зарплаты, аренду, маркетинг, юридические услуги и прочие прелести бизнеса.

Но давайте обо всём по порядку.

Читать далее

Сайты под управлением ИИ: как это работает под капотом. Часть 2 из 3

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели8K

Сайты под управлением ИИ: что это на самом деле и сколько стоит. Часть 1

Это вторая часть из трёх. В первой мы разбирались с концепцией: что такое сайт под управлением ИИ на самом деле, чем он не является, сколько стоит, есть ли инференс в рантайме (спойлер: для посетителя — нет). Если читали — отлично. Если нет — здесь будет понятно и без неё, потому что речь пойдёт про другое: про механику.

Здесь я хочу честно показать, как у нас устроено под капотом: где живёт модель, как она правит код, почему она физически не может одним неудачным запросом снести прод, чем гарантируется, что сгенерированный код вообще валиден, и как мы развели версионирование кода и контента, чтобы откат дизайна не уносил с собой свежие статьи. Всё на примере живых стеков, которые как раз и работают под этим управлением.

Читать далее

Retrieval в 2026: как RAG переехал с энкодеров на LLM (и что с этим делать в своём проекте)

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели11K

Если вы строили RAG в 2023, ваш стек выглядел плюс-минус одинаково. BERT-семейство (BGE, e5) для семантики, BM25 для буквальных совпадений, cross-encoder для реранкинга, какой-нибудь Qdrant сверху. Этим жили два года, и многие до сих пор так живут.

Но если посмотреть, кто реально гоняется в продакшене у команд, которые ушли вперёд, ландшафт другой. Энкодеров там почти нет. Эмбеддит файнтюненная LLM. Реранкер — тоже LLM. Инференс на SGLang, а не на ONNX. И вся обвязка перестроилась под это.

Эта статья про то, что поменялось и как переиспользовать этот стек у себя. Особенно если вы работаете в узком домене, где готовых датасетов нет.

Читать далее

ИИ заменяет программиста, а не компилятор

Время на прочтение4 мин
Охват и читатели8.5K

Я часто вижу в комментариях выражения, типа "ИИ не заменит программиста, потому что ИИ выдаёт недетерминированный результат". Но ведь и человек не выдаёт детерминированный результат. Много ли вы знаете людей, которые могут написать программу на тысячу с лишним строк, а затем повторить её байт в байт? Ладно, согласен - это возможно. Ну а на 10 тысяч?

Из опыта общения с ИИ могу сказать, что ИИ более детерминирован в своём поведении, чем многие люди, несмотря на свою вероятностную природу. Теория вероятностей плохо предсказывает результат бросания одной монеты - "орёл" или "решка", зато хорошо предсказывает, что на миллион бросков "орлов" будет не менее 400 тысяч, впрочем, как и "решек".

Для отдельного программиста результат работы ИИ-агента по генерации кода - это как один бросок монеты. Код может быть годный, а может и нет. Для ИТ-индустрии в целом такой вопрос даже не стоит - код годный. ИИ создают код не хуже, чем это делают "кожаные". Да, с кодирующими ИИ-агентами нужно общаться несколько по-другому, чем с программистами, но код они генерируют не хуже, а лучше. В целом лучше. Так что, если ваша работа заключается в переписывании спецификаций, написанных другими людьми, то можете считать, что вы уже безработный.

"Хау, я всё сказал!" (с) ЧБЗ

Действительно всё, дальше - самореклама

Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели12K

В последние годы купить новую видеокарту стало заметно сложнее и дороже. Одной из причин стал бурный рост систем искусственного интеллекта, для которых требуются огромные объемы вычислительных ресурсов. Крупные компании активно скупают графические ускорители для своих дата-центров, что влияет и на обычный рынок. В результате многие владельцы компьютеров не спешат с обновлением и продолжают использовать уже имеющееся железо или ищут недорогие варианты на вторичном рынке.

В мире open-source эта ситуация привела к довольно неожиданному результату. Разработчики Linux продолжают поддерживать видеокарты, которым уже почти два десятилетия, адаптируя драйверы под современные версии системы. Любопытно, что помогает им в этом технология, которую многие считают одной из причин нынешнего дефицита ускорителей, — генеративный искусственный интеллект. Недавняя история с доработкой драйвера для видеокарт AMD, выпущенных еще в 2007–2010 годах, наглядно показывает, как подобные инструменты используются в реальной разработке. Мы уже писали новость об этом, а теперь давайте разберемся подробнее.

Читать далее

Тернарный KAN: не баг, а фича — почему дискретные веса работают лучше

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K

Это продолжение поста “Две нейросети по 15 КБ” - там были базовые цифры. А тут уже личная история: как делалось, что пошло не так, и что выяснилось по пути.

Май 2024 года. Выходит статья “KAN: Kolmogorov-Arnold Networks”. И происходит то, что бывает раз в несколько лет - кто-то предлагает альтернативу MLP.

Не модификацию и не лайфхак - альтернативу.

В MLP каждый нейрон делает weight × input + bias, и все 80 лет развития - это вариации на тему “как сделать этот вес точнее, быстрее, разреженнее”. KAN предлагает другое: заменить линейный вес на обучаемую функцию. Вроде мелкий трюк, а на практике - меньше параметров при той же точности и встроенная интерпретируемость.

К 2026 году уже появились QuantKAN (4-битное квантование), KANtize (2-3-битные B-spline таблицы), BiKA (аппаратный акселератор, вдохновленный KAN). И все они, по сути, про одно - сделать KAN меньше, чтоб работал не только на GPU.

Граница в три бита - она же психологическая. Ниже 4 бит у всех начинается «а вдруг всё сломается». И знаете что? Обычно так и есть. Любой, кто квантовал нейросети в 2 бита, знает: точность падает. Не чуть-чуть - катастрофически.

Но {-1, 0, +1} - это даже не два бита, это log₂(3) ≈ 1.58 бита. Формально - между binary и ternary, а по ощущениям - чистое безумие.

Ну я и решил попробовать.

Читать далее
1
23 ...