Как стать автором
Обновить
1431.06

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?

Время на прочтение10 мин
Количество просмотров223

В исследовании языков программирования меня всегда наиболее привлекала их разработка.

Когда аккуратно мастеришь язык программирования, синтаксис и семантика которого тщательно подогнаны под конкретную предметную область, ты как программист должен предоставить конечным пользователям интерфейс, полностью согласующийся с наработанной ими интуицией и их устоявшимися привычками. Так пользователи языка смогут сосредоточиться на интересных аспектах стоящих перед ними задач и браться за более крупные и сложные проекты.

Читать далее

Новости

Я построил Vision Transformer с нуля — и научил его обращать внимание

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.8K

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

Читать далее

Три письма из мультивселенной: какое будущее с ИИ мы выберем?

Время на прочтение6 мин
Количество просмотров525

Представьте, что в будущем научились передавать информацию сквозь время. Вы получили три послания из разных параллельных реальностей: одно из них пугает, второе соблазняет, а третье описывает ту реальность, в которой мы, скорее всего, окажемся уже скоро. На каждом пометка: «Темное», «Светлое» и «Нефильтрованное» «Нормальное». Давайте откроем их по порядку.

Читать далее

Создаем датасет печатных букв с любым шрифтом за 170 строк

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров427

В этой работе разбирается простой способ генерации изображений букв для подготовки данных для обучения нейронной сети для классификации (распознавания) букв русского алфавита.

Читать далее

Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?

Время на прочтение5 мин
Количество просмотров2.2K

Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.

Читать далее

Мышление и AI

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров476

Эта статья погружает в саму структуру нашего мышления, предлагая практический подход к тому, как сделать его более осознанным и управляемым. Мы разберём, как можно обогатить свой мыслительный процесс, используя внешние инструменты для навигации в сложных идеях и защиты от когнитивных искажений. Это размышление о том, как превратить собственный разум в ясного и сильного союзника, способного видеть суть вещей за пеленой ментального шума.

Читать далее

Твоя колонка шпионит за тобой? Или как перестать кормить корпорации личными данными

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

Сегодня голосовые ассистенты умеют включать музыку, подсказывать погоду и даже шутить. Большинство таких помощников – от Siri до Alexa – работают через облако: все ваши команды отправляются на серверы корпораций. Казалось бы, это удобно: тяжелые вычисления происходят дистанционно, а нам остается лишь слушать ответ. Однако за удобством скрывается ряд проблем, о которых часто не задумываются. Давайте разберемся, почему локальный голосовой ИИ-ассистент, работающий прямо на вашем устройстве, может быть лучше и безопаснее облачного собрата.

Читать далее

ИИ в радиологии: определение контура опухоли легких во время дыхания

Время на прочтение9 мин
Количество просмотров245


Мы неоднократно наблюдали всплески «трендовых» технологий, реакция общества на которые варьировалась от фанатичного желания получить эту технологию до радикального ее отрицания. Дополненная реальность, 3D-печать, голограммы, ИИ — все эти технологии очень громко обсуждались, но не все их них распространились и стали частью нашего быта. ИИ во всех его проявлениях (языковые модели, машинное обучение и т. д.) кажется проник везде, от браузеров и ОС смартфонов, до телевизоров и пылесосов. К ИИ вопросов много, от их этичности до воздействия на экологию. Однако стоит отметить, что не все ИИ одинаково плохи. Многие из них помогают в исследованиях и становятся инструментами улучшения уже имеющихся технологий. Ученые из Северо-Западного университета (Эванстон, штат Иллинойс, США) разработали систему, которая объединяет МРТ и ИИ, что позволяет трехмерно визуализировать контуры опухолей легких, которые меняются при дыхании пациента. Как именно работает данная система, что она позволяет увидеть в легких, и насколько она лучше экспертов-радиологов? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

Время на прочтение8 мин
Количество просмотров1.6K

Привет, Хабр!

В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B‑Preview и Polaris-7B‑Preview, обученные с нуля на reasoning‑задачах с использованием Reinforcement Learning. Эти модели не просто догоняют топовые коммерческие аналоги вроде Claude‑Opus и Grok-3-Beta — они их обгоняют. Причём на архитектуре всего в 4 миллиарда параметров.

Все это результат продуманного инженерного подхода. В этой статье коротко рассмотрим, как авторам Polaris это удалось.

Читать далее

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Время на прочтение5 мин
Количество просмотров1.3K

Привет, Хабр! 

Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п.

Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми.

Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами. 

Узнать подробности

Разбор заданий AI CTF на Positive Hack Days Fest. Часть 1

Уровень сложностиСредний
Время на прочтение30 мин
Количество просмотров983

Машинное обучение применяется везде: модели советуют врачам лекарства, помогают банкам ловить мошенников и пишут код вместо программистов. Проблемы с безопасностью в таких системах могут стоить денег, данных и репутации. Поэтому с 2019 года на конференции по безопасности PHDays мы проводим отдельный AI Track, а в рамках него — AI CTF, соревнование по взлому ML-систем.

Месяц назад мы провели AI CTF 2025 и хотим рассказать, какие задания мы придумали для участников, и какие атаки на AI и ML в них нужно было провернуть. На AI CTF 2025 было 14 заданий разного уровня и тематики, и 40 часов на их решение. В первой части мы с авторами разберем 8 заданий — те, что попроще.

Читать далее

Нейросеть приближается к опыту профессионального дерматолога

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров901

Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.

Читать далее

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июня 2025

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.2K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: китайцы открыли доступ к Ernie 4.5, появилась диффузионная LLM Mercury, в открытый доступ выложили веса FLUX Kontext, а Tencent показала нейросеть, которая генерирует игры по текстовому описанию.

Тем временем Tesla начала тестировать роботакси, а Claude — обанкротил бизнес, в который его пустили поэкспериментировать.

Читать далее

Ближайшие события

200 000+ снимков мусора: что мы узнали о датасетах

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров914

В нашей работе хватает безумных задач. Мы создали первого в России цифрового PR-менеджера, разрабатывали виртуальную примерочную и делали много чего еще, о чем не всегда можно рассказать. Но когда мы взялись за создание ИИ-сортировщика мусора MARQUS, поняли — будет совсем жестко.

Не так давно мы создали систему сортировки ТКО (Твердых коммунальных отходов) MARQUS, которая делит отходы на бумагу, металл, пластик, стекло и т.д. Система использует искусственный интеллект и специальные сенсоры, чтобы распознавать различные типы отходов прямо на конвейере и направлять их в соответствующие секции для переработки.

В процессе разработки MARQUS мы столкнулись с задачей — найти или собрать подходящие датасеты, так как без них эффективность нейронной сети резко снижается, если вообще приближается к нулю.

Мы перепробовали множество подходов, пересмотрели доступные датасеты с готовой разметкой и потратили достаточное количество времени и денег, чтобы честно признаться — на обучении нейронок сэкономить не получится, но обо всем по порядку.

Читать далее

DevOps в 2025 году: отдельные дисциплины, машинное обучение и прогноз на будущее

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.7K

Привет! Меня зовут Константин Полуэктов, я solution architect в Yandex Cloud и технический эксперт в онлайн-магистратуре от Яндекса и ИТМО «DevOps-инженер облачных сервисов». В этой статье я расскажу о сфере DevOps: что изменилось за последние годы и чего ждать в будущем.

Читать далее

16 перемен, которые уже меняют корпоративный подход к генеративному ИИ

Время на прочтение11 мин
Количество просмотров895

В 2023 году генеративные ИИ стремительно ворвались в потребительский сегмент, достигнув миллиарда долларов пользовательских расходов за рекордно короткий срок. В 2024-м, по нашим оценкам, потенциал выручки в enterprise-сегменте будет в несколько раз выше.

Пока в прошлом году потребители часами общались с новыми AI-компаньонами или создавали изображения и видео с помощью diffusion-моделей, корпоративное внедрение genAI, казалось, ограничивалось лишь очевидными кейсами и выпуском «GPT-оберток» в виде новых SKU. Скептики задавались вопросами: действительно ли genAI может масштабироваться в enterprise? Разве мы не застряли а трёх одинаковых сценариях? Способны ли стартапы вообще зарабатывать на этом деньги? А вдруг это просто хайп?

За последние несколько месяцев мы пообщались с десятками топ-менеджеров компаний из списка Fortune 500 и других лидеров enterprise-сегмента, а также провели опрос среди ещё 70 компаний, чтобы понять, как они используют genAI, как покупают решения и как планируют бюджеты. Мы были поражены тем, насколько сильно изменилась структура инвестиций и отношение к генеративным ИИ всего за полгода. Хотя у этих лидеров всё ещё остаются определённые опасения по поводу внедрения generative AI, они почти утроили бюджеты, расширили число рабочих кейсов, реализованных на меньших open-source моделях, и начали активно выводить задачи из стадии эксперимента в продакшн.

Для фаундеров это колоссальная возможность. Мы убеждены: те AI-стартапы, которые, во-первых, ориентируются на стратегические AI-инициативы корпораций с учетом их болевых точек, и, во-вторых, трансформируют сервисную модель в масштабируемые продуктовые решения, — именно они смогут захватить значительную долю нового инвестиционного потока и закрепиться на рынке.

Читать далее

Помогут ли роботы справиться с кадровым голодом на производствах?

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров732

Производство в России внезапно оказалось в двадцать первом веке. Все вокруг говорят про роботов и искусственный интеллект, а на деле — дефицит людей, зарплаты кусаются, а ручной труд стал роскошью, как хороший кофе в автомате. Роботы, конечно, есть, но в основном импортные, и купить их теперь — квест с элементами параллельного импорта и шаманства. Настроить — отдельная боль, потому что специалистов не хватает, а те, что есть, стоят как чугунный мост. Кредиты сейчас настолько дорогие, что вложения в роботов окупаются очень медленно — примерно как ждать, когда наконец-то закончат ремонт на самой загруженной улице в вашем городе, который тянется годами.

В машиностроении и прочих индустриях роботизация идет так себе — кусками и без системы. В логистике все сложно: людей не хватает, зарплаты кладовщиков уже больше, чем у некоторых начальников, а фонд оплаты труда жрет половину бюджета. Поэтому все, кто может, мечтают заменить людей на железки. В идеале — чтобы склад работал сам, а люди только чай пили и на кнопки нажимали.

В промышленности роботы собирают, сортируют, пакуют, и делают это без перекуров и обедов. В логистике — тележки сами ездят, дроны летают, коробки считают. В ритейле — кассы самообслуживания и прочие радости. В сельском хозяйстве — трактор сам пашет, комбайн сам собирает, фермер только в соц сети сторис выкладывает.

ИИ пока что больше на бумаге, чем в жизни. Машинное зрение — да, кое-где стоит, но массово никто не внедряет, потому что сложно, дорого и страшно. Все боятся, что ИИ накосячит, а отвечать потом придется живому человеку. В будущем, конечно, обещают, что можно будет голосом отчеты формировать, но пока что максимум — чат-боты, которые не понимают половину вопросов.

Читать далее

ICLR-2025: что нового в мультимодальном ранжировании

Время на прочтение16 мин
Количество просмотров413

Всем привет! Недавно мы — Алексей Спасёнов и Кирилл Никоров из ML‑команды Мультимедиа Поиска Яндекса (Картинки и Видео) — и ещё 90 яндексоидов побывали на конференции ICLR-2025 и рады рассказать о свежих направлениях исследований в области мультимодального ранжирования.

С каждым годом эта область ML приобретает всё более важной. Люди всё чаще предпочитают получать информацию из визуальных медиа и кратких ИИ‑выжимок, а не привычных текстовых статей. При этом область мультимодального ранжирования является довольно сложной и интересной, так как она постоянно использует разные данные (тексты, аудио, изображения) и требует высокой вычислительной эффективности.

В этой статье мы хотели бы поделиться самыми интересными и перспективными для нашей области работами, которые мы выделили на конференции.

Читать далее

Сколько стоит интеллект? Как оптимизировать бюджет AI-проекта в 2025

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров561

AI может помочь снизить затраты, ускорить процессы или увеличить выручку. Однако, чтобы экономика проекта сходилась, нужно не только уметь качественно оценивать потенциальный эффект, но и уметь контролировать затраты.

Цель статьи — показать, как минимизировать расходы на AI-проект.

Дисклеймер: Рынок GenAI очень динамичен, и цены могут быстро меняться. Цены актуальны на момент написания (середина 2025 года) и могут измениться.

Читать далее

ML Q & AI. Глава 1. Эмбеддинги, латентные пространства и представления

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.5K

Известный эксперт в области машинного обучения и ИИ Себастьян Рашка был добр бесплатно поделиться с миром своей уникальной книгой о фундаментальных вопросах в области современного машинного обучения, которая рассматривает и изучает вопросы создания эффективных архитектур для глубинного обучения. В книге рассматриваются 30 важных аспектов этой сферы в максимально доступной и понятной форме: каждый вопрос рассмотрен как небольшая, но интересная статья подобно тем, что мы читаем здесь, на Хабре. Отсутствие такой книги в русскоязычном сегменте - большое упущение, поэтому верю, что серия переводов этой книги будет полезна хабровчанам.

Читать далее
1
23 ...

Вклад авторов