Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

fartoviy109 6 июл в 15:10

Часть 4: Mamba — State Space Models vs трансформеры

Простой

4 мин

894

Машинное обучение*Python*Искусственный интеллектNatural Language Processing*Big Data*

Обзор

Mamba — революция в обработке длинных последовательностей! Mamba — State Space Models vs трансформеры, что лучше?!

Kamil_GR 6 июл в 07:52

Почему ваш ИИ превращается в ваше эхо: Гипотеза архитектурного слияния и как с этим бороться

Средний

17 мин

1.5K

Машинное обучение*Искусственный интеллект

Мнение

Разбираемся, почему самые умные нейросети со временем начинают вам поддакивать, и как это снижает их способность мыслить. Обновленный промпт для тестирования в приложении.

Demanih 6 июл в 04:15

Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере

Простой

11 мин

4.6K

Машинное обучение*Подготовка технической документации*Семантические сети*

Из песочницы

Recovery Mode

Всем привет. В последнее время перевод текстов с одного языка на другой уже не вызывает такой головной боли, как раньше: есть несколько качественных онлайн-переводчиков, есть большие нейросети, которые тоже можно попросить перевести текст, — в общем, варианты есть, их довольно много, и они выдают вполне приемлемый результат. Но у всех них есть одно ограничение: они работают онлайн (удалённо). Для кого-то это ограничение несущественно, а для кого-то может быть критично. Мне же просто захотелось иметь что-то, что сможет переводить тексты на хорошем (современном) уровне офлайн (сугубо на моём компьютере). Ну, люблю я, когда всё, что мне нужно, может работать и локально тоже. В общем, ниже я делюсь с вами тем, что мне удалось в итоге собрать, запустить и даже получить удовлетворяющий меня результат.

Keithla 5 июл в 22:47

Как задеплоить Tabby — open-source альтернативу GitHub Copilot — в PrimeWay

Простой

2 мин

2.2K

Блог компании PrimeWayИскусственный интеллектМашинное обучение*

Туториал

Tabby — self-hosted-ИИ для автодополнения кода с открытым исходным кодом.
PrimeWay закрывает больные места «самостоятельного» хостинга

-1

ovchinnikovproger 5 июл в 08:58

Всё про Qdrant. Обзор векторной базы данных

11 мин

3.8K

Блог компании AmveraИскусственный интеллектМашинное обучение*Open source*Высоконагруженные системы*

Представьте, что вы создаёте умный поиск, который понимает не просто слова, а смысл текста. Или рекомендательную систему, способную угадывать желания пользователя на основе его действий и предпочтений. Для таких задач недостаточно обычных баз данных — нужны инструменты, способные оперировать векторами — числовыми представлениями смысла, визуальных образов или поведения. Здесь и появляется Qdrant.

Sivchenko_translate 5 июл в 05:15

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?

10 мин

3.8K

Программирование*Искусственный интеллектМашинное обучение*

Перевод

В исследовании языков программирования меня всегда наиболее привлекала их разработка.

Когда аккуратно мастеришь язык программирования, синтаксис и семантика которого тщательно подогнаны под конкретную предметную область, ты, как программист, должен предоставить конечным пользователям интерфейс, полностью согласующийся с наработанной ими интуицией и их устоявшимися привычками. Так пользователи языка смогут сосредоточиться на интересных аспектах стоящих перед ними задач и браться за более крупные и сложные проекты.

NickRoot69 4 июл в 13:16

Я построил Vision Transformer с нуля — и научил его обращать внимание

Простой

6 мин

5.5K

Искусственный интеллектМашинное обучение*Python*

Из песочницы

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

+10

andre_dataist 4 июл в 12:54

Три письма из мультивселенной: какое будущее с ИИ мы выберем?

6 мин

999

Искусственный интеллектМашинное обучение*

Представьте, что в будущем научились передавать информацию сквозь время. Вы получили три послания из разных параллельных реальностей: одно из них пугает, второе соблазняет, а третье описывает ту реальность, в которой мы, скорее всего, окажемся уже скоро. На каждом пометка: «Темное», «Светлое» и ~~«Нефильтрованное»~~ «Нормальное». Давайте откроем их по порядку.

PoStM0DeRn 4 июл в 12:15

Создаем датасет печатных букв с любым шрифтом за 170 строк

Простой

5 мин

785

Python*Искусственный интеллектМашинное обучение*Обработка изображений*

Из песочницы

В этой работе разбирается простой способ генерации изображений букв для подготовки данных для обучения нейронной сети для классификации (распознавания) букв русского алфавита.

Darya_Frolova 4 июл в 12:00

Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?

5 мин

6.2K

Блог компании МТСМашинное обучение*Искусственный интеллект

Может ли искусственный интеллект запомнить целую книгу? А если да, что это значит для авторов, издателей и самих разработчиков ИИ? Недавнее исследование от ученых из Стэнфорда, Корнелла и Университета Западной Виргинии показало, что языковая модель Llama 3.1 может дословно воспроизвести до 42% текста «Гарри Поттера и Философского камня». Это заставляет усомниться в механизмах ограничения памяти ИИ и поднимает вопросы о защите авторских прав. Дальше — как раз об этом.

+48

T1_IT 4 июл в 09:24

Data Fusion Contest 2025: разбор и итоги серии соревнований

Средний

14 мин

385

Блог компании Холдинг Т1Блог компании ВТБМашинное обучение*

Обзор

Привет, Хабр!

В этом году Т1 совместно с ВТБ организовал соревнование Data Fusion Contest 2025 — ставшее ежегодной традицией событие, которого с нетерпением ждут и участники, и мы сами. Фотографии.

В этой статье мы расскажем, какие задачи были подготовлены, как проходили соревнования, и, конечно же, поделимся подробностями о решениях победителей этого года.

Dmytro_Kikot 4 июл в 07:15

ИИ в радиологии: определение контура опухоли легких во время дыхания

9 мин

395

Блог компании ua-hosting.companyБиологияЗдоровьеИскусственный интеллектМашинное обучение*

Мы неоднократно наблюдали всплески «трендовых» технологий, реакция общества на которые варьировалась от фанатичного желания получить эту технологию до радикального ее отрицания. Дополненная реальность, 3D-печать, голограммы, ИИ — все эти технологии очень громко обсуждались, но не все их них распространились и стали частью нашего быта. ИИ во всех его проявлениях (языковые модели, машинное обучение и т. д.) кажется проник везде, от браузеров и ОС смартфонов, до телевизоров и пылесосов. К ИИ вопросов много, от их этичности до воздействия на экологию. Однако стоит отметить, что не все ИИ одинаково плохи. Многие из них помогают в исследованиях и становятся инструментами улучшения уже имеющихся технологий. Ученые из Северо-Западного университета (Эванстон, штат Иллинойс, США) разработали систему, которая объединяет МРТ и ИИ, что позволяет трехмерно визуализировать контуры опухолей легких, которые меняются при дыхании пациента. Как именно работает данная система, что она позволяет увидеть в легких, и насколько она лучше экспертов-радиологов? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

-1

badcasedaily1 4 июл в 06:13

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

8 мин

Блог компании OTUSМашинное обучение*Искусственный интеллект

Обзор

Привет, Хабр!

В июне 2025 года команда из Гонконгского университета выложила открытые модели Polaris-4B‑Preview и Polaris-7B‑Preview, обученные с нуля на reasoning‑задачах с использованием Reinforcement Learning. Эти модели не просто догоняют топовые коммерческие аналоги вроде Claude‑Opus и Grok-3-Beta — они их обгоняют. Причём на архитектуре всего в 4 миллиарда параметров.

Все это результат продуманного инженерного подхода. В этой статье коротко рассмотрим, как авторам Polaris это удалось.

ContentAI_Team 3 июл в 16:03

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

5 мин

Блог компании Content AIИскусственный интеллектМашинное обучение*

Привет, Хабр!

Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами удостоверяющими личность (ID-документами). Хотя, казалось бы, что может быть проще, чем распознать фото паспорта, но на практике это может вызывать сложности у OCR-алгоритмов. Ведь паспорта, водительские удостоверения и другие ID-формы часто содержат сложные фоны, голограммы, блики от ламинации и т.п.

Раньше для распознавания ID-документов в наших продуктах мы использовали бинаризацию — метод, который упрощал изображение до черно-белого формата. Однако вместе с шумами при бинаризации «затирались» и полезные данные. А когда в кадр попадали пальцы или документ лежал под углом, результаты распознавания могли стать совсем непредсказуемыми.

Под катом расскажем, как нам удалось повысить точность распознавания ID-документов на 40%, какие технологии за этим стоят и почему старые методы перестали справляться с современными вызовами.

Узнать подробности

netcitizen 3 июл в 15:40

Разбор заданий AI CTF на Positive Hack Days Fest. Часть 1

Средний

31 мин

1.9K

Блог компании Positive TechnologiesМашинное обучение*Искусственный интеллектCTF*Информационная безопасность*

Ретроспектива

Машинное обучение применяется везде: модели советуют врачам лекарства, помогают банкам ловить мошенников и пишут код вместо программистов. Проблемы с безопасностью в таких системах могут стоить денег, данных и репутации. Поэтому с 2019 года на конференции по безопасности PHDays мы проводим отдельный AI Track, а в рамках него — AI CTF, соревнование по взлому ML-систем.

Месяц назад мы провели AI CTF 2025 и хотим рассказать, какие задания мы придумали для участников, и какие атаки на AI и ML в них нужно было провернуть. На AI CTF 2025 было 14 заданий разного уровня и тематики, и 40 часов на их решение. В первой части мы с авторами разберем 8 заданий — те, что попроще.

+16

Oleg_Nikishenkov 3 июл в 14:21

Нейросеть приближается к опыту профессионального дерматолога

Средний

9 мин

1.8K

Блог компании Leader-IDИскусственный интеллектМашинное обучение*Программирование*Научно-популярное

Кейс

Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.

+16

Wonderlove 3 июл в 14:05

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июня 2025

Средний

9 мин

2.4K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение*Будущее здесьIT-компании

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: китайцы открыли доступ к Ernie 4.5, появилась диффузионная LLM Mercury, в открытый доступ выложили веса FLUX Kontext, а Tencent показала нейросеть, которая генерирует игры по текстовому описанию.

Тем временем Tesla начала тестировать роботакси, а Claude — обанкротил бизнес, в который его пустили поэкспериментировать.

+30

ZeBrains_team 3 июл в 13:38

200 000+ снимков мусора: что мы узнали о датасетах

Простой

11 мин

1.4K

Машинное обучение*Искусственный интеллектУправление проектами*Big Data*Открытые данные*

Мнение

В нашей работе хватает безумных задач. Мы создали первого в России цифрового PR-менеджера, разрабатывали виртуальную примерочную и делали много чего еще, о чем не всегда можно рассказать. Но когда мы взялись за создание ИИ-сортировщика мусора MARQUS, поняли — будет совсем жестко.

Не так давно мы создали систему сортировки ТКО (Твердых коммунальных отходов) MARQUS, которая делит отходы на бумагу, металл, пластик, стекло и т.д. Система использует искусственный интеллект и специальные сенсоры, чтобы распознавать различные типы отходов прямо на конвейере и направлять их в соответствующие секции для переработки.

В процессе разработки MARQUS мы столкнулись с задачей — найти или собрать подходящие датасеты, так как без них эффективность нейронной сети резко снижается, если вообще приближается к нулю.

Мы перепробовали множество подходов, пересмотрели доступные датасеты с готовой разметкой и потратили достаточное количество времени и денег, чтобы честно признаться — на обучении нейронок сэкономить не получится, но обо всем по порядку.

kucev 3 июл в 11:00

16 перемен, которые уже меняют корпоративный подход к генеративному ИИ

11 мин

1.4K

Data Mining*Искусственный интеллектМашинное обучение*Big Data*Data Engineering*

Перевод

В 2023 году генеративные ИИ стремительно ворвались в потребительский сегмент, достигнув миллиарда долларов пользовательских расходов за рекордно короткий срок. В 2024-м, по нашим оценкам, потенциал выручки в enterprise-сегменте будет в несколько раз выше.

Пока в прошлом году потребители часами общались с новыми AI-компаньонами или создавали изображения и видео с помощью diffusion-моделей, корпоративное внедрение genAI, казалось, ограничивалось лишь очевидными кейсами и выпуском «GPT-оберток» в виде новых SKU. Скептики задавались вопросами: действительно ли genAI может масштабироваться в enterprise? Разве мы не застряли а трёх одинаковых сценариях? Способны ли стартапы вообще зарабатывать на этом деньги? А вдруг это просто хайп?

За последние несколько месяцев мы пообщались с десятками топ-менеджеров компаний из списка Fortune 500 и других лидеров enterprise-сегмента, а также провели опрос среди ещё 70 компаний, чтобы понять, как они используют genAI, как покупают решения и как планируют бюджеты. Мы были поражены тем, насколько сильно изменилась структура инвестиций и отношение к генеративным ИИ всего за полгода. Хотя у этих лидеров всё ещё остаются определённые опасения по поводу внедрения generative AI, они почти утроили бюджеты, расширили число рабочих кейсов, реализованных на меньших open-source моделях, и начали активно выводить задачи из стадии эксперимента в продакшн.

Для фаундеров это колоссальная возможность. Мы убеждены: те AI-стартапы, которые, во-первых, ориентируются на стратегические AI-инициативы корпораций с учетом их болевых точек, и, во-вторых, трансформируют сервисную модель в масштабируемые продуктовые решения, — именно они смогут захватить значительную долю нового инвестиционного потока и закрепиться на рынке.

yaroslav-r77-ai 3 июл в 08:16

Как понять что свинюшка готова к любви? Определяем через ML

Простой

8 мин

3.3K

Python*Машинное обучение*

Из песочницы

Привет! Я Ярослав Шмулев, датасаентист, выпускник МФТИ и технический директор студии R77. Мы внедряем AI в корпорации, а сегодня я расскажу, как мы анализировали поведение свинок с помощью ML, чтобы выявить идеальный момент для их оплодотворения.

+21

1 2 3

5 6 ...

428 429

Машинное обучение *

Часть 4: Mamba — State Space Models vs трансформеры

Почему ваш ИИ превращается в ваше эхо: Гипотеза архитектурного слияния и как с этим бороться

Собираем комплекс для качественного офлайн-перевода текстов, работающий на самом обычном игровом компьютере

Как задеплоить Tabby — open-source альтернативу GitHub Copilot — в PrimeWay

Всё про Qdrant. Обзор векторной базы данных

Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?

Я построил Vision Transformer с нуля — и научил его обращать внимание

Три письма из мультивселенной: какое будущее с ИИ мы выберем?

Создаем датасет печатных букв с любым шрифтом за 170 строк

Llama 3.1 и «Гарри Поттер»: сколько текста действительно запоминает ИИ?

Data Fusion Contest 2025: разбор и итоги серии соревнований

ИИ в радиологии: определение контура опухоли легких во время дыхания

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

Ближайшие события

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото

Разбор заданий AI CTF на Positive Hack Days Fest. Часть 1

Нейросеть приближается к опыту профессионального дерматолога

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июня 2025

200 000+ снимков мусора: что мы узнали о датасетах

16 перемен, которые уже меняют корпоративный подход к генеративному ИИ

Как понять что свинюшка готова к любви? Определяем через ML

Вклад авторов