Как стать автором
Поиск
Написать публикацию
Обновить
754.85

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Нейросети без градиентов: спектральное моделирование и построение решений

Уровень сложностиСложный
Время на прочтение19 мин
Количество просмотров6.4K

В статье предлагается альтернативный подход к построению нейронных сетей без использования алгоритма обратного распространения ошибки. Вместо оптимизации весов с помощью градиентов рассматривается прямой спектральный синтез решений, основанный на анализе гармонического содержания сигналов. На примере логических функций XOR, AND и OR показано, как линейные и нелинейные преобразования влияют на спектр входных данных и как эти преобразования можно использовать для ручной сборки нейросетевых структур. Отдельное внимание уделяется роли функций активации как спектральных операторов. В завершение обсуждаются ограничения классического подхода к обучению и обозначаются перспективы использования частотного кодирования, которое будет рассмотрено в следующей статье.

Читать далее

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито

Время на прочтение10 мин
Количество просмотров14K

Всем привет! Я Владислав Урих, работаю продуктовым аналитиком в Авито, сейчас занимаюсь построением алгоритмов мэтчинга в новом транзакционном продукте — Авито Подработка. В статье рассказываю, как мы построили алгоритм мэтчинга — инструмент подбора оптимальной выдачи для каждого конкретного покупателя.

Вы узнаете, почему алгоритмы поиска в категориях Авито работают по-разному, как собрать и использовать больше данных о пользователях без анкет, легко проверить гипотезу в офлайн-тестах и получить значимые продуктовые улучшения. 

Текст будет полезен всем продуктовым аналитикам, ML-инженерам и продакт-менеджерам, которые работают с алгоритмическими продуктами.

Читать далее

Как выстроить стратегию внедрения ИИ в организации: едим бутерброд Гартнера правильно

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.4K

Внедрение ИИ технологий – это неизбежность для коммерческих организаций, желающих остаться конкурентными на своем рынке, да, и просто желающих выжить. Общемировая динамика освоения ИИ за 2024 год по оценке McKinsey показывает 20% рост числа организаций, внедривших ИИ хотя бы в одну бизнес функцию.

Инновационный бум, масштабы и скорость трансформации технологического ландшафта приводят к появлению новых подходов и методологий в выстраивании цифрового фундамента бизнеса. Gartner's AI Technology Sandwich  – это новый фреймворк, помогающий компаниям различного уровня управлять процессом построения AI-powered экосистем и систематизировать их сложную многослойную структуру.

Читать далее

Заказать и купить чеки для бухгалтерии с НДС и QR кодом: Обзор лучших компаний

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров3.5K

Когда я впервые столкнулся с необходимостью подтвердить свои расходы чеками, это оказалось не так просто, как казалось на первый взгляд. Где взять чеки для отчета, если у тебя уже нет оригинальных документов, а отчетность нужно сдать как можно скорее? Тогда я впервые задумался о том, чтобы купить чеки для отчетности в интернете. С тех пор я не раз пользовался подобными сервисами и протестировал ряд компаний, занимающихся изготовлением чеков. Теперь хочу поделиться своим опытом и помочь тем, кто нуждается в кассовых чеках с QR-кодом или товарных чеках с печатью.

Читать далее

Великая иллюзия Copilot

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров27K

Глава 1: мой коллега, программист

Пустая оболочка человека. Он больше похож на попугая, чем на личность. Мой начальник, искренне верящий в священнодействие Парного Программирования, сковал цепью меня и этого коллегу-«программиста», как сиамских близнецов с разных планет. Общей была наша клавиатура, но не мышление. Боже, как же он был далёк от этого.

«Постой-ка. У меня появилась идея. Дай мне клавиатуру.»

Идея. Ага. Как у младенца появляется «идея» засунуть вилку в розетку. Я почти доделал нечто прекрасное; стройную, изящную логику, пронзающую сложность подобно ножу, режущему масло. И тут появился он — бьёт по клавиатуре, как будто она ему деньги должна, копипастит код-франкенштейн из комментария на StackOverflow, написанный последователем Дяди Боба в 2014 году.

Знает ли он, что делает наша система? Нет.

Прочитал ли он тикет? Разумеется, нет.

Ощущает ли он уверенность, когда безрассудно корёжит глобальное состояние? Разумеется, да.

Читать далее

Inference-Time Scaling for Generalist Reward Modeling

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров551

 DeepSeek прокачивает RL: генеративная reward-модель с «рассуждением»

В DeepSeek предложили сделать RM генеративной (Generative Reward Model, GRM). И не просто генеративной, а с Inference-Time Scaling, то есть с неким аналогом ризонинга.

Читать далее

Что забирает до 90% времени на созвонах и как перестать проводить их впустую

Время на прочтение8 мин
Количество просмотров2.4K

Все компании попадают в такую ловушку: кажется, что по любому вопросу проще собрать онлайн-совещание. Но часто от онлайн-встреч не так много пользы - собирается больше сотрудников чем нужно, а по итогу - все расходятся, так и не поняв, к чему пришли за пару часов. Мы тоже там были, но придумали, как проводить видеоконференции эффективнее и быстрее.

Читать далее

От depth map* до нейросети: практический опыт создания аппаратного решения по измерению товаров на складе

Уровень сложностиСредний
Время на прочтение22 мин
Количество просмотров2.3K

В предыдущей статье мы рассказали об истории создания нашего измерительного устройства и о том, как появилась идея собственного решения. Во второй части мы сосредоточимся на технической стороне проекта: разберём алгоритмы измерения и инженерные решения, которые позволили добиться высоких точности и скорости замеров. Мы также поделимся опытом преодоления ключевых технических вызовов и расскажем, как пришли к текущему виду устройства.

Читать далее

Ритейл, который смог: как Walmart  и Amazon зарабатывают с помощью ИИ

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.5K

ИИ в ритейле уже меняет правила игры. Пока одни составляют стратегии, Walmart и Amazon давно монетизируют ИИ-решения.

Разбираем на примерах: где технологии реально прибавили к выручке, а где — к судам, багам и массовым сокращениям.

Читать далее

В Москве идет Datafest 2025

Время на прочтение5 мин
Количество просмотров875

Примерно через каждый день проходит то или иное событие в Москве в даты с 25 мая по 2 июня 2025 года. Видимо, мероприятия от организаторов Data Fusion не одноразовое, и что-то подобное планируется проводить ежегодно, поэтому интересно посмотреть программу данного фестиваля.

Читать далее

10 лет мои сотрудники делали акты и договоры руками, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.1K

Мы каждый месяц формируем новые приложения к договорам с той услугой, которую клиент у нас заказал и выставляем акты за прошлый период. Представьте процесс: открыть шаблон, заменить номер, дату, сумму, название услуги, перевести сумму в пропись... И так 80 раз! Целый рабочий день уходит на монотонную работу.

Читать далее

Как мы создали новую технологию маршрутизации для пешеходов и велосипедистов

Время на прочтение12 мин
Количество просмотров5.3K

Каждый день в Яндекс Картах строят миллионы пешеходных и велосипедных маршрутов. Несмотря на популярность, этот тип маршрутизации давно не менялся. В прошлом году мы решили его улучшить: проанализировали недостатки и узнали, что на самом деле нужно пользователям. Теперь мы готовы поделиться результатами крупного обновления наших маршрутов.

Меня зовут Антон Овчинкин, я руководитель разработки пешеходной и транспортной навигации в Картах. Я расскажу, как мы научили алгоритмы обходить промзоны, создали ML‑модель расчёта времени в пути с учётом светофоров и подъёмов, а ещё — как связана пешеходная маршрутизация и подсчёт калорий.

Читать далее

Цвета её плаща

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров8.7K

I.


В Балладе о Белом Коне Г.К. Честертон описывает Деву Марию:


Её лицо было как открытое слово,
Когда смельчаки говорят и решают,
Даже цвета её плаща
Были лучше добрых вестей.

Почему цвета её плаща?


Средневековые мастера относились к краскам очень серьезно. Это было до появления современной химии, поэтому для получения хороших цветов приходилось изрядно потрудиться. И они действительно старались: известно, что для создания золотых бликов они использовали настоящее золото, расплющенное в тончайшие листы.


Синий был ещё одним сложным цветом. Можно было получить посредственный, полувыцветший синий с помощью азурита. Но если нужен был идеальный синий, цвет неба в ясный вечер, требовался ультрамарин.


[)


Мадонна с младенцем, автор Филиппино Липпи

Читать дальше →

Ближайшие события

Тест на прочность: LLM против сложных задач

Время на прочтение4 мин
Количество просмотров1.5K

В мире, где условия задач постоянно меняются, способность языковой модели учиться на ходу без перестройки своих параметров становится настоящим вызовом. Недавнее исследование показывает, как простые техники рефлексии, эволюционных эвристик и планирования превращают LLM в гибких агентов, способных адаптироваться к новым ситуациям. От классической игры «камень-ножницы-бумага» до сложных головоломок Ханойской башни — узнайте, какие стратегии работают лучше всего и какие перспективы откроются перед LLM в динамических средах.

Читать далее

Gemma-3: Обзор модели

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров8.2K

Языковая модель, которая работает быстрее, понимает глубже, а объём имеет более компактный, — кто ты, воин? Да, это Gemma-3, как вы уже догадались по названию статьи. Google, а точнее подразделение DeepMind, вновь смог приятно удивить активных пользователей ИИ, выпустив довольно лёгкий инструмент, который готов посоперничать с гигантами вроде ChatGPT-4 и Deepseek-R1. Компания даже заявила, что Gemma-3 — это лучшая нейросеть среди малых языковых моделей и что она лишь немного уступает производительности DeepSeek-R1, который имеет 671 млрд параметров.

Нейросети Gemma позиционируются разработчиками как лёгкие ИИ, способные выполнять широкий спектр операций: генерировать текст различных форматов, изображения и даже короткие видео, анализировать медиа, создавать несложный программный код и так далее.

Ну, по крайней мере так про неё говорят. А насколько это правда, мы проверим.

Читать далее

Автоматизация без кода: как FastML справляется с документами за несколько кликов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1K

Привет, Хабр!

В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь) начала работать на российских документах разного типа в контуре нашего продукта ContentCapture и что из этого вышло.

Вкратце введем в курс дела. Многие компании сталкиваются с необходимостью обрабатывать большое количество однотипных (не одинаковых) документов, извлекать из них нужную информацию и экспортировать. Естественно, это долго, мучительно, а иногда еще и с ошибками. Для автоматизации такой рутины и используется ContentCapture, а точнее, встроенные в него две технологии — гибкие описания и теперь еще и FastML. 

Гибкие описания — это универсальный подход к извлечению данных, особенно если речь идет о сложных документах. Однако для их создания нужно время и навыки работы со специальным инструментом — Content AI Layout Studio. Для тех, у кого таких скиллов нет, и был создан FastML, с которым сможет справиться любой пользователь, независимо от техподготовки. С помощью FastML модели для новых типов документов создаются в несколько кликов на основе нескольких примеров, что значительно сокращает время их внедрения в контур компании и бизнес-процессы. 

Под катом рассказываем и показываем, какие теперь документы могут автоматически обрабатывать пользователи ContentCapture с помощью встроенного в него FastML, а также делимся данными тестирования и объясняем, в чем могут возникнуть сложности.

Читать далее

Нейро-дайджест: ключевые события мира AI за 3-ю неделю мая 2025

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров2K

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

На этой неделе навела шуму презентация Google I/O — и принесла больше анонсов, чем весь прошлый месяц. Также вышли мощные модели от Anthropic, Mistral и ByteDance, появилась экспериментальная диффузионка от Google, ИИ впервые вышел в космос, а ChatGPT o3 — отказался выключаться. 

Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

Читать далее

Шпаргалка по установке драйверов NVIDIA на ML сервер

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.7K

Данный материал предназначен для быстрой и последовательной установки драйверов NVIDIA, в том числе для видеокарт 50xx серии, а также настройки NVIDIA Container Toolkit. Эта инструкция актуальна для Linux-систем на базе Ubuntu и других Debian-совместимых дистрибутивов.

Читать далее

Разработчики открыли ранний доступ к Kling 2.1

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

Через несколько дней после того, как Google выпустила Veo 3, компания Kling, видимо, ощутила давление и открыла ранний доступ к своему грядущему семейству видеомоделей Kling 2.1. Время было выбрано как нельзя более удачно.

Вчера на X и Reddit появилось несколько видеороликов, созданных с помощью Kling 2.1. В этом посте я расскажу о том, что же на самом деле предлагает Kling.

Судя по тому, что я прочитал, будет три разных режима:

Standard Mode в Kling 2.1:

Читать далее

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 2

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.8K

Часть 2 — это гайд по выживанию в мире кривых текстов, а также грамматический апокалипсис, куда мы закинули ChatGPT‑o1, o3, две штуковины от «Яндекса» — «Нейроредактор» и YandexGPT-5-Pro, Text.ru и «Мистера корректора». Заставили их искать опечатки, запятые, кавычки и ошибки уровня «25-го декабря» — и да, это больно.

Зачем терпеть этот разбор? Чтобы не стать тем парнем, чей пост на «Хабре» поправили в комментах. Готовьтесь: тут будут не только баллы, но и таблица, из‑за которой один нейрокорректор плачет в уголке. Да‑да, он снова всё испортил. Поехали разбирать, кто реально исправит ваши «исчо», а кто наделает новых ошибок.

Читать далее

Вклад авторов