Обновить
276.22

Алгоритмы *

Все об алгоритмах

Сначала показывать
Порог рейтинга
Уровень сложности

Контекстные бандиты в ценообразовании

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели1.9K

Всем привет! На связи команда аналитиков X5 Tech. Мы продолжаем исследовать подходы Reinforcement Learning для ценообразования. В этой статье мы рассмотрим применение контекстных многоруких бандитов на примере модельной задачи, опишем несколько реализаций и сравним их.

Читать далее

SQL HowTo: рекурсивные циклы и их контроль (Advent of Code 2024, Day 6: Guard Gallivant)

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели1.3K

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части научимся применять разные условия в зависимости от состояния рекурсивного "цикла" и отлавливать его "зацикливание".

Читать далее

Готовимся к Micromouse: как роботу найти короткий путь к цели

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели916

Привет, Хабр! Я Денис Логашов, инженер-исследователь отдела автоматической обработки результатов моделирования и визуализации YADRO. В этой статье я расскажу о решении основной задачи в соревновании Micromouse: как роботу пользоваться сохраненной картой лабиринта для передвижения по нему и поиска кратчайшего пути. Это продолжение предыдущего материала, где мы учили робота карту составлять.

Читать далее

Белый Прямоугольник (классическая задачка вместо приветствия)

Время на прочтение2 мин
Охват и читатели1.5K

Оказывается Хабр доброжелательно предоставляет возможность завести бесплатный «корпоративный» блог для опенсорсного проекта. Какое‑то время назад я подал заявку — и недавно обнаружил что она была удовлетворена. Начинать программисты любят с «тестового» поста, но т.к. речь идёт о публичном пространстве, пусть он будет хоть немного содержательным:)

На сайт CodeAbbey сегодня добавилась задачка про поиск Белого Прямоугольника. Речь идёт о матрице в которой есть чёрные и белые клетки — расставленные достаточно хаотично — и хочется найти прямоугольник без чёрных клеток максимальной площади (со сторонами параллельными сторонам матрицы, конечно).

Про сам сайт мы ещё расскажем в отдельно (иначе зачем блог было заводить) — а сейчас всё же про саму задачку.

И что там про задачку?

SQL HowTo: поиск в словаре и массивах, сортировка «пузырьком» (Advent of Code 2024, Day 5: Print Queue)

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели885

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части воспользуемся обширными возможностями поиска в массивах и реализуем рекурсивную сортировку «пузырьком».

Читать далее

Модель числа I. Нахождение инволюции

Уровень сложностиСложный
Время на прочтение17 мин
Охват и читатели928

Ранее в  статьях. о симметриях списочной многострочной модели (СММ) рассматривались окаймления строки нетривиальных инволюций (НIn) парами строк, содержащих квадратичные вычеты — полные квадраты (КВК). В таблице А0 показаны названные зависимости.

При изложении текста  решается задача определения нетривиальных инволюций (НIn) в конечном числовом кольце вычетов (КЧКВ) по составному (полупростому) модулю и формировании полного списка модели. Для получения решения используется модель составного числа (СММ) и Закон распределения делителей (ЗРД здесь). Любая пара строк СММ, окаймляющая строку нетривиальных инволюций, имеет номера, полусумма которых равна номеру строки НIn, совпадающему с меньшим значением инволюции.

Читать далее

Сравнение алгоритмов градиентного бустинга или история знает только первых…

Уровень сложностиСредний
Время на прочтение24 мин
Охват и читатели2.4K

Всем привет ! Данная статья написана по итогам обучения на курсе Otus ML Basic и в ней я проведу сравнение алгоритмов градиентного бустинга. Почему бустинг, спросите вы ? Понятно, что нейронные сети интереснее, но не всегда их применение целесообразно и есть задачи для которых классические методы машинного обучения являются лучшим выбором. Бустинг является одним из наиболее эффективных классических алгоритмов и поскольку существуют различные его реализации, то мы проведем сравнение, чтобы понять, кто из них демонстрирует лучшие результаты.

Читать далее

Гуру тест про порядок элементов в иерархии

Время на прочтение1 мин
Охват и читатели917

Предлагаю вашему вниманию задачу, которую задавал своим коллегам 1сникам. Но они не справились. Возможно, ваши познания в SQL лучше, чем их.

Есть некоторый иерархический справочник, иерархия элементов. У каждого элемента есть поле «Позиция» (может быть дробным и отрицательным). Элементы в пределах одного родителя должны быть пронумерованы в поле «Позиция» по порядку с единицы с шагом один: 1, 2, … N

Таким образом, например, чтобы поменять порядок элементов с позициями 2 и 3 мы можем элементу с позицией 2 установить позицию 2,5 и вызвать процедуру исправления порядка.

Читать далее

SQL HowTo: работа с массивами (Advent of Code 2024, Day 4: Ceres Search)

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели1.4K

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части немного поработаем с массивами.

Читать далее

SQL HowTo: «чистые» регулярки (Advent of Code 2024, Day 3: Mull It Over)

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели673

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части будет очень простой код, с чуть-чуть сложным регулярным выражением.

Читать далее

SQL HowTo: логические агрегаты (Advent of Code 2024, Day 2: Red-Nosed Reports)

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели1K

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части с решением нам помогут логические агрегаты bool_and/bool_or.

Читать далее

SQL HowTo: регулярные выражения и условная агрегация (Advent of Code 2024, Day 1: Historian Hysteria)

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.5K

В этой челлендж-серии статей, начатой, внезапно, с разбора задачи Day 11, попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

Читать далее

Металл и алгоритм отжига

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели1.9K

Вступление

Тема искусственного интеллекта стремительно набирала популярность, но реализация алгоритмов используемых в ИИ часто бывает сложной и запутанной. В этой статье я продемонстрирую реализацию алгоритма Брайна Люка "Отжиг"применив современные практики и технологии для сокращения исходного кода.

Понимание Алгоритма Отжига

В области алгоритмов оптимизации выделяется Алгоритм Отжига (Симулированный Анализ) - мощная техника, вдохновленная физическим процессом в металлургии, позволяющая улучшить кристаллическую структуру материалов.Идея заключается в том, чтобы начать с высокотемпературной системы с постепенным охлаждением и переходом к минимальной энергии.Разработанный Брайаном Луком в конце 1980-х алгоритм нашел широкое применение в различных областяхот инженерии и информатики до финансов и биологии, благодаря способности эффективно искать оптимальные решения в сложных пространствах.

Реализация

Реализация являет поиск глобального минимума функции энергии: принимая начальное состояние, максимальное количество итераций, начальную и конечную температуру на каждой итерации алгоритм генерирует новое состояние, вычисляет разницу энергии между новым и текущим состояниями и принимает новое состояние с определенной вероятностью, зависящей от температуры.

Рассмотрим фазы алгоритма:

Читать далее

Ближайшие события

JavaScript: структуры данных и алгоритмы. Часть 7

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели3.2K


Привет, друзья!


В этой серии статей мы разбираем структуры данных и алгоритмы, представленные в этом замечательном репозитории. Это седьмая часть серии.


Сегодня мы поговорим об алгоритмах для работы со строками и поиска.


Код, представленный в этой и других статьях серии, можно найти в этом репозитории.


Интересно? Тогда прошу под кат.

Читать дальше →

Рекомендательная библиотека RePlay: сравнение с конкурентами RecBole и Recommenders на примере SOTA-модели SASRec

Уровень сложностиСложный
Время на прочтение19 мин
Охват и читатели1.6K

Привет, Хабр! Мы — команда ML‑разработчиков Сбера и Sber AI Lab. Хотим рассказать о нашем open‑source инструменте RePlay, который позволяет создавать рекомендательные системы с нуля, начиная с самых ранних DS‑экспериментов и заканчивая промышленной эксплуатацией. Статья будет интересна ML‑инженерам, разрабатывающим промышленные рекомендательные системы.

Мотивацией для создания RePlay послужил тот факт, что все популярные на сегодняшний день RecSys‑фреймворки в основном нацелены на научные исследования и плохо оптимизированы для промышленной эксплуатации: не в состоянии обработать большой объём данных или требуют для этого значительных модификаций. Подробнее о создании библиотеки вы можете прочитать в соответствующей статье с RecSys 2024. По той же ссылке вы найдёте обзорное видео о RePlay.

Здесь же мы сравним RePlay с главными конкурентами — RecBole и Microsoft Recommenders. Разберём возможности, которые предоставляет каждая из библиотек, а затем, на примере SOTA‑модели, построим рекомендательную систему, начиная с ввода данных и заканчивая генерированием рекомендаций и подсчётом метрик. Сравним полученные модели по качеству и длительности обучения и инференса. В конце расскажем об уникальных возможностях RePlay, которые помогут ещё сильнее облегчить путь разработчика, по сравнению с использованием библиотек‑конкурентов

Читать далее

Миф о RAM

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели14K

Миф о RAM — это верование о том, что память современного компьютера напоминает идеальную память с произвольным доступом. Кэш люди считают оптимизацией для малых данных: если они умещаются в L2, то будут обрабатываться быстрее; если нет, то тут уж ничего не поделаешь.

Вероятнее всего, что самым быстрым разбиения данных будет такой код (я использую в качестве псевдокода Python; можете представить, что я пишу это на вашем любимом низкоуровневом языке):

groups = [[] for _ in range(n_groups)]

for element in elements:

groups[element.group].append(element)

Он и в самом деле линеен (то есть асимптотически оптимален), и мы всё равно должны выполнять доступ к произвольным индексам, так что кэш здесь нам ни в чём бы не помог.

В реальности, когда количество групп высоко, такой код не задействует большую часть производительности, а некоторые асимптотически более медленные алгоритмы могут выполнять сегментирование гораздо быстрее. В основном они применяются в базах данных на диске, но, как ни странно, полезны даже в случае данных в RAM.

Читать далее

Стратегия Келли точно не подведёт

Время на прочтение6 мин
Охват и читатели3.9K

Возможно, вы слышали о финансовой стратегии ставок по методу Келли. Это система, позволяющая оборачивать себе на пользу известную информацию в азартной игре или связанные с ней предубеждения. Эта стратегия также называется максимально агрессивной или стратегией высокой дисперсии. Дело в том, что если сделать ставку выше, чем позволяет предел Келли, то последствия могут быть катастрофическими.
Недавно мне попалась странная карточная игра, в которой стратегия Келли абсолютно не подразумевала риска, поскольку в игре действует Нулевая дисперсия. В своей знаменитой книге «Математические головоломки» Питер Уинклер называет её «Next Card Bet» («Следующая карточная ставка»). Саму задачу и её решение, по-видимому, сформулировал Томас Кавер. Мне понравилась как сама эта игра в ставки, так и её анализ, поэтому я поделюсь ими с вами здесь.

Читать далее

Знакомства на основе данных: как мы запустили корпоративный дейтинг-сервис в Сбере

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.5K

Привет, меня зовут Андрей Кузьминых. Я технологический предприниматель, запускаю ИИ-стартапы и внедряю искусственный интеллект в компаниях. Некоторое время назад я работал в Сбере в роли директора по данным и ИИ, где мы с командой анализировали огромные массивы данных, строили ML-модели, создавали управленческие дашборды и рекомендательные сервисы. Но одним из самых интересных и нестандартных проектов стало создание первого в России корпоративного приложения для знакомств среди сотрудников – SberDating. Идея родилась из стремления помочь людям найти тех, с кем можно установить нечто большее, чем просто деловые отношения, – друзей, собеседников, а возможно, и любимого человека. Но чтобы понять, как мы к этому пришли, нужно вернуться на пять лет назад.

Если вам интересна тема ИИ, мои кейсы и опыт, подписывайтесь на мой телеграм-канал, где я делюсь инсайтами, практическими советами и последними новостями из мира искусственного интеллекта.

Читать далее

ANS-технология в гарнитурах VT и Yealink

Время на прочтение5 мин
Охват и читатели579

Если вы хотя бы раз пользовались гарнитурой с технологией ANS (Active Noise Suppression, активное шумоподавление), то уже знаете, насколько применение ANS меняет качество передачи речи. Голос собеседника четко слышен в любой обстановке: на улице, в шумном офисе или на производстве.

Технология ANS анализирует аудиосигнал, выделяя голос (полезный сигнал) и отделяя его от окружающего шума, а затем либо подавляет шум, либо удаляет его полностью.

Давайте проанализируем подходы VT и Yealink к реализации ANS в гарнитурах и сравним эффективность их решений.

Читать далее

Как сделать видео на стриминге легче и не погрязнуть в шакалах: опыт Кинопоиска

Время на прочтение13 мин
Охват и читатели4.6K

Привет! Меня зовут Михаил Мазанов, я отвечаю за технологический стек работы с медиаданными в Кинопоиске: от съёмок оригинальных проектов до доставки и просмотра видео на всех экранах. Для нашей пятой ежегодной конференции про стриминг PlayButton 2024 я готовил большой доклад про оптимизацию качества видео Кинопоиска, а для Хабра решил пересобрать его в виде статьи — для тех, кому текстовый формат предпочтительнее видео.

Кроме технических графиков, вас ждёт ещё и наглядная разница в работе алгоритмов сжатия на примере «Рика и Морти» и «Джона Уика».

Читать далее

Вклад авторов