Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

krvtmr 1 окт 2021 в 11:33

Как нужно обрабатывать изображения, чтобы не расстраивать математику?

4 мин

14K

Блог компании twin3dОбработка изображений * Алгоритмы * 3D-графика * Математика *

Мы часто расстраиваем математику, выполняя привычные операции с изображениями — например, когда мы масштабируем их или применяем к ним фильтры. Одним словом — тогда, когда мы производим арифметические операции (+,-,*,/) над значениями цветовых каналов. Обычно это не заметно, но иногда это может доставить неприятности.

Из статьи вы узнаете, почему при решении задач компьютерного зрения (и не только) важно использовать гамма-коррекцию или линейные цветовые пространства. В конце статьи будет показано, как это отражается на задаче 3D-реконструкции человеческих лиц.

+44

YARUSru 30 сен 2021 в 07:02

Как ЯRUS ежедневно собирает более 56 000 новостей из источников и выбирает из этого самое интересное

3 мин

1.2K

Разработка мобильных приложений * Алгоритмы * IT-компании

Сегодня уже мало кто заходит на один единственный сайт, чтобы почитать новости. Медиаполе современного человека соткано из множества инфопотоков и ресурсов, и для многих вопрос информационной гигиены стоит очень остро. Где и как организовать удобную новостную ленту, которая бы имела максимально широкий охват источников, но при этом выдавала бы из них только интересные конкретному пользователю материалы? Именно эту проблему решает раздел новостей в приложении ЯRUS, о котором пойдет речь ниже.

Ежедневно агрегатор мониторит около 10 тысяч новостных ресурсов и собирает не менее 56 000 новостей для парсинга. Со стороннего ресурса берутся заголовок, текст и изображения, поэтому у пользователя приложения есть возможность прочесть новость, не покидая его. При этом в ленте отображаются не только заголовки, но и лид, что дает возможность быстро оценить, стоит ли открыть новость и продолжить чтение или же листать дальше.

-13

trehleb 30 сен 2021 в 05:01

Самопаркующаяся тачка в 500 строк кода

25 мин

13K

JavaScript * Программирование * Алгоритмы * Машинное обучение * Искусственный интеллект

Туториал

Перевод

В этой статье мы "научим" автомобиль выполнять самостоятельную парковку с помощью генетического алгоритма.

В 1-м поколении автомобили будут иметь случайный геном и будут вести себя хаотично.

К ≈40-му поколению автомобили понемногу начнут учиться парковке и будут все ближе и ближе подбираться к парковочному месту

Чтобы увидеть эволюционный процесс прямо в браузере вы можете запустить ? симулятор эволюции, .

Генетический алгоритм для этого проекта будем реализовывать на TypeScript. В этой статье будет показан полный исходный код алгоритма, но вы также можете найти финальные примеры кода в репозитории симулятора.

+36

Dmytro_Kikot 29 сен 2021 в 11:00

Лингвистика, математика и колориметрия: коммуникативные потребности в цветах

11 мин

2.2K

Блог компании ua-hosting.companyНаучно-популярноеМатематика * БиологияАлгоритмы *

В отличие от многих существ, обитающих по соседству с нами на планете Земля, наш вид богат национальностями, культурами, языками и обычаями. Несмотря на принадлежность к одному виду, люди из разных уголков планеты обладают множеством отличий, одним из которых является язык. Внутри любого вида существует потребность обмениваться информацией. Методов реализации этой потребности достаточно много: запахи, цвета, движения, звуки и т.д. Человек больше всего полагается на вербальный метод коммуникации, в результате чего за долгие годы эволюции и развития нашей цивилизации образовалось множество языковых групп и отдельных языков. Другими словами, человек обладает очень разнообразным ассортиментом вербальных инструментов, которые, по идее, должны в равной степени точно описывать те или иные предметы и события. Однако структура языка может сильно отличаться между языковыми группами. Ученые из Пенсильванского университета (США) выяснили, что словесное описание индивидуальных цветов сильно отличается между разными нациями (т.е. между языками), но вот группировка цветов по категориям демонстрирует общие черты. Какую роль в этом играют коммуникативные потребности, как фрукты повлияли на словесное описание цветов, чем разные народы отличаются, и что между ними общего, когда речь идет о цветах? Об этом мы узнаем из доклада ученых. Поехали.

Читать дальше →

+15

MaximML 29 сен 2021 в 09:02

Геоанализ этажности Санкт-Петербурга алгоритмом KDE, или Как меняется облик города

4 мин

Блог компании СитимобилАлгоритмы * Геоинформационные сервисы * Big Data *

Всем привет, меня зовут Максим Шаланкин, в Ситимобил я занимаюсь машинным обучением. Мы используем множество крутых алгоритмов для оптимизации наших сервисов и улучшения бизнес-процессов. В этой публикации я расскажу, как использовать в геоаналитике алгоритм ядерной оценки плотности (Kernel Density Estimation) и строить полигоны на карте, основываясь на распределении географических данных.

Врууум

+26

SolarDozor 29 сен 2021 в 07:00

Распознавание печатей: нейронные сети против SIFT, и причем тут Госзакупки

18 мин

7.1K

Блог компании СоларИнформационная безопасность * Алгоритмы * Обработка изображений * Машинное обучение *

Туториал

Привет, Хабр! Сегодня мы расскажем, как делали в нашей группе анализа данных прототип для уже успешно работающего внутри DLP-системы Solar Dozor движка детектирования графических объектов на изображениях. Покажем это на примере одного его представителя - оттисков печатей на изображениях документов. Вспомним о противоречивых требованиях к решению задачи и очертим бизнес-метрики, определяющие успешное решение. В процессе подберем фильтр наличия печатей из арсенала компьютерного зрения и сравним подходы к детектированию объектов - популярных движках CNN, SIFT и их вариациях. А также поведаем об интересных находках в части создания датасетов. Здесь, как оказалось, немало места для творчества и экспериментов. В общем, запасайтесь попкорном.

Читать дальше →

andrewrays 27 сен 2021 в 15:03

Модельно-ориентированное проектирование на службе у специалиста по электроприводу. Часть 2. Эксперименты

6 мин

2.6K

Блог компании ЦИТМ ЭкспонентаАлгоритмы * Matlab * Энергия и элементы питанияИнженерные системы *

В предыдущей статье я рассказал, как создается модель векторного управления СДПМ, и определил параметры двигателя по экспериментальным данным.

В этой статье мы заставим вращаться двигатель так, как нам нужно, т.е. займемся настройкой контуров управления, и, разумеется, проведем эксперимент, воспользовавшись сгенерированным из модели кодом.

Taetricus 27 сен 2021 в 11:50

Тесты своей реализации ассоциативных массивов vs хеш-таблица

7 мин

4.3K

Программирование * Алгоритмы *

Приветствую, читатель. Я являюсь автором языка программирования Shar. В стандартном модуле Shar есть несколько реализаций ассоциативных массивов и при написании данного модуля я подумал: "А какую структуру данных для реализации ассоциативных массивов мне выбрать?". Являясь любителем слушать различные конференции по программированию, я периодически натыкаюсь на выступления людей, принимающих участие в разработке популярных языков программирования. На основании таких выступлений, у меня сложилось субъективное восприятие того, что в большинстве случаев для реализации ассоциативных массивов используется хеш-таблица. Хеш таблица действительно является очень хорошим выбором, но тогда почему я начал задумываться о выборе подходящей структуры данных? А причина в том, что ...

NewTechAudit 27 сен 2021 в 11:16

Алгоритмы поиска схожих объектов в рекомендательных системах

8 мин

21K

Python * Программирование * Алгоритмы * Машинное обучение *

«Досмотрю вот это видео на YouTube и пойду спать! Ой, в рекомендациях еще одно интересное. Сон, прости…». «Закажу в IKEA только стулья. Ах, сайт показал мне еще посуду, постельное белье и новую кухню в сборке. Когда там следующая зарплата?». «Бесконечный плейлист любимых музыкальных жанров в СберЗвуке заряжает меня позитивом! Как специалистам удается создавать выборку специально для меня?».

Согласитесь, вы сталкивались с подобными мыслями при использовании интернет сервисов. Магическим образом пользователю предлагают новые и новые объекты: видеоролики, музыку, товары. Никакого волшебства здесь нет — это рутинная работа рекомендательных систем. Алгоритмы поиска похожих объектов в больших массивах данных органично вплелись в нашу жизнь и помогают нам делать почти осознанный выбор в той или иной области повседневных дел.

Модели рекомендаций можно использовать для поиска похожих объектов вне контекста продаж. Например, выявлять однообразные ответы операторов в чатах, распознавать будущих злостных неплательщиков кредитных обязательств по косвенным признакам или находить различные группы сотрудников, которым требуется рекомендовать курсы повышения квалификации, в зависимости от текущих навыков. Не стоит забывать и о сайтах знакомств, где рекомендательные алгоритмы будут подбирать собеседника по указанным критериям.

TL:DR

Статья описывает основные подходы к поиску схожих объектов в наборе данных и содержит вводный курс в мир рекомендательных систем. Представлены варианты подготовки данных. Информация будет полезна аналитикам, которые изучают python, и начинающим data-scientist’ам. Мы не будем останавливаться на подробном описании каждого метода и разбирать отличия контентных и коллаборативных рекомендательных систем. Базовая теоретических часть находится здесь, здесь и здесь. Нас интересует применение алгоритмов матчинга (matching, англ. Поиск схожих объектов) в повседневных задачах. К статье прилагается ноутбук на платформе Kaggle с основным кодом, который рекомендуем запускать одновременно с изучением текста.

Saldojin 26 сен 2021 в 18:16

Как финансировать стартап на этапе MVP? Краткое руководство по первичному финансированию

5 мин

5.1K

Финансы в ITРазвитие стартапаКонференцииАлгоритмы *

Из песочницы

Как финансировать стартап на этапе MVP? Краткое руководство по первичному финансированию

Деньги на собственный бизнес — самая заветная мечта начинающего предпринимателя, не так ли?

Именно получение гранта может воплотить ее в жизнь. И пока владельцы малого бизнеса мечтают о гранте чтобы профинансировать свой стартап, процесс его получения выдается не таким легким и безоблачным как кажется на первый взгляд.

Однако если знать где искать тот самый фонд и как подать заявку, путь к получению капитала для развития бизнеса может значительно сократиться.

berlicon 25 сен 2021 в 20:55

Впечатления от прохождения конкурса Яндекс «One Day Offer Frontend»

8 мин

21K

Лайфхаки для гиковКарьера в IT-индустрииАлгоритмы * JavaScript * Веб-разработка *

Технотекст 2021

Делюсь впечатлениями как я поучаствовал в конкурсе Яндекс "One Day Offer Frontend". Суть в том, что надо пройти онлайн соревнование - решить за 3часа 5 задач, можно частично. Задачи на алгоритмы и верстку на 5, 45, 70, 90 и 90 баллов. Надо набрать >=100 баллов и тогда будет уже онлайн собес с людьми 25 сентября и оффер в одну из команд Я.Такси, Маркет или Поиск если все будет ОК.

+18

Vaiker24 18 сен 2021 в 22:02

Точка пересечения двух отрезков

4 мин

12K

Java * Алгоритмы * Математика *

Из песочницы

Нахождение точки пересечения двух отрезков

-10

blue_limon 18 сен 2021 в 18:48

Лунный звездный месяц (27.32 дней), лунный месяц по фазам Луны (29.5306 дней) в радиоактивном распаде

6 мин

3.5K

Python * Алгоритмы * Математика *

Recovery Mode

Эта статья продолжение серии публикаций по эффекту Шноля - космо-физических циклов проявляющихся в случайных процессах (прежде всего в радиоактивном распаде). Здесь приведенный алгоритм используется и в данной статье. Изменение косметические (графики вероятностей не двигаются до более полного совпадения по дистанции Эвклида). Данные предоставлены пользователем - 48 дней с 19 декабря 2012 года по 6 февраля 2013 года распад стронция-90, измерение дозиметром ДП-5В.

-6

nagadit 16 сен 2021 в 10:15

Involution: Attention is not what you need, или Как скрестить Self-Attention из NLP и Convolution в задачах CV

5 мин

7.4K

Python * Алгоритмы * Машинное обучение *

Из песочницы

Если говорить про Self-Attention в картиночных моделях, то тут есть 2 варианта. Олдскульный “давайте просто перевзвесим фичи” в разных вариантах: поканально, пространственно, в некоторой проекции. И новомодный "давайте обучим трансформер" с представлением патчей как визуальных слов. Первый подход рабочий, но не дает значительного улучшения в плане метрик. Второй подход слишком вычислительно сложный и часто заточен на размер картинок.

Подход коллег из ByteDance AI Lab и университета Пекина сильно отличается от этих крайностей и является переосмыслением Attention-механизма трансформеров в работе свёрток.

Читать подробнее об Involution

+13

mdan_2000 16 сен 2021 в 08:52

Как я писал Биномиальную кучу

9 мин

Программирование * C++ * Алгоритмы *

Из песочницы

Я сейчас изучаю продвинутые структуры данных и в один прекрасный вечер я решил собирать алгоритмы и структуры данных к себе на гитхаб (и до сих пор это делаю). Захотел я сделать так, чтобы сделать всё шаблонным, если что-то мне резко понадобится, то я смог за считанные секунды добавить себе шаблонный класс структуры данных или шаблонную функцию алгоритма и использовать. Звучит замечательно, особенно на контесты с codeforces.

Я столкнулся с проблемами и решил здесь поделиться опытом с тем, кто также, как и я, мало знаком с пром. прогой и до этого в основном увлекался олимпиадным программированием.

PatientZero 16 сен 2021 в 07:58

Рейкастинг в игровых 2D-движках

8 мин

21K

Алгоритмы * 3D-графика * Разработка игр *

Перевод

Введение

На мой взгляд, рейкастинг — великолепная концепция, понять которую не так сложно, но качественных ресурсов по ней очень мало. Я расскажу о математике, лежащей в её основе, чтобы вы при желании с лёгкостью могли реализовать её в своих будущих проектах. Постараюсь сделать объяснение как можно более понятным, рассказать о всех тонкостях и проблемах, с которыми вы можете столкнуться. Также мы поговорим об оптимизации и о том, как сильно вам могут помочь пространственные хэш-карты. Ещё я напишу простые интерактивные примеры, с которыми вы сможете поэкспериментировать. Учтите, что демо написаны максимально простым образом, не ожидайте увидеть в них код уровня энтерпрайза — мы изучаем саму концепцию, а не реализацию.

Читать дальше →

+19

Razoomnick 15 сен 2021 в 11:16

Делаем быстрый поиск по неточному совпадению среди 100 миллионов товаров

10 мин

13K

Поисковые технологии * .NET * Алгоритмы * C# * Разработка под e-commerce *

Туториал

Это четвертая статья с этой картинкой для привлечения внимания. Она каким-то удивительным образом опять подошла по смыслу.

Мы делаем проект по управлению большими каталогами товаров, и нам потребовалось быстро искать товары по неточному совпадению.

Забегая вперед, скажу, что от идеи до рабочего решения на продакшене прошло пять часов.

Исходная ситуация такова: таблица в MS SQL базе, 50 миллионов записей, записи добавляются постоянно, удаляются или обновляются крайне редко. Средняя длина названия товара составляет 64 символа. Поиск по неточному совпадению работает, для этого используются триграммы и полнотекстовый индекс по столбцу с триграммами. Ранжирование результатов осуществляется при помощи функции CONTAINSTABLE. Результаты получаются релевантные, но поиск работает откровенно медленно, 2-5 секунд на запрос, в зависимости от длины запроса. Мы хотим ускорить его раз в 20, а лучше в 100 подручными средствами.

+12

Kilor 13 сен 2021 в 14:10

Кластеризуем миллионы планов PostgreSQL

4 мин

4.7K

Блог компании ТензорВизуализация данных * Базы данных * Алгоритмы * PostgreSQL *

Как найти самые "горячие" запросы на вашем PostgreSQL-сервере? Поискать их в логе и проанализировать план или воспользоваться расширением pg_stat_statements.

А если в лог попадает миллион запросов за сутки?.. Тогда любое значение лимита pg_stat_statements.max окажется недостаточно велико, чтобы собрать правдивую статистику. Так давайте собирать эту статистику прямо с планов!

Но для некоторых сервисов СБИС нам в "Тензоре" производительность запросов к базе настолько важна, что auto_explain.log_min_duration приходится выставлять в единицы миллисекунд - и вот они, миллионы планов... Как не потеряться в них?

istishev 13 сен 2021 в 13:29

Как работает распознавание лиц? Разбор

4 мин

38K

Блог компании Droider.RuФототехникаСофтПоисковые технологии * Алгоритмы *

Среднестатистический человек может идентифицировать знакомое лицо в толпе с точностью 97,53%. Вы скажете, это немало и будете правы. Но это ничто по сравнению с современными алгоритмами, которые добились точности 99,8% еще в 2014 году. А в последние несколько лет они достигли практически совершенства! Современный алгоритм, использующийся в камерах видеонаблюдения в Москве способен обрабатывать 1 миллиард изображений менее чем за полсекунды с точностью близкой к 100%.

Этот алгоритм насколько крут, что уже в этом году в Московском Метро планируют ввести систему прохода по лицу — FacePay. При этом нам обещают, что система будет работать даже если человек в медицинской маске.

Как вы понимаете, жизнь уже не будет прежней. Поэтому давайте разберемся:

Как работают алгоритмы распознавания лиц?
Страшны ли эти алгоритмы на самом деле и где их применяют во благо?
А также поговорим какого будущего нам ждать.

Читать дальше →

+12

MightyRaccoonn 10 сен 2021 в 11:48

Как назначить самого подходящего курьера: наша скоринговая модель

8 мин

6.5K

Блог компании Delivery Club TechУправление e-commerce * Исследования и прогнозы в IT * Анализ и проектирование систем * Алгоритмы *

Всем привет! Меня зовут Михаил Моловцев, и я ~~алкоголик~~ операционный аналитик в Delivery Club. Наша команда помогает бизнесу и разработке в процессах и исследованиях, связанных с курьерами и доставкой заказов. Я занимаюсь исследованиями систем назначений заказов, прогнозированием времени доставки и курьерскими скорингами. Расскажу о том, как мы обновили подход к скорингу курьеров для системы назначения заказов.

Немного о скоринге

Представим, что у вас есть некий сервис и клиентская аудитория. У клиентов много различных характеристик, которые важны для сервиса: возраст, длительность пользования сервисом, поведенческие особенности при пользовании и т.д. Характеристик может быть сколь угодно много, и их набор зависит от предметной области.

У вас могут возникать разные задачи по категоризации пользователей. Например, определять клиентов с высокой лояльностью к сервису, или клиентов, которые точно смогут вернуть кредит, и т.д. То есть нужно будет вычислять степень соответствия каждого клиента той или иной категории.

Читать дальше →

1 2 ...

104 105

106

107 108 ...

318 319

Алгоритмы *

Как нужно обрабатывать изображения, чтобы не расстраивать математику?

Как ЯRUS ежедневно собирает более 56 000 новостей из источников и выбирает из этого самое интересное

Самопаркующаяся тачка в 500 строк кода

Лингвистика, математика и колориметрия: коммуникативные потребности в цветах

Геоанализ этажности Санкт-Петербурга алгоритмом KDE, или Как меняется облик города

Распознавание печатей: нейронные сети против SIFT, и причем тут Госзакупки

Модельно-ориентированное проектирование на службе у специалиста по электроприводу. Часть 2. Эксперименты

Тесты своей реализации ассоциативных массивов vs хеш-таблица

Алгоритмы поиска схожих объектов в рекомендательных системах

Как финансировать стартап на этапе MVP? Краткое руководство по первичному финансированию

Впечатления от прохождения конкурса Яндекс «One Day Offer Frontend»

Точка пересечения двух отрезков

Лунный звездный месяц (27.32 дней), лунный месяц по фазам Луны (29.5306 дней) в радиоактивном распаде

Ближайшие события

Involution: Attention is not what you need, или Как скрестить Self-Attention из NLP и Convolution в задачах CV

Как я писал Биномиальную кучу

Рейкастинг в игровых 2D-движках

Введение

Делаем быстрый поиск по неточному совпадению среди 100 миллионов товаров

Кластеризуем миллионы планов PostgreSQL

Как работает распознавание лиц? Разбор

Как назначить самого подходящего курьера: наша скоринговая модель

Немного о скоринге

Вклад авторов