Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

ru_vds 30 окт 2024 в 13:01

Анализ задачи с собеседования в Google: конь и телефонные кнопки

Средний

13 мин

18K

Блог компании RUVDS.comАлгоритмы * Занимательные задачкиКарьера в IT-индустрииПрограммирование *

Обзор

Перевод

Для начала я должен заявить: хотя собеседование кандидатов — это одна из моих профессиональных обязанностей, в этой статье представлены лишь личные наблюдения, истории и мнения. Они ни в коем случае не являются официальными заявлениями Google, Alphabet или любых других лиц или организаций.

Это была первая задача, которую я использовал в своей карьере собеседующего, она же первая утекла и была запрещена к использованию. Мне она нравится потому, что обладает очень приятными свойствами:

Её легко сформулировать и понять.
У неё есть множество решений, каждое из которых требует разной степени знаний алгоритмов и структур данных. Кроме того, здесь важны логические рассуждения.
Каждое решение можно реализовать в относительно малом объёме кода, поэтому она идеальна для ограниченных по времени собеседований.

Если вы студент или ищете работу в технологической сфере, то, надеюсь, после прочтения статьи вы будете лучше понимать, чего ожидать от задач на собеседованиях. Если же вы проводите собеседования, то мне бы хотелось поделиться своим мыслительным процессом и стилистическим подходом к собеседованиям.

Читать дальше →

+57

alexey_zakharenkov 30 окт 2024 в 11:35

«Куда, куда вы удалились», или поиск пропущенных остановок в маршрутах общественного транспорта в OpenStreetMap

Средний

6 мин

929

OpenStreetMap * Алгоритмы * Транспорт

OpenStreetMap (OSM) — глобальный проект, образованный вокруг геоинформационной базы данных, наполняемой всеми желающими — как энтузиастами, так и заинтересованными компаниями. Любой может внести свой вклад, однако открытость имеет и оборотную сторону, которая приводит к тому, что в базу часто попадают некорректные правки. Поэтому в экосистеме OSM написано множество валидаторов, которые позволяют поддерживать качество данных на приемлемом уровне.

С 2016 года в open source существует препроцессор метро, который валидирует маршруты скоростного городского транспорта в OSM на предмет полноты и логических/топологических ошибок и преобразует их в форматы, пригодные для сервисов роутинга и рендеринга, в том числе в GTFS. Кроме данных OSM он принимает на вход список сетей общественного транспорта (ОТ), содержащий контрольную информацию о числе линий, станций и прочего в некоторой транспортной сети. Препроцессор успешно себя зарекомендовал в подготовке данных об ОТ для таких приложений, как Maps.me и Organic Maps.

В этой статье я хотел бы поделиться подходом к детектированию одного из видов ошибок, которые довольно часто случаются в данных OSM и автоматический отлов которых представляет собой некоторый вызов — это случайное выпадение станции из маршрута. Все исходные коды валидатора и описываемого алгоритма находятся в открытом доступе. Но сначала определимся с понятиями, используемыми для представления данных об ОТ в OpenStreetMap.

+18

achupahina 30 окт 2024 в 09:31

Как мы переманили пользователей удобным сервисом платежей

Средний

7 мин

1.7K

Блог компании ВТБАлгоритмы * Обработка изображений * Искусственный интеллект

Кейс

Всем привет! Меня зовут Александра Пилюгина, я продакт-менеджер команды «QR и Фотоплатеж» в управлении «Платежи», банк ВТБ. К нам каждый месяц приходит около 500 тысяч новых клиентов. Специально для них наша команда разработала сервис переноса платежей в ВТБ Онлайн, попутно решив множество проблем с распознаванием платежных документов и извлечения из них полезной информации.

Заходите под кат — расскажу, как мы всё это делали.

Подробнее

+15

THunderCondOR 30 окт 2024 в 07:37

Как мы выиграли соревнование CLEF 2024 по генерации медицинских снимков

Сложный

11 мин

913

Блог компании AIRIАлгоритмы * ЗдоровьеОбработка изображений * Машинное обучение *

Кейс

Всем привет! Меня зовут Михаил Чайчук, я учусь в магистратуре Вышки на ФКН, где также являюсь исследователем в НУЛ моделей и методов вычислительной прагматики. А недавно я пришел работать в AIRI на должность инженера-исследователя в команду Прикладное NLP, которой руководит Елена Тутубалина. Вместе с ней мы приняли участие в соревновании ImageCLEFmed MEDVQA-GI 2024 по генерации медицинских картинок, которое проводилось в рамках конференции CLEF 2024.

Наш результат оказался лучшим среди 27 зарегистрированных команд! Мы уже опубликовали статью в сборнике соревнования, здесь же я расскажу, как нам удалось добиться победы.

ДИСКЛЕЙМЕР

В этом тексте содержатся изображения, имитирующих результаты эндоскопических исследований желудка и кишечника, таких как гастроскопия и колоноскопия. К сожалению, редактор Хабра не умеет блюрить картинки. Поэтому если вы чувствительны к подобным фотографиям, от чтения этой статьи вам лучше воздержаться.

Приятного ~~аппетита~~чтения!

datacompboy 29 окт 2024 в 09:17

Литкод изи — это просто

Простой

6 мин

9.1K

JavaScript * Программирование * Алгоритмы * Учебный процесс в ITИнтервью

Туториал

Задумывались ли вы, где можно применить навык решения задачек а-ля литкод изи? Я встречаюсь с ними частенько, главное просто присмотреться.

Например, на Linked.in недавно ввели "игры". Я как-то глянул на них на послеобеденном кофе.

Пусть оно само

+16

youjintyan 28 окт 2024 в 15:15

5 результатов обучения в IT и не только

Простой

8 мин

2.9K

Учебный процесс в ITPython * Алгоритмы * Логические игры

Из песочницы

Статью адресую всем, у кого есть дети и кто обучает детей/подростков. Тема статьи стала ключевым фактором в моём опыте успешного обучения программированию детей. Это то, что даёт действительно уверенные результаты и помогает формировать личность, сильно выходя за рамки изучаемого предмета.

Из тех, кому вёл уроки более 2-х лет, многие сейчас учатся в технических вузах, кто-то подрабатывает уже. Отсеялись те, кто пошёл учиться изначально “для расширения кругозора”. За всё время более 2-х лет занималось около 50 подростков. В среднем за год через мои занятия проходило 96 человек (8 групп по 12 человек) в школах и на частном обучении около 20 человек в год.

10 лет в сумме проработал в ИТ-образовании. Была и компьютерная грамотность, и робототехника, и программирование, и тренинги, и выездные лагеря по личностному росту, в том числе.

PPR 28 окт 2024 в 11:36

Создаем алгоритм определения скорости объектов по видео

Средний

6 мин

3.7K

Блог компании Программный ПродуктАлгоритмы * Искусственный интеллект

Туториал

Определение скорости объекта на видеопотоке является актуальной задачей в сфере компьютерного зрения и обработки видео, в частности, в области автономного вождения, контроля на дорогах, видеонаблюдения, спортивной аналитики. Скорость объектов может быть важной информацией в задаче трекинга, определения действий и других задач.

Мы разработали алгоритм, который учитывает движение камеры при помощи оптического потока. Оптический поток определяет движение пикселей между двумя последовательными кадрами. Изменения в потоке являются, смещением пикселей, анализируя которое, можно вычислить относительную скорость движения объекта и скорость фона вокруг него. Из физики известно, что вектор абсолютной скорости является их разностью. Так как смещение в пикселях можно пересчитать в смещение в метрах, то и абсолютная скорость движения в пикселях пересчитывается в скорость в м/с, что требуется для решения задачи.

+13

idsulik 28 окт 2024 в 08:19

Решение задачи с собеседования Linked List Cycle [+ ВИДЕО]

Простой

3 мин

1.2K

Алгоритмы * Интервью

Туториал

Всем салют! Давайте решим задачу "Linked List Cycle"

Дан head, являющийся головой связного списка, необходимо определить, есть ли в списке цикл.

Fech 27 окт 2024 в 20:53

Обучение модели как ребёнка

Простой

4 мин

3.2K

Контент и копирайтинг * Алгоритмы * HabrИскусственный интеллектМашинное обучение *

Мнение

Привет, я токсичный программист в области машинного обучения (МЛ), и у меня есть идея создать проект, посвящённый разработке сильного искусственного интеллекта (далее — СИИ (или же AGI)). В небольшом блоге я буду делиться с вами своим опытом в создании чат-бота, который будет обладать СИИ, ну или хотя бы казаться таким.

FaryaRos 24 окт 2024 в 16:06

Настройка ПИД-регулятора для беспилотных автомобилей

Средний

5 мин

Математика * Алгоритмы * Matlab * Производство и разработка электроники *

Кейс

Перевод

Настройка ПИД-регулятора для беспилотных автомобилей

Этот проект иллюстрирует концепцию ПИД-регулятора, применяемого в беспилотных автомобилях в рамках программы Udacity «Беспилотный автомобиль»

ПИД-регулятор — это механизм обратной связи в контуре управления, который вычисляет разницу между желаемым заданным значением и фактическим результатом процесса и использует результат для внесения корректировок в процесс. ПИД-регуляторы широко применяются в промышленном и роботизированном управлении процессами.

В контексте беспилотных автомобилей они играют важную роль в управлении такими параметрами движения, как рулевое управление, ускорение и т. д. Сложные алгоритмы, используемые в беспилотных автомобилях, по сути, рассчитывают траекторию и скорость движения беспилотного автомобиля. Автономность может быть реализована только в том случае, если автомобиль следует по траектории с заданной скоростью. Именно здесь PID-регулятор играет свою роль, обеспечивая соблюдение беспилотным автомобилем рассчитанных параметров. Любое отклонение от рассчитанных параметров может привести к непредвиденным или катастрофическим последствиям.

Antony_Rain 24 окт 2024 в 14:09

Государственные перевороты: бармалеи выпрыгивают как черти из табакерки. Не хотите, дети, в Африку сыграть?

Средний

12 мин

1.9K

Python * Data Engineering * Машинное обучение * Алгоритмы * Исследования и прогнозы в IT *

Аналитика

На исторических данных за 1991-2019 год покажем, как можно "увидеть" и "выцепить" признаки переворота. С помощью машинного обучения и ансамблевых модели. Ансамбли (конечно, не музыкальные), как показывает практика, – более эффективны в таких делах, и самое главное - хорошо "тюнятся" и "чипуются".

*Nota Bene (та Bene, что ни разу не гессерит). При всем негативном отношении к революциям, переворотам и прочим событиям в любой части мира, это – объективная реальность, которую можно не только изучать, но и предупреждать.

grigoriy-melnikov 24 окт 2024 в 07:22

Как получить на 30% больше подписчиков, раздавая промокоды в Telegram

Средний

7 мин

1.3K

Повышение конверсии * Веб-аналитика * Алгоритмы * Интернет-маркетинг * Социальные сети

Обзор

Каждый день на меня сыпятся предложения "Подпишись на канал!" И знаете, в чём их главная ошибка? Они все пытаются продать мне подписку, хотя я их вижу впервые. Холодный контакт, ноль доверия — нет, спасибо.

Вместо того, чтобы втюхивать подписку холодной аудитории, узнай:
- Как согреть холодных пользователей и превратить их в лояльных;
- Как использовать промокод грамотно и мотивировать подписку на Telegram-канал;
- Как автоматизировать выдачу промокодов и защитить их от злоупотреблений;

Плюс, в конце статьи тебя ждет реальный код для создания бота на PHP, который будет автоматически выдавать промокоды.

Sivchenko_translate 23 окт 2024 в 21:30

Пошаговое повышение производительности алгоритма

11 мин

1.4K

C++ * Rust * Алгоритмы * Высоконагруженные системы * Программирование *

Перевод

Недавно мне довелось работать над новым алгоритмом приближённого поиска ближайших соседей, который называется RaBitQ. Автор этого алгоритма уже предоставил достаточно скоростную реализацию на C++. Я попытался переписать этот алгоритм на Rust (ещё один случай «а почему бы не переписать на Rust»). Однако, я обнаружил, что моя реализация гораздо медленнее оригинальной. Далее я расскажу, как шаг за шагом доработал её производительность.

+10

Dmytro_Kikot 23 окт 2024 в 07:10

ИИ в диагностике рака кожи

16 мин

835

Блог компании ua-hosting.companyАлгоритмы * ЗдоровьеИскусственный интеллектНаучно-популярное

Одним из самых коварных и гадких заболеваний у человека является рак. Независимо от его локализации, он может нанести колоссальный ущерб здоровью или привести к летальному исходу. Одним из самых распространенных считается рак кожи, а именно меланома. Проблема этого типа рака заключается в том, что он может быть на видном месте и не вызывать каких-либо ощутимых симптомов до момента, когда уже будет поздно что-либо делать. Именно потому людям, которые входят в группу риска, необходимо регулярно проверяться у дерматоонколога. Однако даже самый опытный специалист все равно остается человеком, который может упустить малозаметные признаки, тем самым подарив раку шанс на развитие. По этой причине человечество начало изобретать множество разнообразных инструментов диагностики, помогающие врачам найти рак вовремя. Одним из потенциально полезных инструментов в данном начинании может быть искусственный интеллект. Ученые из Университета им. Раскина (Великобритания) провели исследование, в котором обучили систему ИИ определять ранние признаки меланомы. Как именно проходило это обучение, и насколько эффективен ИИ в качестве диагноста? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+12

PatientZero 22 окт 2024 в 07:17

Насколько быстры B-деревья по сравнению с хэш-таблицами?

12 мин

8.7K

Алгоритмы * Клиентская оптимизация * Программирование * Серверная оптимизация *

Перевод

Во многих «скриптовых» языках для стандартных ассоциативных структур данных используется хэш-таблица (hashmap) (объекты Javascript, словари Python и так далее). Хэш-таблицы обладают множеством раздражающих свойств:

Уязвимость к hash flooding.
В случае защиты от hash flooding случайными seed порядок итераций становится недетерминированным, что мешает при тестировании снэпшотов, создании воспроизводимых сборок и так далее.
При вставке может требоваться рехэширование, что в наихудших случаях создаёт для больших хэш-таблиц ужасные задержки.
Многократное увеличение больших распределений памяти без фрагментации сложно реализовать в целевых платформах wasm, потому что трюки с виртуальной памятью недоступны, а для страниц невозможно выполнить unmapping.
Векторные команды в wasm ограничены, а команды AES отсутствуют. Это делает многие хэш-функции ещё более медленными.

Упорядоченные структуры данных наподобие B-деревьев не имеют этих недостатков. Обычно они медленнее хэш-таблиц, но меня удивило, насколько разнятся ожидания людей относительно их скорости.

Читать дальше →

+19

dimakl 22 окт 2024 в 07:02

Как мы в Яндексе делаем роборуку с искусственным интеллектом

7 мин

9.1K

Блог компании ЯндексМашинное обучение * Искусственный интеллектРобототехникаАлгоритмы *

✏️ Технотекст 7

Ещё 10–20 лет назад многие думали, что роботы под управлением искусственного интеллекта возьмут на себя всю тяжёлую и опасную работу на предприятиях. Однако нейросети нашли применение в офисах, колл‑центрах, службе поддержки и даже стали полезны людям из творческих профессий — копирайтерам, дизайнерам, программистам. Тем не менее создание роботов, которые могут самостоятельно выполнять сложные физические манипуляции с материальными объектами, остаётся трудной и нерешённой задачей.

В этой статье я расскажу, как команда ML R&D в отделе робототехники Маркета создаёт роборуку и обучает нейросети, благодаря которым робот взаимодействует с физическим миром.

+33

grigoriy-melnikov 22 окт 2024 в 06:29

ПО шагам: Защищаем сайт от парсеров и поведенческих ботов с помощью DNS-прокси

Средний

5 мин

6.6K

Спам и антиспамВеб-аналитика * БраузерыАлгоритмы * Информационная безопасность *

Туториал

- контент не будет спаршен
- с ВПН работает
- выявит высокоуровневых JS ботов
- реальных не заблокирует
- фиксирование только настоящих просмотров
- рекомендательная система будет работать изумительно

Как интегрировать защиту, как выявить фейковых http ботов, как написать свой код верификации пользователя на прокси сервере и еще читайте далее.

+12

RodionGork 22 окт 2024 в 05:19

Задачки «полуфинала» соревнования МТС (True Tech Arena 2024) — обзор, разбор

Средний

8 мин

Алгоритмы * Занимательные задачкиПрограммирование *

Немного неожиданно что этот уровень назвали "полуфинал" - участники попадали в него сразу после квалификации, проходившей в первой половине октября. И в квалификации задачки были "не бей лежачего" (коротко упомянем их тоже). В "полуфинале" же предложили 5 задач с тем чтобы решить их за 5 часов, но время можно было выбрать любое в течение нескольких дней. Я решил две, ещё две понимаю как решать и по одной кажется без идей. На решённые задачи затратил минут 20, на нерешенные часа полтора. Давайте посмотрим на них вместе - вдруг вам будет интересно обсудить, поправить или подсказать.

Оговорюсь: я не имею отношения к МТС и не занимаюсь "спортивным/олимпиадным" программированием. Обычный мидл-девелопер из обычной конторы. Отчасти поэтому мне как и большинству из вас подобные задачки в излишних количествах кажутся немного скучными :)

Здесь речь про "алгоритмический трек" - а насчет параллельного соревнования по "роботам" можно посмотреть мою предыдущую статью.

Итак, к задачкам!

Antony_Rain 21 окт 2024 в 14:25

Предиктивная аналитика политических кризисов с помощью machine learning (на исторических данных)

Простой

13 мин

2.1K

Исследования и прогнозы в IT * Алгоритмы * Машинное обучение * Python * Data Engineering *

Аналитика

Допустим, вы инвестор-финансист, покупающий государственные облигации банановой республики или акции компании по выращиванию и поставке бананов или даже правитель бананового рая – всегда необходимо учитывать не только финансовые, но и политические риски в развитии страны. Представим, что наша основная задача - оценить риски. Просто, цинично, в стиле real politic без всякой душеспасительности и ... котиков.

VAE 21 окт 2024 в 11:57

Закон распределения делителей числа (расширенная версия)

Средний

16 мин

2.2K

Информационная безопасность * Математика * Алгоритмы * Визуализация данных * Научно-популярное

В арифметике известны элементарные действия с числами (+), (–), (×), (/) и др., использование которых при заданных исходных данных дает нам возможность получать определенные результаты: сумму, разность, произведение, частное. Обратное действие с результатами в качестве исходных данных возможно далеко не всегда. Например, возведение в третью степень числа 7 ³= 343, обратным действием имеет извлечение из результата корня третьей степени (343)^1/3= 7. При заданных результатах определить какими были исходные данные не всегда возможно. Для суммы даже двух слагаемых 7 + 6 = 13 такого единственного обратного действия нет. Для числа 13 мы можем получить очень разные исходные 13 = 1+12 = 2+11 = 3+10 = 4 +9 = 5 + 8 = 6+7.

С умножением в качестве исходных составных чисел картина похожая, но если исходными сомножителями взяты простые числа, то обратной операцией для произведения является действие, называемое факторизацией числа – результата умножения. К сожалению, на сегодняшний день действие факторизации не может быть задано какими-то простыми вычислениями, а очень большие числа – результаты (сотни цифр в описании) вообще не могут быть факторизованы. Как выполнить поиск простых делителей результата-произведения мы сегодня не знаем.

Такие делители, вообще говоря, как-то распределены в числовых рядах. Например, в натуральном ряде чисел (НРЧ) или в последовательности нечетных чисел (ПНЧ) простые числа-делители и их кратные имеют достаточно регулярные распределения, каждое со своим шагом.

Задавая произведение простых чисел N = p˖q˖h˖s, мы понимаем, что каждое из p, q, h, s меньше самого N. Если ограничить начальный фрагмент НРЧ или ПНЧ значением N, то в пределах выделенного фрагмента будут присутствовать кратные делителей с возрастающими от 1 коэффициентами (для ПНЧ коэффициенты будут нечетными). Сможем ли мы увидеть и выделить такие кратные делителей N? Они ведь нам неизвестны.

Сегодня ответ на этот вопрос положителен. В 2014 году мной на Хабре был опубликован закон распределения делителей (ЗРД) натурального числа N в НРЧ. Применение закона позволяет получать для заданного натурального N его простые делители и их кратные в НРЧ. Ниже я кратко повторю публикацию 2014 года и приведу расширенную версию ЗРД на ряд целых чисел N.

-10

1 2 ...

33 34

36 37 ...

321 322

Алгоритмы *

Анализ задачи с собеседования в Google: конь и телефонные кнопки

«Куда, куда вы удалились», или поиск пропущенных остановок в маршрутах общественного транспорта в OpenStreetMap

Как мы переманили пользователей удобным сервисом платежей

Как мы выиграли соревнование CLEF 2024 по генерации медицинских снимков

Литкод изи — это просто

5 результатов обучения в IT и не только

Создаем алгоритм определения скорости объектов по видео

Решение задачи с собеседования Linked List Cycle [+ ВИДЕО]

Обучение модели как ребёнка

Настройка ПИД-регулятора для беспилотных автомобилей

Государственные перевороты: бармалеи выпрыгивают как черти из табакерки. Не хотите, дети, в Африку сыграть?

Как получить на 30% больше подписчиков, раздавая промокоды в Telegram

Пошаговое повышение производительности алгоритма

Ближайшие события

ИИ в диагностике рака кожи

Насколько быстры B-деревья по сравнению с хэш-таблицами?

Как мы в Яндексе делаем роборуку с искусственным интеллектом

ПО шагам: Защищаем сайт от парсеров и поведенческих ботов с помощью DNS-прокси

Задачки «полуфинала» соревнования МТС (True Tech Arena 2024) — обзор, разбор

Предиктивная аналитика политических кризисов с помощью machine learning (на исторических данных)

Закон распределения делителей числа (расширенная версия)

Вклад авторов