Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

malkovsky 26 фев в 19:11

Алгоритмы манипуляций с битами

Средний

13 мин

10K

Программирование * Алгоритмы * Математика * C++ *

✏️ Технотекст 7

в статье приведены алгоритмы обработки коротких битовых строк, обычно вмещающихся в машинное слово, в большей степени эти алгоритмы предназначены для обработки строк длины 32 или 64, но многие из них можно применять для SIMD инструкций или даже GPU.

+90

PatientZero 26 фев в 10:51

Почему QR-коды в верхнем регистре меньше, чем в нижнем?

Простой

2 мин

11K

Алгоритмы * Хранение данных * IT-стандарты *

Обзор

Перевод

Взгляните на эти два QR-кода. Отсканируйте их, если хотите: обещаю, в них нет ничего опасного.

Слева HTTPS://EDENT.TEL/ в верхнем регистре, а справа — https://edent.tel/ в нижнем.

Можно чётко заметить, что слева QR-код «меньше», то есть в нём меньше битов данных. Оба ведут на один и тот же URl, единственное различие заключается в регистре.

Что здесь происходит?

+152

PatientZero 18 фев в 08:45

Калькулятор? Да его напишет кто угодно

Простой

7 мин

34K

Математика * Программирование * Алгоритмы *

Обзор

Перевод

[Прим. пер.: на Хабре уже был перевод этой статьи, но незавершённый примерно на четверть.]

Неправда.

Калькулятор должен показывать результат введённого математического выражения. А это намно-о-ого сложнее, чем кажется.

В этом посте я расскажу величайшую историю о разработке приложения-калькулятора.

На изображении выше показан калькулятор из iOS.

Заметили что-нибудь?

Он посчитал неправильно.

(10¹⁰⁰) + 1 − (10¹⁰⁰) равно 1, а не 0.

Android считает правильно. А причина, по которой он это делает, абсолютно безумна.

+221

157

ru_vds 12 фев в 13:01

Ни одна реализация элементарных функций не соответствует стандарту IEEE 754

Средний

9 мин

12K

Блог компании RUVDS.comIT-стандарты * Алгоритмы * Математика * Программирование *

Обзор

Перевод

Введённый в 1985 году стандарт IEEE-754 для чисел с плавающей запятой был предназначен для решения проблемы разнородности реализаций чисел с плавающей запятой, мешавших портируемости кода, а также для повышения стабильности между платформами.

Он получил широкое применение и многократно пересматривался в течение прошедших лет. Если вы когда-нибудь работали с любыми вещественными числами в своих приложениях, то они, вероятно, отвечали этому стандарту.

Моя работа в течение последнего года заключалась в анализе погрешности различных математических функций, накопления этой погрешности и способов её уменьшения при помощи различных программных паттернов. Одной из исследованных мной тем были базовые математические функции, используемые в функциях активации нейронных сетей, а также способы их аппроксимации для повышения производительности. В процессе работы нам пришлось столкнуться с противодействием со стороны людей, активно стремящихся к корректной реализации математических функций и к соответствию их стандартам, в частности, к соблюдению обеспечения корректности одной наименее значимой единицы измерения (unit in last place, ULP) для элементарных функций.

Я был заинтересован в дальнейшей работе по аппроксимации этих функций, поэтому приступил к исследованию того, каким образом они гарантируют корректность, и если они корректны только на 1 ULP, то где располагаются ошибки в области определения функции.

В процессе изучения я обнаружил, что ни одна из популярных математических библиотек, используемых во множестве сфер вычислений, на самом деле не выполняет корректное округление в соответствии с требованиями любой версии IEEE 754 после первой редакции 1985 года.

Читать дальше →

+97

roman-gorb 5 фев в 07:00

Ускорение LLM: универсальные методы для популярных архитектур

17 мин

11K

Блог компании ЯндексМашинное обучение * Искусственный интеллектАлгоритмы * Программирование *

✏️ Победитель Технотекста 7

ML‑модели применяются в сервисах Яндекса уже много лет, мы накопили большой опыт в их обучении. Статьи об этом коллеги регулярно публикуют, в том числе на Хабре. Но сегодня хочу обсудить другую не менее важную задачу — ускорение инференса (процесса работы на конечном устройстве) моделей. Скорость зависит от разных условий, главным образом от архитектуры и железа, но есть множество интересных способов повлиять на неё. Особенно актуальна проблема тяжёлого инференса при использовании больших языковых моделей (LLM) — на то они и large!

Для команды YandexGPT, в которой я и тружусь вместе со своими коллегами, тема инференса LLM находится в разряде вечных вопросов. С предыдущей статьи прошёл уже почти год, опыта у нас стало больше — получилось протестировать новые подходы, которыми и хочется поделиться сегодня.

+63

ru_vds 27 янв в 13:01

FizzBuzz, который не помог мне найти работу

Средний

15 мин

11K

Блог компании RUVDS.comПрограммирование * Карьера в IT-индустрииАлгоритмы * TypeScript *

Обзор

Перевод

Fizzbuzz — это простой алгоритм, который когда-то был популярен в контексте технических собеседований.

Я знал, что это такое, но до прошлой недели меня ни разу не просили написать его.

Базовый алгоритм очень прост, но смысл упражнения в том, что собеседующий добавляет новые правила, чтобы проверить, как вы будете дополнять код, обеспечивая при этом его читаемость и удобство поддержки.

Базовую реализацию fizzbuzz можно написать однострочником на Typescript:

const fizzbuzz = (n: number)=>`${n%3 ? '' : 'Fizz'}${n%5 ? '' : 'Buzz'}`;

Во время собеседования меня попросили написать fizzbuzz на любом близком мне языке; собеседующий даже сказал, что можно использовать эзотерические языки программирования, но рекомендовал не делать этого, потому что некоторые правила реализовать будет сложно. Этого вполне можно было ожидать, ведь собеседование могло длиться до 45 минут, а обсуждать простой fizzbuzz особого смысла не было. Менять язык программирования после начала собеседования тоже было запрещено.

Читать дальше →

+94

BiTL 8 янв в 10:16

256 байт веселья, или как развлечь себя Ассемблером когда скучно

Средний

15 мин

19K

Алгоритмы * Программирование * Ненормальное программирование * Демосцена * Assembler *

Из песочницы

Это еще одна статья про демосцену, сайзкодинг, ассемблер, MS‑DOS и ретрокодинг. То есть, о том, как ночами напролет добровольно и бесплатно писать бесполезный и очень трудоемкий код, и получать от этого массу удовольствия (и седую бороду). Даже если вы уже пробовали и вам не понравилось, вам все равно стоит почитать. Возможно, вы что‑то делали не так. Например, использовали не те буквы и цифры. А еще тут есть подборка «демок» размером в 256 байт!

+181

Bright_Translate 5 янв в 09:02

Сортировка «Милосердный Сталин»

Средний

7 мин

19K

Блог компании RUVDS.comPython * Алгоритмы * Математика * Программирование *

Обзор

Перевод

Merciful Stalin Sort (сортировка «Милосердный Сталин») — это новый алгоритм сортировки, вдохновлённый пресловутым Stalin Sort (сталинской сортировкой). В ходе развлекательного эксперимента со сталинской сортировкой возникла интригующая идея: что, если вместо удаления выбивающихся элементов, сохранить те, которые идут по порядку, и рекурсивно упорядочить остальные? Логика заключалась в том, чтобы добиться повышения производительности за счёт уменьшения массива, требующего сортировки, особенно в случае частично упорядоченных массивов. Это и привело к разработке сортировки «Милосердный Сталин».

Читать дальше →

+72

PatientZero 28 дек 2024 в 11:24

Как линейная алгебра помогла мне в разработке интерактивного редактора диаграмм

Простой

9 мин

7.9K

Математика * Алгоритмы * Программирование *

Обзор

Перевод

Ах, матрицы — одна из тех базовых концепций линейной алгебры, с которыми мы встречались в школе. Несмотря на их важность, мне за мою карьеру ни разу не доводилось с ними работать, и из-за этого я забыл, насколько они мощны и универсальны. Подходящий момент, чтобы вспомнить их, настал, когда я работал над моим интерактивным редактором диаграмм Schemio. В этой статье я расскажу, как использовал матрицы для решения сложных задач.

+51

Bright_Translate 8 дек 2024 в 09:13

Элегантная математика фильтров Блума

Средний

7 мин

11K

Блог компании RUVDS.comBig Data * Алгоритмы * Математика *

Обзор

Перевод

Вероятностные функции способны моделировать множество алгоритмов и процедур. Они помогают нам оптимизировать процессы для получения наилучших результатов. Опытные программные инженеры знают, что рано или поздно практически любое ПО достигает определённой степени недетерминированности, когда решение является не абсолютным, но при оптимальной конфигурации приближается к наилучшим результатам. В математическом смысле подобное решение обычно сводится к поиску минимума, максимума или пределов неких вероятностных функций.

В этой статье речь пойдёт об изяществе математики, лежащей в основе фильтров Блума. Мы разберём аспекты точности работы и компромиссов при конфигурировании этих фильтров, а также узнаем, почему в некоторых случаях они могут стать отличным выбором, особенно в сфере больших данных и системах OLAP, когда подразумевается обработка огромных и статичных датасетов.

Читать дальше →

+61

PatientZero 13 ноя 2024 в 07:38

Разбор регулярного выражения, проверяющего простоту чисел

Простой

16 мин

7.1K

Программирование * Регулярные выражения * Алгоритмы *

Обзор

Перевод

Как-то я исследовал способы наиболее эффективного определения простоты числа и наткнулся на показанный выше код.

Он меня заинтриговал. Хоть это, возможно, и не самый эффективный способ, но определённо один из наименее очевидных, поэтому мне стало любопытно. Каким образом соответствие регулярному выражению .?|(..+?)\1+ должно показать, что число непростое (после его преобразования в унарную систему счисления)?

Если вы заинтересовались, продолжайте чтение, я проанализирую это регулярное выражение и объясню, что же в нём происходит. Объяснение не зависит от языка программирования, однако я приведу версии показанного выше Java-кода на Python, JavaScript и Perl и объясню, почему они немного различаются.

Я объясню, как регулярное выражение ^.?$|^(..+?)\1+$ способно отфильтровывать все простые числа. Почему это выражение, а не .?|(..+?)\1+ (использованное в примере кода на Java)? Это связано с тем, как работает String.matches(), о чём я расскажу ниже.

Хотя по этой теме есть несколько постов, я считаю, что они недостаточно глубоки и в них приводится лишь высокоуровневое объяснение, недостаточно хорошо излагающее важные подробности. В своей статье я попытаюсь объяснить подробности, чтобы их мог понять любой. Моя цель — сделать этот код понятным каждому, будь вы гуру регулярных выражений или впервые о них услышали.

+63

mclander 11 ноя 2024 в 05:34

Почему я не готовлюсь к алгоритмическому интервью

Простой

7 мин

34K

Программирование * Алгоритмы * JavaScript * Карьера в IT-индустрии

Мнение

Почему я не готовлюсь к алгоритмическому интервью

И не очень люблю людей, которые к нему готовы. Когда я провожу интервью, то главное - это понять как человек думает и как решает проблемы.

К собеседованию

+70

310

Firemoon 5 ноя 2024 в 11:16

Записываем PNG без мам, пап и внешних библиотек

9 мин

10K

Блог компании SelectelАлгоритмы * Обработка изображений * Сжатие данных *

✏️ Технотекст 7

Я решал очередную техническую задачу и столкнулся с проблемой: нужно сохранять изображения, а у меня нет сериализаторов и я не могу использовать готовые библиотеки. Ситуацию ухудшает, что из доступных форматов только PNG, JPEG и WebP. Выбор пал на PNG.

Формат изображения PNG известен с 1996 года, а на Хабре опубликовано несколько статей о декодировании этого формата. И ни одной — о кодировании. Я расскажу, как сохранить PNG своими руками на случай, если вам тоже придется это делать. Например, в академических целях.

Под катом вас ждет подробный разбор каждого байта на множестве иллюстраций.

Читать дальше →

+145

ru_vds 30 окт 2024 в 13:01

Анализ задачи с собеседования в Google: конь и телефонные кнопки

Средний

13 мин

18K

Блог компании RUVDS.comАлгоритмы * Занимательные задачкиКарьера в IT-индустрииПрограммирование *

Обзор

Перевод

Для начала я должен заявить: хотя собеседование кандидатов — это одна из моих профессиональных обязанностей, в этой статье представлены лишь личные наблюдения, истории и мнения. Они ни в коем случае не являются официальными заявлениями Google, Alphabet или любых других лиц или организаций.

Это была первая задача, которую я использовал в своей карьере собеседующего, она же первая утекла и была запрещена к использованию. Мне она нравится потому, что обладает очень приятными свойствами:

Её легко сформулировать и понять.
У неё есть множество решений, каждое из которых требует разной степени знаний алгоритмов и структур данных. Кроме того, здесь важны логические рассуждения.
Каждое решение можно реализовать в относительно малом объёме кода, поэтому она идеальна для ограниченных по времени собеседований.

Если вы студент или ищете работу в технологической сфере, то, надеюсь, после прочтения статьи вы будете лучше понимать, чего ожидать от задач на собеседованиях. Если же вы проводите собеседования, то мне бы хотелось поделиться своим мыслительным процессом и стилистическим подходом к собеседованиям.

Читать дальше →

+57

techno_mot 17 окт 2024 в 08:13

Это база. Алгоритмы сортировки для начинающих

11 мин

47K

Блог компании SelectelАлгоритмы * Программирование * Читальный зал

Обзор

Привет! В этой статье я расскажу о двух алгоритмах сортировки: Quick Sort и Merge Sort. Объясню, как они работают, как выглядят примеры кода на Python и Java, а также — как выбрать подходящий алгоритм под ваши задачи. Подробности — под катом.

Читать дальше →

+57

ky0 16 окт 2024 в 18:23

Сорок мегабайт простоты

Простой

2 мин

15K

Математика * Алгоритмы * Облачные вычисления *

Привет, Хабр!

Наконец-то я могу опубликовать статью, написание которой оттягивал, кажется, целую пятилетку. Ну, знаете, "можешь не писать - не пиши", да и повода особого не было... Но теперь повод появился - да ещё какой! - в свете которого не схватить перо было бы сущим преступлением.

Без лишних предисловий - найдено 52-ое известное простое число Мерсенна!

Какое-какое число?

+65

ru_vds 14 окт 2024 в 13:01

Почему важно оптимизировать формат данных

Средний

21 мин

12K

Блог компании RUVDS.comХранение данных * Алгоритмы * Базы данных *

Обзор

Перевод

Если вам нужно повысить скорость вашей программы, то первым делом логично будет вспомнить курс по структурам данных и оптимизировать алгоритмическую сложность.

Алгоритмы — важнейшая часть программы: замена «горячего» алгоритма O(n) менее сложным, например, O(log n), обеспечивает практически произвольное увеличение производительности. Однако существенно влияет на производительность и структурированность данных: программы выполняются на физических машинах с физическими свойствами, например, разными задержками чтения/записи данных в кэши, на диски или в ОЗУ. После оптимизации алгоритмов стоит изучить эти свойства, чтобы достичь наибольшей производительности. Оптимизированный формат данных учитывает используемые алгоритмы и паттерны доступа при выборе того, как сохранять структуру данных на физическом носителе. Благодаря этому можно увеличить скорость алгоритмов в несколько раз. В этом посте мы покажем пример, в котором нам удалось достичь четырёхкратного повышения скорости чтения простым изменением формата данных в соответствии с паттерном доступа.

Сравнение хранилищ данных AoS и SoA

Современное оборудование, и, в частности CPU, спроектировано так, чтобы обрабатывать данные определённым образом. Расположение данных в памяти влияет на то, насколько эффективно программа сможет использовать кэш CPU, как часто она сталкивается с промахами кэша и насколько оптимально она сможет задействовать векторные команды (SIMD). Даже при использовании оптимальных алгоритмов выбор неподходящего формата данных может приводить к частым перезагрузкам кэша, простаивающим конвейерам и чрезвычайно большому объёму передач содержимого памяти; всё это снижает производительность.

Читать дальше →

+56

Bright_Translate 11 окт 2024 в 13:01

Учимся читать QR-коды без компьютера

Средний

4 мин

42K

Блог компании RUVDS.comАлгоритмы * Визуализация данных * Интерфейсы *

Туториал

Перевод

Задавались ли вы когда-нибудь вопросом, как работают QR-коды? Если да, то эта статья для вас. Здесь вас ждёт интерактивное объяснение*, которое мы составили для семинара, проводившегося в рамках Всемирного конгресса хакеров 37C3, но вы также можете использовать его самостоятельно.

Прочитав статью, вы узнаете:

Из чего состоят QR-коды.
Как декодировать QR-коды вручную (используя нашу шпаргалку).

Читать дальше →

+123

tayapenskaya 26 сен 2024 в 07:01

Как устроен робот-доставщик Яндекса: от восприятия до планирования движения

15 мин

25K

Блог компании ЯндексАлгоритмы * Машинное обучение * ТранспортРобототехника

✏️ Технотекст 7

Уже пять лет по улицам Москвы колесят роботы‑курьеры Яндекса, доставляя нам еду из любимых ресторанов и магазинов быстрее, чем мы успеваем проголодаться. На пути им встречается много препятствий: от безобидной клумбы, которую можно просто объехать, до восторженных детей (и иногда взрослых), от которых порой не так просто уехать.

Нам пришлось приложить немало усилий, чтобы каждый выезд робота заканчивался успешно. Нужно было научить робота видеть мир вокруг себя, а окружающих правильно реагировать на доставщика.

Привет, меня зовут Тая, и я ML‑разработчик в команде восприятия робота‑доставщика. Сегодня я впервые детально расскажу о технологиях, благодаря которым робот‑доставщик Яндекса успешно доставляет заказы. Разберу ключевые компоненты системы, от сенсоров до алгоритмов принятия решений, и объясню, как они взаимодействуют. Из статьи вы узнаете, что происходит «под капотом» нашего робота во время его путешествий по городу.

Готовы погрузиться в мир автономной доставки?

Поехали!

+90

savastep 25 сен 2024 в 07:02

Знакомьтесь, «Незнакомое». Как мы сделали новый режим для Моей волны

8 мин

5.6K

Блог компании ЯндексАлгоритмы * Машинное обучение * Звук

✏️ Технотекст 7

Привет! Меня зовут Савва Степурин, я старший разработчик в группе рекомендательных продуктов в Фантехе Яндекса. Сегодня расскажу вам про то, как мы сделали «Незнакомое» для Моей волны — специальный режим для активного поиска музыкальных открытий.

«Незнакомое» позволяет вам получать от Моей волны те треки, которые вы ещё не слушали (возможно, даже не знаете про их существование), но которые с большой долей вероятности могут попасть в ваши музыкальные предпочтения. Если Моя волна в чистом виде — это идеальный баланс между любимыми композициями и чем-то новым, то «Незнакомое» помогает выйти из музыкального информационного пузыря и послушать новые треки.

Под катом — техническая эволюция «Незнакомого» от фильтра до отдельного продукта, описание новой модели ранжирования и многое другое.

+64

1 2 3

5 6 ...

50 51

Алгоритмы *

Алгоритмы манипуляций с битами

Почему QR-коды в верхнем регистре меньше, чем в нижнем?

Калькулятор? Да его напишет кто угодно

Ни одна реализация элементарных функций не соответствует стандарту IEEE 754

Ускорение LLM: универсальные методы для популярных архитектур

FizzBuzz, который не помог мне найти работу

256 байт веселья, или как развлечь себя Ассемблером когда скучно

Сортировка «Милосердный Сталин»

Как линейная алгебра помогла мне в разработке интерактивного редактора диаграмм

Элегантная математика фильтров Блума

Разбор регулярного выражения, проверяющего простоту чисел

Почему я не готовлюсь к алгоритмическому интервью

Записываем PNG без мам, пап и внешних библиотек

Ближайшие события

Анализ задачи с собеседования в Google: конь и телефонные кнопки

Это база. Алгоритмы сортировки для начинающих

Сорок мегабайт простоты

Почему важно оптимизировать формат данных

Сравнение хранилищ данных AoS и SoA

Учимся читать QR-коды без компьютера

Как устроен робот-доставщик Яндекса: от восприятия до планирования движения

Знакомьтесь, «Незнакомое». Как мы сделали новый режим для Моей волны

Вклад авторов