Алгоритмы *

Все об алгоритмах

СтатьиПостыНовостиАвторыКомпании

PatientZero 23 мая 2024 в 07:28

Демо City In A Bottle – система рейкастинга в 256 байтах

Средний

8 мин

5.2K

Ненормальное программирование * JavaScript * Векторная графика * Алгоритмы *

Обзор

Перевод

Привет всем любителям size coding, сегодня я расскажу о чём-то потрясающем: крошечном движке трассировки лучей (raycasting) и генераторе города, умещающихся в автономном файле HTML размером 256 байтов.

В этом посте я поделюсь секретами работы этой волшебной программы. Возможно, вы уже видели этот пост в моём Twitter. После публикации два года назад он стал самым популярным моим твитом.

В этой потрясающей программе используется множество разных концепций, а их разбор похож на решение головоломки. Программа состоит из нескольких основных частей: html-кода, цикла обновления кадра, системы рендеринга, движка рейкастинга и самого города.

Возможно, вы подумаете, что для распутывания этой загадки необходима сложная математика, но на самом деле это не так, сам код довольно прост и в нём используется простейшая алгебра, даже без тригонометрических функций. Впрочем, там есть несколько трюков, позволяющих создать впечатляющий результат.

+54

ru_vds 22 мая 2024 в 13:00

Сравнение алгоритмов ограничения частоты запросов

Средний

7 мин

11K

Блог компании RUVDS.comАлгоритмы * Информационная безопасность * Серверное администрирование * Сетевые технологии *

Обзор

Перевод

▍ Зачем ограничивать частоту?

Представьте чат в Twitch со множеством активных пользователей и одним спамером. Без ограничения частоты сообщений единственный спамер может запросто заполнить всю беседу сообщениями. При ограничении частоты у каждого пользователя появляется равная возможность участия.

Видео

Ограничитель частоты позволяет управлять частотой обрабатываемого вашим сервисом трафика, блокируя запросы, превосходящие заданное пороговое значение за период времени. И это полезно не только для борьбы со спамом в чатах. Например, ограничение частоты отправки формы логина позволяет защититься от брутфорс-атак, оставляя при этом пользователю право на ошибку.

Конечные точки API тоже часто ограничивают по частоте запросов, чтобы их ресурсы не монополизировал единственный пользователь. Представьте, что вам нужно, чтобы пользователи могли обращаться к затратной конечной точке не чаще ста раз в минуту. Это можно отслеживать при помощи счётчика, обнуляющегося каждую минуту. Все запросы после сотого в пределах этой минуты будут блокироваться. Это один из простейших алгоритмов ограничения частоты, называющийся fixed window limiter (ограничитель с фиксированным окном). Это распространённый способ управления трафиком к сервису.

Но не всегда всё так просто.

Когда начинается и заканчивается каждое одноминутное окно? Если я запущу поток запросов ближе к концу окна, смогу ли превысить лимит? Ёмкость окна восстанавливается по одному запросу за раз, или сразу на всё количество?

В этом посте мы рассмотрим три самых популярных алгоритма, чтобы ответить на каждый из этих вопросов.

Читать дальше →

+53

Razant 22 мая 2024 в 09:47

Большие языковые модели гораздо линейнее, чем мы думали

Сложный

4 мин

23K

Блог компании AIRIАлгоритмы * Машинное обучение * Искусственный интеллектNatural Language Processing *

Кейс

Хабр, привет! Это снова Антон Разжигаев, аспирант Сколтеха и научный сотрудник лаборатории Fusion Brain в Институте AIRI, где мы продолжаем углубляться в изучение языковых моделей. В прошлый раз мы выяснили, что эмбеддинги трансформеров-декодеров сильно анизотропны. На этот раз я бы хотел рассказать об их удивительной линейности, ведь нашу статью про обнаруженный эффект («Your Transformer is Secretly Linear») несколько дней назад приняли на международную конференцию ACL!

+68

FirstJohn 21 мая 2024 в 09:25

Новый прорыв приближает умножение матриц к идеалу

Средний

7 мин

51K

Блог компании FirstVDSАлгоритмы * Математика *

Дайджест

Перевод

Устранив скрытую неэффективность, учёные придумали новый способ умножения больших матриц, который работает быстрее, чем когда-либо.

Учёные, занимающиеся информатикой, — это требовательная группа. Им недостаточно получить правильный ответ — цель почти всегда состоит в том, чтобы получить ответ как можно эффективнее.

Возьмем, к примеру, умножение матриц или массивов чисел. В 1812 году французский математик Жак Филипп Мари Бине разработал базовый набор правил, которым мы до сих пор обучаем студентов. Это работает прекрасно, но другие математики нашли способы упростить и ускорить процесс умножения матриц.

+52

mynameco 20 мая 2024 в 21:32

Delta-Rle-Huffman (DRH) Texture Format

8 мин

Ненормальное программирование * Алгоритмы * Обработка изображений * C# * Сжатие данных *

Всем привет! В этой статье я опишу алгоритм работы формата сжатия изображений без потерь. Сжатие использует известные методики, которые и дали ему название. Проект начинался с простых экспериментов, которые вышли из под контроля. Не смотря на то, что формат чаще сжимает лучше чем png, никакого практического применения этот формат не имеет, оставаясь чисто академическим.

Внимание! В статье много картинок.

Кому интересно, добро пожаловать под кат!

+53

Bright_Translate 19 мая 2024 в 09:00

Почему для меня так важен алгоритм CORDIC

Средний

8 мин

28K

Блог компании RUVDS.comАлгоритмы * Математика * Программирование *

Обзор

Перевод

CORDIC — это алгоритм для вычисления тригонометрических функций вроде
sin, cos, tan и тому подобных на маломощных устройствах без использования модуля обработки операций с плавающей запятой или затратных таблиц поиска. По факту он сводит эти сложные функции до простых операций сложения и битового сдвига.

Перейду сразу к делу и скажу, почему я так сильно люблю этот алгоритм, а затем займёмся изучением принципов его работы. По сути, фактические операции CORDIC весьма просты — как я уже сказал, это сдвиги и сложение — но выполняет он их путём комбинирования векторной арифметики, тригонометрии, доказательств сходимости и продуманных техник компьютерных наук. Лично я считаю, что именно это имеют ввиду, описывая его природу, как «элегантную».

Читать дальше →

+109

El_Gato_Grande 10 мая 2024 в 08:46

Заставляем ChatGPT быть эгоистичным и решать дилемму заключенного, в которой есть котики

10 мин

8.9K

Блог компании SelectelАлгоритмы * Машинное обучение * Научно-популярное

Успехи машинного обучения наталкивают на мысль, что ИИ, стоящий в развитии на пару ступеней выше человека, уже не за горами. Станет он нам новым лучшим другом или скорее чем-то вроде Скайнета? Мы не знаем будущего, но можем проверить, насколько железный мозг дружелюбен в настоящем.

Привет! Мы в Selectel часто используем ИИ и знаем, что это хороший помощник, которому можно доверить часть рутины. А как насчет человеческих качеств? Чтобы выяснить это, сыграем с ним в классическую математическую игру, с помощью которой ученые уже больше 70 лет исследуют альтруизм и эгоизм, способность к эмпатии и готовность предать — характеристики, присущие человеку.

Читать дальше →

+52

mr-pickles 6 мая 2024 в 08:00

Невероятно, но факт: умножение матриц на GPU идёт быстрее на «предсказуемых» данных

Средний

9 мин

14K

Блог компании Wunder FundВысоконагруженные системы * Алгоритмы * Серверное администрирование *

Перевод

Шёл 2022 год. Я обратил внимание на новый интересный проект CUTLASS, отличающийся очень высокой скоростью выполнения операций умножения матриц. Я взял большую задачу по умножению матриц — 8192 x 8192 x 8192, и померял производительность в PyTorch, где используется библиотека cuBLAS.

+53

carbon2409 27 апр 2024 в 13:51

Похоже, я придумал свой алгоритм поиска кратчайшего пути (upd: меня опередили...)

Средний

17 мин

42K

Python * Алгоритмы * Поисковая оптимизация *

Обзор

Из песочницы

✏️ Технотекст 7

Всем привет! Я реализовал, похоже, собственный алгоритм поиска кратчайшего пути с отрицательными ребрами графа.

Почему собственный? Я искал подобное решение, но не нашел, возможно, оно уже было реализовано, просто плохо поискал. Жду Нобелевскую премию =)

Додумался я до него путем модификации классического Дейкстры. Прошу адекватно отнестись к содержимому, ибо это моя первая статья, и, возможно, я ничего не придумывал и, вообще, этот алгоритм не работает вовсе (но по многочисленным тестам он работает правильно).

+98

113

hommforever 16 апр 2024 в 10:01

Яндекс запустил Нейро. Рассказываем, как он работает

Средний

14 мин

118K

Блог компании ЯндексПоисковые технологии * Алгоритмы * Машинное обучение * Искусственный интеллект

✏️ Технотекст 7

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

+92

144

aio350 10 апр 2024 в 08:01

Фильтр Блума

Средний

9 мин

14K

Блог компании Timeweb CloudJavaScript * Алгоритмы *

Обзор

Перевод

У каждого разработчика есть набор инструментов для решения различных задач. Однако со временем возникает необходимость расширять этот набор, чтобы эффективно справляться с более сложными задачами. В этой статье я хочу познакомить вас с инструментом, которым вы, скорее всего, раньше не пользовались. И хотя он подходит для решения узкого спектра задач, его использование может оказаться весьма полезным. Знакомьтесь — "фильтр Блума" (Bloom filter).

Читать дальше →

+50

italankin 5 апр 2024 в 13:28

Про решаемость пятнашек

Средний

8 мин

37K

Алгоритмы * Математика * Логические игры

Привет, я создатель известного в узких кругах приложения 15 Puzzle для Android.

В статье я расскажу, как я генерирую стартовые позиции для своей игры, а также о том, как я добавлял новые конфигурации головоломки.

+71

Razant 1 апр 2024 в 13:38

Как устроено пространство, в котором думают языковые модели?

Сложный

5 мин

22K

Блог компании AIRIАлгоритмы * Машинное обучение * Искусственный интеллектNatural Language Processing *

Кейс

С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?

Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM).

+55

ibessonov 31 мар 2024 в 16:29

Преобразование Уолша-Адамара

Сложный

11 мин

19K

Программирование * Алгоритмы * Математика *

На сайте hackerrank.com есть отличная задача. По заданному массиву short[] A; найти максимальное количество его подмассивов, xor элементов которых будет одинаковым. Сам этот xor тоже нужно найти.

Максимальная длина массива равна 10⁵, так что квадратичный алгоритм не укладывается в лимит по времени исполнения. Я в своё время с этой задачей не справился и сдался, решив подсмотреть авторское решение. И в этот момент я понял почему не справился — автор предлагал решать задачу через дискретное преобразование Фурье.

+64

re9ulus 19 мар 2024 в 07:00

Quantization Deep Dive, или Введение в современную квантизацию

Средний

16 мин

45K

Блог компании ЯндексПрограммирование * Алгоритмы * Машинное обучение * Искусственный интеллект

✏️ Технотекст 2023

Привет! Меня зовут Василий Землянов, я занимаюсь разработкой ML-инфраструктуры. Несколько лет я проработал в команде, которая делает споттер — специальную маленькую нейросетевую модельку, которая живёт в умных колонках Яндекса и ждёт от пользователя слова «Алиса». Одной из моих задач в этой команде была квантизация моделей. На пользовательских устройствах мало ресурсов, и мы решили, что за счёт квантизации сможем их сэкономить — так в итоге и вышло.

Потом я перешёл в команду YandexGPT. Вместо маленьких моделей я стал работать с очень крупными. Мне стало интересно, как устроена квантизация больших языковых моделей (LLM). Ещё меня очень впечатляли истории, где люди берут гигантские нейросети, квантизируют в 4 бита и умудряются запускать их на ноутбуках. Я решил разобраться, как это делается, и собрал материал на доклад для коллег и друзей. А потом пришла мысль поделиться знаниями с более широкой аудиторией, оформив их в статью. Так я и оказался на Хабре :)

Надеюсь, погружение в тему квантизации будет интересно как специалистам, так и энтузиастам в сфере обучения нейросетей. Я постарался написать статью, которую хотел бы прочитать сам, когда только начинал изучать, как заставить модели работать эффективнее. В ней мы подробно разберём, зачем нужна квантизация и в какой момент лучше всего квантизовать модель, а ещё рассмотрим разные типы данных и современные методы квантизации.

+81

nrsharip 18 мар 2024 в 14:32

Основные типы распределений вероятностей в примерах

Средний

15 мин

91K

Python * Алгоритмы * Математика * Статистика в ITИнфографика

Из песочницы

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением. Любые изменения в пользовательском опыте на сайте компании (внешний вид, структура, контент) приводят к изменениям в работе пользователя и, как результат, изменения наблюдаются в собираемых данных. Важным элементом анализа изменений данных и его фундаментом является использование основных типов распределений случайных величин, от понимания которых напрямую зависит качество оценки значимости наблюдаемого изменения. Рассмотрим их подробнее на наглядных примерах.

+58

PatientZero 9 мар 2024 в 08:45

Как калькуляторы вычисляют синус?

Простой

3 мин

63K

Алгоритмы * Математика * Научно-популярное

Обзор

Перевод

Синус, одна из фундаментальных тригонометрических функций, играет важнейшую роль в различных областях, включая математику, физику, проектирование и computer science. Процесс его вычисления нетривиален, особенно при реализации в электронных калькуляторах, где крайне важна эффективность и точность.

В предыдущих постах серии мы изучили, как калькуляторы решают уравнения и как они вычисляют квадратные корни. В этом посте мы изучим запутанный процесс вычисления функции синуса, начав с простых аппроксимаций, а затем перейдя к более сложным методикам.

+92

PatientZero 6 мар 2024 в 18:53

Челлендж по обработке миллиарда строк на Go: от 1 минуты 45 секунд до 4 секунд

Средний

14 мин

30K

Go * Алгоритмы * Проектирование и рефакторинг * Клиентская оптимизация *

Кейс

Перевод

Пару недель назад я прочитал о запавшем мне в душу челлендже по обработке миллиарда строк, поэтому захотел решить его на Go.

Я немного опоздал, соревнования проводились в январе. И на Java. Меня не особо интересует Java, зато давно интересует оптимизация кода на Go.

Этот челлендж был очень прост: обработать текстовый файл названий метеорологических станций и температур, и для каждой станции вывести минимальное, среднее и максимальное значение. Чтобы упростить задачу, было ещё несколько ограничений, однако я проигнорировал те, что относятся только к Java.

+58

dspmsu 24 фев 2024 в 13:30

Переворачивающиеся при умножении числа

Средний

7 мин

22K

Алгоритмы * Математика *

Из песочницы

Здравствуйте!

Расскажу о серии задач, которая случайно возникла в процессе решения другой задачи. Мне на глаза попалось равенство:

81 * 27 = 2187

– Интересно, – подумал я. – А бывают ли ещё такие числа, чтобы цифры слева и справа повторялись?

+71

AskePit 19 фев 2024 в 06:00

Вороной, Манхэттен, рандом

Простой

34 мин

25K

C++ * Разработка игр * Алгоритмы * Математика * Godot *

Ретроспектива

Это история про то, как не довести дело до конца, но получить уйму опыта, и вообще ни разу не обломаться.

Итак, у нас был один программист, один художник, абсолютное непонимание рабочего процесса, незнакомый нам игровой движок и желание что-то намутить. Если вам интересно, как в одном месте сошлись карта Вороного, частный случай расстояния Минковского, преобразования над полигонами, процедурная генерация и шумы — и все это в красивой стилизованной обертке, то вам под кат.

Осторожно, очень много картинок!

+159

1 2 3 4 5

7 8 ...

50 51

Алгоритмы *

Демо City In A Bottle – система рейкастинга в 256 байтах

Сравнение алгоритмов ограничения частоты запросов

▍ Зачем ограничивать частоту?

Большие языковые модели гораздо линейнее, чем мы думали

Новый прорыв приближает умножение матриц к идеалу

Delta-Rle-Huffman (DRH) Texture Format

Почему для меня так важен алгоритм CORDIC

Заставляем ChatGPT быть эгоистичным и решать дилемму заключенного, в которой есть котики

Невероятно, но факт: умножение матриц на GPU идёт быстрее на «предсказуемых» данных

Похоже, я придумал свой алгоритм поиска кратчайшего пути (upd: меня опередили...)

Яндекс запустил Нейро. Рассказываем, как он работает

Фильтр Блума

Про решаемость пятнашек

Как устроено пространство, в котором думают языковые модели?

Ближайшие события

Преобразование Уолша-Адамара

Quantization Deep Dive, или Введение в современную квантизацию

Основные типы распределений вероятностей в примерах

Как калькуляторы вычисляют синус?

Челлендж по обработке миллиарда строк на Go: от 1 минуты 45 секунд до 4 секунд

Переворачивающиеся при умножении числа

Вороной, Манхэттен, рандом

Вклад авторов