InlyIT Aug 24 2021 at 13:47

Задача, которую предлагали разработчикам на собеседованиях в Reddit: разбор и решение от сотрудника компании

8 min

24K

InlyIT corporate blogPython*Programming*Algorithms*IT career

Translation

+15

Comments 43

UFO just landed and posted this here

amarao Aug 24 2021 at 14:39

Прямо сейчас я с интересом смотрю на программиста, который писал-писал REST, и, вдруг, обнаружил, что ему для работы нужно построить граф (услуги), построить остовной граф из него и найти изолированные подграфы, не связанные с предпочтительными вершинами. Правда, это хороший программист, потому что ещё до появления графов там были деревья и монадки.

amarao Aug 24 2021 at 14:36

Я задумался как я бы реализовывал эту задачу, и мне придумалось вот такое: полезных значений мало (1 бит), и мы можем себе позволить хранить несколько их в массиве, не увеличивая размер массива (я предполагаю, что значения хранятся в int-подобном значении, а не в bitarray, потому что битовая распаковка - это то ещё упражнение).

Используем два бита: бит 0 и бит 1 (маска 1 и маска 2). Для выбора с какой "эпохой" мы работаем, будет per-board переменные new_epoch и current_epoch (которые маски содержат). В конце "хода" мы их меняем местами.

Мы записываем значения с использованием маски new_epoch, а читаем - с использованием current_epoch.

... хотя, попрограммировав на rust, я могу сказать, что это будет не очень быстро. read-write цикл одного значения из памяти полностью сносит все предсказания процессора.

Видимо, running window с небольшим кешем - самое разумное. ... А вот эффективная реализация двухмерного кольцевого буффера - это, даже интересно. Нам нужен буффер 3x3, так что его можно сделать на чистой арифметике...

kompilainenn2 Aug 24 2021 at 14:41

оставляя без внимания мастерство, мягкие навыки

под мягкими навыками что скрывается? Soft skills?

alec_kalinin Aug 24 2021 at 14:48

Я бы для этой задачи использовал бы scientfic python с использованием свертки

import numpy as np
from scipy.ndimage import convolve

board = np.zeros(shape=(height, width), dtype=np.uint8)

kernel = np.array([[1, 1, 1], 
                   [1, 0, 1], 
                   [1, 1, 1]], dtype=np.uint8)
board_state = convolve(board, kernel, mode="wrap")

Для огромных досок используем sparse matrix representation, а для быстрых сверток можно использовать какой-нибудь deep learning framework.

GospodinKolhoznik Aug 24 2021 at 14:54

Вы серьезно потащили бы костыли городить, чтобы сэкономить память на копии массива? На мой взгляд спорное архитектурное решение. Что даст это переусложнение? Потребление памяти будет в 2 раза больше. То есть память не по экспоненте не по полному будет расти а всегда ровно в 2 раза. Как мне кажется такие проблемы надо решать докупкой памяти один раз, зато потом легко поддерживать и актуализировать по. Иначе мы тут капельку сэкономим, а потом в 1000 раз больше потратим на разгребание проблем с модификациями программы.

Ну так, чтобы на собеседовании поспрашивать об этом можно, а в продакшне не надо нарушать принцип kiss там, где его можно не нарушать.

TheGodfather Aug 24 2021 at 15:59

Я в универе писал лабораторную на Qt, и могу заметить, что когда размер поля становится достаточно большим (точных цифр не помню, но условно 500*500), то производительность уже начинает заметно падать (естественно, мы не говорим о разовом обновлении, а о нажатии кнопки типа «плей», которая обновляет несколько раз в секунду). В лабораторной я, конечно, кэша рядов не делал, обошелся копией поля, но все-таки мотивация видна невооруженным взглядом

DirectoriX Aug 24 2021 at 16:32

Возможно, дело не столько в копировании, сколько в долгой перерисовке?
Было бы интересно замерять время на 1 обновление с перерисовкой и, скажем, на 1000 обновлений с единственной перерисовкой в конце.

JustDont Aug 24 2021 at 17:26

Вот да. Потому что когда я это всё писал в универе (на яве, плюс ох и давно это было) — затык начинался очевидно в рендере, причем еще и настолько выдающийся, что даже минимальнейшие оптимизации прорисовки позволяли наращивать поле до размеров всего экрана.
Понятно, что какие-нибудь там триллионы на триллионы клеток поля уже бы начали тормозить и по рассчётам, но их не визуализировать, и "мотивации невооруженным взглядом" уже не будет.

farafonoff Aug 24 2021 at 17:19

500x500 это 250 000. Не знаю когда вы учились в универе, но когда я участвовал в студенческих олимпиадах, мы брали грубую оценку 10^6 "операций" в секунду. Соответственно грубо такое поле можно позволить себе обновлять 4 раза в секунду без всяких оптимизаций.

da-nie Aug 24 2021 at 17:50

обошелся копией поля,

Зачем его вообще копировать? Храните два указателя — новое поле и старое поле. Используйте для построения нового поля данные от старого поля. Потом указатели меняете местами.

DirectoriX Aug 24 2021 at 18:00

Такая же мысль при чтении статьи: зачем вообще что-то копировать, когда достаточно 1 раз сделать второе поле такого же размера и отрефакторить функцию так, чтоб она брала данные с первого поля и клала во второе, а на следующей итерации — обратно (см. «двойная буферизация»). Так будет около 0 расходов на копирование данных и даже на выделение памяти, которые неизбежны в «оптимизированном» варианте с его append'ами.

TheGodfather Aug 24 2021 at 18:05

Да-да, конечно, указатели были, это было очевидным улучшением)

GospodinKolhoznik Aug 24 2021 at 17:57

Производительность будет одинаковая при любом подходе. Меняется только потребление памяти ровно в 2 раза.

t13s Aug 24 2021 at 17:42

<минуткаЭмоций>
Я очень надеюсь, что в том аду, в котором обязательно окажутся все сторонники подобного подхода, температура в котле будет всего-то в два раза выше, чем у соседей.
</минуткаЭмоций>

Но если серьезно, то, во-первых, при неудачном стечении обстоятельств два массива могут просто-напросто не влезть в кэш процессора, что вызовет проблемы не только по памяти, но и по производительности.

Во-вторых, размышляя подобным образом и поощряя такой подход, мы со временем как раз и пришли к тому, что какой-нибудь несчастный мессенджер жрет полтора гигабайта оперативки. Базовая культура все-таки должна быть: на улицах не мусорить, в подол рубашки не сморкаться, память лишнюю не занимать.

DrGluck07 Aug 25 2021 at 13:59

Поэтому я бы начал свой ответ на вопрос с вопроса «а что у нас с ресурсами». В зависимости от ответа стал бы предлагать решение.

t13s Aug 25 2021 at 14:04

В общем и целом - вы правы.

Но в некоторых случаях (и это как раз такой) быстрее сразу реализовать более оптимальное решение, чем спрашивать, философствовать, дожидаться ответа и переносить из-за этого имплементацию на следующий спринт :)

DrGluck07 Aug 25 2021 at 14:06

Вот у нас микроконтроллер с 8K RAM. Заказчик хочет поле 1000х1000. Ну и какой метод оптимальнее? А если не контроллер, а обычный ПК и поле то же самое? А если пофиг на память, но нужно очень быстро? Или наоборот, поле здоровенное, а скорость не очень важна?

t13s Aug 25 2021 at 14:25

микроконтроллер с 8K RAM

скорее всего должен быть в описании условия задачи. И тогда тут либо спросить, возможна ли ситуация с > 3 000 живых клеток, либо изучать возможности использования другого микроконтроллера со 128К RAM, либо узнавать про наличие накопителя и предлагать решение, использующее страничный подход, либо объяснить заказчику, что он хочет странного.

обычный ПК

точно не будет против, если удастся сэкономить чуток памяти.

если нужно очень быстро

то смотреть в сторону параллелизма, а то и вообще расчетов на GPU. При этом выделение памяти в любом случае придется оптимизировать.

поле здоровенное

обычно означает, что наивная имплементация в реальной жизни по скорости никого не устроит, как бы это ни декларировалось в постановке задачи.

DrGluck07 Aug 25 2021 at 15:09

Вот и я об этом. А потом уже отвечать в зависимости от условий.
Единственное в чём я не уверен, что стоит экономить на спичках при реализации на ПК поля 1000х1000 (условно 1 мегабайт * 2). Если только у нас не сервер, на котором одновременно считается 1000000 таких партий.

UFO just landed and posted this here

BugM Aug 24 2021 at 19:51

Подпишусь.

Когда память начинает измеряться в терабайтах оптимизация по памяти в два раза за счёт усложнения алгоритма того стоит.

GospodinKolhoznik Aug 24 2021 at 21:24

А таких случаев, чтобы при накате патча ломался какой то старый функционал, потому что программа написана мудрено и разработчик патча не смог до конца понять некоторых аспектов, таких случаев не бывало?

UFO just landed and posted this here

micho1973 Aug 24 2021 at 15:43

Я упоминаю об этом вскользь, но на самом деле, то, что кандидат способен опознать и разделить эти два этапа, уже говорит в его пользу. Некоторые рубят сплеча и пытаются решить обе задачи одновременно – это не то чтобы плохо, но гораздо труднее. Здесь есть парадоксальный момент: разделение на две задачи упрощает имплементацию, но на практике оказывается сложнее, потому что требует концептуального рывка, который должен подсказать опыт.

Я все-таки не понял, почему эту задачу нельзя решить за один проход всего массива, сохраняя старые значения для тех клеток где они изменились.

Srgun Aug 24 2021 at 16:04

Если старое значение сохранять для всех, то по затратам памяти это то же самое, что 2 полных массива. Если старое сохранять только для изменённых - то оптимизация алгоритма по памяти будет сложнее, чем кеширование 2 строк, и, возможно, придётся сразу решать п.3

RA-NGR Aug 25 2021 at 10:54

Я, если память не изменяет, еще на спектруме, делал за один проход. Значения «старого поля» сохранял в промежуточном массиве 3х3, затем сдвигая его, этакое своеобразное «скользящее окно». А в дальнейшей модификации тупо вообще игрался битами, кодируя текущее состояние в нулевом, а новое в первом )))

Telmah Aug 24 2021 at 15:45

Написать про игру "Жизнь" и не упомянуть Джона Конвея - както совсем неправильно по моему...

anatolii_kostrygin Aug 24 2021 at 16:29

На хабре прошлым летом была пара хороших статей про дальнейшие ускорения алгоритма:

А вообще есть альтернативный путь решения задачи через динамическое программирование - https://en.wikipedia.org/wiki/Hashlife Идея в его основе такая:

Допустим, у нас есть квадрат $3n \times 3n$ . Тогда черезшагов состояние внутреннего квадрата $n \times n$ зависит только от исходного состояния клеток большого квадрата.
Допустим, у нас есть большая хэш-таблица, в которой мы умеем быстро искать по квадратам $3n \times 3n$ .
Тогда задача определения состояния квадрата $2n \times 2n$ через шагов решается делением квадрата на четвертинки и четырьмя обращениями к хэш-таблице.
Последовательно отращивая поле или удваивая время получим логарифмическую сложность.

Druj Aug 24 2021 at 16:40

Серьёзно? В 2021 году в очередной раз писать(!!! переводить!!) на хабр про простейшую реализацию «жизни» да ещё и в максимально простом варианте? Думаю что большая часть читателей просто клюнула на байт с «задачей из Reddita». Фу.

zim32 Aug 24 2021 at 16:45

Мне вот интересно сам этот сотрудник решит задачку поиска кратчайшего пути с учетом загрузки за 40 минут? А напишет алгоритм flood fill для произвольного полигона? А алгоритм поиска оптимального пира в п2 сети с учётом исходящей и входящей полосы? Может алгоритм парсинга бинарных выражений? Конечно же максимум за 40-50 минут. Если нет, то у меня вопрос что он делает в реддите?

Druj Aug 24 2021 at 16:56

1. Если загрузка это вес ребра то Дейкстра/Флойд
2. BFS
3. Хз что это
4. Если парсить то автомат, если вычислять то ОП нотация
Думаю что на пишет без проблем если будет знать что на собесе нужны вызубренные алгоритмы а не опыт работы. А если можно гуглить то и зубрить не надо.

kasthack_phoenix Aug 24 2021 at 17:17

А потом он проходит этот собес и пишет на реакте новый UI для reddit, который тормозит на шестнадцатиядерном десктопе.

M0rdecay Aug 24 2021 at 16:56

Предлагаю ЖизньЕнтерпрайзЕдишн (по аналогии)

Каждая клетка - отдельный класс, реализующий интерфейс:

type Cell interface {
	GetState() state
	NextState() error
  UpdateState() error
}

Где state - специальный отдельный тип, под капотом маппящий 1 как "жив" и 0 как "мёртв", чтоб можно было расширяться и добавлять новые состояния.

При вызове NextState() каждая клетка должна сходить в один из апи-сервисов, узнать состояние соседей, высчитать своё следующее состояние и приготовиться обновиться по вызову UpdateState().

Создаем сервис-менеджер, который может хранить в себе кусочек поля:

type CellManager struct {
    Cells []Cell
}

func (m *CellManager) Initialize(from, to int64) error {}

func (m *CellManager) Next() error {}

func (m *CellManager) Update() error {}

Менеджеры клеток можно разделить по нескольким дата-центрам, каждый из менеджеров может обслуживать свой кусочек поля. Next() и Update(), конечно, асинхронные.

Для большей ентерпрайзности можно положить всё в кубер, а каждый менеджер пусть хранит данные в выделенной базёнке, и чтоб всё масштабировалось налету в зависимости от изначально заданного размера поля.

Теперь нам нужен апи-сервис. Апи-сервис должен знать о расположении всех менеджеров (допустим, что эта информация хранится в кластере Consul). Когда апи получает команду на обновление, он асинхронно кидает команду на менеджеры о вычислении следующего состояния. Когда все вычисления завершаются, отдаётся команда на обновление.

К апи-сервису прилагается какой-нибудь веб-сервер с фронтом, который отображает красивую картинку.

P.S. не воспринимайте серьёзно, просто идея за обеденной чашкой кофе.

t13s Aug 24 2021 at 17:52

высчитать своё следующее состояние

(Удивленного, с недоумением и оттенками презрения во вгляде) что, сама? Помилуйте, голубчик, это же просто POD, а вы в него логику пихаете, да еще с такими букетом зависимостей! Тут отдельный сервис требуется, а то и три!

Femistoklov Aug 24 2021 at 19:16

О! Вас бы с радостью взяли в целую кучу компаний, где меня безуспешно пытались собеседовать! Могу дать все явки. Мне - процент от первой ЗП.

pavelsc Aug 24 2021 at 19:15

Опубликуйте лучше список зарегистрированных в СНГ компаний, в которых на собеседовании дают "типовые задачи на алгоритмы", чтоб сразу в спам офферы с их доменов кидать фильтром.

t13s Aug 25 2021 at 13:49

А как вы предпочитаете демонстрировать потенциальным работодателям свою компетентность?

net_racoon Aug 25 2021 at 10:13

Пробежался по тексу, возможно что-то упустил. Да я и не программист совсем. Но есть вопрос, а нельзя делать не массив, а связку клеток. Т.е. есть клетка, у нее указатель на соседа сверху, снизу, справа, слева и т.д. ?

t13s Aug 25 2021 at 13:40

Т.е. вместо одного бита (ну или байта - в зависимости от реализации) на состояние клетки предлагаете хранить 64*4+1 = 257 бит? :)

petropavel Aug 25 2021 at 17:30

Ну, вообще-то он предлагает вместо 1е6х1е6=1е12 бит, хранить 257*N бит. Одну глайдерную пушку так считать наверняка лучше.

t13s Aug 25 2021 at 17:41

Тогда 257 не хватит. Надо же как-то уметь еще обрабатывать пересечения из различных кластеров точек, т.е. координаты каждой точки хранить, видимо.

Zoomerman Sep 10 2021 at 14:03

Шаг 1: строим вторую матрицу, содержащую сумму соседей для каждой клетки

Шаг 2: изменяем первую матрицу, фильтруя количество соседей по алгоритму, пробегаясь по второй матрице

Если памяти недостаточно - режем вспомогательную матрицу, превращаем в буфер, работаем по принципу скользящего окна.

Если вычислительной мощности недостаточно - распараллеливаем процесс на ядра, GPU, кластер.

Давно уже не сталкивался с задачами, для которых недостаточно оперативной или дисковой памяти. А вот с задачами, в которых узкое место - процессор, сталкиваюсь постоянно.