Комментарии / Профиль captain

В голову пришла мысль, что врачи могут всё писать на бумаге, чтобы было быстро, а потом эти бумаги уносят синкаться в базу.
Выйгрыш в том, что вбивальщики просто сидят на конвеере, не отвлекаются на врача с пациентом и не сбивают ритм. И главное, их нужно гораздо меньше, чем в каждый кабинет.
С чуваками ещё оставлять на смене какого-нибудь врача, чтобы он если что помогал.

Как и зачем мы сделали свои банкоматы

captain_obvious 13 мая 2018 в 15:52

Вот это кстати тема. Идёшь по улице, тебе пуш на телефон приходит: «В 50 метрах можно положить наличку в наш банкомат и получить 2% сверху».

Новая профессия: «помощник виртуальных знакомств»

captain_obvious 29 апр 2018 в 08:56

Роберт Шекли, "Мой двойник — робот".

Шпаргалка для технического собеседования

captain_obvious 3 мар 2018 в 10:20

Основная разновидность — линейные массивы, или одноразмерные.
Их размер статичен, то есть при объявлении линейного массива задаётся фиксированный размер.

Неясно, почему линейные массивы противопоставляются динамическим. Подразумевались, очевидно, статические массивы.

Вставка: линейный массив — недопустимо, динамический массив — O(n).

Действительно, вставка в динамический массив происходит за O(n), но эта информация не очень полезна без того факта, что в силу мультипликативной стратегии реаллокации амортизиованная сложность вставки получается O(1), то есть последовательная вставка n элементов произойдёт не за O(n^2), как можно было бы подумать, а за O(n).

Данные хранятся в узлах, указывающих на другие узлы.
Узел содержит один элемент данных и одну ссылку (на другой узел).
Связный список соединяет узлы друг с другом с помощью ссылок от одного узла к другому.

Под определение, которое дано в статье подходит всякая ересь, например:

Оптимизированный поиск: связный список — O(n).

Неясно, что такое оптимизированный поиск в связном списке.
(оффтоп: чутка развив идею списка можно делать на нём аналог двоичного поиска, гуглить skip list).

Этот процесс называется хэшированием: однозначным сопоставлением друг другу входных и выходных данных.

Вот это жесть, конечно. Конечно, хэширование не занимается однозначным сопоставлением, потому что значений хэшей должно быть меньше, чем значений хэшируемых объектов, чтобы это имело хоть какой-то смысл.

Хэш-коллизиями называются ситуации, когда для двух разных входных данных функция возвращает одинаковые выходные данные.
Эта проблема свойственна всем хэш-функциям.
Часто она решается с помощью увеличения хэш-таблиц до огромного размера.

Решается она не так, конечно, а с помощью использования стратегий разрешения коллизий. Гуглить цепочки, линейное разрешение, двойное хэширование, хэширование кукушки.

Двоичное дерево — это такая структура данных, в которой каждый узел имеет максимум два дочерних элемента.
Дочерние элементы бывают левым и правым.

При этом у каждой вершины не больше одного левого сына и не больше одного правого.

Индексирование: двоичное дерево поиска — O(log n).
Поиск: двоичное дерево поиска — O(log n).
Вставка: двоичное дерево поиска — O(log n).

Все эти операции работают за O(высота дерева). Если дерево сбалансированное, то тогда это действительно O(log N), но само по себе дерево сбалансированным навряд ли станет.
Существуют хитрые двоичные деревья, которые всегда остаются сбалансированными. Гуглить, например, красно-чёрное дерево, AVL-дерево, splay-дерево.

Поиск в ширину оптимален для поиска по дереву, чья ширина превышает глубину.
Это почему вдруг? С точки зрения времени алгоритм всегда обработает каждую вершину 1 раз, а каждое ребро – 2 или 1 раз (в зависимости от того, ориентированный граф или нет). Если же хочется пооптимизировать память, то поиск в ширину наоборот тратит меньше памяти на очередь на «глубоких узких» графах (потому что слои получаются маленькие).

В связи с использованием очереди такой метод поиска потребляет больше памяти, чем поиск в глубину.

Ну неясно. Поиск в глубину же стек поддерживает пока ходит (неявно, через рекурсию). Те же самые O(V) памяти.

E — количество рёбер (граней?).

Рёбер. Грань – область, ограниченная рёбрами в плоском графе и не содержащая внутри себя вершин и рёбер графа.

[Поиск в глубину] Алгоритм оптимален для поиска по дереву, чья глубина превышает ширину.

Аналогично, с точки зрения времени всё то же самое, а с точки зрения памяти всё ровно наоборот.

Сравнение поисков в ширину и в глубину
Выбирайте тип поиска в соответствии с размером и формой дерева.
Для широких, мелких деревьев используйте поиск в ширину.
Для глубоких, узких деревьев используйте поиск в глубину.

Если уж заморачиваться, то ровно наоборот.

Вообще, поиск в ширину и поиск в глубину – это базовые алгоритмы, из которых потом растут свои ответвления, например:

с помощью поиска в ширину можно искать кратчайшие пути в невзвешенном графе
с помощью поиска в глубину можно искать мосты и точки сочленения.

Сравнение данных с помощью алгоритма сортировки:
Весь набор данных делится минимум на две группы.
Пары значений сравниваются между собой, наименьшее перемещается влево.
После сортировки внутри всех пар, сравниваются левые значения двух левых пар. Таким образом, создаётся группа из четырёх значений: два наименьшие — слева, наибольшие — справа.
Процесс повторяется до тех пор, пока не останется только один набор.

~~Каша, мёд, говно и пчёлы.~~ Сначала, я так понял, автор начал описывать рекурсивную реализацию, а потом описал итеративную.
«Весь набор данных делится минимум на две группы» – первый шаг рекурсивного алгоритма. Затем каждая часть рекурсивно сортируется и сливается.

Наилучший вариант сортировки: сортировка слиянием — O(n).
Средний вариант сортировки: сортировка слиянием — O(n log n).
Худший вариант сортировки: сортировка слиянием — O(n log n).

Сортировка слиянием всегда работает ровно за O(n log n).

Жадные алгоритмы используются для поиска оптимального решения данной проблемы.

Все алгоритмы в идеале используются для поиска оптимального решения конкретной проблемы. Специфика жадных алгоритмов в том, что их наоборот часто используют для поиска хоть каких-то решений в задачах, в которых искать оптимальное решение не представляется возможным.

Псевдокод жадного алгоритма для поиска самой большой разницы между двумя числами в массиве

Псевдокод жадного алгоритма для поиска самой большой разницы между двумя соседними числами в массиве.

На шаг ближе к С++20. Итоги встречи в Торонто

captain_obvious 29 сен 2017 в 17:20

Да и первая хороша
SUM(a, b) * SUM(c, d) == a + b*c + d

Сheat-sheets «регулярные выражения»

captain_obvious 23 сен 2017 в 16:21

Так можно и поматчить их как .*?, а чё, все правильные email адреса сматчатся, а на false-positive плевать. На практике, конечно, я согласен с тем, что матчить email адреса нужно по наличию ровно одного @ (ваш регэкс, кстати, сматчит и a@b@c), а затем просто слать email, если хочется удостовериться, что email валидный (и, более того, скорее всего настоящий).

Сheat-sheets «регулярные выражения»

captain_obvious 23 сен 2017 в 15:50

1. Пожалуйста, больше никогда не вываливайте набор символов вроде
#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})
в немоноширинной гарнитуре, это призыв к насилию и вообще экстремизм
2. Электронные адреса не соответствуют никакой регулярной грамматике, а потому и нельзя проверить их никаким регулярным выражением ¯\_(ツ)_/¯
3. То, что должно матчить HTML-теги сматчит не только HTML-теги.

Манифест Ричарда Столлмана: How I do my computing

captain_obvious 6 ноя 2016 в 19:22

GNU/Linux
// Столлман мод

Сотню старичков могут выбросить на улицу

captain_obvious 21 июн 2016 в 23:18

В Португалии занимаемся чартерной авиацией (http://jetway.to), нужно серверов восемь-десять для просчёта логистики.
Забрать могу прямо из Утрехта во второй половине июля.
mingalev@jetway.to

Twitter купил нейросеть Magic Pony для повышения резкости изображений и видео

captain_obvious 20 июн 2016 в 20:59

Питерцы чемпионы мира! Не хоккеем, так программированием

captain_obvious 20 мая 2016 в 02:39

> Context
Contest?

Ищем замену Digital Ocean среди отечественных хостинговых компаний

captain_obvious 27 апр 2016 в 07:49

-_____-
https://toster.ru/user/splastunov/answers

Теперь официально: люди плохо понимают значение используемых ими эмодзи

captain_obvious 17 апр 2016 в 19:45

А как так получилось, что опрос проводили среди 300 человек, а на диаграмме всего 37?

Посмотрел оригинальную работу. Откуда взялась диаграмма выше так и не понял, а в самой статье лежит куда более интересная.

Новый браузер Brave от сооснователя Mozilla будет платить пользователям за просмотр рекламы

captain_obvious 6 апр 2016 в 12:28

Пользователи, которые не верифицировались, денег не получат, но их доля также просчитывается, и автоматически отправляется владельцам сайтов, которые сами эти пользователи посещают чаще других.

Делаешь ферму неверифицированных кликеров, которые сидят на твоём сайте

Я знал, как валидировать email-адрес. Пока не прочитал RFC

captain_obvious 13 янв 2016 в 00:22

Про сценарии различные согласен, разумеется.
Вообще интересны какие-нибудь исследования про долю ошибок в поле емейла, которые отсекаются чем-то сложнее проверкой наличия коммерческого at и точки, отделяющей TLD.

Я знал, как валидировать email-адрес. Пока не прочитал RFC

captain_obvious 12 янв 2016 в 23:34

Лучший способ проверить email на валидность — отправить туда письмо.

+38

2 3 4