Articles / Bookmarks / Profile of DistortNeo / Habr

Андрей @DistortNeo

Математик, программист

ProfileArticles3PostsNewsComments8.5K

1shaman Dec 15 2021 at 08:00

15 супер полезных примеров команды find в Linux

9 min

123K

FirstVDS corporate blogConfiguring Linux*System administration*

Translation

Практические примеры, которые приведены в этой статье, помогут вам освоить очень эффективную и крайне полезную команду find.

Читать дальше →

+31

Olga_NasheVremya Jan 6 2022 at 11:01

Хватит совать в детей интерфероны

9 min

123K

Наше время corporate blogHealthPopular science

Интерфероны? Да в задницу их!

Это, как многие думают, концентрат иммунитета. Коротко — нет.

Что происходит:

Ребёнка с симптомами ОРВИ приводят к педиатру.
Педиатр прописывает витамин С, разбавленный сахар и интерферон в форме ректального суппозитория. Если витамин С и дорогой сахар в целом безопасны, то вот с интерфероном это далеко не так.
Уровень интерферона в крови — это сложнейшая система, дающая сигнал к запуску процесса иммунного ответа, связующее звено врождённого и приобретённого иммунитета, но добавление интерферона в организм не означает, что иммунитет будет «сильнее». Упрощая, интерфероны тормозят работу заражённых клеток и дают другим клеткам вокруг поражённой вирусом сигнал, что произошло вторжение, останавливают деление вируса внутри клетки и стимулируют работу Т- и В-лимфоцитов. Так же они способны влиять на деление клеток, что важно при онкологии, например.

Изначально этот класс белков случайно открыли в 1957 году вирусологи Алик Айзекс и Жан Линдеман. У них возникла проблема с мышами, которые не заболевали при введении вируса. Как выяснилось позже, причина была в том, что эти мыши уже болели другой вирусной инфекцией, что приводило к выбросу белков ранее неизвестного класса — интерферонов. Поначалу казалось, что наконец найдено универсальное решение против вирусных болезней, но, как обычно, дальнейшие исследования выявили множество ограничений. Например, при введении серьёзных дозировок интерферона альфа можно получить жёсткую депрессию, биполярное расстройство и другие ментальные нарушения вплоть до бреда и галлюцинаций.

Поэтому сегодня я попробую объяснить, почему этот класс препаратов вовсе не добрые капельки от гриппа, а серьёзное лечение с кучей побочных эффектов. Ну и бесполезность введения его в нос и per rectum тоже затронем.

Читать дальше →

+180

231

stranger777 Jan 5 2022 at 12:12

Компилятор C# 10, .NET 6 и интерполяция строк

24 min

19K

Skillfactory corporate blogC#*Compilers*.NET*Programming*

Translation

К старту курса по разработке на C# делимся материалом из блога .NET о том, как компилятор C# 10 и .NET 6 упрощают программирование, как они обращаются с форматированием, а также о причинах конкретных решений команды .NET. И это далеко не всё. За подробностями приглашаем под кат.

+25

prickly_u Aug 26 2018 at 15:36

Mask R-CNN: архитектура современной нейронной сети для сегментации объектов на изображениях

13 min

102K

Artificial IntelligenceMachine learning*Image processing*

Времена, когда одной из самых актуальных задач компьютерного зрения была способность отличать фотографии собак от фотографий кошек, уже остались в прошлом. На данный момент нейронные сети способны выполнять куда более сложные и интересные задания по обработке изображений. В частности, сеть с архитектурой Mask R-CNN позволяет выделять на фотографиях контуры («маски») экземпляров разных объектов, даже если таких экземпляров несколько, они имеют различный размер и частично перекрываются. Сеть так же способна к распознаванию поз людей на изображении.

Читать дальше →

+19

vovaf709 Jan 1 2022 at 20:18

Обзор архитектуры Swin Transformer

7 min

16K

Image processing*Machine learning*

Трансформеры шагают по планете! В статье вспомним/узнаем как работает visual attention, поймём что с ним не так, а главное как его поправить, чтобы получить на выходе best paper ICCV21.

Автоботы, трансформируемся!

tyomitch Dec 6 2021 at 13:00

История славянских шипящих: почему мы пишем жи-ши через И?

7 min

45K

RUVDS.com corporate blogLearning languagesPopular science

tl;dr: потому что перед Ы не могли возникнуть ни Ж, ни Ш.

Орфография многих живых языков отражает давно исчезнувшие вещи: например, написание английского слова knight указывает на то, что когда-то в 14 в. оно произносилось «книхт». В русской орфографии тоже полно «доисторических окаменелостей»; и для того, чтобы не зубрить, а понимать орфографические правила — нужно разбираться, откуда эти правила взялись. Готового обзора истории шипящих я не нашёл, так что взялся составить его сам. Особенно интригует природа буквы Щ — самой необычной в нашем алфавите.

Читать дальше →

+101

235

EnglishDom Nov 19 2021 at 16:00

Сатурн по субботам, или Почему дни недели на английском такие странные

6 min

39K

EnglishDom corporate blogLearning languages

Названия дней недели на английском зачастую учат уже на первых занятиях. И мы заметили, что абсолютное большинство студентов просто привыкают к ним и не задумываются над историей их происхождения.

А она очень интересная, ведь названия дней недели практически без изменений пришли со староанглийского языка — им уже больше полутора тысяч лет. И с их помощью вы славите скандинавских богов. Сегодня рассказываем о них. Поехали!

+60

itsoft Nov 22 2021 at 21:38

Если мошенники украли деньги с банковской карты — не спешите в полицию

8 min

185K

ITSOFT corporate blogInformation Security*Legislation in ITFinance in IT

Мне давно надоели эти банки, но инфопространство постоянно забито историями, как мошенники в очередной раз украли деньги, причём даже без социальной инженерии.

Народ жалуется на Tinkoff, Альфа-банк и прочие банки, на операторов сотовой связи. Портал banki.ru ввёл драконовские правила, что у него решения судов без оценок в народном рейтинге, на форуме нельзя написать, что itsoft выиграл дело у ВТБ — это реклама itsoft видите ли, то есть видно надо писать одна компания, но не скажем какая выиграла суд у ВТБ.

В статье “Банки не хотят внедрять многофакторную авторизацию и покончить с мошенничеством” есть простые рецепты, которые бы исключили случаи мошенничества хотя бы для тех, кто не разговаривает с мошенниками и не сообщает им коды. Народ хочет аппаратные токены, а банки не дают.

К написанию данной статьи меня ещё подвиг наш конфликт с хостером Leaseweb. 7 лет мы платили одну цену в месяц за аренду серверов там. А потом она внезапно выросла в 70 раз. Leaseweb решил, что за действия злоумышленников деньги надо списать с нашей корпоративной карты.

Банки и корпорации разрабатывают свои договоры и внутренние инструкции таким образом, чтобы не иметь никакой ответственности перед клиентом, а клиента ободрать до нитки за действия третьих лиц, даже если закон прямо говорит, что банк обязан вернуть клиенту деньги.

+160

210

ddimitrov Nov 2 2021 at 11:34

ruDALL-E: генерируем изображения по текстовому описанию, или Самый большой вычислительный проект в России

10 min

172K

Сбер corporate blogSberDevices corporate blogImage processing*Machine learning*Artificial Intelligence

2021 год в машинном обучении ознаменовался мультимодальностью — активно развиваются нейросети, работающие одновременно с изображениями, текстами, речью, музыкой. Правит балом, как обычно, OpenAI, но, несмотря на слово «open» в своём названии, не спешит выкладывать модели в открытый доступ. В начале года компания представила нейросеть DALL-E, генерирующую любые изображения размером 256×256 пикселей по текстовому описанию. В качестве опорного материала для сообщества были доступны статья на arxiv и примеры в блоге.

С момента выхода DALL-E к проблеме активно подключились китайские исследователи: открытый код нейросети CogView позволяет решить ту же проблему — получать изображения из текстов. Но что в России? Разобрать, понять, обучить — уже, можно сказать, наш инженерный девиз. Мы нырнули с головой в новый проект и сегодня рассказываем, как создали с нуля полный пайплайн для генерации изображений по описаниям на русском языке.

В проекте активно участвовали команды SberAI, SberDevices, Самарского университета, AIRI и SberCloud.

Мы обучили две версии модели разного размера и дали им имена великих российских абстракционистов – Василия Кандинского и Казимира Малевича:

1. ruDALL-E Kandinsky (XXL) с 12 миллиардами параметров;

2. ruDALL-E Malevich (XL), содержащая 1,3 миллиарда параметров.

Некоторые версии наших моделей доступны в open source уже сейчас:

1. ruDALL-E Malevich (XL) [GitHub, HuggingFace]

2. Sber VQ-GAN [GitHub, HuggingFace]

3. ruCLIP Small [GitHub, HuggingFace]

4. Super Resolution (Real ESRGAN) [GitHub, HuggingFace]

Две последние модели встроены в пайплайн генерации изображений по тексту (об этом расскажем ниже).

Версии моделей ruDALL-E Malevich (XL), ruDALL-E Kandinsky (XXL), ruCLIP Small, ruCLIP Large, Super Resolution (Real ESRGAN) также скоро будут доступны в DataHub.

Обучение нейросети ruDALL-E на кластере Christofari стало самой большой вычислительной задачей в России:

1. Модель ruDALL-E Kandinsky (XXL) обучалась 37 дней на 512 GPU TESLA V100, а затем ещё 11 дней на 128 GPU TESLA V100 — всего 20 352 GPU-дней;

2. Модель ruDALL-E Malevich (XL) обучалась 8 дней на 128 GPU TESLA V100, а затем еще 15 дней на 192 GPU TESLA V100 – всего 3 904 GPU-дня.

Таким образом, суммарно обучение обеих моделей заняло 24 256 GPU-дней.

Разберём возможности наших генеративных моделей.

+106

185

Nurked Oct 27 2021 at 13:00

Шарим (в) консоль

5 min

19K

RUVDS.com corporate blogAbnormal programming*Configuring Linux*Logic gamesSystem administration*

Мы уже все привыкли, что конференции проводятся виртуально. Мы все работаем через зумы, скайпы, миты и тимзы. Удобно, конечно, но у нас есть одна занудная проблема. Когда нам, программистам надо расшарить экран, мы тяжело вздыхаем и нажимаем кнопку Share Screen. Всё это не без проблем.

Как показать детям те прелести, которые происходят в консоли?

Самое неприятное — это когда возникает необходимость показать какую-то ссылку на экране. После завершения операции в консоли отобразилась ссылка, или ключ, который надо расшарить с командой. Естественно, приходится выделять, копировать и «дублировать в чатик». Особенно это неудобно, когда в чатик надо продублировать то, что выплюнула тебе какая-нибудь команда терминала. Строки, конечно же, заботливо съедут, форматирование потеряется, а цвета поблёкнут.

Читать дальше →

+71

ITSumma Aug 4 2021 at 09:19

Как симулировать плохую сеть под Linux, macOS и Windows

3 min

26K

ITSumma corporate blogMobile applications testing*Web services testing*IT systems testing*Software

Tutorial

Clumsy 0.2

Все распределённые системы — базы данных, мобильные приложения, корпративные SaaS и так далее — следует разрабатывать с учётом сбоев. Например, компания Stripe во время тестов убивала случайные инстансы — и смотрела, что произойдёт. Компания Netflix рандомно уничтожала инстансы прямо в продакшне с помощью программы Chaos Monkey (проект Simian Army).

Симуляция сбоев — необходимое средство тестирования. Проблема в том, что ситуации не делятся только на чёрное и белое, Есть огромная «серая» зона, где сбои явно не выражены, а проявляются в плохих условиях сети: ненадёжное соединение, узкий канал, потери пакетов, высокая задержка, дубликаты пакетов и так далее.

Читать дальше →

+45

Asya_Dyu Oct 13 2021 at 14:05

Здоровый сон взрослого человека — это засыпать за 15 минут и не вставать ночью попить и пописать

13 min

167K

Timeweb Cloud corporate blogGTD*BiologyHealthPopular science

Послушала на днях 2х-часовое выступление «Здоровый сон» врача-невролога, сомнолога Елены Царевой. Выдернула самые важные для себя пункты:

Спать регулярно, ложиться и вставать в одно и то же время — самое важное.
Биоритмы — частично наследуются, частично регулируются стилем жизни. На них можно влиять самому.
Нормальное время отхода ко сну около 22:00. Сова и жаворонок — это отклонение на ±1-2 часа. Больше — это нарушение и сдвиг фазы сна, чаще из-за внешних раздражителей.
Самая частая причина плохого сна и тяжелого засыпания — неправильный свет.
Для сдвига режима на 1 час организму нужен 1 день на адаптацию.
Невозможно «доспать» бессонную ночь. Досыпание устраняет только 30% последствий недосыпа.
Прежде, чем искать причины плохого сна, исключите психологические проблемы (тревожность, депрессию), нарушения щитовидки, дефицит железа, диабеты, сердечно-сосудистые заболевания и патологию почек и мочеполовой системы.
Водителям и пассажирам: 17 часов без сна равны 0,5 промилле, 21 час без сна — 0,8 промилле.
В постели без сна больше 15 минут не находиться — совет при бессоннице.
Самые физиологичные будильники — те, что светятся.

Под катом конспект 2х-часового выступления про сон на 15 минут чтения. Еще один поинт в копилку полезных материалов про сон — Sleep Hackers.

Читать дальше →

+127

247

Deleted-user Oct 12 2021 at 18:45

Особенности работы с POSIX-сигналами

10 min

16K

Programming*C++*System Programming*C*Development for Linux*

Как и любой другой инструмент, POSIX-сигналы имеют свои правила, как их использовать грамотно, надежно и безопасно. Они испокон веков описаны в самом стандарте POSIX, в стандартах языков программирования, в manpages, однако и по сей день я нередко встречаю связанные с этим грубые ошибки даже в коде опытных разработчиков, что в коммерческих проектах, что в открытых. Поэтому давайте поговорим о важном еще раз.

+61

belyalova Oct 12 2021 at 12:17

Копнем поглубже: сравниваем популярные алгоритмы оптимизации с менее известными. Часть 2

6 min

6.1K

Prequel corporate blogAlgorithms*Artificial IntelligenceMachine learning*Image processing*

Еще раз здравствуй, Хабр! Меня зовут Мария Белялова, и я занимаюсь data science в мобильном фоторедакторе Prequel. Кстати, именно в нём и обработана фотография из шапки поста.

Эта вторая статья в нашем цикле материалов про сравнение алгоритмов оптимизации для обучения нейросетей. В первой части мы сравнивали поведение 39 алгоритмов на тестовых функциях. Если вы ее еще не читали, то советуем начать с нее. Также в прошлой статье мы кратко рассказали, в связи с чем появляется так много разных оптимизаторов для нейросетей.

В этой статье мы посмотрим, как они ведут себя на игрушечной задаче — распознавании цифр из датасета MNIST. В следующей части мы проверим эти алгоритмы в бою на реальной задаче из продакшена. Код для этой и предыдущей части находится здесь.

Читать дальше →

KD637 Oct 7 2021 at 19:33

Как написать генератор изображений, который вас понимает

13 min

44K

Skillfactory corporate blogWebsite development*Python*Programming*Machine learning*

Tutorial

Translation

Автор статьи рассказывает, как за неделю создал Text2Art.com — генератор изображений на основе VQGAN+CLIP, способный рисовать пиксель-арт и живопись, а также изображать то, что вы напишете в текстовом поле.

Для интерфейса используется Gradio, модель работает на сервере FastAPI, а системой очереди сообщений служит Firebase. Подробностями делимся к старту курса по ML и DL.

+11

dom1n1k Jun 28 2016 at 11:56

Об относительной яркости, или насколько живучим бывает легаси

6 min

41K

Image processing*IT Standards*

Я уверен, что многим программистам знакома формула:

$Y = 0.299 R + 0.587 G + 0.114 B$

А уж тот, кто плотно работал с графикой, знает эти цифры буквально наизусть — как в былые времена эникейщики запоминали серийники Windows. Иногда коэффициенты округляют до второго знака, иногда уточняют до четвертого, но каноническая форма именно такая.

Вычисляет она относительную яркость цвета (relative luminance или в некоторых контекстах luma; не путать с lightness и brightness) и широко применяется для преобразования цветного RGB-изображения в Grayscale и связанных с этим задач.

Формула растиражирована и процитирована в тысячах статей, форумных обсуждений и ответов на StackOverflow… Но дело в том, что единственно-правильное её место — на свалке истории. Использовать её нельзя. Однако же используют.

Но почему нельзя? И откуда же взялись именно такие коэффициенты?

Мини-экскурс в историю

+87

130

Bright_Translate Aug 29 2021 at 14:00

Переносим философию Unix в 21 век

5 min

23K

RUVDS.com corporate blogServer Administration*Configuring Linux**nix*System administration*

Translation

Один из основных принципов философии Unix заключается в создании таких программ, каждая из которых эффективно выполняет всего одну задачу, и связывании этих программ в конвейер. Подобный подход отлично зарекомендовал себя за десятилетия существования системы.

В статье же речь пойдет о том, чего ощутимо не хватает современным системам Linux с точки зрения этой философии, а также будет предложено решение связанных с этим проблем.

Читать дальше →

+119

Kilor Aug 17 2021 at 09:10

PostgreSQL Antipatterns: «слишком много золота»

6 min

14K

Тензор corporate blogHigh performance*PostgreSQL*SQL*Database Administration*

Иногда мы пишем SQL-запросы, мало задумываясь над тем фактом, что сначала они должны быть по сети как-то доставлены до сервера, а затем их результат - обратно в клиентское приложение. Если при этом на пути до сервера присутствует еще и пулер соединений типа pgbouncer, дополнительно "перекладывающий" байты между входящими и исходящими коннектами, ситуация становится еще тяжелее...

Поэтому сегодня рассмотрим некоторые типичные ситуации, в которых разработчики иногда принимают не самые оптимальные решения, гоняя по сети мегабайты трафика при общении с сервером PostgreSQL - а заодно посмотрим, как можно увидеть такую ситуацию в плане с помощью explain.tensor.ru и подумаем над вариантами, как сделать подобное взаимодействие более эффективным.

+27

Kirill_Nikiforov Aug 9 2021 at 15:36

Взгляд изнутри: цены на видеокарты и чего ждать от рынка завтра?

7 min

42K

ASUS corporate blogDesktop PC'sVideo cardsComputer hardware

Привет, Хабр!

Ты, наверняка, знаешь, что большинство крупных бизнесов с более 100% дохода находятся по ту сторону закона. В конце 2020 года такие прибыли стали повседневной реальностью для продавцов видеокарт, что с одной стороны легально, а с другой — очень непривычно для этой индустрии. Как такое произошло, кто остался в плюсе, что будет дальше и как быть геймерам, об этом я хочу рассказать сегодня.

+18

belyalova Jul 20 2021 at 10:29

Копнём поглубже: сравниваем популярные алгоритмы оптимизации с менее известными

7 min

13K

Prequel corporate blogImage processing*Machine learning*Artificial IntelligenceAlgorithms*

Привет, Хабр! Меня зовут Мария Белялова, и я занимаюсь data science в мобильном фоторедакторе Prequel.

Эта статья открывает наш цикл материалов со сравнением алгоритмов оптимизации для обучения нейросетей. Помимо классических методов, которые давно зарекомендовали себя, мы рассмотрим и менее известные методы, и совсем новые: например, алгоритм MADGRAD, разработанный в Facebook в этом году. В первой статье мы сравним поведение алгоритмов на тестовых функциях, во второй — посмотрим, как они ведут себя на игрушечной задаче по распознаванию цифр из датасета MNIST, а в третьей — проверим эти алгоритмы в бою на реальной задаче из продакшена.

Читать дальше →

+15

1 2

4 5 6 7 8