Articles / Bookmarks / Profile of ggJa / Habr

Алексей Савчик @ggJa

User

Profile Publications Comments 105Bookmarks 22

greck Sep 10 2022 at 12:31

1. Теория информации + ML. Энтропия

9 min

16K

Mathematics*Machine learning*Statistics in IT

Tutorial

Теория Информации и Machine Learning мне видятся как интересная пара областей, глубокая связь которых часто неизвестна ML инженерам, и синергия которых раскрыта ещё не в полной мере.

Начнём с базовых понятий Энтропии, Информации в сообщении, Mutual Information, пропускной способности канала. Далее будут материалы про схожесть задач максимизации Mutual Information и минимизации Loss-а в регрессионных задачах. Затем будет часть про метрику Фишера, геодезические и градиентные методы, и их связь с гауссовскими процессами.

+14

greck Nov 19 2022 at 11:50

3. Теория информации и ML. Прогноз

31 min

7.2K

Mathematics*Machine learning*

Tutorial

Понятие Mutual Information (MI) связано с задачей прогноза. Собственно, задачу прогноза можно рассматривать как задачу извлечения информации о сигнале из факторов. Какая-то часть информации о сигнале содержится в факторах. И если вы напишите функцию, которая по факторам вычисляет число близкое к сигналу, то это и будет демонстрацией того, что вы смогли извлечь MI между сигналом и факторами.

+10

Alex4yb Aug 15 2022 at 14:14

Сложный опыт: как мы наняли 50 человек с завода в ИТ-поддержку и по каким граблям прошлись

7 min

27K

КРОК corporate blogProject management*Personnel Management*

Крупное производство с несколькими заводами на разных участках. Техпроцесс зависит от работы систем связи, а на них АСУ ТП и промышленное видеонаблюдение за станками и опасными участками. Если хотя бы одна рация на участке не работает — работать нельзя. Работать с СКС/ЛВС в колодцах, погружаясь на большую глубину, ремонтировать системы видеонаблюдения в строительных люльках на высоте выше 10 метров, работать под напряжением до 1000 В — всё это на заводе рутина.

На производстве есть своя команда из 50 человек, разбитая по площадкам. Условно, на каждой площадке есть несколько ролей, и они работают сменами с покрытием 24/7, то есть каждый инженер работает только процентов 10–15 времени, а остальное время дежурит удалённо и «~~плюёт в потолок»~~ осуществляет проактивный мониторинг. Производство решает перейти от модели постоянных дежурств к профилактике и быстрым выездам: по их расчёту, тогда будут незакрыты только риски массовых аварий на разных площадках, а всё остальное окупается за счёт экономии при большей утилизации времени команды.

Это всё планируется отдать в аутсорсное управление интегратору, потому что сам завод умеет отлично делать свои изделия, но не является сервисной ИТ-компанией. Играется тендер, одно из условий которого — принять на 3-летний контракт старую команду, которая уже этим занималась по местам.

Мы побеждаем, принимаем старую команду, нам передают дела — и начинается жесть.

Сейчас прошло два года, и я уже могу более-менее рассказывать, почему вам никогда не стоит повторять такие незабываемые приключения.

+49

149

iLushkersky Jul 3 2022 at 17:00

Антиматерия и бариогенезис. Три причины, почему нет антивещества, но есть мы

13 min

13K

Popular sciencePhysicsAstronomy

Изучая окружающий мир мы пришли к выводу, что вещество состоит из частиц, которые можно описать с помощью некоторой теории. Но с помощью этой же теории можно предсказать частицы с совершенно противоположными свойствами, и они должны существовать в нашем мире. Но почему мы не видим их? Потому что их нет. В статье я расскажу о трёх причинах, почему это так.

+37

sshmakov May 8 2022 at 12:23

Как правильно имитировать Agile?

15 min

35K

Project management*Agile*

Подобная статья должна была появиться раньше, лет десять или пятнадцать назад, когда Agile только начинал внедряться в ИТ-компаниях. Сколько можно бы было избежать ошибок, проблем, конфликтов, , если бы менеджеры сразу подходили к вопросу правильно, не отвлекаясь на лишние действия …

Зато за это время накопился опыт "внедрений" Agile в разных условиях, в разных компаниях, который следует обобщить и повсеместно распространять.

+86

Erwinmal Sep 4 2021 at 13:00

Пять лучших киберпанк-аниме

7 min

80K

RUVDS.com corporate blogReading roomCyberpunkPopular scienceScience fiction

Очень скоро киберпанк как жанр отметит своё сорокалетие. Почему он появился именно в США начала 80-х, и почему при этом с первых дней стал настолько «японским» – мы уже говорили . Как он породил целую группу жанров, и сам понемногу из актуальных размышлений о будущем стал формой ретрофутуризма – тоже.

И всё же в обоих этих статьях огромный массив японского киберпанка лишь упоминался. А ведь он во многих отношениях даже больше и значимее, чем на родине жанра, в США. Киберпанк не просто так получил массу японских черт ещё у американских авторов. Сами японцы уже в 80-е буквально влюбились в новый жанр, и принялись в нём активно работать. Однако если киберпанк в США – это преимущественно фильмы и книги, то в стране Восходящего Солнца его основными воплощениями стали манга и аниме, комиксы и мультипликация с японской спецификой.

За сорок прошедших с начала 80-х лет японцы сделали десятки, если не сотни, аниме-произведений в жанре киберпанка. И некоторые из них прочно вошли в золотой фонд жанра. Списков топ-10 и так далее в сети хватает – но многие из них крайне поверхностны, кратки и написаны «для галочки» без особого вникания в предмет.

Так что почему бы не попробовать сделать свой вариант, копнув чуть глубже?

+76

126

TilekSamiev May 1 2021 at 13:20

New IP — следующий этап развития Интернета или ужесточение контроля над пользователями

10 min

54K

Information Security*Network technologies*IT Standards*VDSina.ru corporate blog

В Китае жизнь превратилась в компьютерную игру. Или даже в эпизод «Черного зеркала». Там с 01.01.2021 принят новый гражданский кодекс, официально узаконивший «Систему социального кредита». Теперь каждому гражданину присваивается стартовый рейтинг в 1000 баллов. Благодаря вездесущим камерам видеонаблюдения, Единый информационный центр анализирует каждого по 160 тысячам различных параметров из 142 учреждений. Если рейтинг больше 1050 баллов, то это образцовый гражданин и маркируется индексом ААА. С 1000 баллов можно рассчитывать на А+, а с 900 – на B. Если рейтинг упал ниже 849 – это уже «мутная личность» из категории C, кого запросто могут уволить из государственных и муниципальных структур. Те, у кого меньше 600 баллов попадают в группу D, это сравнимо с «чёрной меткой». Люди с рейтингом D не могут устроиться на нормальную работу, им не дают кредиты, не продают билеты на транспорт и даже могут отказать в аренде велосипеда. Для сравнения, человеку с рейтингом А+ велосипед в аренду дадут бесплатно и еще разрешат полчаса кататься на нем без единого юаня. Человек со средним рейтингом С велосипед дадут только под залог в 200 юаней.

В Китае аналогичный принцип ранжирования людей применяют и в Интернете. А компания Huawei решила пойти дальше и разработала новый стек протоколов, с которым провайдеры могут блокировать доступ в Сеть любого пользователя с низким рейтингом.

Читать дальше →

+44

129

sahsAGU Oct 1 2019 at 10:00

Вышли обновления ML.NET и Model Builder: что нового

2 min

.NET*Microsoft corporate blogBig Data*Machine learning*Artificial Intelligence

Translation

Мы рады сообщить о выходе обновлений Model Builder и ML.NET. ML.NET — это кроссплатформенная среда машинного обучения с открытым исходным кодом (Windows, Linux, macOS) для разработчиков .NET.

ML.NET предлагает Model Builder (простой инструмент пользовательского интерфейса) и интерфейс командной строки, созданные для того, чтобы упростить создание пользовательских моделей ML с использованием AutoML.

Используя ML.NET, разработчики могут задействовать свои существующие инструменты и наборы навыков для разработки и внедрения ИИ в приложения, создавая пользовательские модели машинного обучения для распространенных сценариев, таких как анализ тональности текста, рекомендации, классификация изображений и многое другое!

Читать дальше →

Goodcn Dec 25 2020 at 13:17

Git, я хочу все отменить! Команды исправления допущенных ошибок

4 min

47K

Programming*Git*Skillbox corporate blogLifehacks for geeks

Translation

Git — удобная, но довольно сложная система. Сложность, прежде всего, в том, что по невнимательности можно допустить ошибку, которую затем сложно или вообще невозможно исправить. Документация Git предоставляет описание множества команд, которые дают возможность исправить ошибку.

Но вся штука в том, что для исправления проблемы нужно знать точное название команды. И здесь у нас возникает типичная проблема курицы и яйца. В этой статье рассказывается о командах, которые помогают решить проблемные ситуации.

Читать дальше →

+20

vertver Oct 31 2020 at 17:44

Как не надо разрабатывать звуковые движки

5 min

7.2K

C++*Game development*Sound

From sandbox

Программируя звук в приложениях и в играх, мне часто приходилось переписывать всю кодовую базу звуковых модулей, так как многие из них обладали либо слишком запутанной архитектурой, либо наоборот ничего не умели кроме простого проигрывания звуков.

Читать дальше →

+16

phillennium Oct 3 2019 at 14:27

«Освоить F# не сложнее, чем Entity Framework или WPF»: интервью со Скоттом Влашиным

17 min

9.9K

.NET*C#*JUG Ru Group corporate blogF#*

Кого расспрашивать про F#, как не человека, посвятившего этому языку подробный сайт? Скотт Влашин создал ресурс «F# for Fun and Profit», знакомый многим хабравчанам: на Хабре переводили оттуда и серию статей «Функциональное мышление», и статью «Железнодорожно-ориентированное программирование».

А в ноябре он выступит в Москве на нашей конференции DotNext с докладом «The power of composition». И в преддверии этого выступления мы расспросили его про F# и вообще функциональное программирование.

Читать дальше →

+42

eshulyndina Sep 27 2019 at 11:43

«Конференция для людей и для решения их запросов»: программный комитет DevOpsDays о том, что такое комьюнити-конференция

10 min

775

System administration*IT Infrastructure*Cloud computing*DevOps*Человек наук corporate blog

Третий московский DevOpsDays пройдет 7 декабря в «Технополисе». Мы ждем разработчиков, тимлидов, руководителей отделов разработки, чтобы обсудить свой опыт и новое в мире DevOps. Это не yet another конференция про DevOps, это конференция, которую сообщество организует для сообщества.

В этом посте члены программного комитета рассказали, чем DevOpsDays Moscow отличается от других конференций, что такое комьюнити-конференция и какой должна быть идеальная конференция про DevOps. Ниже все подробности.

Читать дальше →

+10

sidristij Sep 9 2019 at 22:26

История и альтернативы платформы .NET

9 min

23K

Abnormal programming*Programming*.NET*C#*Seminars by Stanislav Sidristy corporate blog

Недавно мне повезло пообщаться с Крисом Бэйконом, который написал DotNetAnywhere (альтернативный вариант .NET Runtime), и я остроумно заметил:

… ты, наверное, один из тех немногих, кто создал собственную среду выполнения .NET, и это круто!

если исключить тех, кто на зарплате, т.е. инженеров Microsoft/Mono/Xamarin, их очень немного.

Это — перевод статьи Matt Warren (A History of .NET Runtimes). Дабы не делать повторную публикацию, оставлю as is

+63

marks Jan 5 2019 at 17:48

Исследователи проходят ReCAPTCHA при помощи сервисов Google

3 min

16K

Information Security*Cloud services*

Проверки «докажи, что ты не робот» раздражают многих. Да, ReCAPTCHA и другие подобные инструменты помогают отсекать массу ботов и спамеров, но обычные пользователи теряют время и тратят нервные клетки на эти тесты. Поэтому специалисты по информационной безопасности со всего мира пытаются найти альтернативу, кроме того, некоторые специалисты учатся обходить капчу.

Ученым из Мэрилендского университета это удается лучше других. Они назвали свой метод unCaptcha, он позволяет обходить ReCAPTCHA от Google при помощи сервисов самой корпорации Google. Процент удачных попыток превышает 90%. Стоит напомнить, что ReCAPTCHA работает на тысячах сайтов, сервис популярнее многих других. Поэтому, научившись обходить его, специалисты получают обширные возможности.

onegreyonewhite Dec 21 2018 at 03:53

История одного эксперимента с Cython и C++ vector

7 min

6.7K

Python*C++*Development for Linux*

Одним ~~тёплым~~ холодным зимним вечером, хотелось согреться в офисе и проверить теорию одного коллеги, что C++ vector мог бы быстрее справиться с задачей, чем CPython list.

В компании мы разрабатываем продукты на базе Django и случилось так, что нужно было обработать один большой массив словарей. Коллега предположил, что реализация на C++ была бы гораздо быстрее, а меня не покидало чувство, что Гвидо и сообщество наверное немного круче нас в Си и возможно уже решили и обошли все подводные камни, реализовав всё гораздо быстрее.

Для проверки теории, я решил написать небольшой тестовый файл, в котором решил прогнать в цикле вставку 1М словарей одинакового содержания в массив и в vector 100 раз подряд.

Результаты хоть и были ожидаемые, но так же и внезапные.

Что же из этого вышло?