Статьи / Закладки / Профиль ggJa / Хабр

Алексей Савчик @ggJa

Пользователь

Профиль Публикации Комментарии 105Закладки 22

greck 10 сен 2022 в 12:31

1. Теория информации + ML. Энтропия

9 мин

17K

Математика*Машинное обучение*Статистика в IT

Туториал

Теория Информации и Machine Learning мне видятся как интересная пара областей, глубокая связь которых часто неизвестна ML инженерам, и синергия которых раскрыта ещё не в полной мере.

Начнём с базовых понятий Энтропии, Информации в сообщении, Mutual Information, пропускной способности канала. Далее будут материалы про схожесть задач максимизации Mutual Information и минимизации Loss-а в регрессионных задачах. Затем будет часть про метрику Фишера, геодезические и градиентные методы, и их связь с гауссовскими процессами.

+14

greck 19 ноя 2022 в 11:50

3. Теория информации и ML. Прогноз

31 мин

7.2K

Математика*Машинное обучение*

Туториал

Понятие Mutual Information (MI) связано с задачей прогноза. Собственно, задачу прогноза можно рассматривать как задачу извлечения информации о сигнале из факторов. Какая-то часть информации о сигнале содержится в факторах. И если вы напишите функцию, которая по факторам вычисляет число близкое к сигналу, то это и будет демонстрацией того, что вы смогли извлечь MI между сигналом и факторами.

+10

Alex4yb 15 авг 2022 в 14:14

Сложный опыт: как мы наняли 50 человек с завода в ИТ-поддержку и по каким граблям прошлись

7 мин

27K

Блог компании КРОКУправление проектами*Управление персоналом*

Крупное производство с несколькими заводами на разных участках. Техпроцесс зависит от работы систем связи, а на них АСУ ТП и промышленное видеонаблюдение за станками и опасными участками. Если хотя бы одна рация на участке не работает — работать нельзя. Работать с СКС/ЛВС в колодцах, погружаясь на большую глубину, ремонтировать системы видеонаблюдения в строительных люльках на высоте выше 10 метров, работать под напряжением до 1000 В — всё это на заводе рутина.

На производстве есть своя команда из 50 человек, разбитая по площадкам. Условно, на каждой площадке есть несколько ролей, и они работают сменами с покрытием 24/7, то есть каждый инженер работает только процентов 10–15 времени, а остальное время дежурит удалённо и «~~плюёт в потолок»~~ осуществляет проактивный мониторинг. Производство решает перейти от модели постоянных дежурств к профилактике и быстрым выездам: по их расчёту, тогда будут незакрыты только риски массовых аварий на разных площадках, а всё остальное окупается за счёт экономии при большей утилизации времени команды.

Это всё планируется отдать в аутсорсное управление интегратору, потому что сам завод умеет отлично делать свои изделия, но не является сервисной ИТ-компанией. Играется тендер, одно из условий которого — принять на 3-летний контракт старую команду, которая уже этим занималась по местам.

Мы побеждаем, принимаем старую команду, нам передают дела — и начинается жесть.

Сейчас прошло два года, и я уже могу более-менее рассказывать, почему вам никогда не стоит повторять такие незабываемые приключения.

+49

149

iLushkersky 3 июл 2022 в 17:00

Антиматерия и бариогенезис. Три причины, почему нет антивещества, но есть мы

13 мин

13K

Научно-популярноеФизикаАстрономия

Изучая окружающий мир мы пришли к выводу, что вещество состоит из частиц, которые можно описать с помощью некоторой теории. Но с помощью этой же теории можно предсказать частицы с совершенно противоположными свойствами, и они должны существовать в нашем мире. Но почему мы не видим их? Потому что их нет. В статье я расскажу о трёх причинах, почему это так.

+37

sshmakov 8 мая 2022 в 12:23

Как правильно имитировать Agile?

15 мин

35K

Управление проектами*Agile*

Подобная статья должна была появиться раньше, лет десять или пятнадцать назад, когда Agile только начинал внедряться в ИТ-компаниях. Сколько можно бы было избежать ошибок, проблем, конфликтов, , если бы менеджеры сразу подходили к вопросу правильно, не отвлекаясь на лишние действия …

Зато за это время накопился опыт "внедрений" Agile в разных условиях, в разных компаниях, который следует обобщить и повсеместно распространять.

+86

Erwinmal 4 сен 2021 в 13:00

Пять лучших киберпанк-аниме

7 мин

80K

Блог компании RUVDS.comЧитальный залКиберпанкНаучно-популярноеНаучная фантастика

Очень скоро киберпанк как жанр отметит своё сорокалетие. Почему он появился именно в США начала 80-х, и почему при этом с первых дней стал настолько «японским» – мы уже говорили . Как он породил целую группу жанров, и сам понемногу из актуальных размышлений о будущем стал формой ретрофутуризма – тоже.

И всё же в обоих этих статьях огромный массив японского киберпанка лишь упоминался. А ведь он во многих отношениях даже больше и значимее, чем на родине жанра, в США. Киберпанк не просто так получил массу японских черт ещё у американских авторов. Сами японцы уже в 80-е буквально влюбились в новый жанр, и принялись в нём активно работать. Однако если киберпанк в США – это преимущественно фильмы и книги, то в стране Восходящего Солнца его основными воплощениями стали манга и аниме, комиксы и мультипликация с японской спецификой.

За сорок прошедших с начала 80-х лет японцы сделали десятки, если не сотни, аниме-произведений в жанре киберпанка. И некоторые из них прочно вошли в золотой фонд жанра. Списков топ-10 и так далее в сети хватает – но многие из них крайне поверхностны, кратки и написаны «для галочки» без особого вникания в предмет.

Так что почему бы не попробовать сделать свой вариант, копнув чуть глубже?

+76

126

TilekSamiev 1 мая 2021 в 13:20

New IP — следующий этап развития Интернета или ужесточение контроля над пользователями

10 мин

54K

Информационная безопасность*Сетевые технологии*IT-стандарты*Блог компании VDSina.ru

В Китае жизнь превратилась в компьютерную игру. Или даже в эпизод «Черного зеркала». Там с 01.01.2021 принят новый гражданский кодекс, официально узаконивший «Систему социального кредита». Теперь каждому гражданину присваивается стартовый рейтинг в 1000 баллов. Благодаря вездесущим камерам видеонаблюдения, Единый информационный центр анализирует каждого по 160 тысячам различных параметров из 142 учреждений. Если рейтинг больше 1050 баллов, то это образцовый гражданин и маркируется индексом ААА. С 1000 баллов можно рассчитывать на А+, а с 900 – на B. Если рейтинг упал ниже 849 – это уже «мутная личность» из категории C, кого запросто могут уволить из государственных и муниципальных структур. Те, у кого меньше 600 баллов попадают в группу D, это сравнимо с «чёрной меткой». Люди с рейтингом D не могут устроиться на нормальную работу, им не дают кредиты, не продают билеты на транспорт и даже могут отказать в аренде велосипеда. Для сравнения, человеку с рейтингом А+ велосипед в аренду дадут бесплатно и еще разрешат полчаса кататься на нем без единого юаня. Человек со средним рейтингом С велосипед дадут только под залог в 200 юаней.

В Китае аналогичный принцип ранжирования людей применяют и в Интернете. А компания Huawei решила пойти дальше и разработала новый стек протоколов, с которым провайдеры могут блокировать доступ в Сеть любого пользователя с низким рейтингом.

Читать дальше →

+44

129

sahsAGU 1 окт 2019 в 10:00

Вышли обновления ML.NET и Model Builder: что нового

2 мин

3.1K

.NET*Блог компании MicrosoftBig Data*Машинное обучение*Искусственный интеллект

Перевод

Мы рады сообщить о выходе обновлений Model Builder и ML.NET. ML.NET — это кроссплатформенная среда машинного обучения с открытым исходным кодом (Windows, Linux, macOS) для разработчиков .NET.

ML.NET предлагает Model Builder (простой инструмент пользовательского интерфейса) и интерфейс командной строки, созданные для того, чтобы упростить создание пользовательских моделей ML с использованием AutoML.

Используя ML.NET, разработчики могут задействовать свои существующие инструменты и наборы навыков для разработки и внедрения ИИ в приложения, создавая пользовательские модели машинного обучения для распространенных сценариев, таких как анализ тональности текста, рекомендации, классификация изображений и многое другое!

Читать дальше →

Goodcn 25 дек 2020 в 13:17

Git, я хочу все отменить! Команды исправления допущенных ошибок

4 мин

47K

Программирование*Git*Блог компании SkillboxЛайфхаки для гиков

Перевод

Git — удобная, но довольно сложная система. Сложность, прежде всего, в том, что по невнимательности можно допустить ошибку, которую затем сложно или вообще невозможно исправить. Документация Git предоставляет описание множества команд, которые дают возможность исправить ошибку.

Но вся штука в том, что для исправления проблемы нужно знать точное название команды. И здесь у нас возникает типичная проблема курицы и яйца. В этой статье рассказывается о командах, которые помогают решить проблемные ситуации.

Читать дальше →

+20

vertver 31 окт 2020 в 17:44

Как не надо разрабатывать звуковые движки

5 мин

7.2K

C++*Разработка игр*Звук

Из песочницы

Программируя звук в приложениях и в играх, мне часто приходилось переписывать всю кодовую базу звуковых модулей, так как многие из них обладали либо слишком запутанной архитектурой, либо наоборот ничего не умели кроме простого проигрывания звуков.

Читать дальше →

+16

phillennium 3 окт 2019 в 14:27

«Освоить F# не сложнее, чем Entity Framework или WPF»: интервью со Скоттом Влашиным

17 мин

9.9K

.NET*C#*Блог компании JUG Ru GroupF#*

Кого расспрашивать про F#, как не человека, посвятившего этому языку подробный сайт? Скотт Влашин создал ресурс «F# for Fun and Profit», знакомый многим хабравчанам: на Хабре переводили оттуда и серию статей «Функциональное мышление», и статью «Железнодорожно-ориентированное программирование».

А в ноябре он выступит в Москве на нашей конференции DotNext с докладом «The power of composition». И в преддверии этого выступления мы расспросили его про F# и вообще функциональное программирование.

Читать дальше →

+42

eshulyndina 27 сен 2019 в 11:43

«Конференция для людей и для решения их запросов»: программный комитет DevOpsDays о том, что такое комьюнити-конференция

10 мин

777

Системное администрирование*IT-инфраструктура*Облачные вычисления*DevOps*Блог компании Человек наук

Третий московский DevOpsDays пройдет 7 декабря в «Технополисе». Мы ждем разработчиков, тимлидов, руководителей отделов разработки, чтобы обсудить свой опыт и новое в мире DevOps. Это не yet another конференция про DevOps, это конференция, которую сообщество организует для сообщества.

В этом посте члены программного комитета рассказали, чем DevOpsDays Moscow отличается от других конференций, что такое комьюнити-конференция и какой должна быть идеальная конференция про DevOps. Ниже все подробности.

Читать дальше →

+10

sidristij 9 сен 2019 в 22:26

История и альтернативы платформы .NET

9 мин

23K

Ненормальное программирование*Программирование*.NET*C#*Блог компании Семинары Станислава Сидристого

Недавно мне повезло пообщаться с Крисом Бэйконом, который написал DotNetAnywhere (альтернативный вариант .NET Runtime), и я остроумно заметил:

… ты, наверное, один из тех немногих, кто создал собственную среду выполнения .NET, и это круто!

если исключить тех, кто на зарплате, т.е. инженеров Microsoft/Mono/Xamarin, их очень немного.

Это — перевод статьи Matt Warren (A History of .NET Runtimes). Дабы не делать повторную публикацию, оставлю as is

+63

marks 5 янв 2019 в 17:48

Исследователи проходят ReCAPTCHA при помощи сервисов Google

3 мин

16K

Информационная безопасность*Облачные сервисы*

Проверки «докажи, что ты не робот» раздражают многих. Да, ReCAPTCHA и другие подобные инструменты помогают отсекать массу ботов и спамеров, но обычные пользователи теряют время и тратят нервные клетки на эти тесты. Поэтому специалисты по информационной безопасности со всего мира пытаются найти альтернативу, кроме того, некоторые специалисты учатся обходить капчу.

Ученым из Мэрилендского университета это удается лучше других. Они назвали свой метод unCaptcha, он позволяет обходить ReCAPTCHA от Google при помощи сервисов самой корпорации Google. Процент удачных попыток превышает 90%. Стоит напомнить, что ReCAPTCHA работает на тысячах сайтов, сервис популярнее многих других. Поэтому, научившись обходить его, специалисты получают обширные возможности.

onegreyonewhite 21 дек 2018 в 03:53

История одного эксперимента с Cython и C++ vector

7 мин

6.7K

Python*C++*Разработка под Linux*

Одним ~~тёплым~~ холодным зимним вечером, хотелось согреться в офисе и проверить теорию одного коллеги, что C++ vector мог бы быстрее справиться с задачей, чем CPython list.

В компании мы разрабатываем продукты на базе Django и случилось так, что нужно было обработать один большой массив словарей. Коллега предположил, что реализация на C++ была бы гораздо быстрее, а меня не покидало чувство, что Гвидо и сообщество наверное немного круче нас в Си и возможно уже решили и обошли все подводные камни, реализовав всё гораздо быстрее.

Для проверки теории, я решил написать небольшой тестовый файл, в котором решил прогнать в цикле вставку 1М словарей одинакового содержания в массив и в vector 100 раз подряд.

Результаты хоть и были ожидаемые, но так же и внезапные.

Что же из этого вышло?