Как стать автором
Обновить
-28
0.1
Андрей @Andrey_Dolg

Full stack

Отправить сообщение

Clustergram: визуализация кластерного анализа на Python

Время на прочтение6 мин
Количество просмотров11K

В этой статье, переводом которой мы решили поделиться специально к старту курса о Data Science, автор представляет новый пакет Python для генерации кластерограмм из решений кластеризации. Библиотека была разработана в рамках исследовательского проекта Urban Grammar и совместима со scikit-learn и библиотеками с поддержкой GPU, такими как cuML или cuDF в рамках RAPIDS.AI.

Читать далее
Всего голосов 10: ↑9 и ↓1+10
Комментарии0

Реализация конечного автомата для автоматизации процессов

Время на прочтение5 мин
Количество просмотров7.8K

Каждый уважающий себя техлид \ архитектор ПО \ руководитель разработки,

должен написать в своей жизни хотя бы одну CRM

народная мудрость

Читать далее
Всего голосов 22: ↑21 и ↓1+21
Комментарии11

Новые возможности анализа табличных данных с алгоритмами машинного обучения в Elastic

Время на прочтение20 мин
Количество просмотров5.7K


Elastic stack, также известный как ELK Stack (аббревиатура из программных компонентов: Elasticsearch, Kibana и Logstash), — это платформа построения озера данных с возможностью аналитики по ним в реальном масштабе времени. В настоящее время широко применяется для обеспечения информационной безопасности, мониторинга бесперебойности и производительности работы ИТ-среды и оборудования, анализа рабочих процессов, бизнес-аналитики.


В соответствии со стратегией компании, исходный код всех продуктов Elastic является открытым, разработка ведётся публично, а базовые функции доступны бесплатно, что выгодно отличает платформу от конкурентов.


Одним из платных наборов функций, в которых Elastic видит коммерческий потенциал и активно развивает, является анализ данных с использованием технологий машинного обучения. О его новых возможностях расскажем в нашей статье.

Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии2

Как удобно вести игровой баланс и не сломаться от количества ячеек в таблицах

Время на прочтение11 мин
Количество просмотров16K

Каждый геймдизайнер рано или поздно сталкивается с необходимостью регулярной работы с таблицами. Базовых знаний Google Sheets или Excel обычно достаточно для того, чтобы вести простые расчеты и работать над игровым балансом. Но когда игра развивается и обрастает новыми сущностями, возникает потребность в том, чтобы организовать для себя удобную и эффективную структуру. При этом нужно иметь возможность легко в ней ориентироваться, дополнять и модифицировать ее, она должна быть устойчива к ошибкам. 

В этой статье я систематизировал собственный опыт работы с таблицами и их дополнительными функциями, которые могут оказаться полезными как для начинающих, так и опытных геймдизайнеров. Примеры приведены в Google Sheets, поскольку они чаще используются командами разработки, но большая часть из них применима и к MS Excel.

Читать далее
Всего голосов 22: ↑21 и ↓1+25
Комментарии10

DIY наушники. Как, а главное, зачем

Время на прочтение14 мин
Количество просмотров54K

Рассказываю, как собрать свои собственные наушники, зачем это нужно и каков результат (спойлер - очень хорош). Для постройки выбрана ленточная технология излучателей и описано то, почему она по многим параметрам предпочтительнее. Все исходники прилагаются.

Читать далее
Всего голосов 95: ↑95 и ↓0+95
Комментарии103

Большая игра на понижение крипты. Механизм финансовой катастрофы

Время на прочтение17 мин
Количество просмотров277K


Это история сделки с биткоинами — самой крупной в моей жизни. К этой сделке меня привело глубокое, но безумное исследование криптоэкосистемы. И это история о том, что на самом деле происходит в крипте — и что с этим делать.

Если у вас есть значительные объёмы криптовалюты или вы подумываете о её покупке, то именно для вас я это написал. Пожалуйста, прочтите до конца.
Всего голосов 183: ↑176 и ↓7+228
Комментарии390

6 принципов эффективной визуализации данных

Время на прочтение6 мин
Количество просмотров16K

Ключевые принципы создания полезных и информативных графиков


Визуализация данных является важным этапом в процессе постижения науки о данных. Здесь вы представляете свои результаты и сообщаете о них в графическом формате, который является интуитивно понятным и лёгким для понимания.

Визуализация данных требует большой работы, большой труд по очистке и анализу уходит на перегонку и превращение грязных данных в красивые графики и диаграммы. Но даже с подготовленными данными всё равно приходится придерживаться определённых принципов или методологий, чтобы создать полезную, информативную графику.

Тем не менее при написании этой статьи я черпал вдохновение в книге Эдварда Тафта «Beautiful Evidence», которая содержит шесть принципов, посвящённых тому, как сделать графики данных полезными. Именно эти принципы отделяют полезные графики от бесполезных.

Эта статья также в значительной степени вдохновлена книгой Роджера Д. Пенга «Exploratory Data Analysis in R» Она доступна бесплатно на Bookdown, и вы можете прочитать её, чтобы узнать больше о EDA.

Давайте ближе познакомимся с этими принципами.


Пример визуализации данных на Our World in Data
Приятного чтения!
Всего голосов 25: ↑19 и ↓6+20
Комментарии12

Заброшенный сайд-проект, который превратился в бизнес с доходом в 700 млн долларов в год

Время на прочтение8 мин
Количество просмотров36K

20-летний путь Бена Честната, основателя MailChimp


Ему было 26 лет, когда его уволили и он основал студию веб-дизайна.

Я был предупрежден за месяц, так что у меня было время спланировать дальнейшую жизнь.

После увольнения в 2000 году Бен Честнат занялся тем, что знал лучше всего, — разработкой веб-сайтов. За эти годы он создал около двух тысяч рекламных баннеров для своего бывшего работодателя, газеты Cox. Он точно знал, как создавать интерактивные объекты в Интернете.

И я подумал… Что ж, это наш шанс открыть компанию. Мой деловой партнёр и я просто нашли клиентов. Мы пошли стучаться в двери по коридору от нашего офиса. И у нас появились оплачиваемые проекты. Мы получили проекты на 13 000 и 32 000$. Даже до получения лицензии на бизнес.

К сожалению, для управления студией веб-дизайна ваше умение говорить по телефону куда важнее вашего мастерства в дизайне. Студии часто привлекают самый причудливый бизнес, где мнения клиентов заменяют реальные ключевые показатели эффективности, а успокаивающий голос может быть важнее движения продукта. Естественно, группа интровертов и внимательных дизайнеров под названием Rocket Science Group не смогла добиться успеха в среде, где внешность важнее сущности.


Приятного чтения!
Всего голосов 35: ↑26 и ↓9+24
Комментарии41

ИИ итоги 2020-го года в мире машинного обучения

Время на прочтение3 мин
Количество просмотров11K

Подведем основные итоги уходящего года в мире машинного обучения. Рассмотрим самые громкие открытия в мире компьютерного зрения, обработки естественного языка, генерации изображений и видео, а также крупный прорыв в области биологии. Коротко о самом главном за год!

Поехали!
Всего голосов 18: ↑18 и ↓0+18
Комментарии6

ARM серверы — более производительные и более дешёвые

Время на прочтение3 мин
Количество просмотров20K

В этом году Apple потрясла рынок десктопных процессоров чипом Apple M1 и устройствами на нём. Похожее событие произошло в мире облачных вычислений в прошлом году. AWS выпустили новый тип сервера на собственных ARM процессорах Graviton2. По заявлениям Amazon, соотношение производительности к цене у новых процессоров на 40% выше, чем у аналогов на x86. Ещё одно недавнее обновление - сервера Amazon RDS (облачный сервис, предоставляющий сервера баз данных) на Graviton2. Я запустил несколько бенчмарков и нагрузочный тест реального бэкенд приложения, чтобы проверить настолько ли хороши сервера на ARM процессорах и узнать какие проблемы совместимости могут возникнуть.

Читать далее
Всего голосов 16: ↑14 и ↓2+20
Комментарии14

Вытаскиваем данные из Instagram

Время на прочтение17 мин
Количество просмотров123K

Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе.

Читать далее
Всего голосов 23: ↑20 и ↓3+22
Комментарии19

Реверс-инжиниринг исходного кода коронавирусной вакцины от компаний BioNTech/Pfizer

Время на прочтение11 мин
Количество просмотров105K
Добро пожаловать. В данном посте мы посимвольно разберём исходный код вакцины BioNTech/Pfizer SARS-CoV-2 мРНК.

Да, такое заявление может вас удивить. Вакцина – это ведь жидкость, которую вводят человеку в руку. При чём тут какой-то исходный код?

Хороший вопрос. Начнём мы с небольшой части того самого исходного кода вакцины BioNTech/Pfizer, также известной, как BNT162b2, также известной, как Tozinameran, также известной, как Comirnaty.


Первые 500 символов мРНК BNT162b2.

В сердце вакцины находится вот такой цифровой код. Его длина составляет 4284 символа, так что его вполне можно уместить в несколько твитов. В самом начале процесса производства вакцины кто-то закачал этот код в ДНК-принтер (ага), который, в свою очередь, превратил байты с накопителя в реальные молекулы ДНК.
Всего голосов 238: ↑232 и ↓6+304
Комментарии366

3D ML. Часть 6: Обзор алгоритмов семантической сегментации облака точек

Время на прочтение17 мин
Количество просмотров11K


Мы уже успели поговорить про сверточные операторы на графах, а теперь посмотрим на реальные архитектуры.


В этой заметке мы сравним между собой модели глубокого обучения, направленные на решение задачи семантической сегментации облака точек, и попытаемся выяснить, какие из существующих моделей наиболее пригодны для встраивания в реальную систему сканирования пространства.

Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии1

Принцип слоеного теста

Время на прочтение12 мин
Количество просмотров5.9K
Всем неустрашимым на пути от отрицания до убеждения посвящается…

image

Среди разработчиков бытует справедливое мнение, что если программист не покрывает код тестами, то попросту не понимает зачем они нужны и как их готовить. С этим трудно не согласиться, когда уже понимаешь о чем речь. Но как достичь этого драгоценного понимания?
Читать дальше →
Всего голосов 8: ↑6 и ↓2+8
Комментарии28

Сынок, запрыгивай в вагон, я закину чемоданы! Экспресс-вход в индустрию, когда почти прошел мимо

Время на прочтение6 мин
Количество просмотров6.4K

Когда-то я рассказывал как шел к Java-программированию и прошел мимо. Теперь расскажу почему вернулся, поднял, почистил и пользуюсь. Это не еще один восторженный опус про смену специальности. Скорее логическое продолжение первой статьи с наблюдениями, которые пригодились бы мне из прошлого. Может, пригодятся и тем, кто находится на перепутье сейчас.

ну-ка, ну-ка
Всего голосов 12: ↑9 и ↓3+10
Комментарии6

Как я перестал бояться и научился любить нейронные сети

Время на прочтение14 мин
Количество просмотров15K

В рекомендательных системах нет доминирующего класса моделей. Матричные разложения, графовые  и контентные рекомендеры активно развиваются: про них пишут научные статьи, их используют в продакшене. Пять лет назад на волне интереса к нейронным сетям стали популярны нейросетевые рекомендеры, но довольно быстро наступило разочарование. На RecSys 2019 лучшей выбрали статью с критикой нейросетевого подхода (в этом году его тоже пинают). Стоит ли практикам забыть о нейронных сетях в рекомендациях? Я уверен, что нет. Мой рекомендер уже год работает в продакшене и помогает пользователям Одноклассников заказывать интересные товары. Я расскажу, почему построил рекомендер на основе нейронной сети. После прочтения статьи у вас не останется причин не сделать также в вашем сервисе.

Читать далее
Всего голосов 31: ↑31 и ↓0+31
Комментарии1

Процедурное разрушение в Control: какие уроки можно почерпнуть из опыта Remedy

Время на прочтение11 мин
Количество просмотров9.2K
Этим летом на GDC старший VFX-артист Remedy Йоханнес Рихтер рассказал о том, как реализовано процедурное разрушение в последней игре студии — мистическом экшене Control.

В своей лекции он уделил внимание основному принципу построения многих внутриигровых эффектов, или принципу гранулярности. О том, как студия реализовала масштабную систему реалистичной разрушаемости, с какими ограничениями собственных ресурсов и производительности платформ столкнулась, какие оптимизации произвела и какие уроки из всего этого вынесла — далее в материале.


Читать дальше →
Всего голосов 32: ↑29 и ↓3+29
Комментарии7

Мифы семантической технологии

Время на прочтение4 мин
Количество просмотров3.7K
В предыдущем тексте “Миф семантического веба” была сделана попытка обосновать мысль, что семантический веб в рамках исходно предложенных его основателями технологических решений так и останется мечтой. Хотя сами семантические инструменты от W3C не без скрипа, с доводкой напильником, но вполне успешно применяются для моделирования онтологий в энтерпрайз-проектах.

Сейчас же попробуем разобраться с мифами, которые можно услышать при обсуждении семантического подхода даже от профессионалов.
Читать дальше →
Всего голосов 12: ↑9 и ↓3+14
Комментарии28

Заметки из больницы

Время на прочтение17 мин
Количество просмотров16K
Эту статью я начал писать, находясь в стационаре Рижского психиатрическо-наркологического центра и подлечивая депрессивный эпизод. Загнал себя чуток чередой стрессов и затянувшимся выгоранием. Будучи в таком интересном и щекотливом месте, я решил пообщаться со специалистами и узнать их мнение о нас, программистах, и родственных профессиях, о свойственных нам проблемах и о том, что нужно делать вовремя, чтобы не проследовать по моим стопам. В общем, по-своему протягиваю хабровчанам руку помощи.



Сразу отмечу, интервью я брал впервые, так что буду признателен, если в комментариях поделитесь, как у меня получилось. Речь местами может быть корявой, т.к. русский — не родной язык для тех, кто делился со мной мыслями. Не судите строго, в общем. Могу сказать точно — для себя я узнал некоторые интересные вещи о наших профессиональных заболеваниях и способах их предотвращения.
Читать дальше →
Всего голосов 27: ↑25 и ↓2+31
Комментарии13

Используем Chrome DevTools профессионально

Время на прочтение5 мин
Количество просмотров75K
И снова здравствуйте. В преддверии старта курса «JavaScript Developer. Professional» перевели

11 советов для тех, кто использует Chrome в качестве среды разработки.





Итак, по тем или иным причинам вы решили при разработке ориентироваться на Chrome. Вы открываете инструменты разработчика и приступаете к отладке кода.



Иногда вы открываете консоль, чтобы посмотреть вывод своей программы, или вкладку Elements, чтобы проверить CSS-стили элементов DOM.



А действительно ли вы разбираетесь в Chrome DevTools? На самом деле у инструментов разработчика множество мощных функций, которые облегчают жизнь, но о них мало кто знает.
Я расскажу о самых полезных из них.
Читать дальше →
Всего голосов 41: ↑38 и ↓3+48
Комментарии17

Информация

В рейтинге
4 210-й
Откуда
Bansko, Blagoevgrad, Болгария
Зарегистрирован
Активность