Search
Write a publication
Pull to refresh
0
@masdimaread⁠-⁠only

User

Send message

От «data-driven» к «data-driving» в инжиниринге данных

Reading time11 min
Views2.9K

Всем привет! Это мой дебют на Хабре с переводом классной статьи по теме инжиниринга данных.

Оригинал статьи:

From Data Driven to Driving Data— The dysfunctions of Data Engineering

О том, как дата инженерам перестать быть сервисной командой в компаниях, "управляемых данными", и перебраться за руль в этом сложном процессе.

Читать далее

Мы создали автоматизированный YouTube-канал на Python и он стал виральным

Reading time6 min
Views24K
image

Статистика канала Most Popular TikTok Compilations в YouTube Analytics за 365 дней (8 октября 2019 года — 6 октября 2020 года). 16,7 миллиона просмотров, 911,1 тысяч часов просмотра и 51,2 тысяч подписчиков.

С чего всё началось: история


В 2019 году мы с друзьями искали проект, которым нам было бы интересно заниматься летом. Я заходил на YouTube и как обычно просматривал финансовые каналы разных ютуберов. Одного из них звали «Biaheza». Его видео под названием «Как люди зарабатывают миллионы долларов на TikTok» привлекло моё внимание. Почему? Потому что эти каналы генерируют миллионы просмотров, то есть должны и приносить большую прибыль. Но так ли это на самом деле?

Мне всегда было любопытно, как монетизируются каналы. Как монетизировать контент, владельцем которого ты не являешься? Спрашивают ли они разрешение на использование чужого контента? Как насчёт музыки, которая используется в компиляциях? Но самое важное…

Как создаются компиляции?

Честно говоря, не представляю, чтобы мне было весело создавать эти компиляции копипастингом одного ролика за другим. Я разработчик ПО, поэтому первым делом мне в голову пришла мысль…

Почему бы не автоматизировать этот процесс?
Читать дальше →

Пишем чат-бот на Python + PostgreSQL и Telegram

Reading time8 min
Views74K

Пошаговое руководство написания чат-бота на языке Python.

Установим Python и библиотеки на Debian, подключим PostgreSQL, получим вопросы и ответы, подключим морфологию и нормализуем слова, запустим чат-бота в Telegram.

Голая практика и полный листинг с комментариями.

Смотрим далее

Он вам не саранча! Тяжелые будни серого кузнечика

Reading time7 min
Views25K

Бывает, что в жизни мы сталкиваемся с непониманием, встречая незнакомцев по одежке, а книжки выбирая по обложке. То же самое случается и с животным миром. Нет, сегодняшний пост не про мимикрию — о ней вы можете почитать здесь. Сегодня мы поговорим об одном из самых недооцененных и страдающих от предрассудков насекомых — сером кузнечике.

Читать далее

Метаклассы в Python

Reading time14 min
Views38K

Привет, Хабр! У нас продолжается распродажа в честь черной пятницы. Там вы найдете много занимательных книг.

Возможен вопрос: а что такое метакласс? Если коротко, метакласс относится к  классу точно как класс к объекту.

Метаклассы – не самый популярный аспект языка Python; не сказать, что о них воспоминают в каждой беседе. Тем не менее, они используется в весьма многих статусных проектах: в частности, Django ORM[2], стандартная библиотека абстрактных базовых классов (ABC)[3] и реализации Protocol Buffers [4].

Это сложная фича, позволяющая программисту приспособить под задачу некоторые самые базовые механизмы языка. Именно по причине такой гибкости открываются и возможности для злоупотреблений – но нас это уже не удивляет. С большими возможностями приходит большая ответственность.

Читать далее

Как сегодня делают игры в браузере? Часть 2

Reading time3 min
Views2.7K

В этот раз речь пойдет о немного более сложных вещах, таких, как управление состоянием, компоненты высшего порядка и Gamepad API.

Как вообще-то передвигать персонажа (который есть набор отдельных 3D-объектов) в пространстве? Я уже рассказывал ранее в 4 шаге о том, об объединении объектов в группу. Еще раз: вы можете перемещать группу с линейной скоростью; в сумме с подходящей анимацией это будет выглядеть как ходьба или бег, в зависимости от вашей задумки.

Читать далее

Си должен умереть

Reading time21 min
Views112K

Язык Си - один из наиболее влиятельных языков программирования за всю историю. Он стал незаменимым инструментом разработки операционных систем, сместив с этого пьедестала языки ассемблера. Изучение Си обязательно для любого уважающего себя программиста. Этот язык любим за свою внешнюю простоту и ненавидим за беспощадность к ошибкам. Благодаря нему у нас есть ядро Linux и тысячи уязвимостей в нём же в придачу.

Попробуем понять, что же такое этот противоречивый язык Си - благословение или проклятие?

Читать далее

Теория графов в криптографии. Обзор основных подходов

Reading time9 min
Views6.2K

Теория графов - один из основных инструментов математики, который используется для представления множеств и связей между ними. Любая сфера науки, в том числе криптография, включает в себя анализ данных, поэтому модель имеет широкое практическое применение. В данной статье рассматриваются задачи из теории графов, которые лежат в основе современных криптографических протоколов.

Читать далее

[Личный опыт] Балканский полуостров: экспансия за рубеж без подготовки

Reading time7 min
Views12K

Основатель Postoplan Алексей Божин переехал из России сначала в Черногорию, потом — в Сербию. Сейчас он снова собирает чемодан, но куда — пока держит в тайне, даже от родных. Зато нам он рассказал о стартапе на €1 млн, сотрудничестве с разработчиками по всему миру, опыте переезда на Балканы и интеграции без знания языка. Передаем ему слово.

Читать далее

Как захостить сайт на 500 лет?

Reading time7 min
Views13K


Предположим, вы хотите опубликовать информацию для будущих поколений. Для потомков, которые будут жить через 500-1000 лет. Казалось бы, недолгий срок по меркам человеческой цивилизации. Но как надёжнее всего передать им информацию? В каком формате, на каком носителе? Где захостить этот сайт, в конце концов? Как оптимисты мы полагаем, что Интернет не исчезнет в техногенном фоллауте, население Земли не утратит способность читать, и это будут представители нашего вида.
Читать дальше →

Как улучшить ключевые метрики банка за счет кассовых чеков ОФД?

Reading time8 min
Views4.5K

Плох тот дата сайентист, который не представляет, как будут использоваться его модели в конечных продуктах, как они помогут бизнесу увеличить чистую прибыль, улучшить клиентский опыт или любой другой ключевой показатель в компании. Часто задачи приходят от продуктовых подразделений, но в случае, когда главным компонентом продукта является модель машинного обучения, без экспертного взгляда специалиста не обойтись. В этой статье рассмотрим, как можно принести пользу компании за счет данных кассовых чеков ОФД.

Читать далее

Мифы про аутизм и вещи, которые можно сделать вовремя, если знать

Reading time15 min
Views35K


Привет, Хабр! Я врач-невролог, и ко мне часто попадают пациенты с РАС или подозрением на РАС. Поскольку я детский невролог, то занимаюсь детьми и подростками. Пожалуй, из всего спектра моей работы именно аутизм больше всего подвержен разным выдумкам и мифам как среди пациентов, так и среди специалистов. В последние годы появилось немало новых научных исследований с хорошими уровнями достоверности, которые меняют представление о том, что можно сделать, а что — нет. И поэтому давайте разберём основные мифы.

Первое и главное — ранняя диагностика до двух лет позволяет иногда очень сильно скомпенсировать возможные последствия.

Второе — люди нередко считают, что РАС — «бесперспективный» диагноз. Это уже давно не так, и есть состояния, при которых правильная и своевременная помощь специалистов может очень хорошо помочь даже во взрослом возрасте.

В общем, давайте я расскажу, с чем часто сталкиваюсь в работе, и попробую объяснить, чем на самом деле можно помочь пациентам с РАС. Ниже будут список мифов и разбор каждого из них.
Читать дальше →

Декарбонизация по-японски: как и зачем делают уголь «зеленым»

Reading time13 min
Views14K

Если вы в общих чертах представляете, как устроена современная угольная электростанция с высоким КПД, то японцы вас все равно удивят. Такого последовательного наслоения технологий сейчас нет нигде: в одном месте собраны и газификация угля, и котлы сверхвысокого давления, и топливные элементы. Плюс улавливание СО2.

Зачем все это? Думаю, японцы понемногу догадываются (добродушный сарказм), что всевозможные ветряные парки дают энергию лишь 20% времени в году. А в остальные «счастливые моменты» дома все равно чем-то надо топить. Желательно чем-то «зеленым», маневренным и недорогим, чтобы экономика не треснула. А еще они «догадываются», что энергетике нужен переходный период ко всему «зеленому», а не политические заявления о резком перескоке на ВИЭ и нравоучения шведских школьниц (Грета, привет).

Под катом рассказ японского профессора о том, что делают и что уже сделали в направлении «зеленого угля». А также про то, как все это устроено.

Читать далее

Плацкарт «ёлочка» — индивидуальные капсулы и нормальные столы, результат эволюции предыдущих прототипов

Reading time10 min
Views81K
У нас тут новый плацкарт, который имеет все шансы стать основной версией для ночных экспрессов. На нём я хочу показать, как ваши отзывы помогали менять вагон. Поскольку эта история прототипов уже длинная, отлично видно и тупиковые ветки, от которых отказались, и удачные решения. Начнём с того, что есть сейчас:



ТМХ показали четвёртый, близкий к финалу плацкартный вагон в диагональной компоновке. Напомню, сначала у нас был капсульный отель со шкафом вместо стола, потом целый вагон боковушек, а теперь есть тот вариант, который больше всего похож на китайский диагональный плацкарт, только с учётом всего того, что до этого говорили эксперты и пассажиры. Например, посты на Хабре собрали 548, 518 и 888 комментариев, куча обратной связи была с выставок, других публикаций и от тех, кто зашёл на макеты (они были на Ярославском, Павелецком вокзалах и на ВДНХ).



Значит, главное: будут и «капсулы», и привычные плацкарты со столом, в вашей тумбочке всё так же останутся ноги соседа. Багаж теперь не будет торчать в проход, а станет надёжно лежать между полкой и окном, плюс наверх можно будет лазить с бутылками. Естественно, новый свет, розетки везде и компромисс с багажными полками в проходе вместо третьих.

Напомню, традиционный плацкарт хорош, но если стоит задача удлинить полки и решить ещё кучу вещей, накопившихся за последние лет так 50, то нужна перекомпоновка. Именно её мы сейчас видим.
Читать дальше →

Забираем большие маленькие данные по REST API

Reading time6 min
Views9.1K


Кадр из мультфильма «Смешарики: 132 серия (Пылесос)»


При проведении различной ad-hoc аналитики или же создания интеграций между DS решением и внешними системами очень часто приходится использовать REST API для получения данных. Ситуация, когда все помещается в один запрос — идеальна, но редка как единорог. Как правило, приходится тянуть большие объемы, тянуть по частям и в режиме многоходовок, возможно, с использованием курсоров. Внешняя система может лечь при большой нагрузке или же там включатся механизмы пропуска запросов (троттлинг). Вопросы «почему у меня не работает» и «как мне сделать, чтобы работало» возникают с завидной регулярностью.


Ниже приведен блочный разбор типового скрипта для получению данных из внешней системы через REST API. Его можно рассматривать как первое приближение решения задачи подобного класса.


Является продолжением серии предыдущих публикаций.

Читать дальше →

Робопрактика для бизнес-аналитиков: как это было

Reading time9 min
Views1.3K

Мы в red_mad_robot регулярно запускаем Робопрактики — бесплатные образовательные мероприятия, где рассказываем про технологии, методологии, подходы и процессы, которые используем в разработке digital-продуктов. Проводим их для QA-инженеров, мобильных и бекэнд-разработчиков — это один из наших способов делиться знаниями и практическим опытом, а также находить и прокачивать новых ребят. А самых сильных практикантов приглашаем работать в компанию. Рассказываем, как это было, и делимся опытом и полезными материалами.

Читать далее

Яндекс.Практикум: самый подробный отзыв

Reading time31 min
Views307K

Хочу поделиться личным опытом (об/м)учения в Яндекс.Практикуме на курсе "Веб-разработчик", и почему, вернувшись на год назад в прошлое, я бы никогда не стал там учиться даже за бесплатно.

Для начала расскажу о причинах, по которым я решил войти в IT (спойлер: и в итоге всё-таки вполз), и почему я выбрал именно Яндекс.Практикум.

Получив 2 красных диплома, которые теперь лежат на полке, я понял, что дипломированный инженер-строитель никому не нужен, т. к. с поиском работы по специальности в моём городе (областном центре) было тяжко. В итоге, отработав полгода рабочим на строительном комбинате и разочаровавшись в высшем образовании вообще и в своей специальности в частности, я задумался о смене профессии на более:

1) прибыльную (на комбинате я получал 24 тысячи в месяц);

2) перспективную (в IT действует меритократия, а в строительной сфере без связей, которых у меня нет, далеко на уедешь и высоко не взлетишь);

3) интересную и интеллектуальную. 

У меня есть старший брат – веб-разработчик с 10-летним стажем, за плечами которого опыт разработки в Яндексе, TopTal и нынешняя работа senior-программистом в Amazon. Я специально так подробно рассказываю о своём брате, т. к. далее эта информация понадобится для понимания контекста.

Брат, видя, как я страдаю от невозможности реализовать себя в профессии, на обучение которой потратил 8 лет, предложил попробовать себя в IT-сфере и посоветовал найти подходящие IT-курсы по профессии веб-разработчик, а он будет меня менторить.

Почему я выбрал именно веб? Потому что по личному опыту брата и его друзей-айтишников порог входа в веб ниже, чем в других IT-профессиях. И мне, как визуалу, важно видеть результаты своего труда (чертежи, запроектированные и построенные здания). И как раз фронтенд-разработка предоставляет эту возможность.

Читать далее

Разработка, сборка, деплой и мониторинг сервисов: от общего к частному и обратно

Reading time8 min
Views7.9K

Привет, Хабр! Меня зовут Андрей Перепелкин. Я руководитель группы бэкенд-разработчиков, вошел в IT более 15 лет назад, 10 лет занимаюсь Java и около 4 плотно работаю с микросервисами. 

В этой статье я расскажу, как:

— мы организовали разработку микросервисов так, чтобы вынести инфраструктуру из продуктового проекта и управлять ей отдельно;

— создали общее поле разработки для независимых команд, получить единый стиль кода и контролировать качество;

— встраиваем микросервисы в инфраструктуру и собираем метрики и логи, не загружая этим разработчиков.

Читать далее

Как квантовые компьютеры будут исправлять свои ошибки

Reading time5 min
Views6.4K

В 1994 году Питер Шор, математик из Bell Labs в Нью-Джерси, доказал, что квантовый компьютер способен решать некоторые задачи экспоненциально быстрее, чем классический компьютер. Вопрос был в том, можно ли построить квантовый компьютер? Скептики утверждали, что квантовые состояния слишком хрупкие - окружающая среда неизбежно перемешает информацию в квантовом компьютере, сделав его совсем неквантовым.

Год спустя Шор ответил. Классические схемы измеряли отдельные биты для проверки на наличие ошибок, но этот подход не работал бы для квантовых битов или «кубитов», поскольку любое измерение разрушило бы квантовое состояние и, следовательно, вычисления. Шор нашел способ определить, произошла ли ошибка, без измерения состояния самого кубита. Код Шора положил начало области квантовой коррекции ошибок.

Раздел квантовой коррекции ошибок расцвел. Большинство физиков видят в нём единственный путь к созданию чрезвычайно мощного квантового компьютера. «Без коррекции ошибок мы не сможем масштабировать квантовые компьютеры до такой степени, чтобы они могли решать действительно сложные задачи», - сказал Джон Прескилл, физик из Калифорнийского технологического института.

Как и в случае с квантовыми вычислениями в целом, одно дело разработать код, исправляющий ошибки, и совсем другое - реализовать его на работающей машине. Но в начале октября исследователи под руководством Криса Монро, физика из Университета Мэриленда, сообщили, что они продемонстрировали многие ингредиенты, необходимые для работы схемы Шора с исправлением ошибок.

Читать далее

Технический долг как инструмент управления архитектурой банка

Reading time16 min
Views4.9K

Управление техническим долгом в архитектурном процессе современного банка — это не локальная задача его архитекторов. Это стратегический механизм, который при правильной реализации позволит непрерывно улучшать ИТ-ландшафт и, в конечном итоге, обеспечит достижение результатов, запланированных как ИТ-стратегией, так и бизнес-стратегией банка. Недостаточно техдолг просто записать — его жизненный цикл и формируемые показатели наглядно демонстрируют, что с ИТ не так и что с этим делать.

Читать далее о техническом долге в банке..

Information

Rating
Does not participate
Location
Praha, Hlavni Mesto Praha, Чехия
Date of birth
Registered
Activity