Статьи / Закладки / Профиль Ranlod / Хабр

Сергей @Ranlod

Аналитик

Профиль Публикации 2Комментарии 58Закладки 175

badcasedaily1 3 сен в 12:23

Как ускорить A/B тесты: несколько способов

Простой

8 мин

1.1K

Блог компании OTUSPython*Программирование*

Обзор

Знаете, что самое раздражающее в A/B тестах? Это ожидание результатов.

А что, если можно ускорить процесс и получить нужные данные быстрее? Сегодня расскажу, как разогнать A/B тесты, чтобы не терять время зря и быстрее получать результаты.

tguev 9 июл в 12:05

Секреты логических операторов в Python

Средний

8 мин

20K

Python*Программирование*

Логические операции играют важную роль в программировании. Они используются для создания условных конструкций и составления сложных алгоритмов. В Python для проведения логических операций используются логические операторы:

not — логическое отрицание

and — логическое умножение

or — логическое сложение

В этой статье мы поговорим о неочевидных деталях и скрытых особенностях работы логических операторов в Python.

+52

Guest11 19 мая в 00:40

А/В эксперименты. Ускорение вычислений с помощью бакетизации

Простой

5 мин

2.9K

Python*Data Mining*Big Data*

В данной статье мы рассмотрим, как бакетизация может существенно ускорить вычисления и представим график зависимости отношения времени на расчеты p-value без бакетизации к времени на расчеты с бакетизацией.

Время – деньги!

Dmytro_Kikot 24 апр в 10:00

Спасение от ампутации: обувная стелька для диабетиков

10 мин

2.5K

Блог компании ua-hosting.companyНаучно-популярноеФизикаНосимая электроникаЗдоровье

Организм человека не зря называют сложнейшим механизмом, ведь он состоит из множества взаимосвязанных систем, цель которых заключается в поддержании нормального функционирования всего организма. К сожалению, несмотря на технологичный прогресс медицины и фармацевтики, многие заболевания продолжают существовать. Часть этих заболеваний помимо прямого воздействия на конкретную систему организма обладают косвенным влиянием и на другие. Ярким тому примером является диабет, который может вызывать образование язвы на нижних конечностях, приводя в итоге к ампутации пальца, стопы или всей ноги. Ученые из Техасского университета в Арлингтоне (США) разработали специальную обувную стельку, которая значительно снижает риск образования язв и, как следствие, риск ампутации. Из чего сделана эта стелька, как она работает, и насколько она эффективна? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+21

vasilevafb 10 апр в 15:15

Более 250 бесплатных курсов и ресурсов по аналитике

Простой

11 мин

23K

Big Data*

Роадмэп

Большая подборка для аналитиков данных, продуктовых аналитиков, веб аналитиков, маркетинговых аналитиков и особенно тех, кто хочет ими стать. От автора Telegram-канала «Аналитика и Growth mind-set».

Но прежде несколько важных моментов:

+14

klimkovsky 7 апр в 17:53

Полное солнечное затмение 8 апреля 2024 года

Средний

7 мин

108K

Научно-популярноеАстрономия

Обзор

Это затмение называют "Великим Американским Затмением". Можно догадаться почему. Зона его видимости — североамериканский континент. За незначительным исключением, нигде на суше, кроме США, Канады, Мексики и нескольких стран центральной Америки, затмение не видно.

Да — в зоне видимости будет еще акватория Тихого и Атлантического океанов, ряд островов расположенных в них, Гренландия и самый краешек северной Европы — совсем уже на излете (во время захода Солнца и в очень малых фазах). Но если говорить о полосе полной фазы, в которой для наблюдателей Солнце затмится Луною совершенно, наступят густые сумерки, и на небе вспыхнут самые яркие звезды и планеты, то она коснется лишь трех стран: Мексики, США и Канады.

+76

david_khoperiya 3 апр в 11:59

Мониторинг Apache Airflow. Оценка «прожорливости» тасок

10 мин

4.4K

Блог компании Ozon БанкPython*Apache*Data Engineering*

Туториал

Всем привет! Случались ли у вас ситуации, когда количество DAG’ов в вашем Airflow переваливает за 800 и увеличивается на 10-20 DAG’ов в неделю? Согласен, звучит страшно, чувствуешь себя тем героем из Subway Surfers… А теперь представьте, что эта платформа является единой точкой входа для всех аналитиков из различных команд и DAG’и пишут более 50 различных специалистов. Подкосились ноги, холодный пот и желание уйти из IT?

Не спешите паниковать, под катом я расскажу о том, как контролировать потребление ресурсов DAG’ов Airflow для предупреждения неоптимально написанных DAG’ов и борьбы с ними.

Меня зовут Давид Хоперия, я Data Engineer в департаменте данных Ozon.Fintech и моим основным инструментом является Apache Airflow, поэтому настало время углубиться в детали его работы.

Поехали

+16

UranusExplorer 15 мар в 00:03

Надежный обход блокировок в 2024: протоколы, клиенты и настройка сервера от простого к сложному

Средний

46 мин

216K

Настройка Linux*Информационная безопасность*Системное администрирование*Сетевые технологии*

Туториал

Поскольку блокировки интернета в РФ в последние недели и месяцы многократно активизировались, а маразм все крепчает и крепчает, стоит еще раз поднять тему обхода этих самых блокировок (и делаем ставки, через сколько дней на эту статью доброжелатели напишут донос в РКН чтобы ограничить к ней доступ на территории страны).

Вы, наверняка, помните отличный цикл статей на Хабре в прошлом году от пользователя MiraclePtr, который рассказывал о разных методах блокировок, о разных методах обхода блокировок, о разных клиентах и серверах для обходов блокировок, и о разных способах их настройки (раз, два, три, четыре, пять, шесть, семь, восемь, десять, десять, и вроде были еще другие), и можете спросить, а зачем еще одна? Есть две основные причины для этого.

+489

364

vv_kuznetsov 18 фев в 18:48

SimulIDE: открытый симулятор цифровых схем и микроконтроллеров

3 мин

25K

Open source*CAD/CAM*Программирование микроконтроллеров*DIY или Сделай сам

В этой заметке я решил рассказать о SimulIDE. Это относительно новое программное средство с открытым исходном кодом, предназначенное для моделирования 8-битных микроконтроллеров семейств AVR и PIC, а также прочих электронных схем. По интерфейсу SimulIDE напоминает Proteus. SimulIDE кроссплатформенный и работает под Linux, Windows и Mac. Далее будут рассмотрены основные возможности этого симулятора и рассказано о моих личных впечатлениях от работы с данной программой.

+57

badcasedaily1 19 фев в 14:33

Обзор библиотеки Stan в R

Средний

11 мин

1.4K

Блог компании OTUSПрограммирование*Алгоритмы*R*Машинное обучение*

Обзор

Приветствую!

Stan - это библиотека на C++, предназначенная для байесовского моделирования и вывода. Она использует сэмплер NUTS, чтобы создавать апостериорные симуляции модели, основываясь на заданных пользователем моделях и данных. Так же Stan может использовать алгоритм оптимизации LBFGS для максимизации целевой функции, к примеру как логарифмическое правдоподобие.

Для облегчения работы с Stan из языка программирования R доступен пакет rstan, который предоставляет интерфейс R для Stan.

Сегодня мы и рассмотрим этот пакет.

badcasedaily1 6 фев в 15:55

Параллельное выполнение в R

Простой

7 мин

1.2K

Блог компании OTUSR*Визуализация данных*

Обзор

Привет, Хабр!

Параллельные вычисления – подход к проектированию и выполнению программ, который позволяет ускорить обработку данных и вычисления, используя множество процессоров или ядер процессора одновременно.

В ЯП R паралельное выполнение также имеет свои варианты реализации. Рассмотрим их в статье.

+14

pavelmakis 2 фев в 16:30

Как я создаю себе колоды Anki для немецких слов

Средний

14 мин

8.6K

Python*Изучение языков

Из песочницы

Я захотел продолжить некогда заброшенное изучение немецкого языка. Долгое время на просторах интернета слышал мнение, что карточки Anki – чуть ли не самый лучший способ изучение языка, и решил, собственно, посмотреть что к чему. Рекомендации YouTube привели меня к интересному видео, где автор рассказывает о своем шаблоне карточек с немецкими словами. Автор не желал публиковать свою колоду, и не найдя аналогов среди публичных колод, я принялся делать свое. Конечно же не вручную.

+17

TSjB 12 янв в 18:41

Семантический поиск и генерация текста на R. Часть 1

Средний

10 мин

2.5K

Поисковые технологии*Семантика*R*Машинное обучение*Natural Language Processing*

Из песочницы

Для этой задачи использую LLM (Large Language Models - например, chatGPT или opensouce модели) для внутренних задач (а-ля поиск или вопрос-ответную систему по необходимым данным).

Я пишу на языке R и также увлекаюсь NLP (надеюсь, я не один такой). Но есть сложности из-за того, что основной язык для LLM - это python. Соответственно, на R мало примеров и документации, поэтому приходится больше времени тратить, чтобы “переводить” с питона, но с другой стороны прокачиваюсь от этого.

Чтобы не городить свою инфраструктуру, есть уже готовые решения, чтобы быстро и удобно подключить и использовать. Это LangChain и LlamaIndex. Я обычно использую LangChain (дальше он и будет использоваться). Не могу сказать, что лучше, просто так повелось, что использую первое. Они написаны на питоне, но с помощью библиотеки reticulate всё работает и на R.

TSjB 18 янв в 21:32

Семантический поиск и генерация текста на R. Часть 2

Средний

5 мин

Поисковые технологии*Семантика*R*Машинное обучение*Natural Language Processing*

В первой части говорили про использование поиска и генерации ответа с помощью языковых моделей. В этой части рассмотрим память и агентов.

Polina_Vostrikova 7 янв в 15:51

Как получить повышение. Взгляд глазами руководителя

Простой

8 мин

68K

Блог компании «Лаборатория Касперского»Управление персоналом*Карьера в IT-индустрииДизайнIT-компании

Мнение

Новый год — это не только праздник/отдых/премии и вот это вот все, нужное подчеркнуть; это еще и старт нового промоушен-периода, когда вы можете претендовать на повышение грейда или увеличение зарплаты.

В моем отделе (B2В Product Design, хотя это сейчас неважно) 25 человек. Непосредственно я руковожу не линейными сотрудниками, а тимлидами команд, но суть в том, что по каждому из коллег в мои задачи входит распределение премий, повышение зарплат и назначение новых грейдов.

За время моей работы я не только помогла с промоушеном примерно полутора десяткам коллег, но и много раз сталкивалась с типовыми ошибками сотрудников в этих вопросах. И хотела бы поделиться своим опытом со стороны руководителя, как вы можете увеличить свои шансы получить заветное повышение.

И я не зря публикую этот пост в самом начале года: во-первых, в разных компаниях промоушен-периоды проходят в разные сроки, начиная в том числе прямо с зимы; во-вторых, чем раньше вы выберете правильную тактику, тем больше у вас шансов на успех.

(Моя любимая команда. И тут, кстати, не все))

Читать дальше →

-9

294

it_union 6 окт 2023 в 09:00

Состояние рынка труда и зарплат в IT

Простой

5 мин

24K

Исследования и прогнозы в IT*Карьера в IT-индустрии

Обзор

На Хабре регулярно публикуются зарплатные исследования сервисов для поиска работы. Данные одних основываются на зарплатах, которую предлагают работодатели в вакансиях. Другие же анализируют зарплаты, которые указали в анкетах сами IT-специалисты. Эти исследования учитывают зарплаты только внутри России, но с февраля 2022 года сотни тысяч айтишников России (и не только) уехали в другие страны. Многие из них нашли работу в новых странах, но кто-то продолжил работать на компанию из родной страны. Кроме того, эти исследования не учитывают важные, на наш взгляд, факторы: работает специалист удалённо или в офисе, оформлен ли трудовой договор или договор оказания услуг, и как от всего этого зависит зарплата. Так в коллективе профсоюза родилась идея провести собственное исследование состояния рынка труда и зарплат в IT.

+36

ru_vds 28 авг 2023 в 16:00

Профилирование Python — почему и где тормозит ваш код

Средний

10 мин

22K

Блог компании RUVDS.comPython*Отладка*Визуализация данных*

Туториал

Перевод

Представьте ситуацию: вы написали скрипт для обработки каких-то данных на ноутбуке, ушли попить кофе, а когда пятнадцать минут спустя вернулись, завершилось едва ли 10%.

Почему скрипт работает так медленно? Какая его часть тормозит? Дело в чтении данных, их обработке или сохранении? Как ускорить исполнение? Действительно ли скрипт вообще медленный?

Ответить на все эти вопросы поможет инструмент под названием «профилировщик» (profiler).

Читать дальше →

+66

badcasedaily1 24 авг 2023 в 12:55

Статистические тесты и проверка гипотез в R

15 мин

7.5K

Блог компании OTUSR*

Современный мир насыщен данными, анализ информации становится критически важным инструментом для принятия обоснованных решений. Однако просто иметь данные не достаточно – необходимо извлечь из них ценную информацию. В этом процессе статистические тесты и проверка гипотез играют важнейшую роль. Они позволяют нам сделать выводы на основе данных, опираясь на строгие методы анализа, и тем самым способствуют принятию обоснованных решений.

Статистические тесты – это мощный инструмент, который позволяет провести объективную оценку данных и проверить гипотезы, основанные на этой информации. Они позволяют определить, насколько вероятно, что наблюдаемые различия или закономерности случайны, а не реально существующие в популяции. Статистические тесты позволяют избежать ошибок и предоставляют научно обоснованный подход к анализу данных.

+11

Abby_Baby 13 фев 2023 в 22:07

Заметки по R: находим каждый последний понедельник месяца в наборе данных

Простой

3 мин

1.3K

Мнение

Периодически возникают задачи в R, которые просты по своей сути, но не очевидны для тех, кто только начинает свой путь.

Представим, что в нашей организации каждый последний понедельник месяца происходит учет товара. В эти дни нет продаж. И мы бы хотели учесть это в наших прогнозах. Стоит вопрос: как в данных "выловить" эти понедельники, не используя function.

mr-pickles 19 сен 2022 в 12:48

Списковые включения в Python мощнее, чем можно подумать

7 мин

34K

Блог компании Wunder FundВеб-разработка*Python*Программирование*

Перевод

В Python списковые включения (и генераторы списков) — замечательные механизмы, способные серьёзно упрощать программный код. Правда, чаще всего их используют в форме, предусматривающей наличие единственного цикла for и, возможно, одного условия if. И это всё. Но если попытаться немного вникнуть в эту тему, то окажется, что у списковых включений Python имеется гораздо больше возможностей, чем можно подумать, возможностей, разобравшись с которыми, можно, по меньшей мере, кое-чему научиться.

+29

2 3 ...

8 9