Articles / Bookmarks / Profile of KristinaMyLife / Habr

How to become an author

@KristinaMyLife

Пользователь

ProfileArticles16PostsNewsComments96

MaxRokatansky Oct 3 2024 at 14:49

Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

16 min

5.7K

OTUS corporate blogGo*Machine learning*

Translation

В этой статье я поделюсь с вами своим опытом использования Golang, Kafka и Clickhouse на примере простого ETL-конвейера для параллельной передачи JSON-данных в базу данных с последующим прогнозированием температуры на основе машинного обучения.

Читать далее

+9

badcasedaily1 Oct 3 2024 at 18:14

Кратко про Ensemble методы с примерами

4 min

1.4K

OTUS corporate blogPython*Programming*

Сегодня мы рассмотрим Ensemble методов, которые помогают сделать модели более точными и устойчивыми к переобучению. Рассмотрим три основных подхода: Bagging, Boosting и Stacking, и посмотрим, как их реализовать на Python.

Читать далее

+8

Andrey_Biryukov Oct 4 2024 at 04:29

О bruteforce и его реинкарнациях

6 min

6.5K

OTUS corporate blogInformation Security*

Все мы хорошо знаем о том, что пароли можно подобрать или перехватить другими способами. В рамках данной статьи мы будем говорить именно о подборе паролей. Будем считать, что наш атакующий не имеет физического доступа к машине, с которой осуществляется аутентификация и следовательно, поставить троян или кейлоггер он не может. Также хакер не может контролировать каналы связи, весь трафик между клиентом и сервером зашифрован и у злоумышленника нет возможности реализовать Man in the Middle. Но зато, хакеру доступен интерфейс атакуемого приложения, где он может вводить свои учетные данные.

Читать далее

+15

shahmatun Oct 4 2024 at 09:31

Создание эффективной команды QA: Рекомендации для лидеров

Easy

5 min

1.7K

OTUS corporate blogPersonnel Management*

Opinion

В эпоху стремительного развития технологий и повышенных ожиданий пользователей качество программного обеспечения становится критическим фактором успеха продукта на рынке. Ошибки и сбои могут привести не только к финансовым потерям, но и к подрыву доверия клиентов. В этих условиях команда QA (Quality Assurance) играет ключевую роль в обеспечении стабильности и надежности продуктов.

Читать далее

+13

Andrey_Biryukov Oct 4 2024 at 17:42

Из чего состоит безопасность современных приложений

7 min

2K

OTUS corporate blogInformation Security*

В сети можно встретить различные трактования понятия AppSec (Application Security). И в этой статье мы попробуем разобраться с тем, что же должно входить в AppSec и какие навыки требуются специалистам, работающим в данной отрасли и какие инструменты они должны применять.

В целом, методология AppSec помогает защитить данные и код приложений от кибератак и кражи данных. В методологии рассматриваются все аспекты безопасности при проектировании, разработке и развертывании приложений. AppSec включает в себя внедрение программного обеспечения, аппаратного обеспечения и процедур, которые выявляют и сокращают количество уязвимостей в системе безопасности и сводят к минимуму вероятность успешной атаки.

AppSec обычно включает в себя внедрение средств защиты и контроля в программные процессы. Например, автоматический статический анализ нового кода, тестирование новых версий программного обеспечения на наличие уязвимостей в системе безопасности или неправильных настроек, а также использование брандмауэра приложений для строгого определения разрешенных и запрещенных действий.

Рассмотрим более подробно составные части методологии AppSec.

Читать далее

+10

badcasedaily1 Oct 5 2024 at 07:01

Darts: тестируем временные ряды с нуля

5 min

2.3K

OTUS corporate blogPython*Machine learning*

Привет, Хабр!

Если вы когда-либо имели дело с временными рядами, то, вероятно, слышали о Darts. А для тех, кто ещё в танке: Darts — это мощный инструмент, который поддерживает мультиварибельные временные ряды и легко интегрируется с PyTorch и TensorFlow.

Зачем же тестировать временные ряды, когда в классическом машинном обучении всё так просто с кросс-валидацией? Временные ряды обладают своей изюминкой: они подвержены временным зависимостям, сезонности, трендам и другим радостям жизни. Так что, если вы хотите, чтобы ваши модели не провалились на тестах, время разобраться с их особенностями!

Читать далее

+11

Andrey_Biryukov Oct 5 2024 at 09:02

Машинное обучение и криптография: знакомимся с CipherGAN

Easy

7 min

1.7K

OTUS corporate blogMachine learning*Information Security*

Review

Машинное обучение в большей или меньшей степени сейчас используется в различных отраслях. Не стало исключением и направление криптографического анализа. В этой статье мы рассмотрим генеративно‑состязательную сеть CipherGAN, используемую для определения базового шифровального отображения по банкам непарного зашифрованного текста и открытого текста.

Читать далее

+14

MaxRokatansky Oct 6 2024 at 11:35

Ошибки в интерпретации A/B-тестов: как избежать неверных выводов

6 min

1.5K

OTUS corporate blogProduct Management*

А/В‑тестирование является одним из ключевых инструментов продуктовой аналитики, позволяя принимать обоснованные решения на основе данных. Но, несмотря на свою эффективность, многие команды допускают типичные ошибки при проведении и интерпретации результатов А/В‑тестов.

В этой статье я рассмотрю 7 наиболее распространенных ошибок с примерами и способами их предотвращения. Чтобы выводы ваших А/В были точны и надежны.

Читать далее

+11

badcasedaily1 Oct 2 2024 at 05:06

Перегрузка операторов в C++

Easy

4 min

3.1K

OTUS corporate blogC++*Programming*

Review

Привет, Хабр! Сегодня мы рассмотрим одну из самых мощных и увлекательных возможностей C++ — перегрузку операторов. Эта фича позволяет настраивать стандартные операторы так, чтобы они работали с пользовательскими типами данных, делая код чище и понятнее.

Представьте, что вместо вызова метода add() для сложения двух объектов, можно просто написать object1 + object2. Звучит здорово, не правда ли?

Читать далее

+4

Andrey_Biryukov Oct 2 2024 at 13:10

ЦОД: топологии и архитектуры

5 min

6.5K

OTUS corporate blogNetwork technologies*

Центры Обработки Данных, как правило представляют собой здания с помещениями достаточно большого размера, в которых размещаются бесконечные шкафы с серверами, коммуникационным оборудованием, системами хранения и прочими инфраструктурными элементами. И порой крайне сложно разобраться, как взаимодействует между собой все это техническое многообразие. В этой статье мы поговорим о топологии и архитектуре сетей ЦОД.

Сетевая архитектура центра обработки данных должна обеспечивать баланс между надежностью, производительностью, гибкостью, масштабируемостью и стоимостью. При этом, она также должна поддерживать как текущие, так и будущие приложения и иметь запас мощности, который может потребоваться для развертывания новых приложений.

Для начала поговорим о том, какие топологии могут использоваться в сетях ЦОД.

Читать далее

+20

badcasedaily1 Oct 2 2024 at 18:08

Как проверить свои модели ONNX на Python: кратко

Easy

4 min

2.9K

OTUS corporate blogMachine learning*

Review

Привет, Хабр!

В этой статье разберем, что такое ONNX, как экспортировать модели в этот универсальный формат и, что самое главное, как протестировать их с помощью Python.

Читать далее

+11

kmoseenk Sep 18 2024 at 08:42

Что должен знать каждый разработчик о вычислениях на GPU

Medium

13 min

17K

OTUS corporate blogProgramming*CPU

Translation

Большинство программистов отлично разбираются в работе процессоров и последовательном программировании, поскольку с самого начала пишут код для CPU. Однако многие из них меньше знают о том, как устроены графические процессоры (GPU) и в чем заключается их уникальность. За последнее десятилетие GPU стали чрезвычайно важны благодаря широкому применению в глубоком обучении, и сегодня каждому разработчику необходимо обладать базовыми знаниями о том, как они работают. Цель этой статьи — дать вам это понимание.

Читать далее

+43

Loxmatiymamont Sep 19 2024 at 08:13

Майкл Стоунбрейкер: «Всё новое — это хорошо забытое старое. Продолжение»

40 min

6.9K

Postgres Professional corporate blogPostgreSQL*Database Administration*Data storage*Reading room

Opinion

Translation

От редакции: Майкл Стоунбрейкер - один из самых известных в IT мире ученых и отец-основатель Postgres. В соавторстве с Энрю Павло, недавно опубликовал большой обзор всех актуальных технологий систем управления базами данных. В этом материале — подробно обо всем, что произошло в мире баз данных за последнее время, а также прогнозы. Мы посчитали что нельзя лишать нашу аудиторию возможности ознакомиться с этим обзором, поэтому подготовили данный перевод.

Читать далее

+31

Gscraid Aug 8 2024 at 09:02

LIBRA: Long Input Benchmark for Russian Analysis

Medium

6 min

4.7K

SberDevices corporate blogOpen data*Machine learning*Artificial IntelligenceNatural Language Processing*

Review

Мы разработали бенчмарк LIBRA, который включает в себя 21 адаптированный набор данных для тщательного изучения способности LLM понимать длинный контекст. Помимо самих данных для оценки, мы опубликовали кодовую базу и лидерборд для сравнения моделей.

Читать далее

+32

badcasedaily1 Aug 7 2024 at 16:16

Оптимизация в Python c Kubernetes: кэширование и CDN

Easy

4 min

634

OTUS corporate blogServer optimization*Programming*Python*Kubernetes*

Привет, Хабр!

Очень важно не только писать хороший код, но и использовать все возможности инфраструктуры на максимум. Именно с этой целью в этой статье рассмотрим, как правильно использовать инструменты кэширования внутри Kubernetes и как настроить CDN для максимума производительности Python-приложения.

Читать далее

+9

badcasedaily1 Aug 8 2024 at 11:54

On-premise, private cloud, public cloud: разбираемся в плюсах и минусах

Easy

4 min

1.8K

OTUS corporate blogProject management*Business Models*

Review

Привет, Хабр!

On-premise, private cloud, и public cloud — это три основные модели развертывания IT-инфраструктуры, каждая из которых предлагает различные уровни контроля, управления и масштабируемости.

Выбор между этими моделями часто ставит в тупик. Как выбрать подходящую платформу? Сегодня мы рассмотрим все плюсы и минусы этих трех подходов.

Читать далее

+8

badcasedaily1 Aug 8 2024 at 17:40

Rust и иммутабельность

Easy

5 min

3.3K

OTUS corporate blogData storage*Rust*Programming*High performance*

Review

Привет, Хабр!

Иммутабельность данных в Rust – это основа для создания систем, устойчивых к ошибкам и сайд-эффектам. В этой статье рассмотрим, как Rust позволяет использовать неизменяемые структуры данных для улучшения производительности и безопасности приложений.

Начнем с синтаксических особенностей.

Читать далее

+8

badcasedaily1 Aug 8 2024 at 18:26

От текста к краткому изложению: библиотека Sumy

Easy

4 min

3.2K

OTUS corporate blogPython*Programming*Natural Language Processing*

Review

Привет, Хабр!

Sumy — это инструмент для автоматического обобщения текстов на Python. В основе работы лежит задача резюмирования текста, которая позволяет получать краткие и четкие версии больших объемов информации.

Читать далее

+12

badcasedaily1 Aug 9 2024 at 12:41

Полезные фичи в Java для новичков: мой список

Easy

7 min

15K

OTUS corporate blogProgramming*Java*

Review

Привет, Хабр!

В Java никогда не бывает скучно, особенно когда речь заходит о вещах, которые делают нашу жизнь проще и код — чище.

Сегодня я хочу рассказать вам о четырех фичах в Java, которые сам активно использовал в своих проектах и которые, на мой взгляд, заслуживают внимания. Да, это мой личный список, и я не претендую на то, что эти фичи новы или являются последним писком моды. Однако, по моему опыту, они действительно могут упростить жизнь.

И знаете, что самое приятное? Когда коллеги начинают говорить: "А почему я об этом не знал раньше?"

Читать далее

+6

Andrey_Biryukov Aug 9 2024 at 22:40

Настраиваем дампы ядра в Linux

Medium

5 min

5.5K

OTUS corporate blogConfiguring Linux*

Core Dump (Дамп ядра) - это файл, который автоматически генерируется ядром Linux после сбоя программы. Этот файл содержит данные о памяти, значениях регистров и стеке вызовов приложения на момент сбоя. Да, обычно появление сообщения о создании Core Dump является не слишком приятным сюрпризом, которых лучше бы было поменьше. Но если уж Core Dump был создан, то лучше, чтобы он содержал максимум полезной информации, которая поможет разработчикам и администраторам разобраться в причинах возникшего сбоя.

В этой статье мы поговорим о том, как правильно настраивать создание дампов ядра.

Читать далее

+14

2

3 4 ...