Статьи / Закладки / Профиль Sterhel / Хабр

Как стать автором

Алексей @Sterhel

Работаю в Фантехе Яндекса

Профиль Публикации 224Комментарии 3.1KЗакладки 1.9K

Beeline_tech 26 окт 2023 в 17:57

Настройка NVMe over TCP — для тех, кому надо подключить больше 1 диска единственной конфигурации из всех примеров в Сети

Средний

13 мин

16K

Блог компании билайнХранение данных*Серверное администрирование*Системное администрирование*Oracle*

Кейс

Технология NVMe через различные фабрики (далее NVMeOF) оформлена в качестве стандарта летом 2016 года, она была встроена в пятую ветку ядра Linux.

Поэтому, когда было решено мигрировать объемные базы данных с легаси-решений на общедоступные платформы, возник вопрос — можно ли применить эту технологию для увеличения дискового пространства для создания зеркал локальных дисков?

Чтобы все зеркала не вышли из строя сразу, принимать такие диски надо бы небольшими группами с нескольких машин из разных стоек. Идея показалась достойной рассмотрения, поэтому создали небольшой стенд.

Меня зовут Алексей Дрожжов, я старший инженер в билайне, и в этом посте расскажу, как мы решали эту задачу.

Задача: подключить много дисков с нескольких серверов

Читать далее

+20

cool4uma 26 окт 2023 в 14:13

Автоматизация Swimlanes на досках Jira

Простой

2 мин

2.8K

Блог компании SM LabAtlassian*Управление проектами*

Туториал

В досках Kanban и Scrum есть удобный инструмент горизонтальной группировки задач swimlanes (дорожки). С помощью дорожек задачи можно группировать по разным категориям: типам задач, проектам, пользовательским полям и прочему. Многие из вас наверняка уже знакомы с этим инструментом и активно пользуются им.

А что, если работу с дорожками можно сделать еще удобней и интересней? На примере реального кейса я попробую рассказать про способ автоматического добавления и удаления дорожек в досках Jira.

Читать далее

+5

anastasiy_y 24 окт 2023 в 16:05

Путешествие прошлого: что ели моряки и воины в пути

Простой

7 мин

12K

Блог компании РСХБ.цифра (Россельхозбанк)Научно-популярноеЧитальный зал

Ретроспектива

В этой статье поговорим о рационе мореплавателей и о продуктах, которые чаще всего были на борту кораблей и в путевых рюкзаках.

Это первая часть из серии статей. В следующей статье мы подробно рассмотрим необычные способы хранения продуктов питания без холодильников, сушильных машин и вакууматоров.

Читать далее

+12

horo69 24 окт 2023 в 15:51

One week offer для системных аналитиков и аналитиков данных — с 7 по 10 ноября

2 мин

5.6K

Блог компании SM LabУправление персоналом*Карьера в IT-индустрииАнализ и проектирование систем*Аналитика мобильных приложений*

Привет! Мы тут решили запустить очередной One Week Offer, на этот раз — для системных аналитиков и аналитиков данных, с 7 по 10 ноября. Если вам интересно — до 3 ноября зарегистрируйтесь на лендинге, и с вами свяжутся.

Почему нам нужны системные аналитики

Сейчас в SM Lab работает более 2000 человек, которые с нуля написали и запустили более 320 сервисов и систем. Аналитиков у нас сейчас — порядка 200 человек. Так что, как вы понимаете, работы для желающих ещё много, скучно не будет.

Работать можно как из офисов (пока можем предложить Москву, Санкт-Петербург, Краснодар, Липецк, Новосибирск, Екатеринбург и Воронеж), так и из дома, если вам больше по душе удалёнка, или же вашего города нет в списке.

Читать далее

+5

bda_0 23 окт 2023 в 13:35

Экспорт статьи из LibreOffice Writer в Habr Flavored Markdown или HTML

Простой

8 мин

2.3K

HabrLaTeX*Visual Basic for Applications*Подготовка технической документации*

Из песочницы

Резюме.
В статье дается ссылка на файл в формате ODT (основной формат файлов, используемый в текстовом редакторе LibreOffice Writer), содержащий макросы на «родном» для LibreOffice языке программирования макросов BASIC, которые осуществляют экспорт текста из LibreOffice Writer в новый файл в формате Habr Flavored Markdown (далее - HFM) или HTML, в виде, пригодном для размещения статьи в интернете, например, на сайте habr.com.

Текст данной статьи был экспортирован в формат HFM для размещения на сайте habr.com с помощью библиотеки макросов, содержащихся в данном файле.

Для использования достаточно скачать указанный файл (его можно переименовать), заменить в нем текст на свой текст, подготовленный в соответствии с описанием в статье, и вызвать макрос. В папке со скачанным файлом появится новый файл в выбранном формате.

Рассмотрение макросов на языке BASIC, которые осуществляют экспорт, предполагается в отдельной статье.

Читать далее

+19

smlab_stories 19 окт 2023 в 16:10

Путешествуй, ни в чем себе не отказывай

3 мин

5.8K

Блог компании SM LabУправление персоналом*Здоровье

В этом посте Оксана, старший специалист клиентского сервиса SM Lab, поделится одной из рабочих практик по борьбе с выгоранием. А именно — пользой небольших путешествий на пару дней, которые ощутимо помогают разгрузить голову и не выгореть. Под катом — про это (а ещё много фото Питера).

— Выбери себе работу по душе, и тебе не придётся работать ни одного дня в своей жизни, — наставляет нас Конфуций.

Только мне такой подход кажется утопией в современных реалиях? Даже если работа откликается вашему характеру и складу ума, для достижения результата нужно много учиться, смело преодолевать сложности, принимать ответственные решения, справляться со стрессом и иногда переживать выгорание.

Читать далее

+4

x-sile 17 окт 2023 в 15:33

MLOps в билайн: как катить машинное обучение в production без ML-инженеров. Часть I

Средний

10 мин

6.5K

Блог компании билайнDevOps*Машинное обучение*Big Data*IT-инфраструктура*

Туториал

Всем привет! Меня зовут Николай Безносов, я отвечаю за применение и развитие машинного обучения и продвинутой аналитики в билайне. В одной из прошлых статей мои коллеги рассказывали о месте Seldon в ML-инфраструктуре компании, а сегодня мы поднимемся на уровень выше и поговорим о том, что из себя представляет MLOps в билайне в целом - как с точки зрения инфраструктуры, так и с точки зрения процессов.

В статье речь пойдет о нашем опыте создания ML-платформы, которая помогает дата-сайентистам самостоятельно управлять всем жизненным циклом ML-моделей - от разработки до постановки в production. Я рассчитываю, что статья будет полезна как небольшим командам, которые только начинают выстраивать у себя ML-инфраструктуру, так и корпорациям с большим количеством команд и жесткими требованиями к безопасности, которые при этом хотят эффективно масштабироваться.

Статья будет состоять из двух частей. В первой части мы посмотрим верхнеуровнево, как и по каким причинам менялись наши ML-процессы и инфраструктура в билайне - с чего мы начинали и к чему в итоге пришли. Во второй части поговорим о конкретных инструментах и технологиях, которые мы внедрили, чтобы сделать наш процесс разработки и деплоя моделей простым, воспроизводимым, автоматизируемым и наблюдаемым.

Читать далее

+17

Isenanao 12 окт 2023 в 20:16

Каталог данных — почему без него непросто и как всё организовать с максимальной пользой

Средний

12 мин

8.4K

Блог компании Московский кредитный банкDevOps*Big Data*

В этом посте мы расскажем, как организовали каталог данных в МКБ в текущих условиях — когда многие вендоры ушли, и по-настоящему рабочих вариантов осталось два: или пилить что-то самим с нуля, или обратиться к опенсорсным решениям.

Пилить самим — тут как всегда, это и дорого, и долго. Брать же готовую коробку и использовать ее вчистую тоже достаточно сложно, вы же не знаете наверняка и досконально, чего там и как на самом деле внутри работает.

Когда речь идет о корпоративных данных, это важно. К примеру, та же OpenMetadata — если не знать ее подкапотное устройство, работать с ней будет сложно. А разобраться сложно, потому что документация по ней на сегодня скудноватая, и экспертизы у людей на рынке еще не набралось, из-за чего до много приходится додумываться самим уже в процессе.

Под катом — немного о проблематике работы с данными (и о доверии), о плюсах, которые даст вам каталог данных, а также наша подробная инструкция для разворачивания каталога у себя.

Читать далее

+13

Daria09 12 окт 2023 в 14:22

Как совмещать работу с учебой. Что-то про тайм-менеджмент

Простой

7 мин

20K

Блог компании SM LabУчебный процесс в ITКарьера в IT-индустрииУдалённая работаGTD*

Туториал

Всем привет! Меня зовут Даша и я системный аналитик компании SM Lab. Работаю в команде Brand Planning Tool. Наша команда BPT помогает брендам (таким как Fila, Demix, Northland) запускать новые коллекции.

В этом я году закончила бакалавриат и поступила в магистратуру по направлению «Системный анализ и управление». С третьего курса начала работать по специальности.

В этой статье я расскажу о своем опыте совмещения работы с учебой, о различных методиках и лайфхаках в тайм-менеджменте, которые помогают грамотно планировать свой день. Надеюсь, что мой опыт окажется полезным для всех, кто так же планирует совмещать эти сферы жизни или просто хочет успевать больше в течение дня.

Под катом:

• Моя история
• Важные моменты при планировании
• Методики тайм‑менеджмента
• Выводы

Читать далее

+10

Beeline_tech 12 окт 2023 в 14:40

Как мы переводим наш мониторинг в наблюдаемость

Средний

12 мин

6.9K

Блог компании билайнСистемное администрирование*IT-инфраструктура*

Кейс

Привет всем! Полное содержание первого сезона можно прочитать тут и тут, а краткое содержание такое:

• Компания приняла решение улучшить работу клиентских сервисов и одним из рычагов для этого стал мониторинг.

• Мониторинг был разным (Patrol, Zabbix. NetCool), про Elastic. Про Prometheus, трейсинг и Grafana не слышали.

• У всех команд эксплуатации были свои мониторинги, которые "что-то" показывали, но это все было разрознено и никак не связано.

Привести все это «богатство» в адекватное рабочее русло, как-то структурировать и реструктуризировать было поручено команде супергероев, которые в перерывах между паниками (страшно было) взялись за дело

ВАЖНО: Тут не будет скриптов развертывания. Не будет рецептов и настроек систем (что-то есть в интернете, к чему-то пришли через пот и слезы). Это взгляд людей, которые развивают системы мониторинга и философию, которой они придерживается. Что еще важно – среди нас до момента развертывания не было людей, которые слышали про эти системы.

Наш первый сезон мы закончили с таким багажом и знаниями:

Читать далее

+16

Reverie_moon 6 окт 2023 в 12:48

10 причин не участвовать в некоторых IT-конференциях

Простой

7 мин

7.5K

Блог компании SM LabIT-компанииКонференцииУправление сообществом*

Мнение

Привет! У нас тут накопился неплохой опыт в плане работы с конференциями со всех точек зрения — как организатора своих собственных событий, так и активного участия в больших регулярных IT-конференций. Собственно, им мы с вами и поделимся.

Наверняка пост будут читать организаторы подобных событий, деврелы, которые так или иначе в них участвуют, разработчики, выступающие там с докладами, да и просто люди, которые хотят послушать доклады, но при этом видят только внешнее положение дел.

Расскажем о самых частых косяках, отбивающих у компаний желание вообще идти на конференции, поговорим про еду на площадке и про жару, и разберём не самые очевидные промахи организаторов. А если вы захотите поделиться в комментах своим опытом и предложениями, будем только рады.

Вдруг нам всем вместе получится сделать мир отечественных IT-событий немного лучше.

Читать далее

+32

boris-the-blade 5 окт 2023 в 15:51

Реализация случайности в CSS при помощи тригонометрии

Средний

5 мин

5.4K

Блог компании QIWICSS*Математика*Ненормальное программирование*Программирование*

Туториал

Перевод

В прошлых статьях я рассматривал тему реализации псевдослучайности в CSS при помощи операции целочисленного деления и использовал простые числа для создания автоматического счётчика, при помощи которых можно генерировать разные значения для каждого объекта. Благодаря этому мы можем вычислять псевдослучайные значения для каждого элемента по отдельности.

Несмотря на надёжность этого решения, оно имеет и недостатки:

Функция деления с остатком не непрерывна
Способ слишком сложен: он требует трёх переменных и определения @property для каждого случайного значения, которое мы хотим сгенерировать
Требует применения @property, которое пока поддерживается не очень широко

К счастью, можно сделать лучше! В этой статье я предложу более оптимальное решение на основе тригонометрии.

Читать дальше →

+15

digitalsibur 29 сен 2023 в 12:01

Когда стоит заменить A/B-тестирование сэмплированием Томпсона

Средний

7 мин

2.9K

Блог компании Цифровой СИБУРPython*Алгоритмы*Машинное обучение*

Туториал

Перевод

Какую рекламу показать пользователю, красную или синюю?

Представьте, что вам нужно выбрать один из двух баннеров: красный или синий. Разумеется, вам бы хотелось показывать пользователю рекламу с наибольшим откликом.

Но как узнать, какой из баннеров имеет наибольший уровень кликабельности?

Чаще всего для ответа на этот вопрос используется A/B-тестирование. Группа пользователей разделяется пополам, и первой части показывают один баннер, а второй — другой. После этого можно вычислить уровень кликабельности и выбрать лучший из вариантов.

Предположим, что в конце A/B-тестирования у вас получились следующие результаты:

Читать далее

+10

kino6052 29 сен 2023 в 12:00

Как сделать UI тестируемым и легкоизменяемым?

14 мин

7.5K

Блог компании билайнПрограммирование*Совершенный код*Интерфейсы*Дизайн

Мнение

В предыдущих статьях мы пришли к выводу, что для того, чтобы код не превращался в легаси, необходимо получать оперативный фидбек о его правильности, а также использовать хорошие шаблоны программирования. При соблюдении этих двух условий у нас появится возможность легко вносить изменения.

Однако, есть проблемы с текущими подходами к созданию пользовательского интерфейса, которые затрудняют достижение этих двух условий.

Читать далее

+20

badcasedaily1 28 сен 2023 в 15:44

Построение пайплайна обработки данных в реальном времени с использованием Python

Сложный

11 мин

8K

Блог компании OTUSData Engineering*Проектирование и рефакторинг*Программирование*Python*

Обзор

Привет, Хабр!

Обработка данных в реальном времени стала важной составной частью современного мира. Бизнес, исследователи, разработчики и многие другие специалисты сталкиваются с необходимостью обрабатывать потоки данных в реальном времени, чтобы принимать решения быстрее и более точно.

В этой статье мы рассмотрим как построить пайплайн обработки данных в реальном времени с использованием Python.

Читать далее

+14

SLY_G 28 сен 2023 в 15:42

Как учёные снижают пагубное влияние космических полётов на организм человека

4 мин

3.9K

Научно-популярноеКосмонавтикаЗдоровье

Перевод

Когда 30 мая 2023 г. на орбите вокруг Земли одновременно оказались 17 человек, это стало рекордом. Благодаря тому, что НАСА и другие федеральные космические агентства планируют больше пилотируемых полётов, а коммерческие компании уже доставляют людей в космос, возможности для полётов человека в космос быстро расширяются.

Однако полёты в космос сопряжены с риском для человеческого организма. Поскольку NASA планирует отправить пилотируемый полёт на Марс в 2030-х годах, учёным необходимо как можно скорее найти решение этой проблемы.

Как кинезиолог, работающий с космонавтами, я много лет изучаю влияние космоса на тело и мозг человека. Я также участвую в проекте НАСА, направленном на снижение риска для здоровья участников будущего полёта на Марс.

Читать далее

+17

gtkek 28 сен 2023 в 15:48

Основы полнотекстового поиска в ElasticSearch. Часть третья

Средний

4 мин

6.5K

Блог компании SM LabПоисковые технологии*IT-инфраструктура*NoSQL*

FAQ

Это третья и заключительная статья из цикла, в которой рассмотрим стандартную модель ранжирования документов в Elasticsearch.

После того как определено множество документов, которые удовлетворяют параметрам полнотекстового запроса, Elasticsearch рассчитывает метрику релевантности для каждого найденного документа. По значению метрики набор документов сортируется и отдается потребителю.

В Elasticsearch существует несколько моделей ранжирования документов. По умолчанию используется Okapi BM25.

Читать далее

+16

iTr0ff 28 сен 2023 в 14:10

Переезжаем с DUO Mobile на Мультифактор. Опыт (и грабли) QIWI

7 мин

3K

Блог компании QIWIIT-инфраструктура*Информационная безопасность*

Кейс

Когда каждый день слышишь о новых утечках учетных данных пользователей, а социальная инженерия и разного рода мошенники активно прокачивают свои скиллы в выманивании паролей у пользователей, многофакторная аутентификация становится must have.

А если мы говорим о работе в больших компаниях, где есть множество разных систем с разным уровнем доступа, то без одного или нескольких дополнительных факторов не обойтись. Мы в QIWI давно используем второй фактор для доступа к большинству систем.

В этой статье я расскажу, как нам пришлось внезапно переезжать с DUO Security, которое многие из вас знают, на российское решение Мультифактор. Возможно, вам будет интересен наш опыт переезда или работы с этим решением (лучше поздно, чем никогда).

Читать далее

+17

nmgtech 22 сен 2023 в 13:14

Перелом в судьбе змеи: как Python менял версию с 2 на 3

Простой

6 мин

7.6K

Блог компании Национальная Медиа ГруппаPython*Программирование*История IT

Ретроспектива

Перевод

Мы можем только догадываться, что происходило в рождественские выходные 1989 года, когда Гвидо ван Россум приступил к своему хобби-проекту. Что можно сказать о Python, чего ещё не было сказано? Это один из самых популярных языков в мире, первый язык, на котором я учился программировать по-настоящему, и одно из самых громких имён в сфере машинного обучения. Судя по всему, он ни за что не должен был получить всю ту популярность, которой добился. Его на несколько лет опережал Perl: релиз 1.0 вышел в 1987 году и пустил глубокие корни в мире Unix, компьютерной графики и биоинформатики.

Python имел ужасный Global Interpreter Lock (GIL) и был очень медленным по сравнению даже с другими языками с динамической типизацией. К тому же он разделил своё сообщество из-за перехода от версии Python 2 к версии 3. Даже сегодня есть люди, отказывающиеся прикасаться к нему после этого перехода. Но несмотря на все свои недостатки, ему каким-то образом удаётся быть успешным.

Во время перехода с Python 2 на 3 я учился на последнем курсе магистратуры и изучал Python 2, поэтому помню, как оттягивал освоение Python 3. К тому моменту переход длился уже почти десяток лет, поэтому многие библиотеки уже были обновлены. Но окончательный срок Python 2 был ещё далеко. Мне повезло, что мой переход оказался относительно безболезненным, но для многих людей это было не так. Давайте разберёмся, с чего всё началось, но пока совершим небольшое отступление.

Читать далее

+13

SacredDiablo 20 сен 2023 в 12:02

Форматы ORC и Parquet на базе HDFS

Простой

10 мин

5.1K

Блог компании Конференции Олега Бунина (Онтико)Блог компании билайнBig Data*Хранение данных*

Ретроспектива

Каждая компания непрерывно производит и хранит кучу данных, и это вызывает множество проблем. Объёмы хранилищ не бесконечны, как и ресурсы железа. Вот только оптимизация обработки и хранения данных не всегда приносит желаемые результаты. Как всё настроить так, чтобы значительно сократить объём занимаемый ими на диске?

У нас получилось! Мы снизили количество данных на диске в 3 раза, при этом ускорив их обработку. И сейчас расскажу как. Меня зовут Александр Маркачев, я Data Engineer команды Голосовой Антифрод в beeline. В статье затронем тему форматов ORC и Parquet, как их правильно использовать и хранить, чтобы всем было хорошо.

Читать далее

+7

5

6 7 ...