Как стать автором
Обновить
125
0
Алексей @Sterhel

Работаю в Фантехе Яндекса

Отправить сообщение

Настройка NVMe over TCP — для тех, кому надо подключить больше 1 диска единственной конфигурации из всех примеров в Сети

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров16K

Технология NVMe через различные фабрики (далее NVMeOF) оформлена в качестве стандарта летом 2016 года, она была встроена в пятую ветку ядра Linux.

Поэтому, когда было решено мигрировать объемные базы данных с легаси-решений на общедоступные платформы, возник вопрос — можно ли применить эту технологию для увеличения дискового пространства для создания зеркал локальных дисков?

Чтобы все зеркала не вышли из строя сразу, принимать такие диски надо бы небольшими группами с нескольких машин из разных стоек. Идея показалась достойной рассмотрения, поэтому создали небольшой стенд.

Меня зовут Алексей Дрожжов, я старший инженер в билайне, и в этом посте расскажу, как мы решали эту задачу.

Задача: подключить много дисков с нескольких серверов

Читать далее
Всего голосов 20: ↑20 и ↓0+20
Комментарии9

Автоматизация Swimlanes на досках Jira

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.8K

В досках Kanban и Scrum есть удобный инструмент горизонтальной группировки задач swimlanes (дорожки). С помощью дорожек задачи можно группировать по разным категориям: типам задач, проектам, пользовательским полям и прочему. Многие из вас наверняка уже знакомы с этим инструментом и активно пользуются им.

А что, если работу с дорожками можно сделать еще удобней и интересней? На примере реального кейса я попробую рассказать про способ автоматического добавления и удаления дорожек в досках Jira.

Читать далее
Всего голосов 5: ↑4 и ↓1+5
Комментарии0

Путешествие прошлого: что ели моряки и воины в пути

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров12K

В этой статье поговорим о рационе мореплавателей и о продуктах, которые чаще всего были на борту кораблей и в путевых рюкзаках.

Это первая часть из серии статей. В следующей статье мы подробно рассмотрим необычные способы хранения продуктов питания без холодильников, сушильных машин и вакууматоров.

Читать далее
Всего голосов 52: ↑27 и ↓25+12
Комментарии56

One week offer для системных аналитиков и аналитиков данных — с 7 по 10 ноября

Время на прочтение2 мин
Количество просмотров5.6K

Привет! Мы тут решили запустить очередной One Week Offer, на этот раз — для системных аналитиков и аналитиков данных, с 7 по 10 ноября. Если вам интересно —  до 3 ноября зарегистрируйтесь на лендинге, и с вами свяжутся.

Почему нам нужны системные аналитики

Сейчас в SM Lab работает более 2000 человек, которые с нуля написали и запустили более 320 сервисов и систем. Аналитиков у нас сейчас — порядка 200 человек. Так что, как вы понимаете, работы для желающих ещё много, скучно не будет.

Работать можно как из офисов (пока можем предложить Москву, Санкт-Петербург, Краснодар, Липецк, Новосибирск, Екатеринбург и Воронеж), так и из дома, если вам больше по душе удалёнка, или же вашего города нет в списке.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии4

Экспорт статьи из LibreOffice Writer в Habr Flavored Markdown или HTML

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.3K

Резюме.
В статье дается ссылка на файл в формате ODT (основной формат файлов, используемый в текстовом редакторе LibreOffice Writer), содержащий макросы на «родном» для LibreOffice языке программирования макросов BASIC, которые осуществляют экспорт текста из LibreOffice Writer в новый файл в формате Habr Flavored Markdown (далее - HFM) или HTML, в виде, пригодном для размещения статьи в интернете, например, на сайте habr.com.

Текст данной статьи был экспортирован в формат HFM для размещения на сайте habr.com с помощью библиотеки макросов, содержащихся в данном файле.

Для использования достаточно скачать указанный файл (его можно переименовать), заменить в нем текст на свой текст, подготовленный в соответствии с описанием в статье, и вызвать макрос. В папке со скачанным файлом появится новый файл в выбранном формате.

Рассмотрение макросов на языке BASIC, которые осуществляют экспорт, предполагается в отдельной статье.

Читать далее
Всего голосов 19: ↑19 и ↓0+19
Комментарии13

Путешествуй, ни в чем себе не отказывай

Время на прочтение3 мин
Количество просмотров5.8K

В этом посте Оксана, старший специалист клиентского сервиса SM Lab, поделится одной из рабочих практик по борьбе с выгоранием. А именно — пользой небольших путешествий на пару дней, которые ощутимо помогают разгрузить голову и не выгореть. Под катом — про это (а ещё много фото Питера).

— Выбери себе работу по душе, и тебе не придётся работать ни одного дня в своей жизни, — наставляет нас Конфуций.

Только мне такой подход кажется утопией в современных реалиях? Даже если работа откликается вашему характеру и складу ума, для достижения результата нужно много учиться, смело преодолевать сложности, принимать ответственные решения, справляться со стрессом и иногда переживать выгорание.

Читать далее
Всего голосов 16: ↑8 и ↓8+4
Комментарии10

MLOps в билайн: как катить машинное обучение в production без ML-инженеров. Часть I

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров6.5K

Всем привет! Меня зовут Николай Безносов, я отвечаю за применение и развитие машинного обучения и продвинутой аналитики в билайне. В одной из прошлых статей мои коллеги рассказывали о месте Seldon в ML-инфраструктуре компании, а сегодня мы поднимемся на уровень выше и поговорим о том, что из себя представляет MLOps в билайне в целом - как с точки зрения инфраструктуры, так и с точки зрения процессов.

В статье речь пойдет о нашем опыте создания ML-платформы, которая помогает дата-сайентистам самостоятельно управлять всем жизненным циклом ML-моделей - от разработки до постановки в production. Я рассчитываю, что статья будет полезна как небольшим командам, которые только начинают выстраивать у себя ML-инфраструктуру, так и корпорациям с большим количеством команд и жесткими требованиями к безопасности, которые при этом хотят эффективно масштабироваться.

Статья будет состоять из двух частей. В первой части мы посмотрим верхнеуровнево, как и по каким причинам менялись наши ML-процессы и инфраструктура в билайне - с чего мы начинали и к чему в итоге пришли. Во второй части поговорим о конкретных инструментах и технологиях, которые мы внедрили, чтобы сделать наш процесс разработки и деплоя моделей простым, воспроизводимым, автоматизируемым и наблюдаемым.

Читать далее
Всего голосов 14: ↑13 и ↓1+17
Комментарии5

Каталог данных — почему без него непросто и как всё организовать с максимальной пользой

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров8.4K

В этом посте мы расскажем, как организовали каталог данных в МКБ в текущих условиях — когда многие вендоры ушли, и по-настоящему рабочих вариантов осталось два: или пилить что-то самим с нуля, или обратиться к опенсорсным решениям.

Пилить самим — тут как всегда, это и дорого, и долго. Брать же готовую коробку и использовать ее вчистую тоже достаточно сложно, вы же не знаете наверняка и досконально, чего там и как на самом деле внутри работает. 

Когда речь идет о корпоративных данных, это важно. К примеру, та же OpenMetadata — если не знать ее подкапотное устройство, работать с ней будет сложно. А разобраться сложно, потому что документация по ней на сегодня скудноватая, и экспертизы у людей на рынке еще не набралось, из-за чего до много приходится додумываться самим уже в процессе.

Под катом — немного о проблематике работы с данными (и о доверии), о плюсах, которые даст вам каталог данных, а также наша подробная инструкция для разворачивания каталога у себя.

Читать далее
Всего голосов 12: ↑11 и ↓1+13
Комментарии5

Как совмещать работу с учебой. Что-то про тайм-менеджмент

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров20K

Всем привет! Меня зовут Даша и я системный аналитик компании SM Lab. Работаю в команде Brand Planning Tool. Наша команда BPT помогает брендам (таким как Fila, Demix, Northland) запускать новые коллекции.

В этом я году закончила бакалавриат и поступила в магистратуру по направлению «Системный анализ и управление». С третьего курса начала работать по специальности.

В этой статье я расскажу о своем опыте совмещения работы с учебой, о различных методиках и лайфхаках в тайм-менеджменте, которые помогают грамотно планировать свой день. Надеюсь, что мой опыт окажется полезным для всех, кто так же планирует совмещать эти сферы жизни или просто хочет успевать больше в течение дня.

Под катом:

• Моя история
• Важные моменты при планировании
• Методики тайм‑менеджмента
• Выводы

Читать далее
Всего голосов 17: ↑11 и ↓6+10
Комментарии15

Как мы переводим наш мониторинг в наблюдаемость

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров6.9K

Привет всем! Полное содержание первого сезона можно прочитать тут и тут, а краткое содержание такое: 

• Компания приняла решение улучшить работу клиентских сервисов и одним из рычагов для этого стал мониторинг.

• Мониторинг был разным (Patrol, Zabbix. NetCool), про Elastic. Про Prometheus, трейсинг и Grafana не слышали.

• У всех команд эксплуатации были свои мониторинги, которые "что-то" показывали, но это все было разрознено и никак не связано.

Привести все это «богатство» в адекватное рабочее русло, как-то структурировать и реструктуризировать было поручено команде супергероев, которые в перерывах между паниками (страшно было) взялись за дело

ВАЖНО: Тут не будет скриптов развертывания. Не будет рецептов и настроек систем (что-то есть в интернете, к чему-то пришли через пот и слезы). Это взгляд людей, которые развивают системы мониторинга и философию, которой они придерживается. Что еще важно – среди нас до момента развертывания не было людей, которые слышали про эти системы. 

Наш первый сезон мы закончили с таким багажом и знаниями:

Читать далее
Всего голосов 13: ↑12 и ↓1+16
Комментарии2

10 причин не участвовать в некоторых IT-конференциях

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.5K

Привет! У нас тут накопился неплохой опыт в плане работы с конференциями со всех точек зрения — как организатора своих собственных событий, так и активного участия в больших регулярных IT-конференций. Собственно, им мы с вами и поделимся.

Наверняка пост будут читать организаторы подобных событий, деврелы, которые так или иначе в них участвуют, разработчики, выступающие там с докладами, да и просто люди, которые хотят послушать доклады, но при этом видят только внешнее положение дел.

Расскажем о самых частых косяках, отбивающих у компаний желание вообще идти на конференции, поговорим про еду на площадке и про жару, и разберём не самые очевидные промахи организаторов. А если вы захотите поделиться в комментах своим опытом и предложениями, будем только рады. 

Вдруг нам всем вместе получится сделать мир отечественных IT-событий немного лучше.

Читать далее
Всего голосов 36: ↑30 и ↓6+32
Комментарии14

Реализация случайности в CSS при помощи тригонометрии

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров5.4K

В прошлых статьях я рассматривал тему реализации псевдослучайности в CSS при помощи операции целочисленного деления и использовал простые числа для создания автоматического счётчика, при помощи которых можно генерировать разные значения для каждого объекта. Благодаря этому мы можем вычислять псевдослучайные значения для каждого элемента по отдельности.

Несмотря на надёжность этого решения, оно имеет и недостатки:

  • Функция деления с остатком не непрерывна
  • Способ слишком сложен: он требует трёх переменных и определения @property для каждого случайного значения, которое мы хотим сгенерировать
  • Требует применения @property, которое пока поддерживается не очень широко

К счастью, можно сделать лучше! В этой статье я предложу более оптимальное решение на основе тригонометрии.
Читать дальше →
Всего голосов 13: ↑12 и ↓1+15
Комментарии4

Когда стоит заменить A/B-тестирование сэмплированием Томпсона

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.9K

Какую рекламу показать пользователю, красную или синюю?

Представьте, что вам нужно выбрать один из двух баннеров: красный или синий. Разумеется, вам бы хотелось показывать пользователю рекламу с наибольшим откликом.

Но как узнать, какой из баннеров имеет наибольший уровень кликабельности?

Чаще всего для ответа на этот вопрос используется A/B-тестирование. Группа пользователей разделяется пополам, и первой части показывают один баннер, а второй — другой. После этого можно вычислить уровень кликабельности и выбрать лучший из вариантов.

Предположим, что в конце A/B-тестирования у вас получились следующие результаты:

Читать далее
Всего голосов 8: ↑7 и ↓1+10
Комментарии2

Как сделать UI тестируемым и легкоизменяемым?

Время на прочтение14 мин
Количество просмотров7.5K

В предыдущих статьях мы пришли к выводу, что для того, чтобы код не превращался в легаси, необходимо получать оперативный фидбек о его правильности, а также использовать хорошие шаблоны программирования. При соблюдении этих двух условий у нас появится возможность легко вносить изменения.

Однако, есть проблемы с текущими подходами к созданию пользовательского интерфейса, которые затрудняют достижение этих двух условий.

Читать далее
Всего голосов 20: ↑20 и ↓0+20
Комментарии4

Построение пайплайна обработки данных в реальном времени с использованием Python

Уровень сложностиСложный
Время на прочтение11 мин
Количество просмотров8K

Привет, Хабр!

Обработка данных в реальном времени стала важной составной частью современного мира. Бизнес, исследователи, разработчики и многие другие специалисты сталкиваются с необходимостью обрабатывать потоки данных в реальном времени, чтобы принимать решения быстрее и более точно.

В этой статье мы рассмотрим как построить пайплайн обработки данных в реальном времени с использованием Python.

Читать далее
Всего голосов 12: ↑10 и ↓2+14
Комментарии0

Как учёные снижают пагубное влияние космических полётов на организм человека

Время на прочтение4 мин
Количество просмотров3.9K

Когда 30 мая 2023 г. на орбите вокруг Земли одновременно оказались 17 человек, это стало рекордом. Благодаря тому, что НАСА и другие федеральные космические агентства планируют больше пилотируемых полётов, а коммерческие компании уже доставляют людей в космос, возможности для полётов человека в космос быстро расширяются.

Однако полёты в космос сопряжены с риском для человеческого организма. Поскольку NASA планирует отправить пилотируемый полёт на Марс в 2030-х годах, учёным необходимо как можно скорее найти решение этой проблемы.

Как кинезиолог, работающий с космонавтами, я много лет изучаю влияние космоса на тело и мозг человека. Я также участвую в проекте НАСА, направленном на снижение риска для здоровья участников будущего полёта на Марс.

Читать далее
Всего голосов 14: ↑12 и ↓2+17
Комментарии17

Основы полнотекстового поиска в ElasticSearch. Часть третья

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров6.5K

Это третья и заключительная статья из цикла, в которой рассмотрим стандартную модель ранжирования документов в Elasticsearch.

После того как определено множество документов, которые удовлетворяют параметрам полнотекстового запроса, Elasticsearch рассчитывает метрику релевантности для каждого найденного документа. По значению метрики набор документов сортируется и отдается потребителю.

В Elasticsearch существует несколько моделей ранжирования документов. По умолчанию используется Okapi BM25.

Читать далее
Всего голосов 16: ↑16 и ↓0+16
Комментарии1

Переезжаем с DUO Mobile на Мультифактор. Опыт (и грабли) QIWI

Время на прочтение7 мин
Количество просмотров3K

Когда каждый день слышишь о новых утечках учетных данных пользователей, а социальная инженерия и разного рода мошенники активно прокачивают свои скиллы в выманивании паролей у пользователей, многофакторная аутентификация становится must have.

А если мы говорим о работе в больших компаниях, где есть множество разных систем с разным уровнем доступа, то без одного или нескольких дополнительных факторов не обойтись. Мы в QIWI давно используем второй фактор для доступа к большинству систем.

В этой статье я расскажу, как нам пришлось внезапно переезжать с DUO Security, которое многие из вас знают, на российское решение Мультифактор. Возможно, вам будет интересен наш опыт переезда или работы с этим решением (лучше поздно, чем никогда).

Читать далее
Всего голосов 15: ↑14 и ↓1+17
Комментарии1

Перелом в судьбе змеи: как Python менял версию с 2 на 3

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров7.6K

Мы можем только догадываться, что происходило в рождественские выходные 1989 года, когда Гвидо ван Россум приступил к своему хобби-проекту. Что можно сказать о Python, чего ещё не было сказано? Это один из самых популярных языков в мире, первый язык, на котором я учился программировать по-настоящему, и одно из самых громких имён в сфере машинного обучения. Судя по всему, он ни за что не должен был получить всю ту популярность, которой добился. Его на несколько лет опережал Perl: релиз 1.0 вышел в 1987 году и пустил глубокие корни в мире Unix, компьютерной графики и биоинформатики.

Python имел ужасный Global Interpreter Lock (GIL) и был очень медленным по сравнению даже с другими языками с динамической типизацией. К тому же он разделил своё сообщество из-за перехода от версии Python 2 к версии 3. Даже сегодня есть люди, отказывающиеся прикасаться к нему после этого перехода. Но несмотря на все свои недостатки, ему каким-то образом удаётся быть успешным.

Во время перехода с Python 2 на 3 я учился на последнем курсе магистратуры и изучал Python 2, поэтому помню, как оттягивал освоение Python 3. К тому моменту переход длился уже почти десяток лет, поэтому многие библиотеки уже были обновлены. Но окончательный срок Python 2 был ещё далеко. Мне повезло, что мой переход оказался относительно безболезненным, но для многих людей это было не так. Давайте разберёмся, с чего всё началось, но пока совершим небольшое отступление.

Читать далее
Всего голосов 14: ↑11 и ↓3+13
Комментарии4

Форматы ORC и Parquet на базе HDFS

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров5.1K

Каждая компания непрерывно производит и хранит кучу данных, и это вызывает множество проблем. Объёмы хранилищ не бесконечны, как и ресурсы железа. Вот только оптимизация обработки и хранения данных не всегда приносит желаемые результаты. Как всё настроить так, чтобы значительно сократить объём занимаемый ими на диске?

У нас получилось! Мы снизили количество данных на диске в 3 раза, при этом ускорив их обработку. И сейчас расскажу как. Меня зовут Александр Маркачев, я Data Engineer команды Голосовой Антифрод в beeline. В статье затронем тему форматов ORC и Parquet, как их правильно использовать и хранить, чтобы всем было хорошо.

Читать далее
Всего голосов 7: ↑6 и ↓1+7
Комментарии13

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Зарегистрирован
Активность