Как стать автором
Обновить

Компания билайн бизнес временно не ведёт блог на Хабре

Сначала показывать

Почему стоит чуть конкретнее изучить собственную ЦА, даже если она кажется очевидной

Время на прочтение2 мин
Количество просмотров2.1K

Привет!

Чтобы продавать свой товар клиентам и делать это успешно, мало просто иметь отличный товар, возможности бесперебойных поставок, налаженные логистические цепочки и прочее. Важно ещё на самом деле знать свою целевую аудиторию. Потому что, как показывает практика, реальная аудитория продукта или сервиса может ощутимо отличаться от задуманной. Или же быть много шире, чем та, что сейчас.

Читать далее

Старые протоколы, которыми можно пользоваться и сегодня

Время на прочтение13 мин
Количество просмотров13K
Устали от тяжёлых веб-страниц, всплывающих окон, мерцающих баннеров, N-факторной аутентификации, слежки за пользователями и аналитики? Тогда вы можете попробовать поработать с протоколами, которые не менялись последние тридцать лет.


Примерно тридцать лет назад люди видели онлайн-страницы так.
Читать дальше →

Как работает видеоаналитика Билайн

Время на прочтение4 мин
Количество просмотров2.9K

Вся видеоаналитика строится на основе видеонаблюдения. 

Видеонаблюдение - передача видеоизображения, а аналитика - его обработка и создание некоторых автоматизированных выводов по определенному алгоритму. Если раньше стояли большие аналоговые камеры, все записи с которых шли на сервер и на пульт условного охранника, который должен был следить за всем, то сейчас все идет к установке IP-камер и хранения всех записей в облаке, что мы и предлагаем.

Читать далее

Как реализовать магию Sqoop для загрузки данных через Spark

Время на прочтение29 мин
Количество просмотров3K

Очень часто приходится слышать, что Sqoop — это серебряная пуля для загрузки данных большого объёма с реляционных БД в Hadoop, особенно с Oracle, и Spark-ом невозможно достигнуть такой производительности. При этом приводят аргументы, что sqoop — это инструмент, заточенный под загрузку, а Spark предназначен для обработки данных.

Меня зовут Максим Петров, я руководитель департамента "Чаптер инженеров данных и разработчиков", и я решил написать инструкцию о том, как правильно и быстро загружать данные Spark, основываясь на принципах загрузки Sqoop.

Первичное сравнение технологий

В нашем примере будем рассматривать загрузку данных из таблиц OracleDB.

Рассмотрим случай, когда нам необходимо полностью перегрузить таблицу/партицию на кластер Hadoop c созданием метаданных hive.

Читать далее

Разгон процессоров Intel без индекса K: Core i3-12100, Core i5-12400 и Core i7-12700

Время на прочтение7 мин
Количество просмотров51K
В этом обзоре процессоров Intel Alder Lake с блокировкой мы расскажем, как при помощи находящейся в разработке материнской платы MSI можно сделать процессоры текущего поколения гораздо быстрее. Например, Core i5-12400 может стать на 50% быстрее в играх, и мы покажем, как этого добиться.

Одна из немногих проблем процессоров наподобие Core i3-12100, Core i5-12400 и Core i7-12700 заключается в том, что Intel заблокировала их, то есть увеличить их производительность при помощи разгона (оверклокинга) невозможно.


Их производительность «из коробки» всё равно замечательна, и если вы собираете новый PC, то возможности заблокированных ЦП Alder Lake игнорировать сложно. Но на самом деле повышение их производительности может составлять 20% и больше, а в некоторых случаях и превышать 50%.
Читать дальше →

Истории

Apache Kafka — как мы работаем с данными

Время на прочтение10 мин
Количество просмотров9.5K

Привет, Хабр!

Человечество уже написало кучу программ, которые хранят информацию в базах данных. Базы данных, как правило, побуждают думать о мире с точки зрения объектов. В случае Билайна это могут быть абоненты или сотовые вышки, у каждого из них есть какое-то состояние, и мы берём эту информацию, кладём её в базу данных, после чего строим на этом аналитику – допустим, считаем количество абонентов.

Вроде всё хорошо, но у такого подхода обнаружились и недостатки – например, обработка данных при таком подходе откладывается на самый последний этап, когда нам уже понадобилась аналитика. А это может занять довольно много времени, что приводит к задержкам аналитики. Это натолкнуло на мысль о том, что порой удобнее думать о мире в парадигме событий. Каждое событие тоже может иметь своё описание, как и вещь – но главная идея состоит в том, что событие является указанием во времени о появлении факта. Например, если бы мы для подсчёта абонентов имели поток событий – добавление нового абонента, отключение или перевод – мы могли бы быстро посчитать количество абонентов на текущий момент, если бы мы знали их начальное количество и постоянно обрабатывали этот поток.

Для хранения потоковой информации использовать структуру под названием log. Название вам знакомо, и не случайно вы с ней сталкиваетесь, читая консольный вывод приложений. Суть в том, что log – это просто упорядоченная во времени последовательность объектов. Когда происходит событие, мы можем просто добавлять его в конец лога с небольшим описанием происшедшего. Это скажет нам о том, что это событие произошло в определённое время относительно других событий. Всё это выглядит достаточно просто.

Читать далее

История интерфейса Firefox от самых первых версий

Время на прочтение8 мин
Количество просмотров8.8K
История UI Firefox важна для меня потому что мой личный проект компенсирует недостатки его UI Proton и наследует сильные стороны разных UI Firefox.

Кроме того, это один из способов избежать раскола сообщества, ведь каждый раз при серьёзных изменениях в UI возникало множество форков.

Первые версии (v1 ~ v3)



Phoenix (сентябрь 2002 года) возрождается из пепла Netscape [см. историю первых версий Firefox].

Выделяются крупные оранжевые кнопки. Историю Netscape см. в статье A Visual Browser History, from Netscape 4 to Mozilla Firefox.


Firefox v1 (ноябрь 2004 года), v2 (октябрь 2006 года), v3 (июнь 2008 года) [The Importance and Problems of Autoupdate].

Версии примерно с v1 по v3 имеют классический UI, который вы помните, если работали с ним в начале 2000-х. В значках есть цвета и не реализована абстракция.
Читать дальше →

Добавляйте единицы измерения в имена

Время на прочтение3 мин
Количество просмотров19K

Есть одна ловушка читаемости кода, которой легко избежать, если вы о ней знаете; тем не менее она встречается постоянно: это отсутствующие единицы измерения. Рассмотрим три фрагмента кода на Python, Java и Haskell:

time.sleep(300)

Thread.sleep(300)

threadDelay 300

Сколько «спят» эти программы? Программа на Python выполняет задержку на пять минут, программа на Java — на 0,3 секунды, а программа на Haskell — на 0,3 миллисекунды.

Как это можно понять из кода? А никак. Вам просто нужно знать, что аргументом time.sleep являются секунды, а threadDelay — микросекунды. Если вы часто ищете эту информацию, то рано или поздно её запомните, но как сохранить читаемость кода для людей, никогда не встречавшихся с time.sleep?
Читать дальше →

Как аудиобейджи помогают повышать качество обслуживания клиентов

Время на прочтение6 мин
Количество просмотров6.5K

Привет!

В этом посте мы расскажем про аудиобейджи и их роль в налаживании коммуникации между сотрудником магазина и покупателями. Мы проводили этот пилот совместно с VocaTech и одним крупным ритейлером электроники: выбрали 15 магазинов, раздали 355 сотрудникам аудиобейджи, а затем проанализировали результаты и новые уровни продаж.

За 6 месяцев пилота в 15 магазинах у 355 сотрудников мы получили 66 243 часов аудиозаписей, которые были переведены системой VocaTech в 321 353 эпизода обслуживания (транскрипции речи сотрудника во время консультаций). Параметры анализа речи — 70 метрик, включающие более 1000 уникальных фраз и их вариаций (метрика здесь — стандарт речи, например, стандарт речи «Приветствие» фиксируется фразами «Доброе утро», «Добрый день» или «Добрый вечер»).

Спойлер: при всех ключевых словах и улучшенных скриптах для продавцов личная харизма конкретного специалиста всё ещё продолжает играть значительную роль.

Читать далее

Приглашаем инженеров уровней Junior и Middle с опытом работы от года принять участие в нашем Data Engineer Weekend Offer

Время на прочтение1 мин
Количество просмотров2K

28 мая в штаб-квартире билайна пройдёт первый data engineering weekend offer — все этапы собеседования сразу в один день: вы расскажете о себе, проверите свои технические знания, узнаете, какие продукты разрабатывает билайн.

Чтобы ожидание каждого этапа не было скучным, вы сможете пообщаться с экспертами компании, посмотреть последние митапы сообщества и познакомиться с представителями команд в неформальной обстановке.

Читать далее

Интеллектуальный брутфорс: пишем головоломку и солвер для неё

Время на прочтение16 мин
Количество просмотров4.9K

Небольшое предисловие


В колледже я много играл в головоломки. В статье под головоломками я буду подразумевать очень узкое подмножество таких игр. Вот некоторые из примеров:


Также мне посчастливилось изучать структуры данных в Политехническом институте Ренсселера, где в то время студенты профессора Катлера (привет, Барб!) ежегодно участвовали в соревновании по написанию солвера головоломок. Каждый год игра менялась, и в мой год это была Ricochet Robots, которая по сути является головоломкой со скольжением по льду для нескольких игроков. Мне очень понравилось это задание (и я победил в соревновании!), после чего я продолжил участвовать в соревнованиях в качестве ассистента преподавателя.

Цель этой задачи заключалась в том, чтобы познакомить всех с рекурсией и поиском в глубину. Программе передавались исходное состояние игры, а также максимальная глубина рекурсии. Необходимо было вернуть или кратчайшее решение или все возможные решения минимальной длины. В соревнованиях игрокам могли или сообщать, или не сообщать предел глубины; кроме того, возможны были головоломки, не имеющие решения. Я многому научился и получил кучу удовольствия, так что, возможно, вам это тоже понравится.
Читать дальше →

P2P-коммуникации, свой программатик и Big Data: что мобильный оператор может противопоставить кризису на рынке рекламы

Время на прочтение3 мин
Количество просмотров1.9K

Рекламный рынок прямо сейчас испытывает довольно тяжёлые времена, что заставляет его перестраиваться. Где-то выключили таргетинг по группам пользователей, где-то рекламу и монетизацию вообще, какие-то сервисы просто нельзя оплатить. И трансформация уже началась — мы в билайне вместе с группой ОТМ тщательно следим за процессом, и в этом посте хотим рассказать, как механики стали перераспределяться в рекламном сплите, а также о возможностях отечественной программатик-платформы ОТМ

Рекламодатели начали активно искать новые инструменты и смещать свой фокус на те механики, которые раньше в целом и так использовали, но сильно меньше по сравнению с привычными форматами. Решения, базирующиеся на использовании больших данных, могут помочь компаниям расширить своё присутствие на рынке, донести информацию до целевых пользователей и собрать необходимые аудиторные сегменты.

А Big Data-механики можно использовать в тесной связке с программатик-рекламой и другими инструментами. Именно в этом направлении билайн и взаимодействует с ОТМ.

Читать далее

Киберпротезы «Моторики» подключаются к IoT-платформе билайн

Время на прочтение2 мин
Количество просмотров2K

Про “Моторику” на Хабре писали много и часто, у ребят даже есть свой блог. Компания производит 7 видов бионических и тяговых протезов, которыми сейчас пользуются более 1700 человек в 12 странах мира. 

Это не первое сотрудничество билайн и “Моторики”, ещё в 2018 году мы запускали совместный проект по удалённому мониторингу  высокотехнологичных средств реабилитации. В рамках проекта нам нужно было создать цифровое пространство, в котором люди с особенностями развития могли бы проходить реабилитацию. Для этого нужно было объединить сами протезы с технологиями на нашей стороне.

В новых “умных” бионических протезах будут стоять IoT-чипы билайн.

Читать далее

Невидимый Javascript-бэкдор

Время на прочтение4 мин
Количество просмотров29K

Несколько месяцев назад мы увидели пост в сабреддите r/programminghorror: один разработчик рассказал о своих мучениях с поиском синтаксической ошибки, вызванной невидимым символом Unicode, скрывавшемся в исходном коде на JavaScript. Этот пост вдохновил нас на мысль: что если бэкдор в буквальном смысле нельзя было бы увидеть и таким образом он бы избежал тщательных проверок кода?

Как раз когда мы завершали написание этого поста, команда из Кембриджского университета опубликовала статью с описанием такой атаки. Однако её подход сильно отличается от нашего — в нём упор делается на механизм двойного направления текста в Unicode (Bidi). Мы реализовали подход, который в статье называется Invisible Character Attacks и Homoglyph Attacks.

Без лишних предисловий перейдём к бэкдору. Сможете его найти?
Читать дальше →

Ближайшие события

2 – 18 декабря
Yandex DataLens Festival 2024
МоскваОнлайн
11 – 13 декабря
Международная конференция по AI/ML «AI Journey»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Как мы создавали нашу аудиоаналитику и что она умеет

Время на прочтение6 мин
Количество просмотров2.5K

Речевые технологии шагнули далеко вперед, спасибо машинному обучению и не только. Голосовые помощники больше не похожи на плохо смазанных роботов, у которых всегда одна интонация, да и та раздражает. Они научились (более или менее) нормально понимать запросы человека и гораздо адекватнее на них отвечать. 

При этом нужно помнить, что речь — это тоже данные. И, как любые данные, речь тоже можно анализировать. А в ряде случаев — нужно. Меня зовут Алексей Новгородов, я ведущий разработчик дирекции по продуктам и технологиям больших данных. Сегодня я расскажу вам про один из наших продуктов — аудиоаналитику.

Читать далее

Flink для самых маленьких

Время на прочтение12 мин
Количество просмотров31K

Привет! Меня зовут Юля, я работаю в дирекции больших данных Билайн, недавно я познакомилась с фреймворком Flink и хочу рассказать о своих впечатлениях на примере простой с первого взгляда задачи.

Итак, что же такое Flink? 

Apache Flink – это фреймворк и движок для statefull вычислений над неограниченными и ограниченными потоками данных. Flink был разработан для работы во всех распространенных кластерных средах, выполняя вычисления с in-memory скоростью на любом масштабе данных.

Из основных моментов можно подчеркнуть: 

Читать далее

Это же open source! Пусть клиенты чинят код вместо нас

Время на прочтение5 мин
Количество просмотров6.2K
Как правило, мейнтейнеры проектов с открытым исходным кодом ничего вам не должны. Несмотря на то, что мейнтейнеры часто бывают добровольцами, некоторые пользователи заявляют свои права на время мейнтейнеров, отправляя feature requests и ожидая, что мейнтейнеры реализуют всё, что они захотят. Но это ошибка. Повторюсь, мейнтейнеры open source ничего вам не должны.

Но это утверждение применимо не ко всем мейнтейнерам open source: в последнее время меня раздражает то, что некоторые компании, обладающие достаточными ресурсами, перекладывают ношу поддержки (и совершенствования) проектов с открытым исходным кодом с себя на пользователей.

Я говорю об официально поддерживаемых корпоративных «клиентах» в open source для проприетарных продуктов. Среди подобных проектов официальный Python-клиент Stripe (пользоваться которым может только потребитель Stripe) и поддерживаемые Google компоненты BigQuery проекта Apache Beam в open source (который полезен только пользователям Google Cloud). Эти проекты — «обёртки» с открытыми исходниками, позволяющие интегрировать проприетарные продукты (за которые платите вы!) в своё приложение.

Если вы столкнётесь с багом в одном из таких проектов, то мейнтейнеры предложат вам устранить проблему самостоятельно (или игнорировать баг). Чтобы использовать эти проекты-обёртки, вы должны быть клиентом поддерживающих их компаний, и эти проекты часть продуктов этих компаний. Мне кажется, что баги в них должны устранять компании, а не вы.
Читать дальше →

Как мы создали custom resource в Informatica EDC и пронесли его в Axon

Время на прочтение10 мин
Количество просмотров2.5K

Привет! Меня зовут Яна, я администратор Data Governance в Билайне. Этот туториал будет о том, как сконнектить то, что вендор коннектить не планировал. Речь пойдет о связи QlikSense c Informatica Enterprise Data Catalog (EDC) и Informatica Axon (Axon).

EDC – это умный каталог данных, который предоставляет единое представление метаданных, а Informatica Axon объединяет знания всех пользователей, позволяя выстроить и поддерживать в актуальном состоянии систему наиболее значимых для бизнеса информационных активов.

Зачем вообще их коннектить?

В Qlik Sense есть стримы, принадлежащие дирекциям, департаментам и отделам, каждый из этих стримов содержит набор дашбордов, например: считать трафик, количество пользователей в месяц, наиболее популярные услуги и прочее.

Читать дальше

Почему веб победил десктоп, но не победил мобильные?

Время на прочтение9 мин
Количество просмотров16K

Чтобы ответить на подобный вопрос, может понадобится десяток лет исследований.

Если мы сможем частично распутать этот узел, то, возможно, нам удастся перезапустить веб, создав новую платформу. Или начать создавать новые системы, похожие на веб.

Я работал над пятью браузерами и одной операционной системой, наблюдая за тем, как этот вопрос оказывается связанным с UX, продуктом, стратегиями и разработкой. Не могу сказать, что у меня есть все ответы, но кажется, мне удалось распутать несколько важных нитей.

TLDR: «делать приложения при помощи веба» — это неразрушительная стратегия. Это похоже на выживание в кислородной катастрофе по принципу «анаэробы начали фотосинтезировать». Конечно, это здорово, но синезелёная водоросль была первой, так что фотосинтез больше не является асимметричным.

Чего? Ниже представлено более подробное объяснение.
Читать дальше →

«Чтобы это разработать, нужна степень PhD»

Время на прочтение6 мин
Количество просмотров21K

Десятилетнее сидение в офисе и перекладывание бумажек не сделают вас мастером программирования. На это способно только написание программ.

В свете недавних событий, связанных с производительностью терминала Windows [см. https://github.com/microsoft/terminal/issues/10362], я решил, что стоит немного порассуждать на эту тему, поскольку она раскрывает некоторые проблемы, мучающие отрасль разработки ПО. 

Ситуация представляет собой стандартную мыльную интернет-оперу, запечатлённую на Github. Опытный программист опубликовал баг-репорт о медленном рендеринге текста в терминале и после долгого общения с мейнтейнерами один из них выдал следующее заявление: 

— Я считаю то, что вы называете целый исследовательский проект на соискание докторской степени в эмуляции высокопроизводительного терминала «чрезвычайно простой» работой, выглядит довольно агрессивно...

Несколько часов спустя ещё один программист опубликовал прототип гораздо более быстрого рендерера терминала, доказав тем самым, что для опытного программиста рендерер терминала — это просто забавный проект на выходные, совсем не требующий многолетних долгих исследований. Как бы ни унизительно это было для Microsoft, которая, несмотря на владение платформой и API, по-прежнему испытывает трудности в создании ПО с удовлетворительной скоростью, мне кажется, что частично эта проблема вызвана корпоративной системой стимулов. 

На основании моих ограниченных знаний, сложившихся из услышанных историй, я считаю, что отрасль разработки ПО не так сильно ценит совершенство навыков, как она ценит количество рабочей силы. Это, в свою очередь, ограничивает объём опыта, который может получать среднестатистический программист при работе с большими проектами, просто потому, что у него есть стимул как можно скорее уйти с должности создателя реализаций на какую-нибудь руководящую должность. 

Тем не менее, крупные корпоративные проекты расширяются быстрее, чем наша Вселенная, и кому-то всё равно приходится программировать все новые фичи. Но кто же будет выполнять всю эту работу? 

Читать дальше