Обновить

Системный и бизнес-анализ

Сначала показывать
Порог рейтинга
Уровень сложности

Как подготовиться к собеседованию на системного аналитика. Часть 1: Как сделать резюме

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.4K

Хочешь попасть на собеседование по системной аналитике, но не получаешь приглашений? Возможно, дело в резюме. В этой статье — чёткая инструкция, как составить конкурентное резюме, даже если ты начинающий специалист без опыта.

Эта статья — первая часть в серии о подготовке к собеседованию на системного аналитика. В следующих мы также обсудим поведение на интервью, тестовые задания и тревожные звоночки в поведении работодателей.

Читать далее

Накопитель размером с монету и скоростью флагмана: подборка свежих IT-новостей №2

Время на прочтение6 мин
Охват и читатели12K

В этой статье я расскажу о SSD размером с монету, который оставляет далеко позади обычные карты памяти, и о чумовом планшете с жидкостным охлаждением. Читайте, как Трамп спасает ИИ от бюрократии и о чем договорились Москва и Тегеран, в нашей подборке.

Читать далее

Индийский стек — чудо цифровой трансформации

Время на прочтение14 мин
Охват и читатели6.6K

В первой статье этого сериала мы собрали известные нам примеры платформ и проектов, которые можно прямо или условно назвать «биржами данных» (data exchange). После этого мы попытались разложить эти данные по кучкам, громко назвав этот процесс построением типологии. До типологии тут еще далеко, но какая-то ясность наступила. Более того, один из комментаторов не поленился скормить эту недо-типологию своему ИИ-ассистенту и тот выдал визуализацию этой мультифасеточной конструкции. Там есть на что посмотреть и о чем подумать, рекомендую.

Мы же, как и обещали, приступаем к анализу отдельных кейсов в попытке извлечь из них больше деталей и полезных идей для построения биржи данных на заказ.

Многие из наших собеседников предлагали немедленно изучить опыт «китайских товарищей» и взять его за образец при построении бирж данных в РФ. Их аргументация вполне понятна — тенденция к возвращению роли и участия государства в инфраструктурных проектах, которую можно наблюдать в РФ за последние 20 лет, похоже стремится к тому образцу, который сложился в Китае за последние три тысячи лет после реформ Дэн Сяопина. Достаточно сильный мотив, чтобы исследовать систему региональных бирж, созданную в КНР, однако из всего увиденного меня больше всего поразила история цифровой трансформации в Индии, которая привела к появлению нового Тадж-Махала, который называют «индийским стеком».

Читать про новый индийский Тадж-Махал...

Vulristics: как я создал инструмент анализа уязвимостей и теперь использую его практически ежедневно

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели9.8K

Хабр, привет! Меня зовут Александр Леонов. Я ведущий эксперт PT Expert Security Center и среди прочего отвечаю в компании за ежемесячные подборки наиболее критичных (трендовых) уязвимостей, обзоры которых мы каждый месяц публикуем на Хабре.

С 2020 года я развиваю проект Vulristics. Изначально это был мой личный инструмент для анализа уязвимостей из ежемесячных обновлений Microsoft Patch Tuesday. Но постепенно я расширял его функциональность. Теперь утилите можно подавать на вход любой набор идентификаторов CVE и БДУ.

Главная задача Vulristics — оценивать и приоритизировать уязвимости. Для этого утилита анализирует несколько ключевых факторов: наличие признаков публичной эксплуатации, наличие публичного эксплойта, тип уязвимости, популярность ПО, а также оценки CVSS (Common Vulnerability Scoring System) и EPSS (Exploit Prediction Scoring System).

Под катом — история создания Vulristics и рассказ о том, как этот инструмент экономит часы ручной работы, помогая аналитику не утонуть в потоке уязвимостей.

Читать далее

Георейтинг: новый взгляд на доступность социальных объектов в городах России

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели4.5K

В эпоху урбанизации, когда мегаполисы и региональные центры России растут как на дрожжах, вопрос доступности социальной инфраструктуры выходит на первый план. Родители, ищущие ближайший детский сад для своего малыша, урбанисты, планирующие новые жилые кварталы, или городские власти, стремящиеся оптимизировать транспортную сеть, — все они сталкиваются с одной и той же проблемой: как быстро и точно оценить, насколько "дружественен" город к пешеходам? Сколько минут пешком до ближайшей школы? А до игровой площадки? Эти вопросы, кажущиеся простыми, на деле требуют сложных расчетов, анализа геоданных и визуализации, которая была бы интуитивно понятной.

Именно здесь на сцену выходит Георейтинг — инновационный проект, разработанный командой Геоинтеллект. Это мощный инструмент анализа, который превращает абстрактные данные о расстояниях в живые, наглядные инсайты. Запущенный недавно, Георейтинг уже вызывает интерес среди специалистов и обычных пользователей, обещая стать незаменимым помощником в повседневной жизни. 

Города растут, районы меняются, а людям по-прежнему нужно простое и честное понимание: удобно здесь жить или нет?

До сих пор такую оценку каждый делал сам: «вроде недалеко», «дойти можно», «там есть садик, но как далеко?». Георейтинг убирает эти догадки: теперь доступность района — это цифры и визуализация.

Кому это нужно?

Читать далее

Проксируй это: как ускорить A/B-тесты и не попасть в ловушку метрик

Время на прочтение13 мин
Охват и читатели5.9K

В A/B-тестах хотелось бы смотреть на главную метрику, ту самую North Star, которая показывает успех продукта. Но на практике она почти всегда медленная, шумная и бесполезная для быстрых решений. Например, вы запускаете тест новой системы рекомендаций, ждёте неделю, две, а LifeTime Value не двигается. И непонятно, это потому что нет результата или ещё рано делать выводы.

Чтобы не тратить месяцы на догадки, можно воспользоваться прокси-метриками — быстрыми, чувствительными показателями, которые реагируют раньше, чем бизнес-метрика «успевает моргнуть». Проблема в том, что это решение часто требует дополнительные ресурсы.

Привет, Хабр! Меня зовут Артем Ерохин, и я Data Scientist в X5 Tech. Я прочитал современные исследования, пропустил их через свой опыт и собрал концентрат подходов к работе с прокси-метриками. Постараюсь передать только суть. Разберемся, зачем нужны прокси, как с ними не выстрелить себе в ногу, где заканчивается польза и начинается самообман.

Читать далее

Измерение сложности моделей — Часть 2: Применяем теорию на практике

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели4.2K

В предыдущей статье мы заложили фундамент для анализатора сложности, определив ключевые метрики для оценки сложности моделей процессов. Теперь разберем, как превратить эту теорию в реально работающий инструмент.

Читать далее

Парсинг выдачи, анализ конкурентов и семантики: наш реальный подход без «магических» скриптов

Время на прочтение3 мин
Охват и читатели5.9K

В SEO часто создается впечатление, что успех держится на «секретных скриптах» и «внутренних парсерах», которые дают какое-то особое преимущество.
На практике всё иначе.

Мы не используем собственные парсеры и не строим сложных автоматизаций.
В основе — чистая логика, прицельный анализ и корректная работа с семантикой.
Ниже описываю наш реальный рабочий процесс, который применяется в агентстве каждый день.

1. Сбор семантического ядра как отправная точка

Мы начинаем с формирования полного ядра запросов, которое отражает реальный спрос по нише.

Задача — не просто собрать ключи, а понять:

Читать далее

Generalized Propensity Score: как оценить эффект от непрерывного воздействия без A/B-теста

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6.2K

Привет, Хабр! Меня зовут Игорь Пантелеев, я Applied Data Scientist в компании Garage Eight. Сейчас моя команда занимается развитием одного из разделов сайта разрабатываемого нами продукта. 

В прошлом квартале мы задались вопросом: как оценить эффект от времени, которое пользователь проводит в нашем разделе, на Retention Rate (RR)? Казалось бы, решение очевидное: провести A/B-тест, но на поверку всё оказалось не так просто. В статье разберем, как у нас получилось определить эффект, с какими сложностями столкнулись в процессе и как нам помог метод Generalized Propensity Score.

Читать далее

Системный аналитик в России: правда о работе в регионах, универсальности и удалёнке из первых уст

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.6K

Привет, Хабр!

Меня зовут Виталий Герасимов, я ведущий системный аналитик в Lenta tech («Группа Лента»). Сегодня хочу поговорить о том, что редко обсуждают в профессиональных кругах: как региональные особенности влияют на работу системного аналитика в России. Я сам прошёл путь от региональных проектов до удалёнки и столичных компаний и готов поделиться опытом.

Читать далее

Оценка сложности модели — Часть 1: Почему проще обычно лучше

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.6K

В мире оркестрации процессов постоянно всплывает один и тот же вопрос: а не слишком ли сложные модели мы создаем? Вопрос важный, потому что избыточно сложные модели приносят целый букет проблем: их труднее понимать, поддерживать и изменять — а это напрямую бьет по срокам и результатам проектов.

Современные движки рабочих процессов (например, Flowable) легко переваривают даже очень сложные модели, но это не значит, что нужно пользоваться этой возможностью на полную. Упрощение дает ощутимые плюсы: модели становятся более читаемыми, требуют меньше усилий на сопровождение и лучше подходят для совместной работы. В итоге простая модель — это ценный актив для любой компании.

Поэтому главная цель — находить баланс между функциональностью и простотой, чтобы модель оставалась эффективной и удобной в долгосрочной перспективе.

Читать далее

Дежавю на 3 триллиона: Хроники потерянного капитала от доткомов до ИИ

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.9K

Помните звук модема? Этот пронзительный писк и скрежет, который обещал вход в дивный новый мир? Конец 90-х был удивительным временем. Казалось, что старые законы экономики просто взяли и отменили специальным указом где‑то в недрах Кремниевой долины. Прибыль? P/E? Дивиденды? Это всё скука для пенсионеров в костюмах. Главными метриками стали «просмотры», «уникальные пользователи» и «доля рынка». Если у вашей компании в названии не было приставки «e‑» или окончания «.com», вы вообще не существовали для инвесторов.

Сегодня, глядя на графики котировок некоторых технологических гигантов и читая новости про очередной стартап, который «революционизирует [вставьте любое слово] с помощью ИИ», меня преследует стойкое чувство дежавю. Только вместо «.com» теперь вездесущий «AI». Давайте сдуем пыль с истории краха доткомов и посмотрим, не наступаем ли мы сейчас на те же самые грабли, только теперь с нейросетевым управлением.

Читать далее

Автоматизация лабораторных процессов: почему внедрение ЛИМС превращается в проблему еще на старте

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.7K

В эпоху цифровой трансформации лаборатории сталкиваются с парадоксальной ситуацией: несмотря на обилие готовых решений для автоматизации, внедрение ЛИМС остается недосягаемой мечтой. Причина кроется не в технологических ограничениях, а в уникальной специфике лабораторной деятельности, регламентированной стандартом ГОСТ ISO/IEC 17025-2019. Этот документ, насчитывающий 216 прямых требований вида «лаборатория должна», требует систему взаимосвязанных процессов, каждое изменение в которой влияет на десятки других компонентов системы. Необходимость следования всем требованиям стандарта заложена в критериях аккредитации, игнорировать эти требования нельзя. Ожидаемый результат внедрения ЛИМС - автоматизация через цифровизацию, которая должна быть не просто инструментом, а живым отражением всей системы менеджмента качества.

Читать далее

Ближайшие события

Это другое. Python нашел замалчивание в поэзии Беллы Ахмадулиной

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

Творческие секреты поэтессы глазами кода. Что анализ фонетики на Python рассказывает о «шестидесятниках».

Читать далее

Выбор российского ETL-инструмента в 2025 и чек-лист

Время на прочтение6 мин
Охват и читатели7.8K

Привет!

Перед вами новое исследование, посвящённое одной из ключевых технологий управления данными — процессам извлечения, преобразования и загрузки данных (ETL). Оно стало логическим продолжением первого обзора рынка ETL-решений, выпущенного нашей командой три года назад.

За это время многое изменилось. Если в 2022-м рынок опирался на зарубежные платформы, то сегодня акценты сместились в сторону отечественных продуктов. Причины очевидны: уход иностранных вендоров, трудности с продлением лицензий, обновлениями и поддержкой. Импортозамещение из формальности превратилось в стратегическую задачу, а потребность в надёжных российских инструментах — в вопрос технологической безопасности.

Одновременно усилились и глобальные вызовы: рост объёмов данных, переход бизнеса к моделям прогнозной аналитики и управлению на основе данных. ETL-системы в этой экосистеме занимают фундаментальное место — именно они превращают разрозненные источники в согласованный поток информации, на котором строятся аналитика, модели машинного обучения и управленческие решения.

Читать далее

Как понять, чего хочет заказчик?

Время на прочтение9 мин
Охват и читатели8K

Всегда, когда речь идет и разработке отчётов, дашбордов,витрин данных, в принципе любой системы, сначала нужно сформулировать требования совместно с бизнес-подразделениями. Я Кристина Проскурина, руковожу управлением бизнес-анализа данных в РСХБ.Цифра. В этой статье расскажу, как выглядят основные этапы процесса сбора и формирования требований.

Читать далее

Роскомнадзор пытается заблокировать ВСЁ, а также красный уровень тревожности в OpenAI

Время на прочтение9 мин
Охват и читатели82K

Самые интересные новости финансов и технологий в России и мире за неделю: РКН заблокировал FaceTime, Snapchat и Roblox, безвиз с Китаем и Саудовской Аравией, Россию внесли в черный список отмывания денег ЕС, в Южной Корее взломали домашние камеры наблюдения, Твиттер Маска оштрафовали в Европе, а также слухи о «чесночной» модели от OpenAI.

Читать далее

Семантический ритуал: как я извлекаю смысл из документов

Уровень сложностиСредний
Время на прочтение21 мин
Охват и читатели8.8K

Иногда один документ скрывает в себе гораздо больше структуры, чем видно на первый взгляд. Со временем я заметил, что если разобрать его онтологически, он перестаёт быть текстом и превращается в сеть смыслов. Для меня это уже давно не эксперимент, а обычный рабочий процесс: беру документ, запускаю OntoLex — и провожу свой семантический ритуал. Презентация раскладывается на страницы, страницы — на термины, термины — на связи, и в итоге документ растворяется в графе, оставляя после себя живую модель знаний.

далее

Когда ТЗ перестаёт быть фикцией: практический путь к отделу системного анализа

Время на прочтение7 мин
Охват и читатели9.9K

Я пришла в компанию, где системный анализ «формально был», но по факту системные аналитики жили отдельно от разработки и продукта. Итог был предсказуем: аналитики писали ТЗ, которые никто не читал, разработчики ходили к бизнесу напрямую, интерпретировали хотелки «как поняли», в систему прилетали костыли, странные обходные пути и тонны лишней логики, а в прод выкатывалось то, что скорее напоминало мем с качелями «что хотел заказчик — что в результате получилось».

Читать далее

TypeQL: SQL для аналитиков, который знает о данных всё

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели7.1K

Сколько я пользуюсь SQL, столько же он меня бесит. Сегодня хочу рассказать про свой прототип языка для создания больших и сложных аналитических запросов, который компилируется в SQL. Он будет опираться на структуру конкретной БД, и даже больше — он будет опираться на логику данных.

Читать далее