Pull to refresh
21
14.1
Михаил Волошин @McKinseyBA

Business Intelligence на больших данных

Send message

"boxberry" свежих заявок нет.

Их и не может быть, тк регистрация действует до 2031. Попытка хайпа на отсутствии новости засчитана)

А как же бренд Boxberry?

Вряд ли в Яндексе настолько тупые юристы, что не подали заявку на регистрацию ДО объявления о сделке... Due Diligence - штука серьезная

бизнес логики на vba.

Промазал и поставил минус, но ловите плюс в карму. Я вообще предлагал бы расстреливать тех, кто этим злоупотребяет. Весь мой прошлый опыт четко подсказывает, что файл с макросами в 95% случаев превращается в неподдерживаемую плохопахнущую субстанцию после увольнения автора. Мало кто готов в этом копаться и еще меньше знает vba для целей разбора подобного легаси. KISS в Excel прямо мастхэв и чем проще и понятнее формулы - тем лучше всем.

@Exosphere присмотритесь, пожалуйста, к последнему голосованию. 10 лет назад на похожее предложение в поддержку меня послали мне не ответили. Может и правда стоит ввести? Особенно глядя на наличие иных популярных (нет) хабов, да и мем на самом деле,

ни разу не мем

Искренне скажу - мне бы тоже. Но без моего участия даже за 60-летний виски)

А теперь серьезно - уже через полчаса я примерно понял расклад, но сама кончательная проверка гипотез и формулирование тезисов заняла еще 1.5-2 часа. Остальные 18-20 часов - оформление, видеофиксация и преодоление желания "забить". К слову, в процессе изучения возможностей Р7 он упал у меня минимум 30 раз, может 40. Excel же ни разу. Только в одном случае сам грохнул процесс, тк по ошибке не тот 10млн csv грузил чтобы лишний раз увидеть обрезанный до 1048к строк результат

Спасибо, учту на будущее! Но поступлю как MS и продолжу распространение статьи по лицензии "как есть, без ответственности за причиненный ущерб в следствие продолжения использования")

В добавок к ответу выше: локально обрабатывая данные вы уже приблизились к разумному пределу. Дальше идет нормальный стэк корп. уровня из DWH (КХД) разной архитектуры, которое наполняется и трансформируется при помощи организации современного ETLELT. А затем либо ad-hoc анализ на аналитическом слое хранилища при помощи SQL (или Python+Jupiter если вы ML'щик), либо построение дэшбордов при помощи сотен BI систем (визуализация данных)

Именно с вашего уровня сам перешел в BI-аналитики в 2016, а затем в дата-инжиниринг. Дерзайте, но помните, что на своем ноутбуке кратно качественнее обрабатывать данные уже сложно

Помните анекдот о черепах Александра Македонского?

И тут также - это статья не для вас и меня, а для тех, кто управляет ценами в сетках. Типа "смотри, как мы можем за ваши бабки (= за_счет_читателей) сделать ваших акционеров богаче"

В общем, лекция статья "для колхозников")

Не демонизируйте AnchorModel

Ее и демонизировать не нужно - реалии расставили все по местам так, что даже евангелисты этой модели в России были вынуждены сокращать косты на нее. А последние 5 лет львиная доля больших проектов хранилищ создается в DataVault 2.0. Остальное - "по звезде".

Нет, не повлиял. Только немного подвинул сроки.

Жаль, что компания так и не рассказала, что там было и как. Но этот риторический вопрос, наверное, не к вам

Пока мы не упёрлись в максимально доступный в триальной версии Vertica объём в 1 Тб. Нужно было искать новое хранилище. Изучив разные решения, архитектор выбрал IBM DB2. Купили лицензию.

Поржал в голос над выбором и компетентностью архитектора)

модель данных ядра хранилища AnchorModel

Собрался поржать второй раз, но вы и сами поняли, что не туда свернули)))

По итогу - ценой неоднократного перепила data стэка получилось решение, соответствующее текущим реалиям. Вопрос может и не по адресу, но интересно, а инцидент мая 2024 на DWH и ETL обвязку как-то повлиял?

И сейчас отечественным IT-историкам

Шутки-шутками, но мой зав.кафедры С.Г.Кащенко (доктор исторических наук), перед истфаком закончил матмех ЛГУ с красным дипломом. А дипломную писал у сподвижника и ученика Канторовича - М.К. Гавурина. Кстати по распознаванию образов и, возможно, еще до рождения авторов популярных ныне CV библиотек)

А спустя 15 лет, в середине 1980-х, встал у истоков применения мат.статистики в российской исторической науке.

Так что Леонид Витальевич даже на абсолютных гуманитариев оказал влияние

Не надо первым писать в личку в мессенджеры вообще. Просто потому, что пишущего анонимуса никак не отличить от мошенника, дикпикера, спамера, или му..., ой "свободного рекрутера".

Со всем согласен и плюсую комментарий, кроме этого. Я вот люблю когда мне hr пишут именно в тлг и прямо об этом указал в открытом резюме. Мне интересно чувствовать рынок не прилагая много усилий

А то, что вы подаете как проблему легко регулируется отсутствием телефона/тлг_аккаунта в резюме. Указывайте только почту и вообще закройте резюме на hh.ru и сами откликайтесь решив описанную лично для вас проблему на корню.

Тут еще история про то, что во многих корпах есть принципиальное положение - не давать специалистам оклады выше руководства.

Может где-то и есть, но часть моей команды в большой корпорации получала больше меня и я только радовался за них)

А руководство сидит там по 10 лет и на индексацию своего оклада хер поклало - они на другом выезжают

Может где-то и сидит, но я только за зп работал)


А чтобы такие "глубокие" мысли не отравляли существование надо следовать старой народной IT-мудрости и "не работать с мудаками!"

PS: вчера вот с бывшей командой пиво пил и было, как всегда, круто)

Прикольная статья - удачи в автоматизации остальных процессов!

Однако вопрос по КДВП - это нейросетевая лажа или перефотошопленная фотография? Спрашиваю, тк на последующих фотографиях у вас изображен обычный (в смысле нормальный) широкопроходный склад, а на первой картинке и не зона комплектации, и вообще не пойми что... Бывалому складскому глазу заметно и вызывает много вопросов требующих пояснений. Уж лучше без сгенерированных картинок, чем так.

Слава - молодец, но жаль, что от своего имени не написали статью. Тем более, что на своем канале отлично демонстрируете необходимые для этого навыки. Непрошенный совет - пишите от себя с техническими деталями и ваши статьи зайдут на Хабре. Удачи!

Цель благая, но реализация ее получается ценой вендорлока, пусть и open source? Все-так мигрировать хранилище - на один-два порядка более сложная задача чем OLTP БД под любым (даже highload) проектом. Вселяет надежду тот факт, что вы успешными стали еще до 2022 года, доказав жизнеспособность. Однако сложно прогнозировать, что не поступите как, например, Tanzu закрыв исходники... Да и куча других до них и после них.

Кстати, а не закрытие ли исходников GP было ключевым мотивом в принятии решения об этом форке?

PS: c GP не работал и некоторые вопросы могут показаться глупыми)

Скажите спасибо, что забыли. А то бы еще не дай бог начали объяснять чем LEFT JOIN отличается от RIGHT :)

Автор поднял отличную тему - постоянно смущаюсь, как пациент. Головой понимаю, что в никаких "чаевых" - это норма. Но сложившаяся культура накладывает отпечаток даже на взаимодействие с врачами "платной" медицины

На что-только люди не идут чтобы не пользоваться уже готовыми нормальными сервисами...

1
23 ...

Information

Rating
539-th
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Registered
Activity

Specialization

Data Engineer, CDO