Комментарии / Профиль just_vladimir / Хабр

Как стать автором

Владимир @just_vladimir

Пользователь

Профиль Публикации 3Комментарии 203Закладки 87

Актуальные подходы к ETL. Или EL-T? Технологический разбор

just_vladimir 26 июн 2023 в 20:27

Имхо, подавляющая часть потребностей версионирования решается банальным start date / end date, а не затеванием огорода с DV.

С возможностью быстро добавлять новые атрибуты чуть сложнее, но тоже все сложности DV того не стоят. Я скорее соглашусь на решение, где добавить колонку ничего не стоит (условные hbase, parquet) или исходную таблицу заменить view, а внутри сделать join исходной таблицы и таблицы с новыми атрибутами, чем обрекать себя на вечные страдания с DV.

+1

Посмотреть

Авторизация пользователей в системе через сервер аутентификации Blitz Identity Provider (bitrix + slim + react)

just_vladimir 1 апр 2022 в 18:57

Помню у заказчика был этот blitz, хотели на своем стенде разработки его развернуть, но на тот момент с этим были нюансы. Отрадно, что сейчас на сайте появилась возможность скачать дистрибутив.

0

Посмотреть

«Компилятор всё оптимизирует»? Ну уж нет

just_vladimir 17 июн 2021 в 13:56

Замена ArrayList на просто массив не даст вообще ничего, посмотрите исходник ArrayList.

+1

Посмотреть

varchar2 и Unicode для тех, кто ничего не понимает в базах данных Oracle или ORA-12899: value too large for column

just_vladimir 14 дек 2020 в 13:20

Я верно понял, что была тула, которую писал человек, который знал эту особенность Oracle (имхо, вы верно подметили, что эта особенность из-за необходимости поддержки обратной совместимости) и в какой-то момент кто-то другой, уже не знающий этой особенности решил оптимизировать данный тул и убрал дописывание char?
Если все так:
1. Исходный разработчик молодец, но ему стоило написать тест об этом.
2. Разработчик выполнявший рефакторинг решил исправить то, в чем, видимо, сам не особо разбирался
А по итогу во всем обвинили Oracle :-)

0

Посмотреть

Обратный поиск изображений: руководство от детективного агентства Bellingcat

just_vladimir 14 янв 2020 в 12:01

+1 к тому, что у гугла искусственно зарезанные алгоритмы в поисковике, в том же google photo он идеально сортирует фотографии по лицам

0

Посмотреть

Основоположники теории распределенных систем в объятьях гидры

just_vladimir 28 мар 2019 в 18:07

Наверное, будет зависеть от того, что в принципе надо делать, наиболее вероятный вариант это вкатить туда CDH какой-нибудь и что-нибудь на нем делать.

0

Посмотреть

Сравнение топ-4 популярных BI платформ. Какую выбрать?

just_vladimir 15 фев 2018 в 14:00

Может быть кто-нибудь подскажет BI инструмент, удовлетворяющий следующим требованиям:

Не облако (установка на свои сервера, без доступа в интернет)
Возможность создавать дашборды
Возможность нормально встраивать эти дашборды в своё веб-приложение. Под нормально подразумеваю, что это не iframe, а, например, некая javascript библиотека или REST API или еще что-нибудь подобное.
Умение напрямую работать с БД, желательно через jdbc, не создавая своё промежуточное хранилище внутри BI

+1

Посмотреть

Спецпроекты в Сбербанк-Технологиях: как в банках готовят Hadoop, Spark, Kafka и прочую Big Data

just_vladimir 15 фев 2018 в 07:56

Вопросы скорее в воздух, но мало ли у vadsu найдется пара минут свободного времени на ответ:
1. На счет того, что хочется SQL и realtime, но все лежит во всяких Hadoop/Key-Value/NoSQL, а прорабатывались ли такие варианты, как предоставлять SQL через Impala (вместо Key-Value у HBase/Cassandra), а хранение в Kudu, вместо HDFS? Или даже более координально — Yandex ClickHouse?
2. Очень интересно про «Лабиринт», правильно понимаю, что в Key-Value лежит список узлов, а внутри каждого узла уже вся доп информация, которую по нему нашли + список связанных ребер? Если так, то как устроено хранение информации о финансовых связях между организациями, в том смысле, что такие связи порождают не статические ребра, а динамические (сегодня транзакция есть, завтра ее нет, послезавтра снова есть, это одно и тоже ребро или 2 разных?). Агрегируете до достаточно больших периодов, чтобы можно было работать как со статическими ребрами? У пользователей есть возможность запустить какой-нибудь «умный» алгоритм, который проанализирует подграф этого графа начиная с какого-либо узла хотя бы на глубину 2-3 в realtime?

0

Посмотреть

Почему я не люблю автозапуск или размышления гика у замерзшей машины…

just_vladimir 30 янв 2017 в 14:42

Припоминается мне, что есть варианты с подогревом поддона с маслом, по гуглите keenovo.

0

Посмотреть

С чего начать внедрение Hadoop в компании

just_vladimir 10 янв 2017 в 19:24

Пока у меня сложилось впечатление, что хадуп начинается там, где есть куча серверов с DAS , при этом суммарный объем обрабатываемых данных не умещается на один такой сервер и по какой то причине нельзя все затолкать в нормальный NAS .

0

Посмотреть

С чего начать внедрение Hadoop в компании

just_vladimir 9 янв 2017 в 18:22

20 ГБ это очень мало, просто для осознания масштабов, это даже меньше, чем объем ОЗУ, который можно получить на современных десктопах.

0

Посмотреть

С чего начать внедрение Hadoop в компании

just_vladimir 9 янв 2017 в 16:19

10/100 млн событий это всего или в день? Даже если в день, то тоже не проблема, пусть будет одна таблица и партиции в ней (надеюсь MySQL умеет партиции, если не умеет, то просто один день — одна новая таблица с аналогичной структурой), грузим тоже специализированной тулзой (Oracle sql*loader / PostgreSQL COPY, в MySQL наверное тоже что то такое есть) и дальше смело работаете, как вы выразились «в формате SQL». Ну и соответственно никакие хадупы тут не нужны.

+1

Посмотреть

С чего начать внедрение Hadoop в компании

just_vladimir 9 янв 2017 в 16:07

У меня вопрос, все таки на какое железо ориентирован hadoop?
Исходя из личного опыта с задачками, где было много (ну или относительно много) данных, то весь затык всегда случался не на стороне сервера, а на стороне СХД. Условно даже на СХД начального уровня (например, IBM Storwise v3700) можно свободно хранить сотни терабайт данных, но скорость с которой современные магнитные диски выдают данные в разы уступает скорости с которой современные процессора способны переваривать эти данные. И собственно здесь у меня возникает непонимание — как мне поможет кластер серверов с хадупом, если СХД не может угнаться даже за одним более-менее мощным сервером?
Или подразумевается, что это кластер средненьких серверов и на каждом из них пара сотен ГБ встроенного стораджа на SSD и уже они собираются в кластер? Но если так, то при объемах в сотни ТБ можно разориться на железе…

0

Посмотреть

Состоялся финальный релиз Angular 2

just_vladimir 16 сен 2016 в 10:22

~~Ваши предложения по вариантам для нового проекта?~~в комментарии выше спросили быстрее

+1

Посмотреть

Java-конференция JBreak: Покорение Сибири

just_vladimir 31 мар 2016 в 20:08

Понятно, остается только мечтать, что может быть когда-нибудь в будущем и в наших краях пройдет достойная Java конференция. Вдруг Екатеринбуржские СберТех, СКБ-Контур, Яндекс и Наумен возьмут и про спонсируют мероприятие, ну а нам до соседей уж грех будет не скататься.

0

Посмотреть

Java-конференция JBreak: Покорение Сибири

just_vladimir 31 мар 2016 в 17:29

Очень грустно, в этом году не получилось выбраться ни сюда, ни в Мск не получится, а доклады прям хочется послушать. Реквестирую еще одну конференцию где-нибудь на урале (у нас в Перми или в Екатеринбурге).

0

Посмотреть

Java-конференция JBreak: Покорение Сибири

just_vladimir 31 мар 2016 в 13:56

Надеюсь видео будет общедоступным? Или доступным только для участников конференции, а для остальных через год?

0

Посмотреть

Отчёт о Java-конференции Joker 2015

just_vladimir 27 окт 2015 в 17:34

А может сделаете билет только для доступа к видео?

0

Посмотреть

Отчёт о Java-конференции Joker 2015

just_vladimir 26 окт 2015 в 22:33

А видео доступно только для участников или я плохо ищу на сайте?

0

Посмотреть

Тестирование флеш СХД. Huawei Dorado 2100 G2

just_vladimir 21 авг 2015 в 19:47

Я так понимаю цену не озвучат, но было бы очень интересно хотя бы увидеть относительные цены СХД из этого цикла статей. Стоимость самой дешевой из рассмотренных СХД принимаем за единицу, стоимости всех остальных выражаем через нее.

0

Посмотреть

1

2 3 ...