Comments / Profile of yusman / Habr

Tim @yusman

Пользователь

ProfileArticles2PostsNewsComments177

Прокачиваем домофон протоколом MQTT для управления с телефона

yusman Sep 12 2017 at 14:43

Классная статья.
Еще можно по сигналу GPS определять что подходишь к дому и активировать режим «открывать всем».

Look

Машинное обучение в RapidMiner

yusman Sep 8 2017 at 10:53

ограничения касаются кол-ва записей, которые можно процессить. По моему не более 10 тысяч, если больше — то нужна платная версия.

Можно скомпилить OpenSource-версию(есть на гитхабе), позволяет обрабатывать больше 10к, но там нет некоторого полезного функционала.

Look

Машинное обучение в RapidMiner

yusman Sep 8 2017 at 07:47

Не упомянули что продукт OpenSource(с некоторыми ограничениями).
Давно пользуюсь данным тулом для прототипирования, как ML для домохозяек самое оно. Буквально нажал пару кнопок, получил модель, построил графики и работаешь.
Но делать пока что то серьезное на RapidMiner не удобно.

Look

Flash мертв: кто следующий?

yusman Aug 2 2017 at 10:45

Спрос на вопросы может уменьшаться, по причине того, что поисковики развиваются и вопросы отлично гуглятся, при этом они уже задавались много раз.
Так же исследование не совсем репрезентативно, потому что не отражены технологии:
1. Имеющие тенденцию к росту
2. Имеющие стабильный спрос.

Look

Вы неверно измеряете загрузку процессора

yusman May 22 2017 at 14:53

Спасибо за статью. А есть какие то способы изменить IPC под Виндой?

Look

Знакомство с СУБД CockroachDB и создание отказоустойчивого кластера с ней на Ubuntu 16.04

yusman May 4 2017 at 09:21

information_schema, pg_catalog

Не узнаю вас в гриме. :-)

Look

Часть 1. Где хранить данные децентрализованным приложениям на блокчейне?

yusman May 3 2017 at 06:50

Хорошая статья, наконец-то хайп по поводу блокчейна потихоньку проходит.

Look

rssh, или Как разрешить SCP, но запретить SSH

yusman Apr 7 2017 at 08:47

Не проще ли воспользоваться в таком случае утилитой nc? (ничего устанавливать не требуется.)

-1

Look

Frontera: архитектура фреймворка для обхода веба и текущие проблемы

yusman Mar 29 2017 at 12:58

Интересный продукт, спасибо!
Подскажите, а Scrapinghub умеет работать с «динамическими» страницами с большим количеством JS? Например, ждать появления какого либо элемента страницы, прежде чем начать парсить страницу.

Look

Аудит изменения данных PostgreSQL

yusman Mar 10 2017 at 09:47

Нашел вот такую штуку
https://github.com/michaelpq/pg_plugins/tree/master/decoder_raw — читает WAL и генерит SQL стейтменты

Look

Аудит изменения данных PostgreSQL

yusman Mar 10 2017 at 09:28

Спасибо за статью, а можно ли читать изменения из WAL? На одной из конференций я слышал про такую возможность стороннего плагина (берем из WAL и кладем в очередь), но что-то найти не могу.

Look

Vertica+Anchor Modeling = запусти рост своей грибницы

yusman Mar 3 2017 at 15:01

Спасибо за статью, есть несколько вопросов:
1. Не совсем понятно, по какому механизму генерируются суррогатные ключи, и где хранятся натуральные?
2. Как и какими средствами документируете все это?
3. С каким проблемами приходится сталкиваться?

Look

Небольшое сравнение производительности СУБД «MongoDB vs ClickHouse»

yusman Jan 30 2017 at 08:40

Ждем сравнения производительности кислого со сладким.

Look

Crowd разработка скоринговой системы для IEM системы

yusman Jan 27 2017 at 12:45

Похоже вы путаете «статистику» и «расследование фактов».
Идентификация базируется уже на каких то исследованных фактах, например, вы уже нашли мошенников и зафиксировали их. И далее:
1. скормили машине,
2. обучили ее,
3. она нашла кореляции фактов мошенничества с какими то другими показателями.
4. Применяете полученную модель для дальнейших поисков мошенничества.

Можно попробовать провести классификацию по общим признакам, но все равно, нужно расследовать, копать ручками по локоть.

Боюсь, что ваша задача не решается через чистый ML в текущей ее постановке.

Look

Сравнение производительности аналитических СУБД HPE Vertica и Exasol с использованием TPC-H Benchmark

yusman Jan 19 2017 at 08:10

Тем более на таком объеме данных и тем более на таком железе.
Вообще сравнивать скорость выполнения запросов в разных СУБД дело не благодарное — слишком много нюансов. Все аналитические СУБД обрабатывают данные примерно с одинаковой скоростью — все упирается в IO, CPU, алгоритмы компрессии данных, всякие фишки типа предрасчитанных агрегатов и т.д. Физику не обманешь, зато пнули пару рычажков или что-то недонастроили — БД уже тормозит.

Look

Система хранения для миллиардов записей с доступом по ключу

yusman Dec 19 2016 at 08:41

Удивляют такие люди — «Настоящий кодер не будет читать Войну и Мир — настоящий кодер напишет ее с нуля».
Ну есть же достаточно большое количество СУБД которых вам с головой хватит, тем более при таких то объемах

Look

Тестирование производительности Oracle In-Memory Option c использованием TPC-H Benchmark

yusman Dec 16 2016 at 12:11

Спасибо за статью.
А не замеряли нагрузку на CPU? Возможно ваши тесты ресурсоёмкие и упираются в процессор который и не дает нормально разогнаться IM

Look

Как заставить PostgreSQL считать быстрее

yusman Nov 29 2016 at 09:44

Ручное кеширование можно прокачать, например забирать информацию из WAL.
Как-то на одной конфе по PG упоминалось расширение которое умеет читать WAL и класть информацию по изменениям в очереди. Дальше из этих очередей уже можно забирать и агрегировать данные. Конечно агрегат будет отставать от исходной таблицы.
К сожалению, не могу вспомнить название расширения.
Это конечно немного изврат, но в каких-то задачах пригодится.

Look

Первый частный город в России, быть или не быть? Часть 1

yusman Nov 17 2016 at 09:56

К сожалению про NY сказать не могу, но возможно, там проблема в чем-то еще.

Look

Первый частный город в России, быть или не быть? Часть 1

yusman Nov 17 2016 at 08:54

Здравствуйте, сам давно вынашиваю подобную идею(частного города) и с большим удовольствием прочитал ваш пост.
Но есть несколько моментов:
1. Круговой город — это самая большая проблема современных городов, выросших из крепостей — Москва, Лондон и т.п. Круговая структура усложняет перемещение. Квадрат же дает больше путей для перемещения. Круговой город так же усложняет масштабируемость.
2. Большие парки — так же создают проблемы для перемещения из одного кластера у другой, что в сочетаниями с круговой структурой даст еще больше проблем чем есть в современных городах.

На мой взгляд идеально иметь квадратные микрорайоны и небольшие парки в шахматном порядке, либо парки внутри кварталов.

Насчет масштабирования города, город должен иметь определенные границы и не должен переростать их, если город достигает границ необходимо строить еще один город, но рядом, при этом обеспечивать скоростным общественным транспортом их сообщение.
Размеры города должны быть не большими(5-6 км), в идеале не требующими наличие автомобиля — все же на велосипеде или пешком передвигаться приятнее.

Кстати, слышали про «Venus project»? Тоже интересная концепция от одного достаточно известного инженера.

Look

3 4 ...

8 9