Как стать автором
Обновить
1
0

Пользователь

Отправить сообщение

Автор данного ресурса я, доверят или нет это дело каждого.

Если коротко, то я отдаю ровно те провайдеры которые есть официальной реджестри, с теме же хеша что и оригинальные, максимум что я записываю это статистику по скачиванию провайдеров без лишний информации о том, откуда был скачен, только банальный count.

Так же сайт работает только для России и РБ. Если я правильно помню, ты не живешь в России сейчас, если хочешь посмотреть, пиши в телеграмм

На главной страницы https://registry.comcloud.xyz/ описано как подключить, так же ссылки на остальные ресурсы такие как документация(оно же зеркало модулей) и тд

Для устранения проблем безопасности можно воспользоваться
— Snyk вполне не плохо себя зарекомендовал
— Wazuh монстр для комплексной безопасности
— inspec так же вполне себе не плох
Ну и конечно pre-commit с хуками
Чтобы подключиться из Dataiku нужно
— Clickhouse JDBC driver
— Скопировать драйвер в {DATAIKU_HOME}/lib/jdbc
— Перезапустить dataiku
— Потом создаем через UI новое соединение и выбираем тип Other SQL Database
— Указываем класс ru.yandex.clickhouse.ClickHouseDriver
— И jdbc url типа jdbc:clickhouse://:[/]
Всегда можно сгенерировать триальную лицензию и насладиться полным функционалом
Если устанавливать по типу все в одном то минимум 4 GB оперативной памяти, желательно 8.
Готовый образ виртуальной машины доступен тут
Dataiku мощная платформа enterprise уровня, фич крайне много.
Очень удобно разрабатывать свои плагины, так же легкая интеграция с облаками и k8s.
Мы ее используем как основную data science платформу для компании, намного проще того же kubeflow особенно для data scientists.
Есть ряд проблем которые возникают, но вендоры исправляют оперативно.
Очень не хватает нормального мониторинга, но как опять же обещают вендоры скоро выпилят dkumonitor и добавят автопровижинер. Фич реально много
я оптимистичен по поводу linux и содружества в целом. Linux прекрасен использую как основную ос примерно с 95 года, и за все время проблем для себя не видел. В некоторых конторах видел непонимания со стороны windows-администраторов( знаю что не все такие, и не обобщаю, но есть упертые), которые пытались пересадить на windows, аргументирования это тем, что «Linux живет своей жизнью», честно вызывало улыбку. И это ведущий админ одного крупного ретейла. Я уверен, что linux только будет укреплять свои позиции.
у меня слишком большие объемы, со временем придется скорее всего
кстати замечание при таком конфиге, если не указать
:hostname,!contains ,"имя сервера syslog" :ommysql:localhost,Syslog,rsyslog,password


будет генерироваться много не нужного
собственно протестировал при моих настройках генерация и работа стабильная и быстрая у меня уже событий в тбилце много больше чем 82625385 как я писал выше, включил логирование на уровне инфо и у меня инсертов куча, все стабильно и быстро использую perconadb +apache+nginx пока не смотрел как прикрутит кеширование дополнительное
при моих объемах достаточно шустро бегает, сейчас на тестовом очищу табличку, для чистоты эксперимента.
При выключенной опции запрос имеет вид:
mysql> SELECT id, devicereportedtime, facility, priority, fromhost, syslogtag, processid, infounitid, message FROM `SystemEvents` ORDER BY id DESC LIMIT 100;


Выполняется за:
100 rows in set (0,00 sec)


И все начинает летать, при больших объемах.
наоборот, ее лучше не выключать, если у вас предполагается большой размер таблицы. Как я и написал если включена опция Enable Row Counting, то начинается проседание по производительности. Запрос выше, как раз генерирует движок с включенной опцией.
Думаю да, но нигде у них в документации этого не сказано, когда у меня объемы выросли, мне пришлось искать решение, так как собирать плагин для mongo было неохота, решил поискать решения, честно было несказанное удивление когда увидел, что используется SQL_CALC_FOUND_ROWS. Не хочу сказать что функция ужасная или плохая, ее применения обосновано, при маленьких объемах
К примеру:
mysql> SELECT SQL_CALC_FOUND_ROWS id, devicereportedtime, facility, priority, fromhost, syslogtag, processid, infounitid, message FROM `SystemEvents` ORDER BY id DESC LIMIT 100;

100 rows in set (5 min 49,02 sec)


Как видно, этот запрос мягко говоря медленный и тяжелый.
Стоит упомянуть, что при большом объеме данных, допустим как у меня
mysql> select count(*) from SystemEvents;
+----------+
| count(*) |
+----------+
| 82625385 |
+----------+

Enable Row Counting чтобы не использовалась функция SQL_CALC_FOUND_ROWS. Иначе у вас интерфейс будет еле ползать, Так же можно добавить индекс на FromHost
raidz собран из 16 дисков по 2ТБ +1 диск для спера+кеши на двух ssd. Без дополнительного контроллера никак не обойтись и плюс дополнительные настройки. Вот так я готовлю zfs для продакшена.
Мерить именно на пуле zpool iostat. По поводу канала говорил же, видимо не внимательно читали гигабитные порты собранные в lacp.
Тем самым резервирую канал еще. Если вы используете zfs в linux тогда к Вам вопросов больше нет.
где я упоминал что использую рейд? мой контроллер не работает в режиме рейда, а всего лишь дает мне нужную скорость. Причем так включен как указано в одной из Ваших ссылок. Может вы просто не умеете готовить raidz? На сколько мне известно один из Российских cdn используют в таком же режиме как и я и выдерживают серьезные нагрузки.
Что мерить да операции в секунду что еще.
Я вам говорил приведи ВАши цифры по тестам своей системы, допустим подключите лун и туда базу разверните, допустим я тестировал развернул туда базу Диасофта, рядом с нагруженным луном разместил инкрементные бекапы postgres,
что вам не ясно?
Вы сами подумайте, прямое соединение или соединение через контроллер который может обрабатывать на «большой» скорости объемы данных.
Приведите хотя бы сравнительный синтетический тест, не dd. А допустим инсертом пару миллионов строк. Если Вам интересно могу свои данные привести. Меня начали минусовать просто так, забавно. Критика и свое мнение уже не приветствуется?
Я ZFS люблю всей душой (особенно за клоны-снапшоты и контрольные суммы), юзаю его дома, но по производительности он до обычных рейдов не дотягивает, плавали, знаем. А если отключить в нем все плюшки, снижающие производительность, то он получается ничем не лучше традиционных методов — чудес не бывает.


на 6Гб контролере прекрасно себя чувствует.
Приведите пожалуйста тесты вашего решения(запись, чтение, рендомная запись)

Информация

В рейтинге
Не участвует
Откуда
Eastern Finland, Финляндия
Дата рождения
Зарегистрирован
Активность

Специализация

Program Manager