С большим уважением к тому, что делает Selectel, но всё же статья могла бы быть более технической)
Можно поподробнее на счёт SLA, например: - латентность запросов - пропускная способность IOPS - задержка репликации - RPO / RTO - исправление уязвимостей - время реакции тех. поддержки ?
Возможность использования расширений вроде PostGIS/TimescaleDB? Возможность размещения отдельных партиций на медленных дисках?
Экспертиза от команды DBaaS в выявлении медленных запросов, оптимизации производительности базы?
и раз статья про экономический эффект - какова финансовая ответственность Selectel за сохранность и конфиденциальность данных, нарушения SLA?
Самое интересное в RAG – вытянуть максимум из ретривера. А тем, как залить md в вектор и найденные фрагменты вставить в промт — уж «все заборы исписаны»)
Осталось придумать, как не используя субъективные оценки "делай хорошо, не делай плохо" сформулировать требования к грамотному монтажу и критериям приемки)
Критикующие просто могли не знать, каково это подключать базу данных напрямую к инструменту бизнес-аналитики.
Тогда может дело в инструменте бизнес-аналитики? У нас одна из БД на 150кк в основной таблице, не считая джойнов (MySQL кстати). Сбоку BI решение, которое по расписанию каждые 5 минут забирает через ETL (тоже кстати визуальный конструктор) обновления в данных и складывает в свой DWH на Postgresql. По мониторингу всплесков по нагрузке на основную базу нет, даже stage не потребовался
Да, Clickhouse интересная штука, но стоило ли городить огород с Datalens...только чтобы потом гордиться сложностью схемы движения данных?
OOM на 10kk строк..? Не пробовали просто вынести аналитические запросы на stage-базу и настроить репликацию, чтобы не шатать прод? Вообще, olap – это не про то чтобы получать большой объём многомерных данных пусть даже за какой-то период, а про то чтобы быстро получать чаще всего агрегированные данные (преимущественно — предрасчитанные) по различным срезам.
Я не против ClickHouse, но по ощущениям статья написана только ради упоминания продуктов Яндекса.
Неплохо было бы упомянуть и про инициативы вроде A framework for Al-ready data (от ODI), а также упомянуть о том, как "боретесь" за деперсонализацию и в целом с "протечкой" чувствительной информации в наборы данных, предназначенные для обучения.
Опять же может уже внедряете дополнительную разметку вроде Schema.org, или достраиваете графы знаний?
Может уже и свой MCP-сервер реализовали?
Я не столько иронизирую, сколько реально интересно. Да и заголовок статьи уж больно броский ("AI-Ready Data: ... с максимальной отдачей")
Сейчас Habr заставляет при этом бесконечно разгадывать капчу, я "сломался" после четвертой успешно разгаданной подряд. А для комментариев капчи нет) Привет, Habr!
Всё правильно, при импортозамещении авто покупателя лучше сразу начать приучать самостоятельно починять своё новое отечественное ведро. Поскольку вендор и интегратор свои бабки уже получили, и негоже им свои руки марать, время тратить</irony>
Я лично не вижу попыток развивать вокруг своих продуктов профессиональное комьюнити и публично делиться опытом решения проблем / знаниями. YDB и ClickHouse не в счёт, они молодцы. Остальные просто стригут купоны
аргументация на уровне луддитов, сопротивлявшихся механизации труда
каждый использует инструмент по своему разумению, кто-то во благо, а кто-то нет... но тут уж и преподавателю, монотонно начитывающему предмет, не чем помочь
Почему вы решили, что именно "... действия ЦБ приводят к ухудшения положения в экономике?" С чего вы взяли, что ВДЛ страны делится / согласует свои планы с ЦБ? Много вопросов - если сможете ответить на них, станет понятно почему такие прогнозы
Россия и так на протяжении многих лет в топе стран по золотовалютным резервам центральных банков, только не видно чтобы это как то помогало экономике.
Исходя из своего опыта, полагаться только на «на контекст, сформированный по топу полученных векторов» — очень наивный подход, теряется уйма важных деталей. Стоит сразу смотреть в сторону решений вроде GraphRAG, и аннотации чанков дополнительными метаданными, теми же NER к примеру.
Кто-то встречал удобный в использовании инструмент ведения кабельного журнала в электронном виде? Последнее с чем сталкивался сам - RackTables (стойки, юниты, порты), но не сказать, что прям сильно удобно
С большим уважением к тому, что делает Selectel, но всё же статья могла бы быть более технической)
Можно поподробнее на счёт SLA, например:
- латентность запросов
- пропускная способность IOPS
- задержка репликации
- RPO / RTO
- исправление уязвимостей
- время реакции тех. поддержки
?
Возможность использования расширений вроде PostGIS/TimescaleDB? Возможность размещения отдельных партиций на медленных дисках?
Экспертиза от команды DBaaS в выявлении медленных запросов, оптимизации производительности базы?
и раз статья про экономический эффект - какова финансовая ответственность Selectel за сохранность и конфиденциальность данных, нарушения SLA?
Самое интересное в RAG – вытянуть максимум из ретривера. А тем, как залить md в вектор и найденные фрагменты вставить в промт — уж «все заборы исписаны»)
Осталось придумать, как не используя субъективные оценки "делай хорошо, не делай плохо" сформулировать требования к грамотному монтажу и критериям приемки)
Можно поделиться ноутбуком в Google Colab
Я же правильно понимаю, что платформа не поддерживает BPMN?
Тогда может дело в инструменте бизнес-аналитики? У нас одна из БД на 150кк в основной таблице, не считая джойнов (MySQL кстати). Сбоку BI решение, которое по расписанию каждые 5 минут забирает через ETL (тоже кстати визуальный конструктор) обновления в данных и складывает в свой DWH на Postgresql. По мониторингу всплесков по нагрузке на основную базу нет, даже stage не потребовался
Да, Clickhouse интересная штука, но стоило ли городить огород с Datalens...только чтобы потом гордиться сложностью схемы движения данных?
OOM на 10kk строк..? Не пробовали просто вынести аналитические запросы на stage-базу и настроить репликацию, чтобы не шатать прод? Вообще, olap – это не про то чтобы получать большой объём многомерных данных пусть даже за какой-то период, а про то чтобы быстро получать чаще всего агрегированные данные (преимущественно — предрасчитанные) по различным срезам.
Я не против ClickHouse, но по ощущениям статья написана только ради упоминания продуктов Яндекса.
Неплохо было бы упомянуть и про инициативы вроде A framework for Al-ready data (от ODI), а также упомянуть о том, как "боретесь" за деперсонализацию и в целом с "протечкой" чувствительной информации в наборы данных, предназначенные для обучения.
Опять же может уже внедряете дополнительную разметку вроде Schema.org, или достраиваете графы знаний?
Может уже и свой MCP-сервер реализовали?
Я не столько иронизирую, сколько реально интересно. Да и заголовок статьи уж больно броский ("AI-Ready Data: ... с максимальной отдачей")
Напрашивается поддержка SVG, и вынос логики в отдельную подключаемую библиотеку)
Плюсану — гораздо интереснее и содержательнее многих корпоративных блогов тут.
Как будто бы уже пора переходить с ZooKeeper на Raft, нет?
Сейчас Habr заставляет при этом бесконечно разгадывать капчу, я "сломался" после четвертой успешно разгаданной подряд. А для комментариев капчи нет) Привет, Habr!
Всё правильно, при импортозамещении авто покупателя лучше сразу начать приучать самостоятельно починять своё новое отечественное ведро. Поскольку вендор и интегратор свои бабки уже получили, и негоже им свои руки марать, время тратить</irony>
Я лично не вижу попыток развивать вокруг своих продуктов профессиональное комьюнити и публично делиться опытом решения проблем / знаниями. YDB и ClickHouse не в счёт, они молодцы. Остальные просто стригут купоны
Коротко, лаконично, всё по делу. Здесь сложно добавить что-то ещё
В 2025? Ту, на которой можно `vibe no-кодить` с помощью популярных GPT-ассистентов))
А в 2026 — поддерживающую MCP и AI-агентов...
аргументация на уровне луддитов, сопротивлявшихся механизации труда
каждый использует инструмент по своему разумению, кто-то во благо, а кто-то нет... но тут уж и преподавателю, монотонно начитывающему предмет, не чем помочь
Почему вы решили, что именно "... действия ЦБ приводят к ухудшения положения в экономике?" С чего вы взяли, что ВДЛ страны делится / согласует свои планы с ЦБ? Много вопросов - если сможете ответить на них, станет понятно почему такие прогнозы
Россия и так на протяжении многих лет в топе стран по золотовалютным резервам центральных банков, только не видно чтобы это как то помогало экономике.
Исходя из своего опыта, полагаться только на «на контекст, сформированный по топу полученных векторов» — очень наивный подход, теряется уйма важных деталей. Стоит сразу смотреть в сторону решений вроде GraphRAG, и аннотации чанков дополнительными метаданными, теми же NER к примеру.
Кто-то встречал удобный в использовании инструмент ведения кабельного журнала в электронном виде? Последнее с чем сталкивался сам - RackTables (стойки, юниты, порты), но не сказать, что прям сильно удобно
Снёс от греха подальше. А есть такое же, но про Firefox / Chrome?