Comments / Profile of tomleto / Habr

Sergey Khristolyubov @tomleto

Wikibot.pro — AI-agents for support and sales.

ProfileArticles11Posts5News2Comments53

В октябре 2023 WikiBot стал продуктом недели #1 на...

tomleto Oct 18 2023 at 14:24

Эксперты считают что WikiBot открывает новую веху сразу в двух областях: конструкторы чат-ботов и техподдержка

Look

Субботний самопиар на Хабре Стартуем каждую субботу в...

tomleto Jul 17 2023 at 15:18

WikiBot - сервис по созданию чат-бота с искусственным интеллектом для общения с клиентами

WikiBot индексирует вашу документацию или сайт по продукту и затем отвечает на вопросы пользователей как человек. Под капотом ChatGPT или другая большая языковая модель.

Цель WikiBot - сделать простое решение которое позволяет компаниям сократить расходы на ФОТ технической поддержки и уменьшить среднее время ожидания ответа.

Пример, как это работает https://t.me/Excel_WikiBot (Помощник по Excel)
Сайт https://wikibot.tomleto.pro/

Look

Моя система физического и ментального здоровья гика

tomleto Mar 25 2022 at 09:03

спасибо ))

Look

Создаем аналитическое хранилище данных командой из 2-3 спецов

tomleto Jan 19 2022 at 13:34

По data engineering курсов очень много, но именно по теме моделироования DWH нормальных курсов и книг на русском я не нашёл.

Можно начать с книги Building a Scalable Data Warehouse with Data Vault 2.0.

Как мне кажется когда сам изучаешь методологии Data Vault и Anchor modeling, то возникает куча вопросов. Как лучше смоделировать на своих данных? И спросить не у кого.

Поэтому чтобы научиться использовать эти методологии в бою, лучше поработать в большой компании где это всё описано и стандартизировано. Например, я работал в X5 и там очень круто сделана академия EDW где на рельных примерах разбирают все сущности Data Vault и расказывают о 100500 нюансах. Такой информации не найти в книгах.

Look

Создаем аналитическое хранилище данных командой из 2-3 спецов

tomleto Dec 14 2021 at 19:06

Спасибо за развернутое мнение.

Я согласен что есть плюсы и минусы у обоих подходов.

Т.к. я писал рекомендации для маленьких проектов то, рекомендовал начать с sql.

На больших нужно считать деньги и риски, и энетрпрайс решение типа SAS DIS может быть предпочтительней т.к. там есть best bractice, много внедрений и меньше возможностей сделать всё очень плохо.

Look

Создаем аналитическое хранилище данных командой из 2-3 спецов

tomleto Dec 9 2021 at 07:29

У нас расписание всегда запускается с method='increment'

А когда DE разрабатывает джобу ему доступны ещё "full" (полная перезагрузка) и "recreate" (пересоздание таргета).

А алгоритм загрузки определяется в теле джобы и зависит от основных двух параметров.

В примере:

"target_table_type": job_module.JobTargetTableType.MART,

"target_load_type": job_module.JobTargetTableLoadType.UPSERT_ROWS_BY_PK

Например при одном и том же алгоритме UPSERT_ROWS_BY_PK, аналитики для одних типов таблиц просят удалять данные удаленные из источника, а для других помечать как удаленные.

Т.е. как я предполагаю наши опции target_table_type и target_load_type играют ту же роль что у вас метод. И они также определяются в джобе.

Понятно ответил или я не очень понял вопрос?

Look

Создаем аналитическое хранилище данных командой из 2-3 спецов

tomleto Dec 8 2021 at 09:44

Спасибо!

Я пытался описать принципы на основе которых мы создаем DWH.

Look

Создаем аналитическое хранилище данных командой из 2-3 спецов

tomleto Dec 8 2021 at 09:41

Спасибо!

Просто джобы состоят из тасков. И в кругах дата инженеров это самое популярное слова для обозначения законченного ETL/ELT процесса

Look

Работа с Google BigQuery. Считаем деньги

tomleto Feb 9 2021 at 14:56

Спасибо за подробный ответ!
Я просто недавно прочитал «Google BigQuery. Всё о хранилищах данных, аналитике и машинном обучении», и там на мой взгляд, эти моменты были не раскрыты.

Я сам работаю на Greenpllum. Получается BigQuery радикально отличается от Greenpllum.

Look

Работа с Google BigQuery. Считаем деньги

tomleto Feb 8 2021 at 17:02

Спасибо за статью!
Расскажите подробнее как в BQ соотносятся вычислительные ресурсы и внешняя память:
1. Можно контролировать число слотов для моего ХД, например 5?
2. У каждого слота свой SSD и пользователь видит заполненность или для пользователя все данные одинаково доступны всем слотам в регионе?
3. Таблицы которые не входят на диск автоматически шардятся или пользователь должен сам задать настройки?
4. Когда при джойне больших таблиц данные пересылаются между слотами как пользователь может повлиять на оптимизацию запрос?
4.

Look

План прокачки для получения профессии Data engineer

tomleto Oct 26 2019 at 06:41

Спасибо!

Look

План прокачки для получения профессии Data engineer

tomleto Oct 24 2019 at 18:44

1. Конкретно Дата инженеру математика может быть и не очень сильно нужна, но разработчики с хорошим мат бекэндом лучше решают сложные задачи. Дискретная математика нужна при оптимизации различных алгоритмов, работающих с перестановками, сочетаниями, размещениями, разбиением на подмножества, обходы графов, а также при оценке сложности того или иного алгоритма. Теория алгоритмов сильно зависит от знаний алгебры и математического анализа.
Две хорошие статьи на эту тему: ссылка 1, ссылка 2

2. Согласен, Р. Кимбол хорош, просто я сослался на более современную книгу Modeling the Agile Data Warehouse with Data Vault by Hans Hultgren.

Look

Программист как сервис для небольших компаний. Взлетит или нет?

tomleto Mar 15 2019 at 13:49

ник из молодости )
пора поменять!

Look

Программист как сервис для небольших компаний. Взлетит или нет?

tomleto Mar 15 2019 at 13:38

Обычно один специалист параллельно работает с несколькими клиентами.
Что касается качества, вы правы, иногда бывают проблемы.
Зато клиенты могут быстро получить работающее приложение.

Look

Программист как сервис для небольших компаний. Взлетит или нет?

tomleto Mar 15 2019 at 13:30

Проблема в том, что заказчику не нужно ТЗ, им нужен результат.
Поэтому мы предлагаем ТЗ + прототип.

Кстати мы часто отговариваем заказчика от разработки и рекомендуем готовые сервисы.

Look

Программист как сервис для небольших компаний. Взлетит или нет?

tomleto Mar 15 2019 at 13:26

Предлагать одну и туже идею можно по разному.
Да, пока сильно не взлетело, но прогресс есть!
Пробуя разные гипотезы, мы ищем ту которая взлетит — методология CusDev.

Look

Нужны ли людям онлайн-конструкторы бизнес-приложений

tomleto Jan 31 2017 at 05:07

Shamov, всё что нельзя сделать в интерфейсе, можно дописать,
у нас есть серверный и клиентский JavaScript, можно писать библиотеки на C#/Java, есть REST API.

Look

Нужны ли людям онлайн-конструкторы бизнес-приложений

tomleto Jan 31 2017 at 04:53

У нас можно писать на C# в коробочной версии, в SaaS версии пока только на клиентском и серверном JavaScript

Look

Нужны ли людям онлайн-конструкторы бизнес-приложений

tomleto Jan 31 2017 at 04:46

Именно к этому мы идём.
Каждая строка GetReport может иметь набор состояний. Возможные состояния строк таблицы задаются справочником. Состояние строки называется — Статусом. Для каждой роли можно определить доступные переходы между статусами, права на правку ячеек и добавление строк в определенном статусе.

Таким образом, Статусы позволяют определить бизнес-процесс. На каждом шаге бизнес-процесса определённые роли должны заполнять определенные поля, а затем переводить процесс на следующий шаг, изменяя статус объекта.
Следующим шагом развития будет добавление к нашему конструктору BPM нотации,

Любопытно, что с другого конца к нам двигаются BPM системы, которые реализуют у себя конструкторы таблиц и форм, Есть интересная статья, где сравниваются BPM система Appian и конструкторы баз данных: Zoho Creator., Salesforce Lightning, Microsoft PowerApps.

Look

Нужны ли людям онлайн-конструкторы бизнес-приложений

tomleto Jan 30 2017 at 17:02

Триал версия работает 2 недели. О сроке окончания лицензии написано на странице Мой GetReport
Добавим информацию об окончании лицензии в письмо.

Спасибо за предложение, шаблоны сейчас делаем.

Look

Information

Specialization