Дмитрий @Dreamastiy

Пользователь

honsour72 5 июл 2023 в 01:38

Шпаргалка по SQL (postgres), которая выручает меня на собесах

Простой

8 мин

229K

ИнтервьюТерминология ITАдминистрирование баз данных*SQL*PostgreSQL*

Из песочницы

Привет, Хабр!

Я решил посвятить свою первую статью SQL. Вопросы, рассмотренные ниже мне задавали на собеседованиях на позицию python-разработчика. Естественно отвечать правильно получалось не всегда, а если точнее то чаще не правильно, однако проведя N часов в рефлексии я составил перечень ответов, которыми пользуюсь до сих пор.

Данная информация предполагает знание основ языка запросов и я надеюсь, она окажется полезной для разработчиков, которые сейчас активно ищут работу а также, что ты прочитаешь этот текст до конца и добавишь свой вопрос к перечню (ну или поправишь неточности в существующих)

+177

178

zzzneg 22 июн 2023 в 12:00

Чат-бот на ChatGPT в энтерпрайз: чего нам это стоит?

Средний

18 мин

9.2K

Блог компании m2_techИскусственный интеллектАнализ и проектирование систем*

Кейс

✏️ Технотекст 2023

В М2 большой объём письменной коммуникации с клиентами. Это и ответы на общие вопросы — о компании, процессах подбора и покупки недвижимости, — и обсуждение конкретных деталей запущенных сделок. К примеру, клиенты хотят знать, в каком отделении банка они будут подписывать документы, пришли ли деньги продавцу, прошёл ли объект недвижимости проверки перед продажей.

Работа с вопросами происходит в тикет-системе клиентской поддержки (UseDesk). Для каждого вопроса через любой канал коммуникации (e-mail, мессенджеры, чат на сайте) заводится обращение, и сотрудник экспертной поддержки отвечает на него с определённым SLA.

Для оптимизации работы с обращениями процесс разделён на 3 линии поддержки. Первая линия отвечает только на вопросы без привязки к продукту и не знает о конкретных сделках. Она обрабатывает порядка 10 000 обращений в месяц. Вторая линия знает о продуктах и отвечает на вопросы по сделкам, таких обращений около 3 000 в месяц. Третья линия — это уже команды продуктов, до них доходят единичные вопросы.

Вопросы к первой линии поддержки и частично ко второй — однотипные, их обработку можно автоматизировать и сократить тем самым затраты на поддержание бизнес-процесса.

Так выглядел контекст проблемы, с которой вышла на внутренний хакатон наша команда из трёх человек.

Кстати, интересно ваше мнение, как бы вы подошли к решению задачи по автоматизации такого бизнес-процесса? Напишите в комменты или личку.

+12

TyVik 2 июн 2023 в 10:15

Что делает ChatGPT… и почему это работает?

Средний

75 мин

165K

Алгоритмы*Машинное обучение*Искусственный интеллектNatural Language Processing*

Перевод

То, что ChatGPT может автоматически генерировать что-то, что хотя бы на первый взгляд похоже на написанный человеком текст, удивительно и неожиданно. Но как он это делает? И почему это работает? Цель этой статьи - дать приблизительное описание того, что происходит внутри ChatGPT, а затем исследовать, почему он может так хорошо справляться с созданием более-менее осмысленного текста. С самого начала я должен сказать, что собираюсь сосредоточиться на общей картине происходящего, и хотя я упомяну некоторые инженерные детали, но не буду глубоко в них вникать. (Примеры в статье применимы как к другим современным "большим языковым моделям" (LLM), так и к ChatGPT).

+248

124

RationalAnswer 26 апр 2023 в 07:54

Как Федор выписывался из военкомата после эмиграции: полный гайд по снятию с воинского учета удаленно

Простой

13 мин

134K

IT-эмиграцияЗаконодательство в IT

Кейс

На прошлой неделе мой подписчик по имени Федя успешно снялся с воинского учета, не покидая Казахстан. В этой статье мы подробно разберем его пример, а также вместе с юристом распишем вам детальный пошаговый гайд для всего процесса.

+114

280

13 мар 2023 в 14:17

Откуда есть пошла аналитика и что отличает DS, DA, BA и SA

Простой

18 мин

43K

Блог компании Яндекс ПрактикумАнализ и проектирование систем*Big Data*История ITData Engineering*

Каждому из нас приходится принимать решения и иметь дело с их последствиями. Если речь идёт о бизнесе, то верный выбор может принести кругленькую сумму денег, а неверный — стоить целого состояния. Неудивительно, что сейчас в моде data-driven-подход, при котором каждое бизнес-решение принимается на основе объективных данных. Преобразованием данных в решения занимаются аналитики: финансовые, инвестиционные, продуктовые, аналитики рисков — им нет числа, как и строкам в их таблицах.

Разновидностей аналитиков стало уже так много, что в них немудрено и запутаться. Под катом мы разберём, кто такие аналитики данных, системные аналитики, бизнес-аналитики и дата-сайентисты: чем они отличаются, что у них общего, какие навыки нужны, чтобы стать одним из них. А заодно — вспомним первопроходцев, выдающихся аналитиков прошлого и над какими задачами они работали.

+21

Asya_Dyu 5 фев 2023 в 17:01

Вы не умеете играть в Героев 3: 13 карт S-размера, которые вы не пройдете за вечер

11 мин

65K

Блог компании Timeweb CloudДизайн игр*Логические игрыРазработка игр*

Дайджест

Впервые Герои появились в моей жизни лет в 7. Как сейчас помню, зимние каникулы, тётя, старше меня на 16 лет (невероятно взрослая и крутая, слушает Металлику, у нее даже есть косуха), запускает с диска «Герои Меча и Магии III: Полное собрание». Я в предвкушении устраиваюсь сзади на диване, впереди лучшие часы для нас двоих. Для меня Геройский стрим (поиграть меня пустят только через пару лет), а для неё — несколько часов тишины.

За последние 15 лет моя игра в «Герои» не сильно менялась. Ну, сложность повыше, ну, компов побольше. Те же автосгенерированные карты, только сбоку. Если нападать, то на армию не сильно больше моей. Если магия, то жахнуть от души «Цепью молний», на крайний случай «Армагеддон», (если Черные Драконы есть). Но смысл один: строим Ратушу, захватываем Лесопилку, подбираем сундучок, скупаем прирост, отвоёвываем замок у компа. Приелось.

Сразу скачивать карту XXL-убийцу самооценки было стрёмно, а узнать, как играют тру-пацаны — интересно. Оказалось, некоторые картоделы давно уже создают карты-пазлы, с боями на ~~подумать~~ знание поведения ИИ, с использованием багов игры или просто на хитрую логистику. Таких карт-загадок меньше и они не очень популярны, но я нашла 13 шедевров Heroes Might and Magic III S-размера. (Будет очень много скриншотов).

Я веду ламповый Telegram-канал GameDEVils и блог на Substack . Заглядывайте в гости, я делюсь там материалами про геймдизайн, разработку и историю игр ^__^

Читать дальше →

+221

106

Maximov_psy 30 янв 2023 в 10:56

Как студент пытался поднять качество образования в ВУЗе и что из этого получилось (спойлер: ничего)

11 мин

12K

Читальный залЗдоровье

Как говаривал Уинстон Черчилль: "Кто в молодости не был революционером — у того нет сердца. Кто в старости не стал консерватором — у того нет мозгов". Насчет того, появились ли у меня мозги - вопрос открытый и по сей день, а вот насчет своего неудачного опыта Че Гевары в области повышения качества образования хочу поведать.

Разумеется, данная статья не только представляет собой описание неудачной попытки педагогической революции, но так же описывает когнитивные слабости современных школьников, а также даёт пищу для размышления, подкрепленную психолого-педагогическими фактами.

Узнать, как делать не надо

+44

116

dimanosov007 26 янв 2023 в 17:14

Введение в диффузионные модели для генерации изображений – полное руководство

22 мин

40K

Data Engineering*Искусственный интеллектМашинное обучение*Data Mining*Python*

Обзор

Перевод

Диффузионные модели могут значительно расширить мир творческой работы и создания контента в целом. За последние несколько месяцев они уже доказали свою эффективность. Количество диффузионных моделей растет с каждым днем, а старые версии быстро устаревают

+28

marieee 16 ноя 2022 в 12:52

Как построить прогноз спроса и не потерять голову

13 мин

18K

Блог компании ecom.techData Engineering*Аналитика мобильных приложений*Big Data*Алгоритмы*

Всем привет! Представьте себе ситуацию: ваша уютная маленькая команда Data Science занимается прогнозированием спроса для пары десятков дарксторов с помощью какого-нибудь коробочного Prophet. И в один прекрасный день к вам приходит бизнес. Бизнес садится, закидывает ногу на ногу, закуривает сигару и говорит:

«Мы хотим максимально автоматизировать закупки. Нам нужно, чтобы вы умели строить прогноз по всем товарам, старым и новым, для всех дарксторов, старых и новых. А их будет много, их будут сотни, тысячи, миллионы. А ещё у нас будет миллион видов скидок и разные типы ценообразования, и ещё куча промо-механик и конкурсов интересных. Мы хотим, чтобы прогноз обязательно адекватно на всё это реагировал». (с) Типичный Бизнес

Хорошо, думаем мы, кажется, что это звучит нетрудно…

С этой задачи начинается моя история о прогнозе спроса в Самокате. Меня зовут Мария Суртаева, я Data Scientist и расскажу о концепции прогноза спроса, его практических задачах и роли градиентного бустинга.

+27

NizhnikovEvgeny 9 ноя 2022 в 14:47

Как упростить жизнь за 312 коротких шагов: проектируем GraphQL API в микросервисной архитектуре

Простой

9 мин

13K

Блог компании HiFi-стриминг ЗвукМикросервисы*API*Анализ и проектирование систем*Высокая производительность*

Технотекст 2022

Из песочницы

Звук – HiFi-сервис с большой командой инженеров. Мы используем передовые технологии и современный стек, и экспериментируем, чтобы решать сложные, нестандартные задачи. Одна из технологий – GraphQL.

Эта статья изначально создавалась как гайд по работе с GraphQL для инженеров Звука (системные аналитики, разработчики, QA). При этом статья может быть полезна всем, кто никогда не работал с GraphQL, но очень хочет понять, зачем он может быть нужен, и как поможет решить задачу вашего бизнеса.

+27

DmitryAstashov 3 окт 2022 в 16:48

Как оценить эффективность Real-Time Marketing

9 мин

2.9K

Блог компании GlowByteCRM-системы*Повышение конверсии*

Практически все крупные компании уже имеют в арсенале инструменты целевого маркетинга и активно используют их для развития своей клиентской базы. Мы в GlowByte в практике Marketing Management помогаем заказчикам не только внедрять технологии аналитического CRM, но и оценивать эффективность их использования, определяя зоны роста целевого маркетинга и повышения лояльности клиентов к получаемым предложениям.

В этой статье я, Дмитрий Асташов, руководитель направления маркетинговой отчётности в GlowByte, поделюсь своими рассуждениями о подходах к оценке эффективности сценариев, направленных на маркетинговое взаимодействие с клиентами в режиме реального времени, также называемое Real-Time Marketing.

+10

erogov 27 мая 2019 в 10:38

MVCC-6. Очистка

13 мин

60K

Блог компании Postgres ProfessionalSQL*PostgreSQL*

Мы начали с вопросов, связанных с изоляцией, сделали отступление про организацию данных на низком уровне, затем подробно поговорили о версиях строк и о том, как из версий получаются снимки данных.

В прошлый раз мы поговорили о HOT-обновлениях и внутристраничной очистке, а сегодня займемся всем известной обычной очисткой, vacuum vulgaris. Да, про нее написано уже столько всего, что вряд ли я скажу что-то новое, но полнота картины требует жертв. Терпите.

Обычная очистка (vacuum)

Что делает очистка

Внутристраничная очистка выполняется быстро, но освобождает только часть места. Она работает в пределах одной табличной страницы и не затрагивает индексы.

Основная, «обычная» очистка выполняется командой VACUUM и ее мы будем называть просто очисткой (а про автоочистку мы будем говорить отдельно).

Итак, очистка обрабатывает таблицу полностью. Она вычищает не только ненужные версии строк, но и ссылки на них из всех индексов.

Обработка происходит параллельно с другой активностью в системе. Таблица и индексы при этом могут использоваться обычным образом и для чтения, и для изменения (однако одновременное выполнение таких команд, как CREATE INDEX, ALTER TABLE и некоторых других будет невозможно).

В таблице просматриваются только те страницы, в которых происходила какая-то активность. Для этого используется карта видимости (напомню, что в ней отмечены страницы, содержащие только достаточно старые версии строк, которые гарантированно видимы во всех снимках данных). Обрабатываются только страницы, не отмеченные в карте, а сама карта при этом обновляется.

В процессе работы обновляется и карта свободного пространства, чтобы отразить появившееся свободное места в страницах.

Читать дальше →

+23

ms_causa 17 окт 2022 в 17:56

Как правильно внедрить Self-service-аналитику и для чего вам это

7 мин

5.1K

Блог компании AGIMAВизуализация данных*Веб-аналитика*

Технотекст 2022

Привет, Хабр! Я Лена Маеркина, CPO в AGIMA. Сегодня хотела бы поделиться опытом, который упросит жизнь продактам и сделает продукт удобнее для пользователей. Как вы поняли, речь пойдет о Self-service-аналитике. Погнали!

+26

unserialize 11 окт 2022 в 12:12

Цветные функции: ищем плохие архитектурные паттерны

6 мин

16K

Блог компании VKOpen source*PHP*Программирование*Совершенный код*

Когда у языка нет цветовой дифференциации функций… то у языка нет цели?

Я уже много лет занимаюсь компиляторами и языками в целом. Хочу поделиться интересной мыслью, которая когда-то пришла мне в голову. Почему-то такого я нигде не видел.

Если немного расширить понятие функции (ввести атрибут «цвет»), можно описывать паттерны вида «вызывать логгер из performance-critical мест — это плохо» или «ходить в базу при рендеринге шаблонов запрещено».

Идея абсолютно не зависит от языка и применима к любому: хоть JS, хоть Go. Разберу её подробно в статье, и это будет интересно больше с теоретической точки зрения. Хотя мы даже сделали практическую реализацию для PHP, чтобы использовать у себя. Ссылки на GitHub и видео приложу в конце, а пока обо всём по порядку.

+54

katerinasve 29 сен 2022 в 20:09

Матрица уровней дата инженеров Amazon

6 мин

11K

Data Engineering*

Из песочницы

Матрица показывает, как меняются профессиональные навыки специалистов от уровня к уровню. Сюда не включены Принципы Лидерства Amazon (https://www.amazon.jobs/en/principles), поскольку они едины для всех и не зависят от уровня сотрудника.

Матрица уровней не используется сама по себе. Это только референсы навыков для приема на работу. Эйчары рассматривают технические навыки сотрудника в отрыве от личностных качеств и сравнивают их с должностными ожиданиями.

С чем работают дата инженеры?

+15

evpak 21 сен 2022 в 15:01

Без А/B результат XЗ, или Как построить высоконагруженную платформу А/B-тестов

17 мин

24K

Блог компании Ozon TechВысокая производительность*Анализ и проектирование систем*Тестирование веб-сервисов*Управление продуктом*

Победитель Технотекст 2022

Один из важных вопросов как в нашей жизни, так и в бизнесе, и в IT — вопрос эффективности. Эффективно ли мы планируем наше время, те ли задачи решает бизнес, тот ли код мы оптимизируем? Чтобы ответить на эти вопросы, результат должен обладать главным критерием — измеримостью. Измеримость результата новых фич для бизнеса и IT обеспечивает платформа А/B-тестов. О том, как её можно построить, выдерживать большой RPS и при этом не ~~облажаться~~ уронить прод, я расскажу в этой статье.

В конце статьи вы узнаете, как мы задетектили проблемы инфраструктуры, оптимизация которых значительно повлияла на скорость всего Ozon.

+106

polina_ok 6 сен 2022 в 16:37

Продвинутые методы Uplift-моделирования

8 мин

Блог компании GlowByteData Mining*Машинное обучение*

Cезон Data Mining

Всем привет! Меня зовут Окунева Полина, я ведущий аналитик компании GlowByte. Сегодня я хочу рассказать о задаче Uplift-моделирования — частном случае такой большой сферы как Causal Inference, или причинно-следственный анализ, — и методах ее решения. Задачи такого типа важны во многих областях. Если вы сотрудник, например, продуктовой компании, то причинно-следственный анализ поможет сократить издержки на коммуникации с людьми, на которых она не повлияет. Если вы врач, то такой анализ подскажет, выздоровел пациент благодаря лекарству или из-за удачного стечения обстоятельств.

Какого-то полноценного гайда по продвинутым методам Uplift-моделирования я не встретила ни в русско-, ни даже в англоязычном интернете, поэтому было огромное желание структурировать информацию и поделиться ею с интересующимися.

+13

arch1baald 14 сен 2022 в 17:11

Шерудим под капотом Stable Diffusion

10 мин

36K

Natural Language Processing*Искусственный интеллектМашинное обучение*Обработка изображений*

Туториал

Вероятно вы уже слышали про успехи нейросетей в генерации картинок по текстовому описанию.

Я решил разобраться, и заодно сделать небольшой туториал, по архитектуре модели Stable Diffusion. Сегодня мы не будем глубоко погружаться в математику и процесс тренировки. Вместо этого сфокусируемся на применении и устройстве основных компонент: UNet, VAE, CLIP.

+81

AdvoDom 11 сен 2022 в 11:59

Крякнул софт? Суши сухари

5 мин

40K

Информационная безопасность*

Именно так считает "товарищ майор", и с подобным утверждением порой соглашается российское правосудие.

С 1997 года в своде законов российских дремлет статья 273 УК РФ (Создание, использование и распространение вредоносных компьютерных программ), карающая не чтившего уголовный закон наказанием вплоть до семи лет лишения свободы. Судебную практику по данной статье объективно не назовешь обширной, но изучение реальных случаев её применения должно вызывать дрожь и трепет у всякого, возложившего руки на клавиатуру.

+54

187

kesn 2 сен 2022 в 18:15

Груг против сложности. Я пролинтил все посты на Хабре про Python, и вот что я нашёл

52 мин

63K

Блог компании BreakpointПрограммирование*Python*

В какой-то момент времени я превратился в ~~педанта~~ брюзгу. В фильмах малейшие нестыковки и провалы в логике портят мне весь просмотр. В чатах меня бесит it's вместо its. А в статьях про программирование... Всё плохо. За меня всё уже сказал @AlexanderAstafiev, я лишь процитирую:

Простите, я не могу так больше. Я слишком хорошо знаю Python, чтобы молчать при виде такого кода.
Я устал. Я не могу это читать. Простите за токсичную критику, накипело.

Самое забавное, что, по моим ощущениям, везде я вижу одни и те же классы проблем. Я даже запилил сервис, где можно закинуть код и получить код ревью, и, собрав немного статистики, понял, что 50 типов ошибок достаточно, чтобы покрыть большую часть проблем в чужом коде. Но выборка у меня была небольшая, и я подумал: а что, если проверить много кода?

И всё заверте...

+134

153

3 4 ...

19 20