Karuna, Санкт-Петербург / Статьи / Хабр

Компания Karuna временно не ведёт блог на Хабре

Внутреннее устройство sync.Map, сравнение производительности с map + RWMutex

3 мин

1.9K

Блог компании KarunaGo*Алгоритмы*Веб-разработка*Программирование*

Привет, Хабр! Эта статья для тех, кто хочет понять, когда стоит использовать sync.Map, а когда достаточно обычной map с мьютексом.

В Каруне этот вопрос иногда возникал на код ревью, поэтому такая статья мне показалась полезной. TLDR: sync.Map лучше работает на задачах, где много операций чтения, и ключи достаточно стабильны.

Внутреннее устройство sync.Map

sync.Map — это потокобезопасная реализация мапы в Go, оптимизированная для определенных сценариев использования.

Основная структура sync.Map выглядит примерно так:

type Map struct {
    mu Mutex
    read atomic.Value // readOnly
    dirty map[interface{}]*entry
    misses int
}

type readOnly struct {
    m       map[interface{}]*entry
    amended bool
}

type entry struct {
    p unsafe.Pointer // *interface{}
}

Здесь мы видим несколько ключевых полей:

Читать дальше →

+11

varanio 23 июл в 14:36

Ошибки в языке Go — это большая ошибка

3 мин

18K

Блог компании KarunaGo*Веб-разработка*Программирование*

// гофер пытается найти логику среди обработки ошибок
+-------+-------+-------+-------+-------+-------+
|       |  err  |       |  err  |       |  err  |
|  ,_,,,        |       |       |       |       |
| (◉ _ ◉)       |       |       |       |       |
|  /)  (\               |       |       |       |
|  ""  ""               |       |       |       |
+       +-------+       +-------+       +-------+
|       |  err          |  err  |       |  err  |
|       |               |       |       |       |
|       |               |       |       |       |
+-------+       +-------+       +-------+       +
|  err  |               |  err                  |
|       |               |                       |
|       |               |                       |
+       +-------+       +       +-------+       +
|       |  err  |               |  err  | logic |
|       |       |               |       |       |
|       |       |               |       |       |
+-------+-------+-------+-------+-------+-------+

Я пишу на Go несколько лет, в Каруне многие вещи сделаны на нём; язык мне нравится своей простотой, незамысловатой прямолинейностью и приличной эффективностью. На других языках я писать не хочу.

Но сорян, к бесконечным if err != nil я до конца привыкнуть так и не смог.

Да-да, я знаю все аргументы: явное лучше неявного, язык Go многословен, зато понятен, и всё такое. Но, блин, на мой взгляд Го-вэй Го-вэю рознь.

Читать дальше →

+42

varanio 3 июл в 14:43

А что если исходные коды программ хранить в бинарном формате?

3 мин

28K

Блог компании KarunaКомпиляторы*Программирование*Текстовые редакторы и IDE*

Эта статья — просто идея, не судите строго.

TLDR: предлагаю рассмотреть хранение исходных кодов программ в некоем бинарном формате вместо голого текста.

Компилятор и IDE

Как примерно работает компилятор: сначала происходит лексический анализ, т.е. разбиение исходного кода на токены. Потом происходит синтаксический анализ — полученные токены объединяются в синтаксическое дерево. Потом семантический анализ: вывод типов данных, проверка видимости переменных, и т.д.

И только потом идут этапы, приводящие в конце концов к появлению исполняемого файла.

Как работает типичная IDE: да точно так же. Лексический анализ, синтаксический анализ, семантический анализ, вывод типов, и всё прочее. Т.е. по сути ребята пишут полкомпилятора, чтобы вы могли получить все современные возможности IDE.

Т.е. сам текст программы нужен только человеку на этапе ввода информации. Потому что ему для понимания происходящего AST-дерево не подойдёт.

Но что если хранить исходный код по-другому?

Читать дальше →

240

varanio 27 мая в 15:56

Structured concurrency в языке Go

5 мин

5.1K

Блог компании KarunaGo*Веб-разработка*Параллельное программирование*Программирование*

Горутины виснут непонятно почему, случайная запись в закрытый канал вызывает panic, нормально протестировать приложение вообще невозможно.

Наверняка многие из вас сталкивались с такой проблемой: синтаксис языка Go вроде бы очень простой, можно сказать примитивный, да и горутины создаются элементарно, но при этом написать мало-мальски серьёзную программу, которая конкурентно что-то делает, внезапно оказывается не так-то просто.

Чтобы не запутаться, люди придумали концепцию structured concurrency, которую можно применять и в Go.

Читай или страдай

+13

varanio 23 апр в 15:41

Пишем поиск семантически похожих текстов (или товаров) за полчаса на Go и Postgres (pgVector)

5 мин

8.9K

Блог компании KarunaGo*PostgreSQL*Веб-разработка*Программирование*

Туториал

Казалось бы, в посгресе и так есть неплохой полнотекстовый поиск (tsvector/tsquery), и вы из коробки можете проиндексировать ваши тексты, а потом поискать по ним. Но на самом деле это не совсем то, что нужно — такой поиск работает лишь по чётким совпадениям слов. Т.е. postgres не догадается, что "кошка гонится за мышью" — это довольно близко к "котёнок охотится на грызуна". Как же победить такую проблему?

TLDR:

Преобразовываем наши тексты в наборы чисел (векторы) при помощи API openAI.
Сохраняем векторы в базе с помощью pgvector.
Легко ищем близкие друг к другу векторы или ищем их по вектору-запросу.
Ускоряем индексами.

Читать дальше →

+24

GRAlll 1 мар в 15:09

Как не про…пустить все дедлайны. Автоматизируй, властвуй, сохраняй

Простой

11 мин

3.6K

Блог компании KarunaУправление разработкой*Управление проектами*СофтЛайфхаки для гиков

Туториал

Как не умереть от рабочей рутины и не потерять фокус между десятками ежедневных задач? Как по максимуму использовать почту, календарь, мессенджер и браузер?
Читайте мини-гайд и берите на заметку!
P.S. ТОП 8 неудачных прыжков на грабли в комплекте

varanio 26 фев в 14:46

PostgreSQL: обеспечение уникальности записи с проверкой даты валидности

2 мин

4.4K

Блог компании KarunaPostgreSQL*SQL*Веб-разработка*Программирование*

Как бы вы решали такую задачу? Предположим, есть таблица с купонами, и у купонов есть некая дата устаревания valid_until. Вам надо обеспечить такое ограничение (constraint) на уровне БД, чтобы у одного человека мог быть только один действующий купон.

Т.е., таблица изначально выглядит так:

CREATE TABLE coupons (
    id  bigint primary key generated by default as identity,
    user_id bigint not null,
    created_at timestamp not null,
    valid_until timestamp not null
)

Читать дальше →

+12

skitial 21 фев в 17:39

Код-ревью и Рингельман

Простой

4 мин

3.2K

Блог компании KarunaПрограммирование*Управление разработкой*

Код-ревью в команде — это как смотрины при рождении ребенка — большой семейный праздник. Разработчик вытаскивает своё творение на всеобщее обозрение и ждёт приговора, похвалы, замечаний и комментариев. Главная цель — показать изменения, которые вносятся в кодовую базу, а в ходе рецензирования повысить экспертизу как минимум одного участника дискуссии и не допустить плохой код до прода.

GRAlll 28 дек 2023 в 15:54

Как не про…пустить все дедлайны. Таск-трекер в деле

Простой

7 мин

Блог компании KarunaВизуализация данных*Управление проектами*СофтЛайфхаки для гиков

Туториал

Какие подходы к управлению временем вы сейчас используете? Готовы ли вы сказать, что у вас чёткая система по управлению вашими рабочими задачами?

Я готов сказать — да, и поделиться как это работает у меня вот уже много лет.

varanio 4 дек 2023 в 14:28

ORM для реальных приложений не окупается

4 мин

31K

Блог компании KarunaGo*MySQL*PostgreSQL*Программирование*

Идея упростить или абстрагировать код с помощью ORM, возможно, имеет очень ограниченный контекст применимости. По сути ORM хорош для приложений уровня простого CRUD, а дальше начинает только мешать. А CRUD-приложений в реальной жизни очень мало.

Проблемы

При использовании ORM мы обычно прописываем в коде сущности и их взаимосвязи, и по сути это — проектирование БД ещё раз (дублирование логики!) прямо в коде.
Борьба с проблемами производительности никуда не денется всё равно, как ни абстрагируй. Ты просто не можешь не знать, что у тебя под капотом происходит. Какие там делаются джойны и группировки.
Язык запросов в виде цепочки объектов и методов читается хуже, чем SQL, по сути это — особый язык, который надо учить. За себя скажу, что когда писал на PHP (Laravel), длинные запросы на Eloquent меня иногда изумляли своей сложностью чтения:

Читать дальше →

+30

231

GRAlll 9 ноя 2023 в 13:49

Мониторинг с Grafana. Best practices

Средний

11 мин

53K

Блог компании KarunaIT-инфраструктура*Визуализация данных*

Туториал

Сборная солянка из существующих best practices по работе с Grafana и немного с Prometheus, проверенных мной лично. Можно просто положить в закладки — когда-нибудь да пригодится.

Будет полезно

+17

pavel_shunkevich 25 окт 2023 в 14:28

Как получить полезную информацию из своих категориальных признаков?

Простой

9 мин

8.2K

Блог компании KarunaPython*Data Mining*Машинное обучение*Data Engineering*

Туториал

В этой статье я выскажу свою точку зрения о том, что из себя представляют категориальные признаки. Расскажу про способы работы с ними, которыми пользуюсь сам как антифрод-аналитик в Каруне.

+10

varanio 4 окт 2023 в 14:47

Golang: как найти мёртвый код в проекте, а заодно оценить покрытие тестами живого кода

3 мин

3.8K

Блог компании KarunaGo*Программирование*Тестирование веб-сервисов*

В Go 1.20 сделали возможность сбилдить приложение с флагом cover

go build -cover

после чего, если запустить такое приложение, то будет собираться статистика, показывающая, какие части кода были выполнены, а какие нет, и складываться в папочку, указанную в переменной окружения.

Это, конечно, было сделано для интеграционных тестов, когда приложение запускается целиком в каких-то сценариях (а не через go test), но, вероятно, это можно попробовать использовать и по-другому:

запустить такой бинарник прямо на проде, подержать какое-то время и посмотреть, какие участки кода в реальности никогда не запускаются.

Так можно найти недовыпиленный легаси-код, старые эндпоинты API, которые давно никому не нужны, малозначимые проверки if err != nil и прочее. Как минимум, на это интересно посмотреть, можно найти что-нибудь удивительное.

Disclaimer: разумеется, сбор статистики создает какой-то оверхед, поэтому подойдёт точно не всем. Как вариант, можно пустить туда небольшую часть трафика.

Читать дальше →

+10

Asmolovskij 7 сен 2023 в 15:32

Как понять, что клиента пора реактивировать?

Простой

15 мин

Блог компании KarunaPython*Машинное обучение*

Туториал

В идеальном мире мы точно знаем, в какой момент времени пользователю нужно напомнить о нашем продукте. Причём таким образом, чтобы он не отказался от наших услуг, а совершил бы новый платёж. Если мы будем излишне активными, отправляя всем нашим клиентам сообщения, то это может стать и раздражающим фактором, и оказаться не дешевым вариантом. Подходы, основанные на анализе вероятности оттока каждого клиента в отдельности - это, безусловно, отличные варианты, но они требуют времени и ресурсов на исследование и разработку.

А что делать, если прямо сейчас у вас нет ни времени на разработку сложных подходов, ни приблизительного понимания, как долго живёт ваш среднестатистический клиент, а задача от бизнеса дать какие-то рекомендации есть?

Меня зовут Артём, я антифрод-аналитик в Каруне, и в данной статье мы рассмотрим достаточно простой подход, с помощью которого можно решить обозначенную проблему. Если вы скажете, что антифрод решает абсолютно другой спектр задач, то будете абсолютно правы. Однако во время работы с одним из проектов при переосмыслении использованного алгоритмического стека в нём, мы пришли к выводу, что отдельные небольшие кусочки этого стека вполне могут подходить и для решения других задач. На базе нашего опыта расскажу, как с помощью байесовского моделирования и библиотеки PyMC3 можно получить примерную картину о том, как долго ваш клиент должен быть неактивным, чтобы считать его отточником. Это может помочь ответить на базовые вопросы бизнеса и подготовиться к реализации более точных и качественных моделей (если это потребуется).

GRAlll 10 авг 2023 в 13:19

Два стула для руководителя. Слабо усидеть на обоих?

Простой

14 мин

Блог компании KarunaУправление разработкой*Управление продуктом*IT-компании

Обзор

Вы когда-нибудь приходили на позицию руководителя в новую для вас команду?

Если да, вы понимаете, насколько это сложно, и сколько всего вам свалится на голову. Сложнее только, если вы становитесь руководителем других руководителей, у которых свои взгляды на жизнь, команду и процессы.

Вас ждет небольшой Cookbook по непростым ситуациям и вариантам их решения.

Упор делаю на процессы и людей — именно эти 2 “стула” вам предстоит осилить.

+15

varanio 31 июл 2023 в 12:51

В Go 1.21 существенно расширяется стандартная библиотека

4 мин

15K

Блог компании KarunaGo*Программирование*

// теперь в Go так можно!
slices.Contains(s, v)

Год назад в блоге Каруны мы писали про дженерики в Go, и там упоминалось, что гошное сообщество разделилось на две части. Не всем это нововведение было нужно, особенно в простом продуктовом коде. И надо сказать, это до сих пор так, дженерики по-прежнему используют далеко не все проекты.

Однако для стандартной библиотеки Go это было по-настоящему царским подарком. Появились новые стандартные обобщенные функции, и, отстоявшись в экспериментальном репозитории golang.org/x/exp, теперь появятся в Go 1.21. Релиз буквально через месяц.

TLDR: появилось множество функций по работе со слайсами, мапами, а также новый логгер с (почти) всеми нужными фишечками.

Лично для меня знаковым событием стало появление возможности поиска элемента в слайсе и получение ключей мапы, потому что ну давно пора, 10 лет языку.

Но давайте обо всём по порядку.

Читать дальше →

+39

GRAlll 20 июл 2023 в 18:09

Зародыш, франкенштейн или корпорация — почему важно точно знать, где ты сейчас работаешь?

Простой

8 мин

4.4K

Блог компании KarunaУправление разработкой*Развитие стартапаУправление продуктом*Управление персоналом*

Обзор

О чем и для кого статья?

Узнайте, что ждет вас если вы уже работаете в стартапе, или только пришли в компанию, не оставившую "Дух стартапа" позади. Без разницы, менеджер вы или инженер, изменения коснутся вас и стоит подумать уже сейчас насколько вы к ним готовы.

Вас ждет немного утрированная подача и мой (иногда моих знакомых) личный опыт. Разбавим грусть мемами и в конце соберем статистику, сколько кружек вы заслужили за свою карьеру.

MariAfonshina 18 июл 2023 в 14:24

Как стать тестировщиком без регистрации и смс, но с нейросетями. Эксперимент, который зашёл слишком далеко

Простой

7 мин

4.5K

Блог компании KarunaИскусственный интеллектКопирайтТестирование IT-систем*

Репортаж

Привет, меня зовут Мария, я работаю в Каруне неунывающим экспериментатором чата GPT, ну а вообще UX-писателем. В предыдущей статье я попыталась устроиться Middle Full-Stack разработчикам только с помощью чата GPT. Результаты моего эксперимента можно почитать в этой статье.

В этот раз я решила провести более чистый эксперимент – анонимно откликнуться в геймдев компанию моей знакомой, которая как раз ищет тестировщика в проект.

Итак, нам дано: по-прежнему нулевые знания в области разработки, такие же нулевые знания в области тестирования, но большой энтузиазм и чат GPT.

В этот раз я начну с консультации Middle-тестировщицы Ксюши в моей компании Каруна, которая подскажет мне, на что обратить внимание.

varanio 11 июл 2023 в 14:32

Монолит или микросервисы — это не вопрос технологических предпочтений, это про time-to-market

Простой

5 мин

13K

Блог компании KarunaKubernetes*Программирование*Управление разработкой*

Мнение

На конференциях эта тема (монолит vs микросервисы) обсуждается с завидной регулярностью, но обычно в техническом ключе. Кто-то любит консистентность монолита, кто-то гибкость микросервисов, какие-то инструменты удобнее, какие-то нет.

Очень мало обсуждается вопрос команд и их взаимодействия, а ведь это самое главное при выборе. Я написал небольшую заметку в одном телеграм-канале, и в результате последующих обсуждений незаметно выросла целая статья на Хабр.

Поехали.

Итак, главное — это организационная структура компании и процессы взаимодействия команд. Да-да, как всегда, не технологии, а люди. Сейчас я работаю в Каруне, до этого работал в компаниях поменьше, видел, как набивались шишки, поэтому могу сравнить.

Одна команда

Когда команда одна, не очень большая (two pizza team), то никто никому не мешает. Код ревью, рефакторинг, деплой проходят быстро и весело. Бизнес сфокусирован на цели и работает как единое целое. Целью, кстати, зачастую является проверка гипотезы, нужен ли вообще этот проект кому-то или нет.

Читать дальше →

+41

Smirry 19 мая 2023 в 10:49

Ультимативный гайд по хакатону без кода: как проработать 3 запроса бизнеса за 9 часов, и при чём здесь Гарри Поттер

Простой

8 мин

1.3K

Блог компании KarunaУправление сообществом*

Туториал

У нас было 3 темы, 15 команд, 6 сочных заданий, 9 часов плотного хакатонинга с перерывом на обед, заполненный 10+ проектами на 2 квартала вперёд роадмап, и ноль программирования. Мы называли это Карунатон.

Давайте сразу черкану, что даст вам эта статья, и зачем читать её до конца:

2 3

Внутреннее устройство sync.Map, сравнение производительности с map + RWMutex

Внутреннее устройство sync.Map

Ошибки в языке Go — это большая ошибка

А что если исходные коды программ хранить в бинарном формате?

Компилятор и IDE

Structured concurrency в языке Go

Пишем поиск семантически похожих текстов (или товаров) за полчаса на Go и Postgres (pgVector)

Истории

Как не про…пустить все дедлайны. Автоматизируй, властвуй, сохраняй

PostgreSQL: обеспечение уникальности записи с проверкой даты валидности

Код-ревью и Рингельман

Как не про…пустить все дедлайны. Таск-трекер в деле

ORM для реальных приложений не окупается

Проблемы

Мониторинг с Grafana. Best practices

Как получить полезную информацию из своих категориальных признаков?

Golang: как найти мёртвый код в проекте, а заодно оценить покрытие тестами живого кода

Как понять, что клиента пора реактивировать?

Ближайшие события

Два стула для руководителя. Слабо усидеть на обоих?

В Go 1.21 существенно расширяется стандартная библиотека

Зародыш, франкенштейн или корпорация — почему важно точно знать, где ты сейчас работаешь?

Как стать тестировщиком без регистрации и смс, но с нейросетями. Эксперимент, который зашёл слишком далеко

Монолит или микросервисы — это не вопрос технологических предпочтений, это про time-to-market

Одна команда

Ультимативный гайд по хакатону без кода: как проработать 3 запроса бизнеса за 9 часов, и при чём здесь Гарри Поттер