Comments / Profile of cucusenok / Habr

User

Subscribers

Подсчет расстояния Хэмминга на большом наборе данных

cucusenok Jan 14 2025 at 07:52

А еще лучше Дамерау — Левенштейна, еще и перестановки учитывает)
Но на практике, чтобы обеспечить адекватную производительность для него — нужно постараться)

К чему может привести ослабление уровня изоляции транзакций в базах данных

cucusenok Jan 12 2025 at 18:39

*не преследую цель подушнить искренне этого не хочу, преследую цель обсудить*

В статье ценно то, что упомянута неполнота схемы уровней ISO, хотя тут… мне кажется, спецы и так это знают, а неспецам надо детальнее разжевать.

Возможно эту часть стоит вынести в начало статьи, тоже стал задаваться вопросом ценности статьи, в той же "Postgres изнутри" об уровнях изоляции написано, и когда разбираешься в вопросе, там или ISO догоняет реалии, или ISO не достаточно или при составлении ISO не увидели какие ситуацию еще могут быть. Не знаю у как других, но меня в процессе обучения сильно успокаивало, когда видел, что дурак не только я. Простое знание "при составление ISO не подумали" — успокаивает. Вот даже когда пишу коммент, лишний раз задумываюсь о том, дурак я или нет — жесть, одним словом.

неспецам надо детальнее разжевать.

Тут мне кажется еще сложнее, допустим, тут использовали диаграмму Ганта, чтобы передать то как происходит чтение данных, показывают таблицы и SQL запросы и как все это связано со временем, в целом — понятно, но не понятно тогда кто такой "НЕспециалист".

Потому что читающий в виде меня:

Насмотрен на диаграммы Ганта
Знает синтаксис SQL
Знает, что базы данных внутри могут поддерживать(или не поддерживать) уровни изоляции, да и в целом, базы данных в целом могут не поддерживать SQL и документо-ориентированные бд тоже нуждаются в изоляции(забавно) UPD: Была отличная статья которая рассказывала о том как MongoDB применяла "аналог ACID" в маркетинговых целях

В моей практике при работе со студентами и начинающими специалистами к каким только хитростям не нужно приходить, чтобы стало понятно, собственно, пока вижу что побеждают хорошо продуманные визуальные образы или анимации, они более емкие

Я, в целом, сильно за, чтобы был какой-то набор правил или софт, чтобы можно было гибче выбирать уровень детализации который в моменте нужен, потому что каждый раз писать, чтобы всем было понятно — труд сложнее любой работы.

По-поводу курса, захожу на сайт.
Что требуют перед изучением курса:

Опыт работы с Linux на уровне пользователя и базовое представление об SQL

Окей, у Postgres и Clickhouse — восхитительное комьюнити которые многие другие могут позавидовать, ребята огромные молодцы
Есть серия книг, опять таки, аналогичных этой, там даже показывают примеры на банковских операциях.
Что смущает, вы пишите целый курс, и делаете вводную статью, на диаграмму ниже потратил 5 минут(просто потому что, все инструменты под рукой)

Выводы сделать трудно, хочется рубить с плеча, только из-за того что, вводная к курсу, в моем понимании курс это работа методистов, психологов, дизайнеров, профессионалов и многократная проверка материала, поэтому, просто надеюсь, что этот комментарий был хоть кому-то полезен

Вопросно-ответные системы в области кода: часть 1

cucusenok Jan 11 2025 at 14:35

В первую очередь, поиск идет не по точному названию, а "семантический", т.е. вам не нужно угадывать как называется конкретная функция.
Второе — вопросно-ответная система, они сейчас +- одинаковые, создается векторное хранилище, в него добавляются документы(обычный текст, код после tree-sitter`a), тут еще важно, что простой метод getAuth который правильно токенизирован, на `get` и `auth` уже полезная нагрузка, дальше когда вы задаете вопрос в чат происходит следующее:

1. How something work?
2. Поиск по векторной базе данный релевантных документов
3. Полученные релевантные документы(функции, их фрагменты, классы, переменные, все зависит от того как хранят) передаются в LLM
4. LLM использует контекст вашего запроса `How something work?` и найденные документы для построения ответа
5. Результат работы — форматированный и красивый ответ о том, как что-то работает или какую новую функцию нужно написать

Если упрощать, то схема такая

Замечание учту — добавлю схему + более прозрачные примеры

Видео монтаж путем нейронок и OpenCV

cucusenok Jan 10 2025 at 17:53

Если вдруг мысль использовать французкий VPN из-за песни, то догадка уровня профессионала, я даже не сразу понял почему французкий)

Видео монтаж путем нейронок и OpenCV

cucusenok Jan 10 2025 at 17:48

Проверил с французким VPN, URL совпадает, возле иконки YouTube есть пометка что я теперь француз, видео доступно без каких-либо сообщений о блокировке. Если у Хабра есть еще способы удобно встроить видео через не заблокированные ресурсы — сделаю.

https://www.youtube.com/watch?v=uHAvxPDhuds — на всякий случай

Настройка рекламы в TikTok для продвижения интернет-магазина: органический и платный трафик (подробная инструкция)

cucusenok Jan 7 2025 at 07:10

Я не автор, но попробую перевести.

При регистрации аккаунта, тикток привязывает вашу геолокацию или номер телефона(по коду страны) к соответствующей аудитории сегментированной по геолокации аудитории. Почему покупка верифицированного аккаунта это выход — потому что при запуске нового, придется пострадать и вы с очень высокой вероятностью получите за что угодно бан, а во-вторых, раскрутка нового аккаунта что-то вроде игры в "завоюй доверие алгоритмов", поэтому проще купить уже проверенный аккаунт который уже помечен "этот аккаунт для нации X".
К сожалению, без цифр — статья бесполезна. Ибо все рекламные ролики, объявления и так далее ближе к игре в рулетку, чем к чему-то прогнозируемому.

Видео монтаж путем нейронок и OpenCV

cucusenok Jan 4 2025 at 19:04

Исправлено, спасибо

Анкета менеджера it-проектов

cucusenok Apr 13 2023 at 05:44

Анкеты/чеклисты нужны чтобы случайно ничего не забыть. Для условного стратапа, совершенно нормально, например, не поддерживать документацию или даже мониторинг) Если кто-то ищет готовой структурированной информации готовой к использованию тут и сейчас - автор любезно ее предоставляет. Я пробежался по сайту автора - выглядит и написано хорошо, но, например, начинающему менеджеру будет тяжело понять некоторые вещи. Чья это проблема я до сих пор не знаю, стараюсь лишний раз разжевать все что пишу.

Я сделал StackOverflow из IT-чатов Telegram

cucusenok Aug 26 2021 at 06:47

Да, была такая мысль - у самого тьма чатов и хотя бы быстро но пролистываю их, чтобы что-то подчеркнуть для себя)

Фичи.

Как вариант можешь ещё фильтровать по "спасибо" и синонимам - чтобы забирать "закрытый" тред. Ещё можно искать самых активных и к ним добавить метрику "спасибо" - будет список хороших специалистов по идее. Тут надо думать в стиле NLP, метрик с живого чата можно собрать много.
Самые популярные темы за день. Чтобы не пропустить что-то интересное. Можно визуализацию сделать в виде облака слов.
Можно группировать задаваемые вопросы, брать частоту из встречаемости - почти готовый план обучения. Т.е. ты увидишь в каких местах люди не смогли найти ответ самостоятельно и пошли за помощью к людям;