А еще лучше Дамерау — Левенштейна, еще и перестановки учитывает) Но на практике, чтобы обеспечить адекватную производительность для него — нужно постараться)
*не преследую цель подушнить искренне этого не хочу, преследую цель обсудить*
В статье ценно то, что упомянута неполнота схемы уровней ISO, хотя тут… мне кажется, спецы и так это знают, а неспецам надо детальнее разжевать.
Возможно эту часть стоит вынести в начало статьи, тоже стал задаваться вопросом ценности статьи, в той же "Postgres изнутри" об уровнях изоляции написано, и когда разбираешься в вопросе, там или ISO догоняет реалии, или ISO не достаточно или при составлении ISO не увидели какие ситуацию еще могут быть. Не знаю у как других, но меня в процессе обучения сильно успокаивало, когда видел, что дурак не только я. Простое знание "при составление ISO не подумали" — успокаивает. Вот даже когда пишу коммент, лишний раз задумываюсь о том, дурак я или нет — жесть, одним словом.
неспецам надо детальнее разжевать.
Тут мне кажется еще сложнее, допустим, тут использовали диаграмму Ганта, чтобы передать то как происходит чтение данных, показывают таблицы и SQL запросы и как все это связано со временем, в целом — понятно, но не понятно тогда кто такой "НЕспециалист".
Потому что читающий в виде меня:
Насмотрен на диаграммы Ганта
Знает синтаксис SQL
Знает, что базы данных внутри могут поддерживать(или не поддерживать) уровни изоляции, да и в целом, базы данных в целом могут не поддерживать SQL и документо-ориентированные бд тоже нуждаются в изоляции(забавно) UPD: Была отличная статья которая рассказывала о том как MongoDB применяла "аналог ACID" в маркетинговых целях
В моей практике при работе со студентами и начинающими специалистами к каким только хитростям не нужно приходить, чтобы стало понятно, собственно, пока вижу что побеждают хорошо продуманные визуальные образы или анимации, они более емкие
Я, в целом, сильно за, чтобы был какой-то набор правил или софт, чтобы можно было гибче выбирать уровень детализации который в моменте нужен, потому что каждый раз писать, чтобы всем было понятно — труд сложнее любой работы.
По-поводу курса, захожу на сайт. Что требуют перед изучением курса:
Опыт работы с Linux на уровне пользователя и базовое представление об SQL
Окей, у Postgres и Clickhouse — восхитительное комьюнити которые многие другие могут позавидовать, ребята огромные молодцы Есть серия книг, опять таки, аналогичных этой, там даже показывают примеры на банковских операциях. Что смущает, вы пишите целый курс, и делаете вводную статью, на диаграмму ниже потратил 5 минут(просто потому что, все инструменты под рукой)
Выводы сделать трудно, хочется рубить с плеча, только из-за того что, вводная к курсу, в моем понимании курс это работа методистов, психологов, дизайнеров, профессионалов и многократная проверка материала, поэтому, просто надеюсь, что этот комментарий был хоть кому-то полезен
В первую очередь, поиск идет не по точному названию, а "семантический", т.е. вам не нужно угадывать как называется конкретная функция. Второе — вопросно-ответная система, они сейчас +- одинаковые, создается векторное хранилище, в него добавляются документы(обычный текст, код после tree-sitter`a), тут еще важно, что простой метод getAuth который правильно токенизирован, на `get` и `auth` уже полезная нагрузка, дальше когда вы задаете вопрос в чат происходит следующее:
1. How something work? 2. Поиск по векторной базе данный релевантных документов 3. Полученные релевантные документы(функции, их фрагменты, классы, переменные, все зависит от того как хранят) передаются в LLM 4. LLM использует контекст вашего запроса `How something work?` и найденные документы для построения ответа 5. Результат работы — форматированный и красивый ответ о том, как что-то работает или какую новую функцию нужно написать
Если упрощать, то схема такая
Замечание учту — добавлю схему + более прозрачные примеры
Проверил с французким VPN, URL совпадает, возле иконки YouTube есть пометка что я теперь француз, видео доступно без каких-либо сообщений о блокировке. Если у Хабра есть еще способы удобно встроить видео через не заблокированные ресурсы — сделаю.
При регистрации аккаунта, тикток привязывает вашу геолокацию или номер телефона(по коду страны) к соответствующей аудитории сегментированной по геолокации аудитории. Почему покупка верифицированного аккаунта это выход — потому что при запуске нового, придется пострадать и вы с очень высокой вероятностью получите за что угодно бан, а во-вторых, раскрутка нового аккаунта что-то вроде игры в "завоюй доверие алгоритмов", поэтому проще купить уже проверенный аккаунт который уже помечен "этот аккаунт для нации X". К сожалению, без цифр — статья бесполезна. Ибо все рекламные ролики, объявления и так далее ближе к игре в рулетку, чем к чему-то прогнозируемому.
Анкеты/чеклисты нужны чтобы случайно ничего не забыть. Для условного стратапа, совершенно нормально, например, не поддерживать документацию или даже мониторинг) Если кто-то ищет готовой структурированной информации готовой к использованию тут и сейчас - автор любезно ее предоставляет. Я пробежался по сайту автора - выглядит и написано хорошо, но, например, начинающему менеджеру будет тяжело понять некоторые вещи. Чья это проблема я до сих пор не знаю, стараюсь лишний раз разжевать все что пишу.
Да, была такая мысль - у самого тьма чатов и хотя бы быстро но пролистываю их, чтобы что-то подчеркнуть для себя)
Фичи.
Как вариант можешь ещё фильтровать по "спасибо" и синонимам - чтобы забирать "закрытый" тред. Ещё можно искать самых активных и к ним добавить метрику "спасибо" - будет список хороших специалистов по идее. Тут надо думать в стиле NLP, метрик с живого чата можно собрать много.
Самые популярные темы за день. Чтобы не пропустить что-то интересное. Можно визуализацию сделать в виде облака слов.
Можно группировать задаваемые вопросы, брать частоту из встречаемости - почти готовый план обучения. Т.е. ты увидишь в каких местах люди не смогли найти ответ самостоятельно и пошли за помощью к людям;
А еще лучше Дамерау — Левенштейна, еще и перестановки учитывает)
Но на практике, чтобы обеспечить адекватную производительность для него — нужно постараться)
*не преследую цель подушнить искренне этого не хочу, преследую цель обсудить*
Возможно эту часть стоит вынести в начало статьи, тоже стал задаваться вопросом ценности статьи, в той же "Postgres изнутри" об уровнях изоляции написано, и когда разбираешься в вопросе, там или ISO догоняет реалии, или ISO не достаточно или при составлении ISO не увидели какие ситуацию еще могут быть. Не знаю у как других, но меня в процессе обучения сильно успокаивало, когда видел, что дурак не только я. Простое знание "при составление ISO не подумали" — успокаивает. Вот даже когда пишу коммент, лишний раз задумываюсь о том, дурак я или нет — жесть, одним словом.
Тут мне кажется еще сложнее, допустим, тут использовали диаграмму Ганта, чтобы передать то как происходит чтение данных, показывают таблицы и SQL запросы и как все это связано со временем, в целом — понятно, но не понятно тогда кто такой "НЕспециалист".
Потому что читающий в виде меня:
Насмотрен на диаграммы Ганта
Знает синтаксис SQL
Знает, что базы данных внутри могут поддерживать(или не поддерживать) уровни изоляции, да и в целом, базы данных в целом могут не поддерживать SQL и документо-ориентированные бд тоже нуждаются в изоляции(забавно) UPD: Была отличная статья которая рассказывала о том как MongoDB применяла "аналог ACID" в маркетинговых целях
В моей практике при работе со студентами и начинающими специалистами к каким только хитростям не нужно приходить, чтобы стало понятно, собственно, пока вижу что побеждают хорошо продуманные визуальные образы или анимации, они более емкие
Я, в целом, сильно за, чтобы был какой-то набор правил или софт, чтобы можно было гибче выбирать уровень детализации который в моменте нужен, потому что каждый раз писать, чтобы всем было понятно — труд сложнее любой работы.
По-поводу курса, захожу на сайт.
Что требуют перед изучением курса:
Окей, у Postgres и Clickhouse — восхитительное комьюнити которые многие другие могут позавидовать, ребята огромные молодцы
Есть серия книг, опять таки, аналогичных этой, там даже показывают примеры на банковских операциях.
Что смущает, вы пишите целый курс, и делаете вводную статью, на диаграмму ниже потратил 5 минут(просто потому что, все инструменты под рукой)
Выводы сделать трудно, хочется рубить с плеча, только из-за того что, вводная к курсу, в моем понимании курс это работа методистов, психологов, дизайнеров, профессионалов и многократная проверка материала, поэтому, просто надеюсь, что этот комментарий был хоть кому-то полезен
В первую очередь, поиск идет не по точному названию, а "семантический", т.е. вам не нужно угадывать как называется конкретная функция.
Второе — вопросно-ответная система, они сейчас +- одинаковые, создается векторное хранилище, в него добавляются документы(обычный текст, код после tree-sitter`a), тут еще важно, что простой метод getAuth который правильно токенизирован, на `get` и `auth` уже полезная нагрузка, дальше когда вы задаете вопрос в чат происходит следующее:
1. How something work?
2. Поиск по векторной базе данный релевантных документов
3. Полученные релевантные документы(функции, их фрагменты, классы, переменные, все зависит от того как хранят) передаются в LLM
4. LLM использует контекст вашего запроса `How something work?` и найденные документы для построения ответа
5. Результат работы — форматированный и красивый ответ о том, как что-то работает или какую новую функцию нужно написать
Если упрощать, то схема такая
Замечание учту — добавлю схему + более прозрачные примеры
Если вдруг мысль использовать французкий VPN из-за песни, то догадка уровня профессионала, я даже не сразу понял почему французкий)
Проверил с французким VPN, URL совпадает, возле иконки YouTube есть пометка что я теперь француз, видео доступно без каких-либо сообщений о блокировке. Если у Хабра есть еще способы удобно встроить видео через не заблокированные ресурсы — сделаю.
https://www.youtube.com/watch?v=uHAvxPDhuds — на всякий случай
Я не автор, но попробую перевести.
При регистрации аккаунта, тикток привязывает вашу геолокацию или номер телефона(по коду страны) к соответствующей аудитории сегментированной по геолокации аудитории. Почему покупка верифицированного аккаунта это выход — потому что при запуске нового, придется пострадать и вы с очень высокой вероятностью получите за что угодно бан, а во-вторых, раскрутка нового аккаунта что-то вроде игры в "завоюй доверие алгоритмов", поэтому проще купить уже проверенный аккаунт который уже помечен "этот аккаунт для нации X".
К сожалению, без цифр — статья бесполезна. Ибо все рекламные ролики, объявления и так далее ближе к игре в рулетку, чем к чему-то прогнозируемому.
Исправлено, спасибо
Анкеты/чеклисты нужны чтобы случайно ничего не забыть. Для условного стратапа, совершенно нормально, например, не поддерживать документацию или даже мониторинг) Если кто-то ищет готовой структурированной информации готовой к использованию тут и сейчас - автор любезно ее предоставляет. Я пробежался по сайту автора - выглядит и написано хорошо, но, например, начинающему менеджеру будет тяжело понять некоторые вещи. Чья это проблема я до сих пор не знаю, стараюсь лишний раз разжевать все что пишу.
Да, была такая мысль - у самого тьма чатов и хотя бы быстро но пролистываю их, чтобы что-то подчеркнуть для себя)
Фичи.
Как вариант можешь ещё фильтровать по "спасибо" и синонимам - чтобы забирать "закрытый" тред. Ещё можно искать самых активных и к ним добавить метрику "спасибо" - будет список хороших специалистов по идее. Тут надо думать в стиле NLP, метрик с живого чата можно собрать много.
Самые популярные темы за день. Чтобы не пропустить что-то интересное. Можно визуализацию сделать в виде облака слов.
Можно группировать задаваемые вопросы, брать частоту из встречаемости - почти готовый план обучения. Т.е. ты увидишь в каких местах люди не смогли найти ответ самостоятельно и пошли за помощью к людям;