Dataset открытый, исходники в линке, добавляете свой спам набор и вперед. Я так и планирую сделать, когда наберу достаточно своих, вручную отобранных, spam emails.
Постоянный мониторинг: Анализ изменений законодательства в приоритетных регионах и странах должен стать рутинной задачей для внутренних специалистов или привлеченных консультантов.
Гибкая система внутреннего аудита: Внедрение адаптивной системы внутреннего аудита AI-систем компании, основанной на релевантных фреймворках (например, NIST AI RMF, ISO/IEC 42001), становится принципиально важным.
Вообще-то для этих задач существует риск менеджмент системы, суть которых заключается в том, что по каждой теме собирается список законов, структурируется, трансформируется в опросники для ручного и автоматического анализа процессов, данных, etc. и далее строятся аудиты на основании поставляемых данных и трансформированных законов. Делать это вручную слегка архаично. Такие процессы были автоматизированы еще 30 лет назад.
Так и да, вайб-кодинг создает эффектные решения за 5 минут, но, как было сказано выше, проблема начинается в доработке того, что накидал LLM.
Без понимания архитектуры приложения, подсаживаться на Курсор опасно: LLM лопатят код немерянными портянками. Сначала смотришь на сгенеренный код, все вроде грамотно. И накрывает эйфория - сейчас забабахаю шедевр за 5 минут.
Проблемы начинаются, когда количество кода растет и LLM, контролируемый тем же Курсором, не переиспользует имеющийся код, а лихо генерит повторяющийся бесконечными портянками. Смело затирает рабочий функционал.
Это мой опыт. Если что, годовая подписка на Cursor и Anthropic, месячные подписки на OpenAI, Google, AI, Studio, Groq. Использую интенсивно, налабался обходить LLM ловушки.
Как пет-проект - чудно, но если рассматривать как продукт, хорошо бы добавить:
Job Search Criteria Storage Это чтобы хранить разные критерии поиска работы.
JobVacancies platforms Это чтобы определить, на каких площадках ищем работу.
Job Positions Storage Это куда складывать найденные вакансии.
(AI) Resume, Tailoring to Job Description: Skills and Experience. Это чтобы подшаманить ваше резюме под требования вакансии. Иначе не пройдете фильтр ATS (Applicant Tracking System).
(AI) Automated Resume Match Evaluation to Job Description Это чтобы оценить свои шансы, и при совпадении меньше 75% даже не тратить свое драгоценное время.
(AI) Customized Cover Letter Generation Это на всякий случай, если позиция позволяет помимо резюме залить еще Cover Letter.
А теперь всю эту хрень сделать многопользовательской, в виде веб и мобильного приложения. И выложить народу на успешное бодание с ATS.
Решил поделиться деталями, пока пилю продукт и задачи свежи в голове.
Одна из причин, почему новые иммигранты шарахаются русскоязычного сообщества.
Ну тут уж вы перегнули, накатив на старперов. Справедливости ради, неновые эмигранты также очень осторожно общаются с новоприбывшими, так как помнят свою залихватскую самоуверенность, за которую спустя годы было очень стыдно.
На истощение/разрушение, как правило, работают новички, с тяжелыми весами. Грустно наблюдать, когда необразованные энтузиасты приходят и перегружаются железом. Спустя 3 месяца наматывают бинты на суставы, спустя 6 месяцев из зала исчезают.
Хожу в зал последние 15 лет. Каждый день. Нагрузки чередую: кардио, растяжка (на йоге и пилатах), силовые 2 раза в неделю. Уровень кортизола не уменьшает, но стрессоустойчивость значительно увеличивает. После хорошей нагрузки раздражение и беспокойство замещаются физической усталостью. Сорян, что звучит менторски, но это сухая выжимка моего опыта.
Можете пояснить, в каком виде представляете эту обертку?
В приложении NerdLog реализовать возможность хранения соединений и отображения списка соединений. Список соединений может быть отображен слева, как дополнительная панель.
Также хранить состояние подключения. И если на момент закрытия приложения NerdLog соединение было активным, то при повторном старте приложения автоматически пересоединятся с сервером. Это для случаев, когда требуется ongoing troubleshooting.
Я не знаю, какие подобные мультиплексоры есть в Windows, но наверняка есть что-то подобное.
Учитывая, что приложение с терминальным доступом, без разницы, какая операционная система используется. Суть в том, чтобы создавать конфигурационный файл, в котором хранятся настроенные соединения для восстановления соединений при повторном старте NerdLog.
Да, можно.
Dataset открытый, исходники в линке, добавляете свой спам набор и вперед.
Я так и планирую сделать, когда наберу достаточно своих, вручную отобранных, spam emails.
Использовать LLM для идентификации спама, на мой взгляд, из пушек по воробьям.
Можно использовать модель, обученную на идентификацию спама, хостимую локально, и которая жрет очень скромные ресурсы.
Использую локально вот эту модель.
Аккуратность 99% (случаются пропуски, но очень редко).
https://www.kaggle.com/code/dima806/email-spam-classification-roberta
Только если вы Аполлон или организм женского пола.
Вообще-то для этих задач существует риск менеджмент системы, суть которых заключается в том, что по каждой теме собирается список законов, структурируется, трансформируется в опросники для ручного и автоматического анализа процессов, данных, etc. и далее строятся аудиты на основании поставляемых данных и трансформированных законов.
Делать это вручную слегка архаично.
Такие процессы были автоматизированы еще 30 лет назад.
А насколько вежливо будет, если еще и я капну вопрос, касающийся тестирования?
Существует масса векторных баз, облачных и self-hosted.
Правильно ли я понимаю, что расширение можно поставить только на Postgres Pro?
То есть на народную версию не станет.
Так и да, вайб-кодинг создает эффектные решения за 5 минут, но, как было сказано выше, проблема начинается в доработке того, что накидал LLM.
Без понимания архитектуры приложения, подсаживаться на Курсор опасно: LLM лопатят код немерянными портянками.
Сначала смотришь на сгенеренный код, все вроде грамотно.
И накрывает эйфория - сейчас забабахаю шедевр за 5 минут.
Проблемы начинаются, когда количество кода растет и LLM, контролируемый тем же Курсором, не переиспользует имеющийся код, а лихо генерит повторяющийся бесконечными портянками. Смело затирает рабочий функционал.
Это мой опыт.
Если что, годовая подписка на Cursor и Anthropic, месячные подписки на OpenAI, Google, AI, Studio, Groq. Использую интенсивно, налабался обходить LLM ловушки.
Плюсую вопрос - в чем смысл?
Ожидал обоснование выбора той или иной новой векторной базы.
Вполне устраивает Self-Hosted Milvus, и если появилось что-то более молодежное, хотелось бы понимать преимущества прежде чем тестировать.
Из любопытства, для личного поиска работы или похожая задача?
Как пет-проект - чудно, но если рассматривать как продукт, хорошо бы добавить:
Job Search Criteria Storage
Это чтобы хранить разные критерии поиска работы.
JobVacancies platforms
Это чтобы определить, на каких площадках ищем работу.
Job Positions Storage
Это куда складывать найденные вакансии.
(AI) Resume, Tailoring to Job Description: Skills and Experience.
Это чтобы подшаманить ваше резюме под требования вакансии.
Иначе не пройдете фильтр ATS (Applicant Tracking System).
(AI) Automated Resume Match Evaluation to Job Description
Это чтобы оценить свои шансы, и при совпадении меньше 75% даже не тратить свое драгоценное время.
(AI) Customized Cover Letter Generation
Это на всякий случай, если позиция позволяет помимо резюме залить еще Cover Letter.
А теперь всю эту хрень сделать многопользовательской, в виде веб и мобильного приложения. И выложить народу на успешное бодание с ATS.
Решил поделиться деталями, пока пилю продукт и задачи свежи в голове.
Тоже использую Joplin чуть больше года.
Joplin решает задачу сохранения статей.
Вместо того, чтобы букмаркетить хабр статьи, я скидываю в Joplin тексты.
Искать значительно проще, хотя поисковик так себе.
Давно хочу прикрутить Flowise на документы Joplin, чтобы можно было искать по контексту, а не по конкретным словам.
Зашел на ваш сайт по ссылке в статье.
IP: 23.115.251.208
del
Вы правда думаете, что мне интересно, почему меня заблокировали, когда я решил зайти на ваш ресурс?
Благодарю, сэкономили время.
Надеюсь, будет полезно и другим читателям.
А не слишком нагло будет с моей стороны спросить Docker Compose на Airflow 3.0.x?
Ну тут уж вы перегнули, накатив на старперов.
Справедливости ради, неновые эмигранты также очень осторожно общаются с новоприбывшими, так как помнят свою залихватскую самоуверенность, за которую спустя годы было очень стыдно.
Удачи, без иронии и поддевки.
Скорее, изменение типа активности.
На истощение/разрушение, как правило, работают новички, с тяжелыми весами.
Грустно наблюдать, когда необразованные энтузиасты приходят и перегружаются железом.
Спустя 3 месяца наматывают бинты на суставы, спустя 6 месяцев из зала исчезают.
Хожу в зал последние 15 лет. Каждый день.
Нагрузки чередую: кардио, растяжка (на йоге и пилатах), силовые 2 раза в неделю.
Уровень кортизола не уменьшает, но стрессоустойчивость значительно увеличивает.
После хорошей нагрузки раздражение и беспокойство замещаются физической усталостью.
Сорян, что звучит менторски, но это сухая выжимка моего опыта.
В приложении NerdLog реализовать возможность хранения соединений и отображения списка соединений.
Список соединений может быть отображен слева, как дополнительная панель.
Также хранить состояние подключения.
И если на момент закрытия приложения NerdLog соединение было активным, то при повторном старте приложения автоматически пересоединятся с сервером.
Это для случаев, когда требуется ongoing troubleshooting.
Учитывая, что приложение с терминальным доступом, без разницы, какая операционная система используется.
Суть в том, чтобы создавать конфигурационный файл, в котором хранятся настроенные соединения для восстановления соединений при повторном старте NerdLog.
del