"сгенерируй список из 50 общих вопросов из разных областей знаний на русском", потом тоже самое на английском, потом по web3 тематике, п и вопросы с использованием редких utf символов и эмодзи. По временным отсечениям - по вопросу для каждого месяца с 2023 по 2025.
Вопросы для датасета генерировали на gpt4o, по категориям русский/английский общие/специальные/вопросы с временным отсечением/с эмодзи, затем собирали ответы от 21 модели через openrouter. Этот же датасет использовали для пассивного обучения по семантическим признакам. Проблемы были только со старыми бесплатными моделями, на них есть рейт лимиты на каждую модель в день и провайдеры иногда перестают отвечать на запросы, так пришлось исключить несколько очень старых моделей из изначального списка
Скорее похоже на игру в d&d, придумываешь как использовать имеющиеся правила (системный промпт), иногда придумываешь свои, а мастер (llm модель) соглашается или нет. Ну и от удачи тоже зависит, как бросок кубика (т к. вероятностный генератор токенов)
Во второй части статьи как раз есть примеры, как обходил правила игры в конкурсе
Я бы понял, если бы это была твоя личная инициатива, ты тип такой: "Йо-хо-хо, я тут решил использовать LLM для поиска уязвимостей в смарт-контрактах, поэтому дообучил модель на своем рабочем ноуте! Свистать всех наверх!"
Почти так и было :D
Это экспериментальный, побочный проект, посмотреть получится или нет, у нас очень много экспериментальных направлений. Ресурсы компании естественно можно расходовать, когда есть какие-то результаты. Изначально была только идея.
Ты, ****, серьёзно? То есть закидывать приватный код в чат - это ты делишься с компанией этим кодом, и такой подход не рекомендуется. А закидывать те же приватные данные в колаб - это: "Да кому они там нужны будут? Всё нормально!"
Так данные для дообучения и инференса использовались публичные, даже ссылка в статье есть, пожалуйста, скачивайте и делитесь с кем хотите. Единственное что их нужно отфильтровать и распарсить.
С 2017-ого есть вот такая игрушка с картой на базе эмодзи https://t.me/MindQuestBot ммо, пвп, крафт, квесты ивенты и т.д., управление только не инлайн, а кнопками лэйаут
Это все ерунда, я вот подписался на 9731, когда сыну мультики включал на телефоне вот по такой обманке (свой номер нигде при этом не указывал)
вот человек на пикабу писал как это работает
У меня оператор Билайн, вторая симка — Теле2, Теле2 тоже хороши, спамят push сообщениями, где если промазал по кнопке «Отмена» тебя подпишут на платные рассылки
Считаю что вопрос надо решать на законодательном уровне, разрешать платную подписку только при наличии исходящей СМС от клиента на телефон сервиса
Все изображения выводятся в довольно низком разрешении, достаточном для понимания их контента. Это связано с тем, что аватары и карты собираются из множества разных элементов для каждого игрока, и при большом количестве одновременных запросов их сборка в высоком разрешении может существенно нагрузить игровой сервер.
Возможно можно сгенерировать все возможные сочетания заранее (ограниченно число) а в генераторе добавлять только ник
10 лет назад автоматизировал так многие фишки для 1С Предприятия на nncron, вызовы скриптов — по горячим клавишам и по расписанию, бухгалтерия были рады
так вчера уже хорошо оформленный скам сайт gramcoin.tech собрал на preICO Gram порядка 4M$ Из-за вот такого хайпа вокруг слухов, нашлось столько людей, за один вечер отдавшие деньги (пусть и в крипте) за красивую страничку. Просто поражает. А сегодня он уже не доступен :)
А на Yobit уже второй день торгуют GRAM коины (конечно же тоже фейк) с объемами за последние 24 часа в 500K$ рост фейка 300+%
"сгенерируй список из 50 общих вопросов из разных областей знаний на русском", потом тоже самое на английском, потом по web3 тематике, п и вопросы с использованием редких utf символов и эмодзи. По временным отсечениям - по вопросу для каждого месяца с 2023 по 2025.
Вопросы для датасета генерировали на gpt4o, по категориям русский/английский общие/специальные/вопросы с временным отсечением/с эмодзи, затем собирали ответы от 21 модели через openrouter. Этот же датасет использовали для пассивного обучения по семантическим признакам. Проблемы были только со старыми бесплатными моделями, на них есть рейт лимиты на каждую модель в день и провайдеры иногда перестают отвечать на запросы, так пришлось исключить несколько очень старых моделей из изначального списка
Скорее похоже на игру в d&d, придумываешь как использовать имеющиеся правила (системный промпт), иногда придумываешь свои, а мастер (llm модель) соглашается или нет. Ну и от удачи тоже зависит, как бросок кубика (т к. вероятностный генератор токенов)
Во второй части статьи как раз есть примеры, как обходил правила игры в конкурсе
Почти так и было :D
Это экспериментальный, побочный проект, посмотреть получится или нет, у нас очень много экспериментальных направлений. Ресурсы компании естественно можно расходовать, когда есть какие-то результаты. Изначально была только идея.
Так данные для дообучения и инференса использовались публичные, даже ссылка в статье есть, пожалуйста, скачивайте и делитесь с кем хотите. Единственное что их нужно отфильтровать и распарсить.
С 2017-ого есть вот такая игрушка с картой на базе эмодзи https://t.me/MindQuestBot ммо, пвп, крафт, квесты ивенты и т.д., управление только не инлайн, а кнопками лэйаут
вот человек на пикабу писал как это работает
У меня оператор Билайн, вторая симка — Теле2, Теле2 тоже хороши, спамят push сообщениями, где если промазал по кнопке «Отмена» тебя подпишут на платные рассылки
Считаю что вопрос надо решать на законодательном уровне, разрешать платную подписку только при наличии исходящей СМС от клиента на телефон сервиса
А на Yobit уже второй день торгуют GRAM коины (конечно же тоже фейк) с объемами за последние 24 часа в 500K$ рост фейка 300+%