Обновить
-15
@fkvikingread⁠-⁠only

Пользователь

Отправить сообщение

Для нас, действительно, важно было показать саму концепцию и убедиться, что такой подход способен выдавать осмысленные результаты. Но над оценкой эффективности, над ее прозрачностью мы подумаем обязательно.

Одно дело какую-то свечу предсказать, а другое дело заработать на этом. Полностью согласен, это, пожалуй, самый дельный комментарий, чувствуется опыт)) Планирую одну из следующих статей посвятить практической части, как это встраивали в действующие стратегии, что удалось сделать, а что нет. Да и работа в этой части еще продолжается.

Спасибо за развернутый разбор. Но тут надо прояснить несколько моментов.
1. О новых несуществующих словах и токенизации.
Действительно GPT разбивает слова на знакомые токены и работает с ними. Однако когда мы разбиваем незнакомые слова, они разбиваются на токены, которые не формируют осмысленных ассоциаций для GPT. Это снижает вероятность того, что модель будет обращаться к знакомым ей контекстам, которые не имеют отношения к нашей задаче. Например, если бы мы использовали стандартные слова, такие как "рост" или "падение", модель могла бы ассоциировать их с текстами из соответствующей литературы и источников, что исказило бы результат.
Т.о. работая со знакомыми токены, их уникальные комбинации создают своеобразное новое пространство для анализа, которое позволило нам в итоге минимизировать "галлюцинации" модели.
Кроме того, сами несуществующие слова являются новым для нее контекстом. Это создает ситуацию, где модель начинает интерпретировать наши данные без опоры на заранее существующие знания. В результате, она вынуждена искать новые зависимости и закономерности исключительно в рамках предоставленных данных.
2. Про число ингридиентов.
На многое отвечает предыдущий пункт, но также надо добавить следюущее. Выбор между 15 или 150 или другим числом можно было бы сделать, наверняка, более объективно и строго. Но мы посчитали что должно быть умеренно большое число, не вкатываясь в переобученность, при этом сохраняя достаточное множество уникальных "ингредиентов", которые помогают обеспечить точное позиционное кодирование признаков в последовательности.
3. О всей истории графика.
Прежде всего, это работает хуже, просто по опыту). Переобученность - зло. Система становится не гибкой. Разделение данных на короткие последовательности (рецепты) позволяет использовать компактные, но информативные выборки и сделать подход гибким для дальнейшей адаптации к другим данным.

"68% точности" взяты не на техническом анализе. Свечные данные использовались лишь как наглядный пример. Какие на самом деле данные использовались, детали Feature Engineering - мы не раскрываем по понятным причинам.
Статья про эксперимент и про то, как заставить мощные возможности GPT переварить не подходящие для него данные.
Черт побери, есть такие возможности по обучению своих моделей.
Какие, по вашему, более пододящие модели для биржевых данных?

Все как всегда просто. Мы делимся тем, с чем выступают на конференции, своими идеями, экспериментами с разным итогом. Ни кто не обещает философский камень каждому желающему.

Крупные фонды имеют риск менеджеров и больше предпочитают пассивный доход с повышенной ставкой выше чем у рынка в целом. При их ресурсности - это легко достигается

Вы, безусловно, мастер метафор, и ваш комментарий звучит как попытка связать соевые бобы с алхимией. Но позвольте заметить, что мы, как наследники духа экспериментальной науки, не видим смысла скрывать результаты наших поисков.

Ваш вопрос о рефлексии — это будто призыв поставить зеркало перед любопытством, чтобы разглядеть его грани. Но зачем зеркалу сверкать, если цель эксперимента — понять, а не убедить? Мы здесь не для того, чтобы изобретать философский камень объяснений, а чтобы разделить алхимический процесс, где каждая цифра — это магический ингредиент, а каждый рецепт — метафора труда.

Если ваши оценки наших предыдущих работ кажутся вам ключом к пониманию статьи, то это лишь подтверждает, что вы хотите найти форму, не изучив содержание. Мы же придерживаемся другого принципа: научный метод — это путь к ясности, но иногда его ослепительный свет оставляет тени, которые интереснее самого источника.

И всё же, мы ценим вашу критику как часть философского диалога. Ведь, наука — это не клад, а риск, связанный с разрушением очевидного. Так почему бы вам не присоединиться к нашему рискованному эксперименту?

Тоже вариант использовать ресурсы для сентимент анализа, но статья-то о другом. важнее концентрироваться на главном ингредиенте, а не забивать котел новостным шумом.

"Идея хорошая, но пока мы предпочитаем не варить свой суп из нейронов, а брать готовую кухню. Так быстрее добраться до результатов, а не до бюджета на H100.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность