Как стать автором
Обновить
4
2.1

Пользователь

Отправить сообщение

Продолжение исследования RNN

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров445

С прошлой статьи я внёс несколько изменений:
1. Планировщик был сломан и не изменял скорость. Починил.
2. Остаточное соединение через умножение.
3. WindowedDense для выходной проекции.
4. Добавил clipnorm 1, cutoff_rate 0.4

Как обычно это всё добавляет стабильности и 1% точности.

WindowedDense по неизвестной мне причине добавляет SMR стабильность.

Читать далее
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Исследование и оптимизации RNN

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров861

В этой статье я буду анализировать и улучшать ATR, LRN, LSTM, GRU в задаче генерации текста. Обучать их я буду на классике Достоевского. Он первый под руку попался.

Читать далее
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Идеи улучшения точности, удобства и скорости языковых моделей

Время на прочтение3 мин
Количество просмотров952

Я не специалист, и это не статья, а список моих идей для улучшения работы языковых моделей. К сожалению хорошо проверить это не имею возможности. Нигде не встречал таких идей. Интересно узнать мнения о них.

Технический текст.

Читать 10 идей
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Информация

В рейтинге
1 272-й
Откуда
Россия
Зарегистрирован
Активность

Специализация

Software Developer, Game Developer
Middle
Delphi
Win32 API
Vulkan API
DirectX
TENSORFLOW
Python
JavaScript
Lua
X86 asm
C++