Comments / Profile of Rybolos / Habr

How to become an author

Tatiana Shavrina @Rybolos

NLP, data scientist

ProfileArticles9PostsNewsComments58

Бенчмарки Llama-4, предположительно — скам на самом высоком уровне

Rybolos Apr 8 at 16:42

Ну, наверное к мете можно в целом придумать много претензий

И к корпоративному опенсорсу в том числе

И когда что-то непрозрачно, то сразу велик соблазн подумать самое плохое (наверное, обучались на тесте)

В целом придется просто ещё какое-то время выкладывать все логи, опять же, контаминацию бенчей легко проверить независимо - коммьюнити может это сделать.

Надо более качественно готовить релизы (по возможности:) )

Бенчмарки Llama-4, предположительно — скам на самом высоком уровне

Rybolos Apr 8 at 12:40

Да.

Бенчмарки Llama-4, предположительно — скам на самом высоком уровне

Rybolos Apr 8 at 08:51

Даже не хочется ничего писать в опровержение этой глупости, но надо себя перебороть.

Ты собрал несколько новостей из интернета в одну статью и объединил, как тебе хочется.

Випи (Joelle) ушла из Fair, fair никакого отношения не имеет к llama 4, это можно было нагуглить, прежде чем писать, что якобы ушел продакт модели.

История с китайским форумом — это фейк.

Моя команда делала 10 млн контекста. Как писали в релизном посте, это делается за счёт файнтюнинга, а на претрейне контекст был 256 тыс токенов. На таблице сверху по названию моделей видно, что мерили претрейн чекпоинты, а не инстракт с 10млн.

И исправь, пожалуйста, название модели в заголовке, там опечатка.

Все дороги ведут домой или почему я уехал из Лондонского FAANG

Rybolos Aug 3 2024 at 17:17

Политика партии в Сколтехе теперь требует написания таких статей? Или это самодеятельность?

Irbis-7B или как мы учили ЛЛМку казахскому языку

Rybolos Jun 29 2024 at 22:25

Очень здорово!

А какой датасет используется для претрейна? Или хотя бы какой у него жанровый состав

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

Rybolos Dec 3 2022 at 22:41

Ну, по крайней мере люди, носители языка эти задачки решают очень хорошо - их вполне реально решить на 100%

Некоторые датасеты на machine reading и правда как будто из ЕГЭ взяты по формату.

Обучение Russian SuperGLUE моделей с помощью библиотеки DeepPavlov

Rybolos Dec 3 2022 at 22:37

Вот это подарок под новый год!!! Спасибо!

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

Rybolos Jun 24 2022 at 08:53

Спасибо!

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

Rybolos Jun 23 2022 at 18:17

Скажите, какие параметры выставить для оптимальной генерации? Какие рекомендуете?

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

Rybolos Jun 23 2022 at 09:00

А сделаете демку Huggingface? Или не влезет?

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

Rybolos Jun 23 2022 at 08:31

Ура, спасибо за работу!

А пробовали уже few-shot, zero-shot замерить на ней?

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 26 2022 at 13:09

Хороший вопрос!

Дедубликацию мы применили, чтобы дополнительно очистить выборку для каждого автора. Затем искусственно добавили в неё больше Пепперштейна, чтобы сётка во время обучения увидела его больше раз, чем всего остального.

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 26 2022 at 13:07

Вау! Впечатляющая работа! А будет в open source? И.. почему температура такая маленькая?

В целом, согласна по поводу нейронок, мы ещё не исследовали все, что они могут решать, даже в текущем сетапе.

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 25 2022 at 17:07

Нейросеть в лице сбера получила свой гонорар, как по авторскому договору, только чуть переделанному))

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 25 2022 at 14:08

AI-книга заменит программиста?))

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 25 2022 at 11:52

А там есть и персонажи, и сюжет!

Это полноценные рассказы) В этом и фишка.

Конечно, это ещё не роман на 100 страниц, но на 5-10 страниц полноценный текст.

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 25 2022 at 11:50

ПО, конечно, пока специализированное. Когда начнёт одна модель решать все задачи, и учиться новым - это уже по определению будет сильный ИИ.

Ожидания от моделей все время повышаются, но сама возможность решить такую новую задачу - имхо уже очень важный показатель.

Это наконец произошло: нейросеть и человек написали книгу. Вместе! Рассказываем, как им помогали разработчики

Rybolos May 25 2022 at 09:55

Надо emojich'а прикрутить))

Модель-полиглот: как мы учили GPT-3 на 61 языке мира

Rybolos May 6 2022 at 15:27

Попробуйте в колабе, действительно, там инференс занимает порядке 12 Gb

Модель-полиглот: как мы учили GPT-3 на 61 языке мира

Rybolos Apr 29 2022 at 10:47

вроде все на месте

1