Pull to refresh
8K+
4
Александр Колесников@morginalium8

Изучаю ML

4,2
Rating
1
Subscribers
Send message

Можешь глянуть, я тут что-то похожее делал - только там вообще все решить можно

автору 15-16 лет. и он уже имеет грамотную речь, умение описывать свои идеи, доводить их до реализации и описывать результат.
я технические знания придут


там уже все настолько запутано, что даже если кто-то у кого-то воровал - уже не разберешь.

а на счет синтетики - с точки зрении чистого ml это просто скучно. наверное интереснее делать свою модель, свои данные и тд. но менеджеры думают по другому...

Если Маск заплатил за токены - то все ок. он купил и волен делать с ними что угодно.

А кто-то сомневался? Все друг у друга воруют. Или это нельзя назвать воровством?

Смотря какой fabric, смотря сколько details =)

конкретно этот случай - в чате с pro-версией. а аналогичное было в opencode

Бенчмарки уже вообще ничего значат. Уж не знаю как там дела в разработке, но с DS дипсик работает просто ужасно.

Скинул ему ноутбук, попросил поправить кривую реализацию позиционного кодирования. Он 5 раз не мог переписать код: то пытался json выдать, то писал все с нуля, то 'вот вся ячейка - вставьте и запустит' - и херачил все 17 ячеек в одну.

Только на 6ой попытке, спустя 40 минут он выдал что-то внятное. А на бумаге это топовая модель, которая такие задачи должна как орешки щелкать.

Ну вроде как на агентных тестах 27b показал себя лучше. Но я могу ошибаться )))

Зашел на сайт, потыкал, посмотрел. Все просто супер! Есть мелкие проблемы в UI, но сейчас не про это. Хотелось бы вставить свои 3 копейки про алгоритм рекомендаций.

1. Ручные фичи на втором этапе. Для базовой проверки подойдет, но мне кажется лучше реализовать это через линейные слои с расширением (а может и через depthwise-свертку). Можно подавать на вход фильмы, а на выходе получать готовый вектор пользователя.

2. На третьем этапе какая-то несогласованность. Вроде как идея началась с того, что система вообще не будет подсматривать в у других людей, а будет работать индивидуально. А тут ты берешь и вместе в предпочтениями пользователя наваливаешь чужих данных.

3. Дообучение online штука классная, но дорогая. Это надо оптимизировать: либо хранить модель на компе пользователя и там-же дообучать, или использовать свои мощности (что долго и дорого).

Кстати, было бы еще классно исходники на гите увидеть )

Первый нормальный обзор в ру-сегменте., авторам спасибо )

А хоть кто-то Алису использует? Последняя 5.1 стоит непомерно дорого, сравнимо с Opus 4.6 или gpt-5.3.

Information

Rating
1,233-rd
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity

Specialization

ML разработчик
Python
Английский язык
Git
Алгоритмы и структуры данных
Математика
Большие данные
PyTorch