Комментарии 5
В сладком королевстве маркетологи высшего уровня работают. За чтобы не взялись - все не то получается. А насчет Scale AI эти вообще молодцы. Качают данные из сети. Видимо по абзацам и предложениям разбивают и не плохо зарабатывают - фактически из воздуха.
Специализирующиеся на разметке компании берут "сырые" данные — сайты, документы, логи чатов и переписки (при разрешении), очищают их от мусора и дублей, а затем ставят ярлыки: где хороший ответ, где ошибка в тексте, что изображено на картинке и т. д.
И откуда у вас источник сей информации?
У чатов ChatGPT, Gemini, Claude, DeepSeek и прочих после ответа можно оценить хороший ответ, или плохой.
Так вот, плохие ответы попадают в Outlier AI которая не самостоятельная компания, а принадлежит Scale AI. А дальше, аутсорсеры этого аутлайнера разбираются, почему ответ не правильный и пишут правильный ответ на вопрос пользователя.
Не знаю как из России, но из многих стран можно зарегистрироваться в этом Оутлайнере в качестве такого проверяльщика по разным направлениям, включая программирование на разных языках, и даже русский язык. При регистрации необходимо будет доказать, что ты и правда разбираешься в выбранной области. Платят в районе 30 баксов в час, я знаю человека, который несколько месяцев был там таким экспертом по математике за 50 баксов в час, а после покупки Метой, многие проекты позакрывались, просто нет заказов и все, в т.ч. и по математике.
И вот уже на этих данных дообучают модели. Помимо Outlier AI есть и другие конторы которые занимаются тем-же самым. Недавно была статья от Гугла о том, что файнтюнить модели не просто на множестве данных, а на данных там, где модель обучается, на пару порядков эффективнее.
По ме, Цукерберг выглядит самым случайным миллиардером из всей когорты того времени. Счастливчик, одним словом

Meta* вложила $14 млрд в ИИ-стартап Scale AI. Теперь сотрудники недовольны качеством его данных