Как стать автором
Обновить
0
1.4
Dmitry @prog420

Пользователь

Отправить сообщение

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

Despite being trained entirely without external data, AZR achieves overall SOTA performance on coding and mathematical reasoning

Absolute Zero Reasoner (AZR) achieves state-of-the-art performance with ZERO DATA

Ну да, Absolute Zero. Правда, в их алгоритме указано "Require: Pretrained base LLM", но в остальном - у нас точно zero data (капсом), и ещё сотня повторений "without any external data". Давайте теперь любой файнтюн базовой модели в нужную ресёрчерам сторону называть "новой парадигмой", чо.

Ну и у них там ещё одна небольшая табличка, где в первом сравнении моделей SimpleRL показал результаты лучше чем AZR, а в следующих сравнениях оставили только AZR и базовую модель. Интересно, почему...

Молодцы, чё. Грохнули лидера российского геймдева, а заодно и филиалы компании в СНГ заденут. Спасибо за "поддержку" геймдева, которую обещали пару лет назад.

Не завидую работягам из Лесты.

Ща Лесту с высоким шансом национализируют, зато инди-студии из Якутии будут геймдев поднимать, как только после своих релизов полтора рубля соберут.

70% всей выручки пришлось на топ-10 компаний. В их число вошли VK

Рад за них. Ещё больше рад заходить в мобильное приложение Mail и получать в лицо всплывающую рекламу на весь экран. Баннеры ешё ладно, но попапы - это уровень низкопробного стартапа, зарабатывающего на подписках, убирающих рекламу. Спасибо за господдержку такого прекрасного (нет) продукта.

Подход Atlassian к Качественной Помощи (Quality Assurance)

Мониторинг качества здоровья (Quality Health Monitor)

ai generated slop

Про Олега Тинькова забыли, или с новым названием история Т-Банка обнулилась?

Я меняла майндсет от «да как столько просить» до «да, я вот столько прошу за свою работу», и помогали мне в этом разработчики‑мужчины

Если что, майндсет "я стою вот столько" к XY хромосомам не прилагается. К нему идут все разрабы, и не все "разработчики-мужчины" до него доходят.

Больше девушек -> выше конкуренция -> выше качество знаний -> индустрия/экономика выигрывает

Когда я в поиске работы, то не встаю с мыслью "фуф, хорошо что девушек в ойти мало". Я открываю условный hh, вижу 100-1000-X откликов на вакансию, прикидываю как сильно нужно будет вертеться, чтобы пройти воронку кандидатов, и начинаю работать над этим.
Какова доля девушек среди этих 1000 кандидатов, меня волнует в последнюю очередь.

Но дело ли только в том, что нравится, а не в пороге входа и в том, что их на старте в разработке меньше ?

Порог входа в разработку - ноутбук, интернет, знания минимальной базы кампутер саенса, нужного языка и нескольких доп тулзов / либ. Сложно этот порог переступить - занимайтесь другим, не сложно - учитесь, получайте работу, ради бога.

их на старте в разработке меньше

Ну ничего, эсвэо внесло коррективы в гендерный баланс следующих поколений, будет больше возможностей вкатываться в разработку. Удачи.

P.S. Вместо чтения гендерных исследований в США можно читать профильную литературу - тогда обходить мужчин на карьерных поворотах проще.

у сотрудника «не хватало» времени на обучение и поднятие своего грейда как специалиста

Сотрудник - не машина по переботке ИПРов в знания. Нельзя ожидать, что вы просто кинете в него ИПР, а он через X времени вернётся автоматизатором.

я начал строить No-Code тулзу через конфиги

Это не No-Code тулза. Во-первых, работа с конфигами не очень отличается от кода - вместо ЯП нужно изучать формат конфига (кейворды, типы данных, иерархию и тд), отслеживать в системе контроля версий, проверять на код-ревью.

Во-вторых, петстор апи и целый тест на статус 200 и поле в бади - конечно, классно, но в реальных проектах тестирование АПИ несколько сложнее. Появятся сетапы / тирдауны тестов, шаред степы, цепочки запросов с передачей данных, переменные окружения и прочие прелести жизни. А когда количество тестов перевалит за сотню-другую, работа в незнакомом для IDE формате подкинет неудобств.

Ну и напоследок - коллегам вместо широко используемого стека понадобится изучать полностью кастомный тул. С вероятностью 99% им ещё придётся ползать под капотом проекта и прикручивать фичи по ходу работы / отлавливать баги. Начнут ли они сливаться с этого увлекательного мероприятия - вопрос риторический.

Если даёте оценку автору и заголовку с упоминанием "национальности", тогда не забудьте дать оценку и комментарию к ПРу "Go develop sh*t yourself in your swamps and don't spam here".

_Sheremetyevo Wi‑Fi

Есть подозрение, что если мошенник создаст точку доступа "Sheremetyevo Wi‑Fi" без всяких андерскоров, к ней будут подключаться чаще, чем к официальной.

Почему это в хабе и с тегами по машинному обучению? Тут от RL только слово "награда".

Если бы у Дурова было звание, то кататься по враждебным странам - ещё более рискованное занятие. Он ещё и французское гражданство получил - то есть вытащить "своего" властям будет ещё тяжелее. Так что, крайне сомнительная теория.

Почему при словосочетании "правка ошибок в коде" обязательно начинается плач Ярославны про "тестировщики что, должны править код разрабов"? Можно что-то в коде автотестов подкручивать, не залезая глубоко под капот. Для этого степень по кампутер саенс не нужна.

Заменить для чего? Чтобы автор писал баг-репорты с переходом на личности и выделением особо эмоциональных (и настолько же бесполезных) частей капс локом?

Вы совсем обнаглели - <...> Разгильдяи вы, которым абсолютно всё равно.

В характеристиках стилуса его вес исправили, а в описании - нет: <...> То есть вы сделали ещё хуже. А ведь я чётко написал в отзыве: "В характеристиках и ОПИСАНИИ ТОВАРА неверно указан вес (20 г)". Неужели так сложно ВНИМАТЕЛЬНО прочитать короткий текст?!

Постоянно прошу: УКАЗЫВАЙТЕ НОМЕР ОБРАЩЕНИЯ ВО ВСЕХ (!) ОТСЫЛАЕМЫХ SMS!! Неужели так сложно понять, <...>

Ну как можно быть таким внимательным?! <...> В тексте письма я также просил исправить ошибку с оценкой заказа от 20 июня. Жду исправления. ВНИМАНИЕ! Выше ТРИ (3) пункта. Жду ответа на ВСЕ ТРИ!

Тут в комментах кто-то писал про "проведённый аудит". Это не аудит, а вынос мозга саппорту.

Нет. Теперь будут выходить новости про каждый смайлик от представителя OpenAI.

Хороший пример забивания гвоздей микроскопом.

А если я хочу автоматизировать получение фейковых данных через чятгпт, чтобы не использовать человека в качестве прокладки между нейросеткой и проектом, что прикажете делать? У нас теперь следующие перспективы:

  • добавление лишней зависимости от внешнего ресурса (к которому, кстати, проблемы с доступом из некоторых регионов);

  • написание обвязки для API чятгпт;

  • работа с промптами вместо кода. Понадобилось обновить данные или поменять их структуру - идём колдовать над промптами;

  • валидация ответа нейросетки и перевод ответа в питоновские структуры данных.

Зато не надо читать доку очередной либы, да.

Реклама курсов вышла на новый уровень. Берём технаря, который в унике изучал MIPS-ассемблер, C#, Python, шлёпаем заголовок "Как за полтора месяца получить опыт в IT и найти работу" - готово. Мы прекрасны.

Орнул с "Чему ты научился на проекте? По коммиту деплоить на рабочий сервер только что внесенные изменения". Ну да, деплой изменений без этой школы он точно бы не осилил, даже с четырьмя годами технического образования за спиной. Респект.

Почитайте про трансформеров (архитектура нейронных сетей), а затем рассуждайте про наличие у сетки цифрового разума / интеллекта. Спойлер - чистая математика, ничего мистического.

Трансформеры представили ещё в 2017. А причина, почему очередная модель "выстрелила" только сейчас - подход "а давайте обучим модель на как можно большем количестве текста, и посмотрим, что из этого получится". Не удивительно, что после увеличения объёма обучающей выборки до сотен гигабайт (и некоторых улучшений архитектуры) нейросети начали выдавать связные последовательности слов. Достоверность полученного текста они никак не проверяют.

1

Информация

В рейтинге
1 820-й
Откуда
Казань, Татарстан, Россия
Зарегистрирован
Активность

Специализация

Инженер по ручному тестированию, Инженер по обеспечению качества
Python
Git
SQL
Testing apps
Тестирование ПО
Автоматизация тестирования