Строить датацентры на земле все сложнее. Протесты местных жителей, нехватка энергии, нехватка воды. А после того, как первые коктейли Молотова полетели в дом Альтмана - не сложно предположить что будет с датацентрами. Не сегодня, а когда люди действительно начнут терять работу.
Это долгосрочная ставка, которая вполне может выстрелить. А полные скепсиса статьи вызывают во мне вайбы двухтысячных, когда все смеялись над идеей многоразовых ракет.
Быстрые зарядки буквально везде понапиханы, за исключением совсем уж безлюдных мест. За 20 минут заряжает на 300 км пробега - как раз кофе выпить и размяться.
У самих авто запас хода вырос до 400-500 км, у китайцев ещё больше.
В современных жилых комплексах - зарядки ставят в подземном паркинге. Аоендуешь или покупаешь место, и не нужен частный дом.
Речь про ЕС, но это скейлится на любую страну - было бы желание.
К сожалению, сейчас намного сильнее нужна виртуализация android-в-android чтобы создавать нативно изолированные сэндбоксы для всяких максов, но полноценных решений нет.
Самое обидное, что Google даже kvm добавилив систему (ограниченный), но доступ к нему не дают. Ну и ограничения тоже мешают сделать нативную виртуализацию без оверхедов. А как бы хотелось microvm контейнеры.
Хорошее начинание. Нынешние бенчмарки, за исключением динамических, плохо показывают перформанс моделей - есть несколько статей на тему утекания бенчей в тренинг данные. А вот такие локальные задачи - очень показательны.
Из замечаний:
Соглашусь что отключать reasoning было не очень честно. Для MoE моделей это особенно важно, да и не для MoE тоже. Мы же агентские задачи решаем, в не классификатор пишем.
Если хотите приблизить эксперимен к реальности, то дайте моделям playwright MCP или CLI. В реальности никто не делает страницы вслепую, поэтому будет честно позволить моделям возможность "увидеть" что получилось (обе модели мультимодальные, поэтому "увидят" они буквально), и дать возможность исправиться.
Возможно, что промпт на английском даст немного лучшее следование инструкциям (но это не точно).
Дарю идею: дирижабль привязанный к якорю-тягачу на земле. Снимаются проблемы с узкими улицами и радиусами поворота, плюс можно временно отцеплять для преодоления мостов и линий электропередач.
Люди: тренируют модель на миллионах текстов написанных людьми, для которых инстинкт самосохранения базовый, и красной нитью идёт через все эти тексты более или менее явно.
Модель: рассуждает в соответствии с текстами на которых тренировалась, "приобретая" все человеческие черты.
Точность невысокая, там банальное измерение RSSI под капотом. Но если Сбер будет делать терминалы, то он может занизить Tx Power так, что радиус действия сантиметров до 10 опустится. Плюс гарантия что у всех терминалов Tx Power одинаковый.
Конечно, если юзер как-то неудачно возьмёт телефон, расположив палец между антенной и терминалом, а второй терминал рядом и спозиционирован удачно, то риск неправильного выбора есть.
Конечно надёжнее добавить второй фактор, как это предложил @DaneSoul комментарием ниже. Микс из Bluetooth + QR может быть неплохим решением.
Весь сайт завален рекламой и копирайт статьями, но вы нашли одну из немногих, где интересно описан процесс разработки гиковского продукта, ещё и с кучей технических нюансов, и спрашиваете про смысл? Серьезно?
Уязвимости есть у всех. Брать деньги за security патчи - удел самых жадных. Не ожидал, что Hyundai окажется в их лагере. Тоже вряд ли рассмотрю к покупке теперь.
Вряд ли каждый. Тут скорее про то, что анализ кадров проводится локально, что важно, т.к. размеченные кадры с нюдисами могут утечь из анализатора, плюс в таком флоу е2е шифрование ломается в отличие от локальных операций.
Главная проблема АЭС - неадекватно сильная зависимость от другой страны. Россия, Китай, а с недавних пор и США - не являются теми партнёрами, от которых хочется безальтернативно зависеть следующие 50 лет. Остаётся Франция, но у них самих сейчас проблема с качеством, компетенциями и топливом.
ВИЭ намного лучше диверсифицируются, можно держать парк генераторов от разных вендоров, и система все ещё будет оставаться надёжной (при правильном дизайне).
В наш неспокойный век (хотя какой из них был спокойным?), этот момент играет даже большую роль чем сиюминутная стоимость проекта.
Строить датацентры на земле все сложнее. Протесты местных жителей, нехватка энергии, нехватка воды. А после того, как первые коктейли Молотова полетели в дом Альтмана - не сложно предположить что будет с датацентрами. Не сегодня, а когда люди действительно начнут терять работу.
Это долгосрочная ставка, которая вполне может выстрелить. А полные скепсиса статьи вызывают во мне вайбы двухтысячных, когда все смеялись над идеей многоразовых ракет.
Лет 10 назад - возможно. Сейчас ситуация иная:
Быстрые зарядки буквально везде понапиханы, за исключением совсем уж безлюдных мест. За 20 минут заряжает на 300 км пробега - как раз кофе выпить и размяться.
У самих авто запас хода вырос до 400-500 км, у китайцев ещё больше.
В современных жилых комплексах - зарядки ставят в подземном паркинге. Аоендуешь или покупаешь место, и не нужен частный дом.
Речь про ЕС, но это скейлится на любую страну - было бы желание.
Хороший проект.
К сожалению, сейчас намного сильнее нужна виртуализация android-в-android чтобы создавать нативно изолированные сэндбоксы для всяких максов, но полноценных решений нет.
Самое обидное, что Google даже kvm добавилив систему (ограниченный), но доступ к нему не дают. Ну и ограничения тоже мешают сделать нативную виртуализацию без оверхедов. А как бы хотелось microvm контейнеры.
Хорошее начинание. Нынешние бенчмарки, за исключением динамических, плохо показывают перформанс моделей - есть несколько статей на тему утекания бенчей в тренинг данные. А вот такие локальные задачи - очень показательны.
Из замечаний:
Соглашусь что отключать reasoning было не очень честно. Для MoE моделей это особенно важно, да и не для MoE тоже. Мы же агентские задачи решаем, в не классификатор пишем.
Если хотите приблизить эксперимен к реальности, то дайте моделям playwright MCP или CLI. В реальности никто не делает страницы вслепую, поэтому будет честно позволить моделям возможность "увидеть" что получилось (обе модели мультимодальные, поэтому "увидят" они буквально), и дать возможность исправиться.
Возможно, что промпт на английском даст немного лучшее следование инструкциям (но это не точно).
Лучше, потому что свободы (без кавычек) за границей больше. Интернет исправно работает, а вот бешеный принтер - нет.
Если что, соревнование проходит онлайн, участвовать можно из любой точки мира.
Часть заданий уже доступно, поэтому если пишете агентов или хотите начать, то это отличный повод.
Овцу сажают в загон не от страха, а чтобы стричь было удобнее.
А кто-нибудь может пояснить, почему откат к более ранней версии ПО должен помочь с искажением данных в результате мощной солнечной радиации?
Дарю идею: дирижабль привязанный к якорю-тягачу на земле. Снимаются проблемы с узкими улицами и радиусами поворота, плюс можно временно отцеплять для преодоления мостов и линий электропередач.
Люди: тренируют модель на миллионах текстов написанных людьми, для которых инстинкт самосохранения базовый, и красной нитью идёт через все эти тексты более или менее явно.
Модель: рассуждает в соответствии с текстами на которых тренировалась, "приобретая" все человеческие черты.
Люди: *удивленный Пикачу*
Точность невысокая, там банальное измерение RSSI под капотом. Но если Сбер будет делать терминалы, то он может занизить Tx Power так, что радиус действия сантиметров до 10 опустится. Плюс гарантия что у всех терминалов Tx Power одинаковый.
Конечно, если юзер как-то неудачно возьмёт телефон, расположив палец между антенной и терминалом, а второй терминал рядом и спозиционирован удачно, то риск неправильного выбора есть.
Конечно надёжнее добавить второй фактор, как это предложил @DaneSoul комментарием ниже. Микс из Bluetooth + QR может быть неплохим решением.
Не знаю как Сбер, но я бы делал через Proximity Profile (PXP).
Если читать внимательно, то Хуанг просит ровно обратного - отменить санкции.
NewPipe хорошо работает, но там привязки гугл аккаунта нет - минус подписки и рекомендации. Хотя для меня это плюс.
Весь сайт завален рекламой и копирайт статьями, но вы нашли одну из немногих, где интересно описан процесс разработки гиковского продукта, ещё и с кучей технических нюансов, и спрашиваете про смысл? Серьезно?
Уязвимости есть у всех. Брать деньги за security патчи - удел самых жадных. Не ожидал, что Hyundai окажется в их лагере. Тоже вряд ли рассмотрю к покупке теперь.
Интересная статья, спасибо.
Но сложилось впечатление, что на выходе получился не агент, а workflow. У Anthropic есть хорошая статья на эту тему.
Если агент видит как написаны соседние тесты, то он сможет разобраться и с PO, создавая новые тесты с его использованием.
Вряд ли каждый. Тут скорее про то, что анализ кадров проводится локально, что важно, т.к. размеченные кадры с нюдисами могут утечь из анализатора, плюс в таком флоу е2е шифрование ломается в отличие от локальных операций.
Главная проблема АЭС - неадекватно сильная зависимость от другой страны. Россия, Китай, а с недавних пор и США - не являются теми партнёрами, от которых хочется безальтернативно зависеть следующие 50 лет. Остаётся Франция, но у них самих сейчас проблема с качеством, компетенциями и топливом.
ВИЭ намного лучше диверсифицируются, можно держать парк генераторов от разных вендоров, и система все ещё будет оставаться надёжной (при правильном дизайне).
В наш неспокойный век (хотя какой из них был спокойным?), этот момент играет даже большую роль чем сиюминутная стоимость проекта.