Обновить
23
Aleksei Leshchankin@Alozarian

Humanoid & Self-Driving | Deep Tech → Market

21
Подписчики
Отправить сообщение

@DrZlodberg, технически возможно, но это создаёт больше проблем, чем решает. С одним мотором и механической связью вы теряете главное преимущество многоножки — адаптивность к рельефу. Каждая нога должна независимо подстраиваться под высоту опоры. Плюс при поломке одной ноги вся система встанет. Посмотрите на Strandbeest Тео Янсена — красиво, но работает только на идеально ровном пляже.

@RranAmaru, да, помню этот эпизод! Горькавый хорошо уловил преимущество избыточности — потеря нескольких ног некритична. Но в реальности есть нюанс: механическая сороконожка с 40+ ногами весит и стоит как 10 бипедов. На соревнованиях, где важна только проходимость — да, выиграет. В экономике реального применения, где считают ватт-часы и стоимость обслуживания — проиграет.

Кстати, настоящие сороконожки в природе тоже не самые энергоэффективные существа — потому и остались в узкой экологической нише. Эволюция для наземной локомоции выбрала 2-4-6 ног, не больше. Это не случайность, а оптимум между надёжностью и эффективностью.

Интересная точка зрения.

Современные бипеды уже решают эту задачу через активную стабилизацию. Boston Dynamics Atlas часами стоит на месте, выполняя манипуляции. Ключ — не в количестве ног, а в качестве контроля. Центроидальная динамика + предиктивный контроль позволяют удерживать баланс даже при внешних возмущениях.

Для статической устойчивости достаточно трёх точек, образующих треугольник с центром масс внутри. Но вы правы — четыре точки дают больший запас устойчивости. Вопрос в цене: каждая дополнительная конечность это +25% массы, +25% стоимости, +25% точек отказа.

Спасибо за развернутую критику. По пунктам:

Про современную инфраструктуру: Вы правы насчет тренда на accessibility — новые здания действительно становятся доступнее. Но посмотрите шире: стройки, склады, промзоны, старый жилой фонд (70% зданий в мире построены до 2000 года). Там лестницы, пороги, узкие проходы остаются реальностью. Даже в "доступных" зданиях лифт может сломаться, эскалатор встать — и остаются только лестницы.

Тележка на роликах отлично работает в супермаркете или современном офисе. Но попробуйте довезти её до квартиры на 5 этаже в хрущёвке. Или по стройплощадке. Или через бордюр 15 см. Roomba успешен именно потому, что работает в идеальных условиях квартиры. Как только выходим за эти рамки — решение перестает работать.

Гибрид ног с колёсами — Swiss-Mile Robot из ETH как раз такой. Технически работает, но: +30% веса, +40% сложности, компромиссы в обоих режимах. Индустрия пока не видит в этом экономического смысла для массового производства.

Про узкую нишу двуногих: Наоборот, их ниша — везде, где работает человек. Это не только спасатели, но и курьеры (лестницы в подъездах), строители (леса и неровные поверхности), складские работники (узкие проходы между стеллажами), домашние помощники (пороги, ковры, игрушки на полу).

Про ширину и экономику: 20 см разницы в ширине = 30% меньше роботов в том же складском проходе = 30% меньше производительность. При стоимости робота $50K и окупаемости 2 года каждый процент efficiency критичен.

Вы правы, что у каждого подхода своя оптимальная область. Но утверждение, что двуногие имеют узкую нишу, противоречит выбору всех major players (Tesla, Boston Dynamics, Figure, Agility) — они все ставят на бипедов для массового рынка.

Вы правы — я упростил биомеханику для доступности изложения. Прокомментирую по пунктам:

Современные роботы действительно комбинируют режимы баллистический (пассивная фаза движения, как бросок, с минимальным энергопотреблением), изотонический (сокращение с постоянной силой для плавного перемещения) и управление по положению (точное позиционирование суставов).

Совмещение этих режимов достигается через эластичные актуаторы (SEA, Series Elastic Actuators, серийные эластичные приводы), которые позволяют переключаться между жёсткостью и податливостью, повышая энергоэффективность (оставлю тут ссылки для читателей [1], [2], [3] - Вы и так в курсе)

SEA в Atlas позволяют переключаться между position control и force control. Во время ходьбы ноги работают как пружинный маятник (SLIP model), накапливая и отдавая энергию. Это критично для эффективности — без упругих элементов COT увеличивается в 2-3 раза.

Вы абсолютно правы про соотношение высоты и массы. Оптимальная частота шага ω ≈ √(g/L), где L — длина ноги. Человек при росте 1.8м имеет естественную частоту ~2 Гц, что совпадает с комфортной ходьбой. Робот должен попадать в этот диапазон, иначе либо тратит энергию на борьбу с собственной динамикой, либо движется неестественно медленно.

При правильном использовании пассивной динамики (Cornell Ranger прошёл 65 км на одном заряде - еще в 2011 году) двуногие роботы достигают COT < 0.2 — сравнимо с колёсными на пересечённой местности. Ключ в resonance-based control: не бороться с маятником, а использовать его.

В статье я намеренно опустил эти детали, фокусируясь на практических метриках. Но вы правы — без понимания динамики невозможно создать эффективного бипеда.

Хватательные нижние конечности - идея интересная. Технически это возможно, но есть фундаментальные ограничения.

Попробую структурировать.

Энергетика захвата vs опоры: Удержание веса через захват требует постоянного активного усилия (сжатие), а опора на стопу — пассивная передача нагрузки через скелет. Робот массой 50 кг, висящий на захватах 8 часов, потратит в разы больше энергии, чем стоящий на ногах. Обезьяны решают это частой сменой позиций и малым весом, но для рабочего робота это неприемлемо.

Одноточечная опора работает при малых массах. Гиббон (6-8 кг) может висеть на одной руке. Но для робота в 50+ кг с грузом потребуется захват с усилием 700+ Н постоянно. Это либо огромные энергозатраты, либо механическая блокировка (как у ленивцев), которая ограничит скорость перемещения.

Паркур и четырёхопорная система — да, для пересечённой местности это эффективно. Но паркур работает для коротких дистанций и требует огромных пиковых нагрузок. Трейсер использует 4 точки опоры секунды, затем возвращается к бипедальной ходьбе. Для робота, работающего 8 часов, постоянный паркур-режим означает быстрый износ механики и огромное энергопотребление.

В городской среде с перилами и трубами Ваша концепция могла бы работать для специализированных задач (инспекция, обслуживание высоток). Но как универсальное решение — слишком узкая ниша.

Спасибо за комментарий и интересные вопросы - готов обсудить.

  1. Вы правы, искусственный интеллект (особенно обучение с подкреплением и базовые модели) революционизирует балансировку и движение: вместо жёстких контроллеров роботы учатся на данных, адаптируясь к новым сценариям. Например, мы используем RL для динамической ходьбы, где "навыки" — это политики, обученные на миллионах симуляций, и это делает систему отказоустойчивой без ручной настройки.

  2. Для домашних роботов экономичность передвижения действительно второстепенна — ключ в безопасном взаимодействии с людьми и объектами (взаимодействие человека и робота). Но энергоэффективность помогает в автономии (дольше без подзарядки). Клиенты — да, средний бизнес (склады, розница), где массовые гуманоиды (типа Figure 02) дешевле кастомных, с возвратом инвестиций за 1–2 года.

  3. Согласен, основная ниша — сервис (поднос, уборка, доставка), где гуманоиды заменяют людей в повторяющихся задачах. Для грузовиков/экскаваторов лучше специализированные автономные системы (как Tesla Semi или Caterpillar autonomy) — гуманоиды не нужны, где нет среды, ориентированной на человека. Но в смешанных (например, строительных площадках) они могут помогать как помощники.

  4. Смена инструментов — опция для универсальности, но вы правы, для массовых роботов лучше фиксированные 1–4 конечных эффектора (захват, щётка, сканер), как в Unitree G1 или Optimus. Это снижает сложность и стоимость, а обновления — через программное обеспечение. Если нужно больше — модульные руки, но не бесконечно.

Насчёт специализированных роботов — Вы правы. Для узких задач они эффективнее. Мойщик окон с присосками, доставщик на колёсах, сварочный манипулятор — каждый оптимизирован под свою задачу и делает её лучше универсального решения.

Но есть экономическая проблема: для полной автоматизации предприятия нужны десятки типов специализированных роботов. Каждый требует отдельной разработки, производства, обслуживания, обучения персонала. Склад запчастей под 20 типов роботов — это кошмар логистики.

Гуманоид — это компромисс. Да, он моет окна хуже специального бота, возит грузы медленнее AGV. Но один тип робота закрывает 80% задач, требует одного типа запчастей, одной системы управления, одного обучения операторов.

Про "палку вместо руки" — логично для фиксированной задачи. Но что если сегодня нужна палка, завтра отвёртка, послезавтра надо набрать код на клавиатуре? Универсальный захват даёт гибкость. Это как смартфон vs набор отдельных устройств (камера, плеер, навигатор) — каждое устройство лучше в своей области, но смартфон удобнее.

Специализация победит там, где объём одинаковых операций огромен (конвейер). Универсальность — где нужна адаптивность (обслуживание, ремонт, работа в непредсказуемой среде).

Спасибо за контр‑пример. Не спорю, что колёса на ровной плите объективно эффективнее по CoT — и на однотипных трассах их и нужно брать. Статья про другое: микс реальной “человеческой” инфраструктуры (двери, лестницы, узкие проходы, полки на высоте, двурукая работа) и TCO, а не только ватт‑часы на метр. Гибрид leg+wheel добавляет массу/ширину/узлы, усложняет сервис и ухудшает лестницы/ступени; по сумме это часто проигрывает бипеду в зданиях без ретрофита, где решают две свободные руки и проходимость «как у человека». Для длинных коридоров мы решаем задачу проще — тележка/«скейты»/док‑карт: колесная магистраль там, где она уместна, без утяжеления базы.

Развернуто:

  1. Про “доказательства лучшего решения”. Мы и не утверждаем «лучшее вообще». Тезис узкий: локальный минимум TCO в человеческой инфраструктуре при условии двурукой манипуляции и лестниц без ретрофита. В этом допущении бипед даёт наименьший CAPEX на переделку среды и максимум повторного использования железа OTA‑сценариями.

  2. Колёса vs. ступени/двурукая работа. Колёса выигрывают по CoT на ровной поверхности — согласен. Но колёсный или leg+wheel‑гибрид:

    • увеличивает ширину/радиус корпуса (ступицы/механизмы трансформации), что бьёт по дверям и лестницам;

    • добавляет узлы и точки отказа → выше сервис и ниже MTTF;

    • усложняет whole‑body: координация опор, переключения режимов, сертификация безопасности;

    • руки часто заняты опорой/балансом, и двурукая работа на высоте становится нештатной.
      В сумме — хороший “супер‑AMR”, но не универсальный исполнитель внутри зданий без адаптации.

  3. Что считаю «справедливым сравнением». В качестве предложения - бенчмарк‑набор, где сравниваются не только ватт‑часы/метр, а задачи:

    • пройти дверь стандартной ширины, открыть её с грузом;

    • подняться/спуститься по лестнице;

    • снять/поставить коробку с полки на высоте человека двумя руками;

    • проехать 200–300 м по коридору (здесь колесный модуль/тележка даст плюс — и это ок).

      Вот на таком - с моей точки зрения - «миксе» и надо говорить о TCO и аптайме, а не о чистой локомоции.

  4. Про гибридный подход. Ну, тут я не религиозен ))) : для «магистралей» используем стыковку с тележкой/скейтами или буксировку — получаем скорость колёс там, где это выгодно, не утяжеляя базу и не теряя лестницы/манипуляцию.

  5. Формулировка заголовка. Согласен, в лоб провокация читается жёстко. Зато получилась интересная дискуссия.

Побуду, наконец, в роли "автора комментариев" ("боги Хабра" услышали мои молитвы :) и почеленджу идею.

Что работает в вашем подходе: Модульность действительно решает проблему универсальности. Базовая платформа (ноги + торс) + сменные модули (руки, инструменты, грузовые контейнеры) = адаптация под задачу. Это логично для B2B сегмента, где важна утилизация, а не внешний вид.

Где возникнут сложности:

  1. Балансировка и динамика: Каждая конфигурация = новый центр масс и моменты инерции. Контроллер, настроенный на "две руки", упадёт с "грузовым контейнером сверху". Придётся либо ограничивать скорость движения до минимума, либо создавать адаптивный контроллер под каждую конфигурацию.

  2. Интерфейсы крепления: Механические разъёмы для передачи больших усилий (манипуляция = сотни Нм момента) это сложная инженерия. Стоимость промышленных tool changer'ов для роботов — от $10K за штуку. Плюс электрические/пневматические/data разъёмы.

  3. Экономика производства: Универсальная платформа = компромиссы везде. Будет проигрывать специализированным решениям в каждой нише. А модульность добавит 20-30% к стоимости из-за интерфейсов.

Где это уже работает: Universal Robots с их модульными манипуляторами, но это стационарные роботы. Для мобильной платформы пока успешных примеров нет — слишком сложная интеграция.

Ваша идея может сработать для узкого сегмента (например, складская логистика), но как универсальное решение — сомнительно.

PS. При этом поддерживаю подход - любые смелые идеи - это отлично!

Именно так. Экономика простая: переделать миллионы единиц техники и зданий под роботов = триллионы долларов. Создать универсального робота под существующий мир = миллиарды. Разница в 1000 раз.

Ваш пример с "терминатором"-водителем идеален: Один гуманоид может управлять любой техникой — от легковушки до экскаватора. Не нужно роботизировать каждую модель отдельно. Сел, взялся за руль, поехал. Сломался робот — заменили за час. Сломался "умный экскаватор" — простой месяцами.

Мир создан под человека. Логично создавать роботов под этот мир, а не наоборот.

Ваш скептицизм понятен и во многом обоснован.

Про устойчивость и "прыгание на одной ноге": Вы правы — динамическая стабилизация бипедов это сложная задача. Но она уже решена. Boston Dynamics Atlas делает сальто назад, Unitree H1 прыгает и бегает, Tesla Optimus работает на заводе. Да, это требует постоянных вычислений (200-1000 Гц), но современные контроллеры справляются. Ключевое отличие от пьяного человека — робот не устаёт и не теряет концентрацию )))

Про когнитивную нагрузку: Парадоксально, но управлять двумя ногами проще, чем четырьмя. У бипеда в каждый момент только 2 варианта: какую ногу переставить и куда. У квадропеда — 4 ноги × множество последовательностей шага (walk, trot, gallop, pace). Поэтому обучение нейросетевого контроллера для бипеда сходится быстрее — меньше пространство состояний.

Медведь на задних лапах — плохой пример (простите), он анатомически не оптимизирован для бипедализма. Человек же эволюционировал именно для двуногой ходьбы: S-образный позвоночник, широкий таз, длинные ноги. Результат — человек может идти 40 км в день, что недоступно большинству четвероногих при сравнимом весе.

В целом, я согласен, что есть открытые вопросы и компромиссы. Но индустрия уже сделала выбор — все крупные игроки (Tesla, Figure, Boston Dynamics, Agility) ставят на бипедов. ДУмаю, это не случайность, а результат инженерного анализа.

И спасибо за обратную связь! Для меня это очень ценно!

Спасибо за комментарий! Вы правы, 1.3 м/с ≈ 4.68 км/ч, и это не средняя скорость пешехода (обычно 5 км/ч или 1.39 м/с), а оптимальная для минимального COT человека — исследования показывают, что cost of transport минимизируется при 1.04–1.23 м/с, где энергозатраты на ходьбу наиболее эффективны. При 5 км/ч COT выше, но это типичная "бытовая" скорость для повседневных перемещений.

Спасибо за комментарий! Вы абсолютно правы, что формула Rs = R^n применима только к последовательным (сериальным) системам, где отказ любого компонента приводит к отказу всей системы — это упрощение, которое не учитывает дублирование. В реальности для систем с резервированием (параллельные или k-из-n) надежность выше: для полной параллельной дублировки Rs = 1 - (1-R)^n, где отказ происходит только если все копии откажут. Это ключевой аспект теории надежности, и в робототехнике он активно используется для оценки redundant систем, включая многоногие роботы. И Вы правы - формула сильно другая (нехитрым "гуглением" нашлись интересные источники 1 и 2). Например, для 200 приводов с R=0.99 в сериальной системе Rs ≈ 0.134 (катастрофа), но с полным дублированием (n=2 на привод) Rs ≈ 0.9998, что радикально повышает устойчивость.

Однако в многоногих роботах ноги не полностью независимы, а координация добавляет комбинаторную сложность (combinatorial explosion), требуя Monte Carlo симуляций для расчета. В гуманоидах redundancy достигается через whole-body control и fault-tolerant planning: отказ одной ноги компенсируется руками или перераспределением, без роста числа ног. Пример — Atlas от Boston Dynamics, где kinematic redundancy позволяет продолжать движение даже при сбое, минимизируя общую сложность. Для multi-legged (как ANYmal) redundancy повышает terrain adaptability, но увеличивает стоимость и энергопотребление — ну, и исследования показывают, что для mixed environments оптимально 4–6 ног с частичным резервированием, а не 50+ )).

Иван, стараюсь формулировать чётко и технично — чтобы было понятно и разработчикам, и исследователям. Если что-то вызывает вопросы — рад пояснить подробнее.

Мысль про эволюционный багаж - сильная.

Действительно, человеческая нога — это компромисс между наследием четвероногих предков и прямохождением. Те же беговые протезы доказывают: убираем "лишнее" (голеностоп, пальцы) и получаем лучшую энергоэффективность. Карбоновая дуга возвращает до 95% энергии против 60% у биологической ноги.

Но тут дилемма. Технически оптимальный робот с пружинными ногами, шаровыми суставами и лидарной головой будет эффективнее. Но он не пройдёт в дверь (рассчитана на человеческие пропорции), не сядет в машину, не сможет использовать человеческие инструменты. Плюс психология — люди боятся "чужих". Вспомните реакцию на собакоподобного робота от Бостон Динамикс в эпизоде "Чёрного зеркала". А теперь представьте паукообразного робота-курьера у вашей двери.

Компромисс, который мы видим у лидеров: антропоморфная база + технические улучшения там, где это не мешает. У Теслы Оптимус руки человеческие, но приводы — линейные актуаторы вместо "мышц". У Юнитри ноги двуногие, но стопа — упрощённая платформа без пальцев. Это разумный баланс: достаточно человекоподобно для принятия обществом, достаточно оптимизировано для эффективной работы. Эволюция дала нам хорошую отправную точку, но слепо копировать её — путь в никуда (простите за такой "радикализм").

Про надёжность: Животные решили это через избыточность — нет единой точки отказа. Сломалась мышца — соседние компенсируют. В робототехнике мы только начинаем это копировать: упругие элементы в приводах эмулируют эластичность сухожилий, планировщики распределяют нагрузку между конечностями. Но до "гибкой кожи" как универсальной защиты ещё далеко. НАСА со своим Робонавтом ближе всех — кевларовые оболочки и распределённая сенсорика, но это штучное производство.

Про сервис: У автомобиля отказал привод — едет в сервис. У промробота — останавливается линия за 60 тысяч рублей в минуту. У гуманоида должна быть постепенная деградация: отказала рука — работаем одной, параллельно заказываем замену. Для 1000-1500 часов между обслуживаниями нужно: модульные приводы с горячей заменой, предиктивная диагностика по вибрациям, самокалибровка после замены. Сервис будет не "чинить поломки", а "менять расходники по графику".

Про альтернативы колёсам: Моноколесо упрётся в физику — момент инерции растёт как пятая степень радиуса, получается либо огромное колесо, либо тяжёлый маховик. Шар-робот в Цюрихе работал только на идеальном полу — порог 2см и всё. Выдвижные ролики на стопах реальнее, но это лишний вес и точки отказа. Может, проще довести двуногую ходьбу до совершенства? Бостон Динамикс же научил Атласа делать сальто без всяких колёс — вопрос в алгоритмах, а не в костылях.

Полностью согласен — это ключевая проблема текущего поколения роботов. У человека ~5 млн тактильных рецепторов и ~600 мышц с непрерывной проприоцепцией, 130M фоторецепторов, а у топового гуманоида — 6-12 силомоментных датчиков и 20-40 актуаторов. Разница в 5-6 порядков по плотности сенсорной информации.

По сути, мы пытаемся научить "видеть" существо с завязанными глазами и в варежках. Неудивительно, что роботы больше похожи на управляемые протезы, чем на автономные системы.

Параллель с LLM очень точная. GPT-2 с 1.5B параметров был "тупым попугаем", а GPT-3 со 175B внезапно показал emergent reasoning. Возможно, роботам тоже нужна критическая масса сенсорных данных и вычислительных ресурсов для качественного скачка. Проблема в том, что все пытаются запихнуть AI в Jetson Orin на борту (275 TOPS), вместо того чтобы честно разделить: рефлексы и безопасность на edge (<10ms), а cognition в облаке (<200ms). Оптоволокно не потому что "круто", а потому что 100Gbps для потокового видео с десятков камер — это необходимость.

Что делать сейчас? Работать с тем, что есть, но готовить архитектуру к будущему. В Китае я видел прототипы тактильных "кожи" (вполне неплохо работает), neuromorphic чипы на подходе. Пока же компенсируем недостаток сенсоров избыточностью обучения в симуляции (domain randomization), используем hierarchical control для разделения задач по уровням, и не стесняемся cloud-assisted планирования )))))

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность