drakononov Jan 4 2023 at 18:46

Децентрализованные облачные вычисления — благо или зло?

5 min

2.9K

Amazon Web Services*IT Infrastructure*Decentralized networks*

From sandbox

Comments 12

lair Jan 4 2023 at 19:17

Это тот же AWS, только машины расположены не в множестве централизованных серверных в ряде регионов мира, а в домах / гаражах / серверных множества людей по всему земному шару, а каждая машина / кластер будет являться нодой сети блокчейна.

А с латентностью (и пропускной способностью) вы что будете делать, когда конкретый кастомер нажимает кнопку в приложении в Филадельфии, а у вас соответствующий код "децентрализовано" выполняется в чьем-то гараже в Иркутске?

rzerda Jan 4 2023 at 20:57

Что будем, что будем… Страдать будем (с).

Автору как ML ресёчреру интересно не распределенными вычислениями воспользоваться, а модельки дёшево тренировать. Теги вон про одни блокчейны и децентрализацию, ни одного про Амдала и скорость света.

lair Jan 4 2023 at 21:00

а модельки дёшево тренировать

Так оно все равно не будет дешево, потому что таскать данные для обучения моделек - недешево (как и память на оконечном устройстве, чтобы оно туда влезло).

drakononov Jan 4 2023 at 22:40

Про задержки и пропускную способность - солидарен с вами. Инфраструктура и расположение в таких вопросах - решают всё, дяди Васи и сообщества любителей-энтузиастов не подойдут

Вы верно подметили - тягать данные это недешево, а порой и больно с точки зрения времени передачи. В типовых случаях скорость передачи едва ли превысит (хорошо, если вообще достигнет) 100 МБит. Подтянуть датасет ~700 Гб - 17 часов минимум.

это стандартная боль в ML/DL - данные перебрасывать с хоста на хост приходится в любом случае во время сбора / препроцессинга / фильтрации, нужно лишь грамотно строить процессы, чтобы лишний раз ничего никуда не тянуть.
На дистанции в этом вопросе вряд ли будет принципиальная разница между централизованными и децентрализованными провайдерами, что к тем, что к другим большие данные за минуту не отправить. И у обоих хранение влетит в копеечку

lair Jan 4 2023 at 22:46

дяди Васи и сообщества любителей-энтузиастов не подойдут

А кто вообще подойдет, чтобы это было осмысленно?

На дистанции в этом вопросе вряд ли будет принципиальная разница между централизованными и децентрализованными провайдерами

Да нет, как раз принципиальная разница есть: у централизованного провайдера можно организовать локализованное хранение данных (лежит в том же датацентре, где и считаем). А у децентрализованного это по определению невозможно.

drakononov Jan 4 2023 at 22:52

Да, вы правы

Под дистанцией я подразумевал множество циклов сбора данных / обработки / обучения, в каждом новом цикле всё равно их нужно откуда-то куда-то тягать, вероятно это несколько сгладит разницу

lair Jan 4 2023 at 22:55

Не сгладит, а только усугубит. Когда у вас нормально построенная локализованная архитектура, у вас в каждом новом цикле все накладные расходы остаются в рамках одного датацентра. В децентрализованной же архитектуре вы каждый раз будете лить свои данные на какую-то новую ноду неизвестно где.

triky99 Jan 4 2023 at 21:58

потому что на децентрализованных пулах нечего считать.

считают или госконторы или универы на грантах - им персоналка дяди джо просто не нужна

drakononov Jan 4 2023 at 22:45

Понял ваш посыл, в целом согласен, если говорим о "внушительных" вычислениях - высоконагруженные сервисы, обучение огромных моделей, моделирование сложных физических и биохимических процессов - без огромных денег / грантов / льгот это в принципе трудновыполнимо

А средне-мелкого много чего есть для просчета. Но это лишь укрепляет позицию децентрализованных пулов вычислений в качестве нишевых решений для ограниченного пула задач