Pull to refresh
1
0
Send message

Спасибо за ссылки. Я же не говорю что их совсем нет. Только википедия - она же не русскоязычна, а глобальна, да? Какой процент составляют эти полторы тысячи фотографий от общего числа фотографий, размещенных в интеренет (в фотобанках)
Фотографии из музея - это совсем не релевантный пример. Они позволяют получить доступ общественности к просмотру того наследия человечества, которое хранится в музее. И врядли они годятся для обучения нейросетей (ну кроме каких-то довольно специфичных случаев)

Я могу ошибаться, но подозреваю, что сканирование старых фотографий было подстегнуто прогрессом и появлением различных фотобанков и появлением возможности как-то на этом заработать.
То же самое относится и к дорогим камерам и оптике - в результате прогресса появилась потребность в более высоком качестве изображений, появилась возможность (мегапиксели постоянно растут) и это стало доступно.
И я не думаю что вы где-то сможете бесплатно взять изображение в сколько-нибудь высокого разрешения и тем более в raw.
Более того, в лицензии вполне может быть использовано на некоммерческое использование, т.е. смотреть - пожалуйста, поставить на рабочий стол на домашнем компьютере - тоже. А вот на использовать на сайте или напечатать в каком-нибудь журнале - уже нельзя.

Правильно-ли я вас понимаю, что вы считаете, что автор и собственник объекта, охраняемого авторским правом, не может сам определять как ему распоряжаться этим объектом?
И какая-то организация имеет больше прав в определении порядка использования его творений, чем он?

Хорошо, прогресс порвет их. Что будем делать, когда фотографов не останется и новых хороших фотографий в высоком качестве не будет?

Я достаточно неплохо понимаю, как работают нейросети в целом, хотя с генеративными дела не имел. Но не думаю что там что-то принципиально другое.
Нейросети извлекают различные паттерны, которые, как я подозреваю, используются уже в процессе генерации. И без исходных изображения паттерны не могут быть получены. Если взять 100 тысяч чужих изображения и как-то их усреднить - можно ли утверждать что создали что-то новое? или все же каждый раз, когда вы обрабатывали каждую их этих 100 тысяч фотографий, преобразовывая ее в некую дельту и сохраняя эту дельту в своей модели, вы 100 тысяч (помноженное на количество эпох) раз нарушили право авторское право?

Речь идет о запрете, а о бесплатном использовании результатов труда человека для извлечения прибыли.
Это примерно как устроится волонтером в общественную организацию, а потом выяснить, что она никакая не общественная, а коммерческая и кто-то получает вполне себе осязаемый доход от вашей бесплатной работы.
Давно вы где-то работали бесплатно?

Институт сервитута мне знаком. В моем примере он не применим. В нем идёт речь про получение дохода путем экономии за, по сути, чужой счёт.

Ровно то, о чем эта статья

Если нейросети что-то нарвится - пусть идет и фотографирует в том же стиле. Это ей никто не запрещает.
А если чуть более серьезно, то сама нейросеть ничего создавать не может. Она может мимикрировать под какую-то генерализованную версию изображений, которую ей скормили во время обучения. Иными словами она взяла 100 тысяч или миллионов существующих фотографий, как-то их усреднила и при последующей генерации использует какие-то паттерны из тех фотографий, которые она видела.
Здесь поднимается вопрос не про богатство как у Маска. А про то, что многие AI старта (тот же chat gpt) использует открытые источники, которые были открыты для личного использования.
Ну например, у вас есть земельный участок. Отстутвие забора дает право прохода через него.
Вас не было год, вы возращаетесь и видите, что из соседнего карьера проложили через него дорогу и каждый день десятками ездят грузовики. Почему через ваш участок? потому что другая дорогая будет на 3 км длиннее.
Пример не совсем из виртуальной (IT) сферы, но простота копирования и распростарения данных почему-то многими воспринимается что создание этой информации было бесплатным. Увы, нет

Принципиальная разница здесь в том, что в первом случае фотографии используются для извлечения прибыли на постоянной основе, а во втором - для личного разового использования.
Ну вот поставьте себя на место фотографа - вы потратили деньги на обучение, оборудование, вы придумали идею для съемок, подобрали место, поехали туда, понесли затраты, потратили время, сделали съемки. Вы не против поделиться с обществом, чтобы оно видело ту красоту, которую видели вы, но это ваш хлеб. Если кто-то хочет извлекать прибыль из этого или посредством этого - наверно нормально ожидать получить какую-то оплату за свои опыт, знания и время. Правда?

Ну так и пусть эта нейросеть идёт и смотри эти горы сама. Зачем она смотрит на чьи-то фотки?

Если клиенты линуксы — то вообще никакой боли нет. Если винда — один ньюанс и тоже без проблем.
Если изолируете базовую систему, то версионность и апдейт базовой системы вообще не будет напрягать. Будете вспоминать об этом когда версия дистра уйдет в олд-стейбл.
А для клиентов бубунта самое то — на все что надо есть ppa

И все же, 1.5 КВт — это реально много. Сервера лучше тем, что в них изначально продумано охлаждение. Ладно, посмотрел картинки корпуса. Если правильно понял в нем два 120 кулера на подачу и один 140 на вытяжке в районе проца. Ну не продуют два 3-5 ваттных 120 кулера 1.5 кВт тепла, особенно если 2/3 потока вытяжной кулер прогонит через проц. Вам понадобится что-то вроде 30-50 ваттных дельт PFC/FFC1212)
Насчёт 3.3 вольт — это я к тому, что сейчас можно ориентироваться на ватты, разглагольствования про бензин и амперы — они ни к чему. Расчет простой: 100-200 ватт на переферию + tdp CPU и карт и разделить на 0.7. Вот мощность БП. Лучше порассуждать про КПД и голды/платину/титаны.
Насчёт объединения — хорошо что умеете пользоваться паяльником. Но повторю вопрос — если один из блоков решит уйти в оффлайн от перегрузки/КЗ — что будет делать второй? Как отработает система в целом?
Насчёт дисков. Для БД я бы меньше 3710 и не порекомендовал. Совсем не понятна логика почему не NVME. Они такие редкие что 3 не сможете купить? Или что потом они исчезнут и ещё 2 не сможете докупить? Hint — u2.
Опять не понимаю логику между ECC, рабочей станцией и веб сервером. А, ну вот, кстати https://m.habr.com/ru/amp/post/536260/
"Четвертую через удлинитель снаружи." вы чего, серьезно? Зачем вы тогда такой корпус покупали? Взяли бы алюминиевых уголков, райзеры (только те что x8 или x16) и сделали бы корпус как у майнеров. Было бы и дешевле и охлаждение со всех сторон. Зачем все это?

И зря. Виртуализация даёт изоляцию базовой системы от клиентов.
Не понятна логическая цепочка от XFCE к manjaro. Почему не убунта/дебиан/центось?

У вас впереди еще столько интересного :)
Давайте по-порядку.
Насчет корпуса. 4 карты по 350 ватт + все остальное — это почти 1.5 киловатта. Это, на минуточку, примерно как электрический чайник. Все это тепло надо отводить. Вы уверены что ваш корпус сможет отвести столько тепла? При этом все это будет работать совсем не тихо и поставить его в комнате вместе с людьми врядли получится. А если есть серверная — то лучше смотреть корпус с установкой в стойку. Ваш так может?
Насчет БП. Интересные соображения насчет расчета токов и падения 12в до 11в. Вот только время когда основной питающей линией было 3.3 вольта давно ушли и все современные БП расчитывают на нагрузку по линии 12В, а спецификация АТХ позволяет отклонение в ± 5%. Насчет подключения от 2 БП — интересно посмотреть как вы будете их синхронизировать. Будете объединять 12в или нет? А если один из них захочет уйти в оффлайн из-за перегрузки или КЗ, что будет делать второй? В серверах для этого есть специальные платы (power distributor), или вы собираетесь использовать плату с али за 2 бакса на сервере ценой в 1 миллион?
Диск. 860 Evo? Один? Вы серьезно? Какой у него ресурс? Какая на него будет нагрузка (объем записи в день)? Что будете делать если он выйдет из строя? Как будете восстанавливать работоспособность сервера? Менять и все переустанавливать? Вообще не подумали. Экономия на спичках. Под такие системы надо брать ну хотя бы что-то уровня intel s4510, а лучше s4610, а если нужна скорость — то p4610.
Насчет материнки — без ipmi набегаетесь, когда что-то случится. если серверная с кондеями — то еще и продуть может.
По памяти — памяти много не бывает. Особенно для 4*3090. Я бы сказал 128GB — это минимум с которого надо начинать. И только ECC.
В итоге получился игровой компьютер с 4 мощными видеокартами.
И не раскрыты темы:
3090 в большинстве своем на 2.5 слота. как будете ставить?
стандарт АТХ — это 7 карт расширения. Как вы собираетесь засунуть 4 карты (даже по 2 слота)
На мой субъективный взгляд, из всего закупленного можно было бы оставить только видеокарты, но тут не указано что в итоге купили.
Стабильно работающие сервисы — это даже не обсуждается. Это то, для чего админам и прочим айтишникам платят деньги. И это можно и нужно делать прозрачно для остальных сотрудников компании.

А вот ужесточение любых правил доступа к информации/ресурсам, обмена информацией и т.п. — это аффектит уже практически всю компанию, поэтому прежде чем что-то внедрять — надо понять какова стоимость и так какие риски это убирает, а также можно ли эти риски устранить или снизить не создавая дополнительных и/или чрезмерных ограничений и не усложняя выполнение своих функции другим сотрудникам.

Простой пример.
Допустим вводится какая-то процедура, которая отнимает у сотрудника дополнительно всего 10 минут каждый день. В компании работает… ну пусть 60 человек. В итоге получаем что общие трудозатраты составляют 10 часов в день или 1.25 ставки. Если для компании 1 человек обходится в 100 тыр в месяц, то введение этой процедуры компании обходится в 125 тыр ежемесячно или 1.5 миллиона в год.
Казалось бы — всего 10 минут на человека в день и 125 тыр ежемесячно/1.5 миллиона в год — уже заметные деньги.
А сколько таких процедур по «лишние 10 минут в день» может быть? И есть ли уверенность что все они оправданы?
А что, у ИТ-отдела появились статьи доходов? Нет? Ну значит «обслуживающий персонал».
Вообще в термине «обслуживающий персонал» нет ничего плохого. Бухгалтерия по сути тоже обслуживающий персонал.
Касательно любой безопасности и в частности ИБ — когда инициативные товарищи начинают внедрять какие-то новшества не представляя работу других отделов и ставят в позу пол компании — вы считаете это правильно? Любое усложнение бизнес-процесса, снижение мотивации сотрудников, усложнение найма новых сотрудников, прохождение доп.обучения и т.п. — это дополнительные косты компании. Надо адекватно подходить к рискам и стоимости его предотвращения/реагирования. И если безопастник это не понимает — не надо его останавливать если он вдруг решает «валить, валить к чертям»
ну не бесплатно )
10 гигабит — даже если интегрированная, то rj45 свитч выйдет скорее всего немного дороже sfp+, и, вероятно, будет шумнее, а латенси будет чутка больше.
40 гагибит — патчкорд $25, карта $65. Свитч будет дороже чем для 10 гигабит

25/100 гигабит — все дороже 10/40, наверно раз в 5
100 гигабитный мелланокс — это начиная с cx456a. Стартует он где-то с 300.
А вот свичи… 25/100 б/у с ебея там — думаю где-то от $2к. Здесь, думаю, ценник будет стартовать от 400-500тыр
Вот я не уверен, что «все апгрейдятся на 100+». Если в датацентрах они может и нужны, то в обычном энтерпрайзе далеко не всем нужно даже 100 гигабит. И встречал статью, в которой разбирался переход с 10/40 на 25/100. В реальности латенси почти такой-же, цены — в разы дороже, и учитывая что большинству 10/40 хватает — смысла перехода нет. Железки обычно скидывают, когда по ним наступает EOL и нет поддержки. Для 25/100 железок это время еще не наступило.
Учитываю какие потоки свитчи должны перемалывать — очень врядли что-то из маленького найдется хотя бы даже на 4-8 QSFP портов.
Кстати, какой маленький 10 гбит свитч взяли? что-то из микротика?
Да не вопрос — ebay.com :)
2х портовый qsfp (40 гигабит) — Mellanox CX354A-FCBT (ebay)
QCBT можно пережить в fcbt, но китайцы по-моему и так все перешивают в старшие модели и продают уже как старшие модели.
Есть еще однопортовый (cx353a), но смысла нет — деньги те же, а порт один. дока1 дока2
Для подключения лучше использовать пассивные медные патчкорды (dac кабели)
dac кабель — MC2207130-001 (1 метр) или MC2207130-002 (2 метра).
Никакие трансиверы в этом случае не нужны. Смотреть на ebay, хотя на авито может что-то интересное пролетать
IB свитч mellanox is5022 (ebay)
Для Eth смотреть свитчи с qsfp портами. Скорее всего это будут большие железки для установки с стойку. На ебее есть интересные (и относительно недорогие) варианты, но из-за размера/веса и возможных проблем с таможней тащить их не очень интересно.

Еще особенность 40 гигабит — по сути это 4*10 гигабит агрегированных линка. Есть кабели которые позволяют разбивать 40 гигабитный порт на 4 по 10 гигабит (пример) но только со стороны свитча + требуется поддержки свитча
Также у мелланокса есть переходники для подключения в 40 гигабитный порт 10 гигабитных модулей (sfp+) MAM1Q00A-QSA

И еще здесь можно много интересного найти
1

Information

Rating
Does not participate
Registered
Activity