Как стать автором
Обновить

Бум ИИ с открытым исходным кодом зиждется на подачках крупных технологических компаний. Как долго он продлится?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров6.4K
Всего голосов 14: ↑13 и ↓1+13
Комментарии14

Комментарии 14

Цифровой коммунизм какой то, разговорный ИИ всем и каждому..
Как дети ей богу. Кто код оплатил тот его и танцует и если вам дали им попользоваться то это не значит чва м что то должны и стоит пытаться отхватить руку по локоть в порыве жадности и щедрости за чужой счет.

Да, но... Мир не про абсолютно розовых пони. "Кто автомат купил..." - и с ИИ так же, даже тех кому он не нужен, вовлекут владеющие.

А я не сторонница открытого кода», — говорит Маргарет Митчелл, главный специалист по этике Hugging Face.

Что она делает в компании, занимающейся открытым кодом? По ошибке устроилась или диверсант?

Статья в целом без аргументов. Цитаты, цитаты, цитаты. Почему-то разработчикам закрытого софта не удалось пока занять серверный сегмент. Но удалось - десктопный и частично мобильный. Здесь тоже не подскажешь - исследователям удобнее изучать открытые модели. Закрытые модели может изучать только нанятый персонал, а всех энтузиастов не наймёшь.

 Здесь тоже не подскажешь - исследователям удобнее изучать открытые модели. Закрытые модели может изучать только нанятый персонал, а всех энтузиастов не наймёшь.
К тому же компании нанимают людей сделавших существенный вклад в открытый проект, т.е. бонусом они получают квалифицированного и понимающего проект человека

Почему-то разработчикам закрытого софта не удалось пока занять серверный сегмент.

Это всё довольно условно. Приличный опенсорс основательно контрибьютится людьми на щедрой зарплате корпораций. Собственно, только поэтому он становится приличным из поделок энтузиастов.

Опенсорс не означает бесплатную разработку. Он означает открытый код. Никакой условности. Сила не в борьбе людей против корпораций, а в открытом сотрудничестве.

"OpenAI прикрыл лавочку"

17 мая 2023: OpenAI готовит к выпуску open source модель

"Утекшее" письмо от Google расписывает почему утечка LLaMA выгодна ее создателям. А в условиях когда на ИИ пока никто на зарабатывает (кроме Nvidia и псевдо "промт-коучей") экспериментов тех гигантов с open source будет больше.

Может криптаны подкинуть идею как пересчитывать модели кластерами из асиков... Но а вообще openPron это мега тема для индустрии. Никаких согласий, никаких живых моделей, никаких ограничений в анатомии! Золотая жила порока прям!

с distributed training (ML) думаю обучение можно запускать на асиках, утюгах и тостерах

Мне кажется просто контракт с военщиной в целях "национальной безопасности". Но пасту в тюбик запихать будет уже сложно.

Сообществу нужно срочно думать на тему децентрализованной свободной нейросети. И действовать в этом направлении.

Как я себе это представляю: некий алгоритм на основе криптовалюты, конвертирующий личный потраченный вычислительный ресурс в какие-то монеты. И возможность оплаты этими монетами вычислительного ресурса всей сети в целом при выполнении запросов. Наконец-то майнинг обретет практический смысл. Разумеется, монеты можно будет и купить обычным способом.

Никакой цензуры. Иными словами, языковая модель должна свободно выдавать ответы на любые запросы без каких-либо ограничений, а модели генерации медиаконтента - генерировать любой контент аналогично без каких либо ограничений как на запросы, так и на обучающий материал.

И никакого копирайта. Обучение на материалах либгена и сайхаба, медиаконтенте с торрентов и вообще на всем, до чего можно дотянуться в Интернете. Правда, хорошо бы еще снабжать входные данные некими тегами источника (научная книга или комментарий в соцсети), которые бы как-то сохранялись в нейросети.

Все это разумеется должно быть децентрализовано и с открытым исходным кодом. Задача архисложная, я даже представить не могу реально ли это вообще:) Ведь по сути тут надо скрестить очень разные области: нейросети - это вычисления, требующие огромных ресурсов, но при этом они криптографически неверифицируемые. А нужно сделать так, чтобы никто не мог обмануть систему и выдавать мусор вместо результатов реальных вычислений. Гомогенное шифрование? Возможно, но оно затормозит все вычисления на несколько порядков.

ИМХО гораздо более экономично : распределять вычисления по блокам с избыточностью. Т.е. чтобы раздатчик задачи давал блоки в разные участки сети, чтобы каждый блок был вычислен несколько раз. Если результаты сходятся - значит вычисления правильные. А если есть разногласия - то либо отбрасывать и вычислять заново на новых узлах, либо принимать результаты кворумом.

Да, тоже вариант. А если расширить эту идею, возникает концепция децентрализованной сети доверия, то есть каким-то узлам мы доверям больше, каким-то меньше. Рейтинги и цифровые подписи узлов уже можно завернуть в блокчейн и криптографию. Оценка в конечном итоге исходит от пользователей.

ps в предыдущем комментарии я имел в виду конечно гомоморфное шифрование.

Сразу вспомнилась недавняя статья в NYT, о том как в киндлах уже купленные книги без предупреждения меняются на отредактированные версии - вычищаются расистские обороты, шуточки над лишним весом, и разное другое нехорошее, что нужно скрывать от взоров читателей.

Вопрос цензуры не теряет популярности и в эпоху ИИ и то что раньше вызывало возмущение, на фоне происходящего вызывает лишь саркастическую усмешку.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий