Comments / Profile of nivorbud / Habr

How to become an author

User

Profile Publications Comments 572Bookmarks

Как заказчику или работодателю получить права на ПО, которое создано по его заказу или поручению

nivorbud Aug 14 at 09:29

В некоторых случаях, если проект разрабатывается на базе сторонних технологий или фреймворков, могут потребоваться дополнительные лицензии или разрешения.

Не в некоторых случаях, а всегда. Никто сейчас с нуля код не пишет. Имхо, это ключевой момент, радикально влияющий на цену и который многие заказчики не понимают. Фрилансер или компания-разработчик основывают всю свою работу не только на стороннем софте, но и на своем собственном - за много лет накапливаются модули, библиотеки, движки и прочие универсальные готовые решения-инструменты. На базе этого и пишется код. Никто в здравом уме не передаст исключительные права на всё это. Поэтому считаю, что очень важно точно определить, на что именно передаются авторские права, а на что не передаются, а передаются на неисключительных условиях. Если же речь вести о передаче всех исключительных прав на все компоненты, то цена будет заоблачной, ибо это означает передачу разработчиком всего своего многолетнего труда и по сути запрет на дальнейшую деятельность.

Освоение любой темы с помощью искусственного интеллекта и метода Фейнмана

nivorbud Aug 9 at 10:08

А как это выглядит?

Когда сыну в школе потребовалось быстро написать доклад по одноклеточным организмам, ИИ всё написал очень хорошо, профессионально, но... к одноклеточным уверенно, без доли сомнений, причислил и вирусы.

РЖД, «Аэрофлот», «Автодор» и другой крупный бизнес раскритиковали законопроект об оборотных штрафах за утечки данных

nivorbud Jul 22 at 16:27

А уже нельзя не собирать... Для этого недавно соответствующий закон принят об "авторизации" клиентов. Как минимум, емэйл/телефон собирать придется.

РЖД, «Аэрофлот», «Автодор» и другой крупный бизнес раскритиковали законопроект об оборотных штрафах за утечки данных

nivorbud Jul 22 at 15:40

Открыл сейчас законопроект:

Действия (бездействие) оператора, повлекшие неправомерную передачу (предоставление, распространение, доступ) информации, включающей персональные данные от одной тысячи до десяти тысяч субъектов персональных данных, и (или) от десяти тысяч до ста тысяч уникальных обозначений сведений о физических лицах, необходимых для определения таких лиц (далее - идентификаторы), если эти действия (бездействие) не содержат признаков уголовно наказуемого деяния, - влечет наложение административного штрафа на граждан в размере от ста тысяч до двухсот тысяч рублей; на должностных лиц - от восьмисот тысяч до одного миллиона рублей; на юридических лиц - от трех миллионов до пяти миллионов рублей.

Да, минимум - 3 миллиона для организаций за утечку 1000 перс.данных или 10000 идентификаторов этих данных (сюда, думаю, как раз емэйлы и телефоны попадают). Так что для маленького интернет магазинчика (как организации) предлагаемый минимальный штраф - 3 млн. Для ИПэшника - от 800 тыщ, для физика - от 100 тыщ.

А за повторное нарушение:

Совершение административного правонарушения, предусмотренного частями 12-14 настоящей статьи, лицом, подвергнутым административному наказанию за административное правонарушение, предусмотренное частями 12 - 14 настоящей статьи, - влечет наложение административного штрафа на граждан в размере от четырехсот тысяч до шестисот тысяч рублей; на должностных лиц - от двух миллионов до четырех миллионов рублей, на юридических лиц - от одной десятой процента до трех процентов совокупного размера суммы выручки, полученной от реализации всех товаров (работ, услуг), за календарный год, предшествующий году, в котором было выявлено административное правонарушение, либо за предшествующую дате выявленного административного правонарушения часть календарного года, в котором было выявлено административное правонарушение, если правонарушитель не осуществлял деятельность по реализации товаров (работ, услуг) в предшествующем календарном году, но не менее пятнадцати миллионов рублей и не более пятисот миллионов рублей.

Мда... с таким законом, мне кажется, любая организация будет находиться под угрозой банкротства. А мелкому бизнесу грозит мгновенное банкротство.

РЖД, «Аэрофлот», «Автодор» и другой крупный бизнес раскритиковали законопроект об оборотных штрафах за утечки данных

nivorbud Jul 22 at 15:20

А что является персональными данными - вопрос мутный, не имеющий однозначного ответа. Некоторые даже куки притягивают к персональным данным.

РЖД, «Аэрофлот», «Автодор» и другой крупный бизнес раскритиковали законопроект об оборотных штрафах за утечки данных

nivorbud Jul 22 at 15:05

Меня больше не оборотные штрафы беспокоят, а минимальный порог, который составляет, если не ошибаюсь, три миллиона. А штрафы эти планируется применять, насколько помню, при утечке всего более 1000 учетных записей.

Предположим, у вас небольшой форум или маленький интернет-магазинчик с парой тысяч участников/клиентов (мыло, телефон, адрес доставки). Получается, в случае утечки этому микробизнесу (или форуму) кранты?

Также не понятно, как определять, что обнаруженный файл с утекшими данными содержит настоящие данные, а не фейковые? Следствие полноценное будут проводить? Или с ходу штрафовать?

Деньги — чужие, проблемы – Ваши

nivorbud Jul 19 at 18:04

Имхо, всё достаточно просто - отправлять деньги назад только отправителю. Да, оповестить свой банк об ошибочном платеже и о согласии о возврате. А отправитель пусть сам доказывает, что он является настоящим отправителем. Любое недовольство звонящего должно парироваться простой логикой: вы не знаете и не можете знать, что звонящий является отправителем, может там уже очередь из "отправителей" стоит...

Дневник импортозамещения. Linux GUI — ложное искушение

nivorbud Jul 12 at 10:37

Консоль имеет огромное количество преимуществ. Даже на уровне ощущений в консоли намного комфортнее работать.

Сервера для администрирования территориально разбросаны по всему миру. Необходимость срочного администирования зачастую возникает в самых неожиданных местах, с неустойчивым мобильным интернетом. ГУИ требует очень хорошего канала, а консоль может быстро работать даже при очень плохом канале.

Далее... Повторять действия (установку/настройку софта) по документации/сайтам в тыщу раз удобней через консоль. Просто копипастишь последовательность команд и... всё.

Далее... Очень удобный и универсальный принцип маленьких утилит, выполняющих одну функцию, и которые можно по конвейеру объединять в цепочки. Что также способствует простому копипасту: готовые справочные решения представляются простой текстовой строкой, которую скопировать и вставить - дело нескольких секунд.

Например, надо сохранить на будущее процесс установки сложного софта с кучей библиотек и прочего окружения. Проще в блокноте написать список этих команд, да и всё. По ним повторить установку/настройку очень просто.

Также в книгах, документациях и на справочных сайтах... Одно дело написать несколько строк (консольных команд) и другое дело - размещать на нескольких страницах огромные скриншоты с полями, переключателями, кнопками...

Еще... консоль - универсальный способ работы с любыми текстовыми конфигурационными файлами. А ГУИ такой универсальности не имеет.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 13 at 19:45

Да, типа того имел ввиду. Правда БЯМ в этом случае будет являться по большей части основой для генерации ответов на естественном языке. А это необязательно для большинства применений.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 13 at 19:43

Что такое "узкоспециализированные экспертные системы" ?

Узкотематические. Например, какого нибудь медицинского направления. Но уж никак не обо всём на свете.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 21:10

Автокомплит-база знаний и умений, которая точно также как и отвертка может использоваться.

Несомненно. Но при одном условии - эта "отвертка" должна использоваться специалистом, понимающим что и как этой отверткой надо закручивать. (И еще я бы смотрел в сторону узко-специализированных экспертных систем - более компактных и более точных. Думаю, за ними реальное будущее).

Но, как обычно бывает, всё закончится тем, что этим инструментом массово будут пользоваться дилетанты, слепо доверяющие результатам ИИ. На волне хайпа не разбирающиеся в теме руководители будут массово внедрять модные БЯМы в своих организациях. Потом... придется такое использование расхлебывать... Наверняка после несчастных случаев и прочего вреда пойдет волна судебных исков, потом введут жесткое законодательное регулирование и т.д.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 18:05

Где я обвинял технологию?

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 17:47

Но для меня это уже ОЧЕНЬ серьёзное применение! Если эта шушлайка поможет мне решить сложную задачу не за 5 рабочих дней, а подсказками наведëт на более интересные варианты и я решу её за 4 рабочих дня, то по факту она экономии компании средства и увеличивает эффективность работы эксперта на 10-25%, а дальше вопрос только в оценке финансовой эффективности.

Если бы именно в таком ключе эти языковые модели позиционировались, то нет вопросов. Моя претензия к хайпу на этой теме, к утверждениям, что нейронки скоро заменят многие профессии.

В принципе да, можно будет полностью заменить например врачей экспертными системами, уже сейчас можно, но такого будущего не хотелось бы.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 17:41

Только если у вас есть доступ к экспертам, которые готовы работать бесплатно. Для остальных это будет стоить $390 за час работы. Жадная нейронка возьмёт $0,39 за страницу и будет работать несколько секунд.

Разница огромна. Рассмотрим ку примеру юридическую консультацию.

За $0,39 вы получите размытый обобщенный ответ, касаемо ситуаций схожих с вашей.

За $390 вы получите подробную консультацию конкретно по вашей проблеме.

Но первый вариант я тоже не отметаю. Например, если вы сами решили заняться своей проблемой, то можно начать и с первого варианта - с ИИ: получить направление для дальнейшего углубления в тему. Но это уже анализ, для анализа это полезный инструмент. Но тупо доверять таким результатам (без проврки и анализа) я бы не стал.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 17:29

С практической? Недавно сын доклад готовил по биологии (9 класс). Всё хорошо, всё складно и структурно, но... ИИ причислил к одноклеточным организмам также и вирусы. Сын даже глазом не моргнул, а мне бросилось в глаза...

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 17:22

Но для меня это уже ОЧЕНЬ серьёзное применение! Если эта шушлайка поможет мне решить сложную задачу не за 5 рабочих дней, а подсказками наведëт на более интересные варианты и я решу её за 4 рабочих дня, то по факту она экономии компании средства и увеличивает эффективность работы эксперта на 10-25%, а дальше вопрос только в оценке финансовой эффективности.

Да, верно, но... для этого не нужны большие языковые модели. В этом случае скорей всего будут более оптимальны более простые специализированные системы.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 16:36

А что вы будете делать, если эту задачу будет решать человек? Чем отличается некачественный результат от 80% обывателей и ИИ? Какое именно свойство есть у человека и нет у машины, из-за которого его работу обесценивают?

Некачественный результат от качественного отличается источником результата - от обывателя искомый ответ или от эксперта, причем с фамилией, именем, отчеством.

Давайте рассмотрим ситуации решения проблемы:

1) Вы получаете в ответ от ЧатЖПТ некий сгенерированный складный текст - словесно-частотную компиляцию из множества материалов разного качества. По сути получаете подражание экспертам, но не экспертное мнение.

2) Вы получаете от поисковой (или экспертной) системы несколько экспертных материалов от известных в своей области специалистов.

Какой вариант выберите? Я однозначно выберу второй, даже если это будет касаться простых справочных данных. Но понимаю, что большинство обывателей ничтоже сумняшеся выберут первый вариант. Со всеми вытекающими...

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 13:23

Предположим, вам надо принять ответственное решение в теме, в которой вы не являетесь экспертом. Вы спросили нейросеть, получили ответ. Что вы с этим ответом делать будете, если не можете оценить его достоверность?

Я бы предпочел ответ в виде выбора подходящего решения из набора готовых экспертных решений, а не решение полностью сгенерированное ИИ "близко по смыслу". А зачастую ведь каждое слово, каждый термин имеет значение.

Мало того, лучшие решения от openai уже подошли к такому порогу, что чтобы уличить их в ошибке нужно быть человеком выше среднего по уровню интеллекта и огромным багажом знаний (за исключением известных ограничений уже технологии)... мало того я уверен что большинство без гугла (т.е. еще один ИИ по проще) мало что в принципе смогут современному ИИ противопоставить.

А сопоставлять надо именно с системой классического поиска по справочникам, которые на выходе дают подборку экспертных материалов.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 11:04

(Кажется у mistral) были статьи про интерпретируемость, они нашли способ искать, какие веса за какие знания отвечают, и управлять ими без подмены запроса.

Думаю, это несколько иное. Я про полную ясность причин конкретного результата. Не "потому что веса так сошлись", а про понятную цепочку выводов. Например, когда суд спрашивает банк: поясните, по каким конкретным причинам/признакам/логике ваша система заблокировала счета вашего клиента (в результате чего ему были нанесены убытки)?

Направлению от силы 2 года исследований, это ничто для такой сложной отрасли, особенно когда минимальный стартап в ней требует многомиллионные вложения (гаражом не отделаешься). Откуда такие абсолютистские высказывания?

Это же нейронные сети. Им уже много десятков лет. Проблемы эти давно известны.

Вот скажи, 3-5 лет назад, можно было предположить что программа сможет по изображению мема или шутки, дать пояснение этой шутке на естественном языке?

Давайте начистоту. Применение нейронных сетей в поисковых системах, по вашему, улучшило поиск? По мне поиск стал значительно хуже, результат стал сильно размыт. Сейчас стало сложно искать конкретную точную информацию. например, в запросе среди прочего указываешь Debian 11, а в ответ получаешь размытые результаты по любым линуксам, по похожим проблемам, но не по конкретному линуксу и конкретной проблеме. Постоянно приходится использовать кавычки и минусы для точного поиска, да и это зачастую не помогает.

С другой стороны, нейросети в поиске - идеальное решение для обывателя, когда домохозяйка, не зная толком, что она хочет, не зная как сформулировать запрос, вбивает фразу типа: хочу что-нибудь про котиков... и получает размытый, но разнообразный результат с котиками. Домохозяйка довольна.

Я проводил тесты с нейронными сетями для текстового поиска, тематической классификации/кластеризации и пр. Пришел к выводу, что результат для многих серьезных применений не годится или годится в ограниченном упрощенном виде.

Первые результаты, да, вызывали эффект вау: находятся документы соответствующие смыслу запроса, и это при том, что в этих текстах нет ни одного слова из запроса. Однако, стал замечать, что что-то в этих результатах не то. С одной стороны, имеется хорошее совпадение по смыслу, но с другой стороны - всё как-то размыто, перекошено в сторону обобщения, т.е. практической пользы мало. В итоге предпочел простые, но точные ответы, пусть и за счет повышенных требований к запросам и некоторой потери полноты. Т.е. остановился на более простых алгоритмах.

И речь не о поиске картинок в базе данных, а буквально, набросай мем от руки, и оно дает решение!

Проблема в том, что от этого "решения" мало пользы - вы не можете полагаться на этот ответ, не будучи экспертом в этой теме (теме заданного вопроса). Повторюсь, для развлечений это годится, для эксперта, способного оценить ответ, тоже годится, а для серьезных применений за пределами экспертной оценки - вряд ли.

Собираем компьютер для работы с большими языковыми моделями

nivorbud Jun 12 at 09:09

Я бы не экономил прежде всего на блоке питания и корпусе. БП на 850W - это всё же маловато, впритык для 4090. Корпус тоже надо выбирать тщательно - с учетом систем охлаждения.

Материнка бюджетная нежелательна - там мало линий PCI, а это важно при мощной видюхе и нескольких nvme-дисках.

1/2ТБ nvme диск - это ни о чем, очень мало для экспериментов с разными моделями.

ЗЫ:

Я не вижу таких уж огромных перспектив у больших языковых моделей. Имхо, это по большей мере хайп, пузырь. Основную проблему вижу в неинтерпретируемости результатов, это черный ящик. Для баловства - да, для развлечений - да, для анализа данных - да, для серьезных применений - нет! Хотя на последнее видимо наплюют... со всеми вытекающими последствиями. В большинстве случаев нужно что-нибудь попроще, например надежный классификатор с интерпретируемыми результатами. А складность речи - это прикольно, конечно, но это необязательный фактор.

3

4 5 ...