Давно бросил читать переводы, т.к. 1) постоянно приходится мысленно переводить обратно, чтобы понять, что там имел в виду автор и как это понял переводчик 2) знания английского достаточно, чтобы понимать в оригинале.
Каплей стало, когда в очередной раз читая книгу на русском, не мог понять, что имеется в виду под "потоком": thread, stream или flow...
По моему опыту микросервисы именно про команды: если у вас стопицот разработчиков и им тесно в монолите (постоянные мерж-конфликты, размазанная ответственность, side effects, конфликтный деплой).
Иначе же можно просто запилить модульный монолит и не задумываться о всех головных болях микросервисов.
Просто ищешь в Censys по "openai.com" (или полный endpoint к API) Большое число проектов делают запросы в openai на фронте, и соответственно там же хардкодят ключи, в JS. Но большая часть таких ключей триальные. Еще один способ это смотреть в DevTools/Network запросы у AI-проектов, особенно стартапов. Часть из них тоже хардкодят ключи на фронте. И там, как правило, нетриальные ключи.
Llama вообще не чат-бот, а чат-боты, сделанные на его основе, к сожалению, даже до gpt-3.5 не дотягивают.
А вы гоняли модельки-то? Vicuna 13b на основе Llama как чатбот, по ощущению - на уровне GPT3.5 (если использовать рекомендованный формат промтов). Я их в том числе стравливал друг с другом, и Vicuna держалась молодцом. Но это именно как чатбот, поболтать о разном. Основные минусы - у Vicuna хуже познания о внешнем мире, и она хорошо отвечает только на английском.
Разумеется апи для миллионов требует больше железа.
Стоимость инференса не проблема, если запускать на клиенте, что уже реальность.
В больших моделях большое число параметров стоит в нули, т.е. не участвуют в выводе никак. Проект Chinchilla показал, что можно улучшать результат не увеличением числа параметров, а увеличением объёма данных для обучения. Vicuna на 13 миллиардов по ощущениям как чатбот/генератор текстов вполне на уровне GPT3.
В целом само по себе ничего в этом плохого нет - как-то формализовать официальный язык властей. Язык чиновников должен быть понятен всем, чтобы не было недопониманиия. Исполнение только типично российское - через закон и запреты, с антизападной изюминкой. По уму это должно быть что-то вроде официального документа с рекомендациями ("не используйте сленг и просторечия в нормативных актах и переписке" и т.п.), без всяких специальных законопроектов.
Когда нейросети поймут, сколько в действительности у людей должно быть пальцев и ног. У меня получалось генерировать картинки такого типа (в научных целях, конечно) через Stable Diffusion, и, скажем так, получался хоррор в стиле "фестиваль мяса", что сильно на любителя
Pinta продвинутее MS Paint и скорее клон Paint.NET
Но у меня от неё плохие воспоминания, потому что почти на всех Линукс-дистро/машинах, которые у меня были, она стабильно падала и зависала с какой-то ошибкой в недрах mono. Оставила впечатление кривого недоделанного поделия.
Непонятно, на основании чего выносятся такие решения. Договоров же нет никаких, что Гугл что-то обязуется. Защита потребителя? Вроде Ютуб в целом бесплатный, и никто никому ничего не должен. Интересно посмотреть, как выворачивают закон. На что ссылаются?
Давно бросил читать переводы, т.к. 1) постоянно приходится мысленно переводить обратно, чтобы понять, что там имел в виду автор и как это понял переводчик 2) знания английского достаточно, чтобы понимать в оригинале.
Каплей стало, когда в очередной раз читая книгу на русском, не мог понять, что имеется в виду под "потоком": thread, stream или flow...
Допустим, 100 копий монолита на 100 серверах. Поставить впереди лёгонькую проксю и размазывать запросы по нодам. В какой момент мне нужен микросервис?
По моему опыту микросервисы именно про команды: если у вас стопицот разработчиков и им тесно в монолите (постоянные мерж-конфликты, размазанная ответственность, side effects, конфликтный деплой).
Иначе же можно просто запилить модульный монолит и не задумываться о всех головных болях микросервисов.
Есть ли информация, собираются ли открыть доступ к API? Хотелось бы интегрировать в продукты отечественную сеть
Они там хитрят малость. В отчет не включено отопление, например.
Просто ищешь в Censys по "openai.com" (или полный endpoint к API) Большое число проектов делают запросы в openai на фронте, и соответственно там же хардкодят ключи, в JS. Но большая часть таких ключей триальные. Еще один способ это смотреть в DevTools/Network запросы у AI-проектов, особенно стартапов. Часть из них тоже хардкодят ключи на фронте. И там, как правило, нетриальные ключи.
А вы гоняли модельки-то? Vicuna 13b на основе Llama как чатбот, по ощущению - на уровне GPT3.5 (если использовать рекомендованный формат промтов). Я их в том числе стравливал друг с другом, и Vicuna держалась молодцом. Но это именно как чатбот, поболтать о разном. Основные минусы - у Vicuna хуже познания о внешнем мире, и она хорошо отвечает только на английском.
Стоимость инференса не проблема, если запускать на клиенте, что уже реальность.
Через Censys и Shodan можно найти сотни ключей в открытом доступе.
В больших моделях большое число параметров стоит в нули, т.е. не участвуют в выводе никак. Проект Chinchilla показал, что можно улучшать результат не увеличением числа параметров, а увеличением объёма данных для обучения. Vicuna на 13 миллиардов по ощущениям как чатбот/генератор текстов вполне на уровне GPT3.
На Winforms такое можно накостылять за час :)
Есть проект:
https://github.com/bigscience-workshop/petals
Судя по описанию, идея - запускать модель BLOOM распределённо на машинах добровольцев, которые подключают свои GPU в пул
Первая ассоциация - старая уличная вывеска, у которой обвалились части букв. Особенно забавно, когда это действительно вывеска на здании Nokia
В целом само по себе ничего в этом плохого нет - как-то формализовать официальный язык властей. Язык чиновников должен быть понятен всем, чтобы не было недопониманиия. Исполнение только типично российское - через закон и запреты, с антизападной изюминкой. По уму это должно быть что-то вроде официального документа с рекомендациями ("не используйте сленг и просторечия в нормативных актах и переписке" и т.п.), без всяких специальных законопроектов.
Я бы лучше издал закон удалить канцеляризмы из их речи: "нами было принято решение" => "мы решили". Короче и понятнее :)
Полный аналог это председатель. "Президент" происходит от латинских prae- "перед-, пред-" и sideo "сидеть"
P.s. Сверху написали уже
А что мешает им просто передать исходники?
Когда нейросети поймут, сколько в действительности у людей должно быть пальцев и ног. У меня получалось генерировать картинки такого типа (в научных целях, конечно) через Stable Diffusion, и, скажем так, получался хоррор в стиле "фестиваль мяса", что сильно на любителя
Чем крипта отличается от билетов МММ, кроме того, что перешли на цифру?
Pinta продвинутее MS Paint и скорее клон Paint.NET
Но у меня от неё плохие воспоминания, потому что почти на всех Линукс-дистро/машинах, которые у меня были, она стабильно падала и зависала с какой-то ошибкой в недрах mono. Оставила впечатление кривого недоделанного поделия.
Непонятно, на основании чего выносятся такие решения. Договоров же нет никаких, что Гугл что-то обязуется. Защита потребителя? Вроде Ютуб в целом бесплатный, и никто никому ничего не должен. Интересно посмотреть, как выворачивают закон. На что ссылаются?