Как стать автором
Обновить
3
0

Пользователь

Недавно в Reddit'е обсуждали модель от китайской Deepseek. Там интересные моменты есть, вроде того, что она называет Тайвань частью Китая и что её ответы должны соответствовать политике КНР, которое оно называет справдлевивыми и никогда не ошибающимся.

А есть же уже национальный корпус русского языка - https://ruscorpora.ru/

Им занимается РАН. Не совсем понял, для чего этот проект.

Давно бросил читать переводы, т.к. 1) постоянно приходится мысленно переводить обратно, чтобы понять, что там имел в виду автор и как это понял переводчик 2) знания английского достаточно, чтобы понимать в оригинале.

Каплей стало, когда в очередной раз читая книгу на русском, не мог понять, что имеется в виду под "потоком": thread, stream или flow...

Допустим, 100 копий монолита на 100 серверах. Поставить впереди лёгонькую проксю и размазывать запросы по нодам. В какой момент мне нужен микросервис?

По моему опыту микросервисы именно про команды: если у вас стопицот разработчиков и им тесно в монолите (постоянные мерж-конфликты, размазанная ответственность, side effects, конфликтный деплой).

Иначе же можно просто запилить модульный монолит и не задумываться о всех головных болях микросервисов.

Есть ли информация, собираются ли открыть доступ к API? Хотелось бы интегрировать в продукты отечественную сеть

Они там хитрят малость. В отчет не включено отопление, например.

Просто ищешь в Censys по "openai.com" (или полный endpoint к API) Большое число проектов делают запросы в openai на фронте, и соответственно там же хардкодят ключи, в JS. Но большая часть таких ключей триальные. Еще один способ это смотреть в DevTools/Network запросы у AI-проектов, особенно стартапов. Часть из них тоже хардкодят ключи на фронте. И там, как правило, нетриальные ключи.

Llama вообще не чат-бот, а чат-боты, сделанные на его основе, к сожалению, даже до gpt-3.5 не дотягивают.

А вы гоняли модельки-то? Vicuna 13b на основе Llama как чатбот, по ощущению - на уровне GPT3.5 (если использовать рекомендованный формат промтов). Я их в том числе стравливал друг с другом, и Vicuna держалась молодцом. Но это именно как чатбот, поболтать о разном. Основные минусы - у Vicuna хуже познания о внешнем мире, и она хорошо отвечает только на английском.

Разумеется апи для миллионов требует больше железа.

Стоимость инференса не проблема, если запускать на клиенте, что уже реальность.

Через Censys и Shodan можно найти сотни ключей в открытом доступе.

В больших моделях большое число параметров стоит в нули, т.е. не участвуют в выводе никак. Проект Chinchilla показал, что можно улучшать результат не увеличением числа параметров, а увеличением объёма данных для обучения. Vicuna на 13 миллиардов по ощущениям как чатбот/генератор текстов вполне на уровне GPT3.

На Winforms такое можно накостылять за час :)

Децентрализованные ИИ, если и возможны, то пока на грани фантастики.

Есть проект:

https://github.com/bigscience-workshop/petals

Судя по описанию, идея - запускать модель BLOOM распределённо на машинах добровольцев, которые подключают свои GPU в пул

Первая ассоциация - старая уличная вывеска, у которой обвалились части букв. Особенно забавно, когда это действительно вывеска на здании Nokia

В целом само по себе ничего в этом плохого нет - как-то формализовать официальный язык властей. Язык чиновников должен быть понятен всем, чтобы не было недопониманиия. Исполнение только типично российское - через закон и запреты, с антизападной изюминкой. По уму это должно быть что-то вроде официального документа с рекомендациями ("не используйте сленг и просторечия в нормативных актах и переписке" и т.п.), без всяких специальных законопроектов.

Я бы лучше издал закон удалить канцеляризмы из их речи: "нами было принято решение" => "мы решили". Короче и понятнее :)

Президент нерусское слово и Америка тоже. Ближайший русский аналог для первого - это Вождь

Полный аналог это председатель. "Президент" происходит от латинских prae- "перед-, пред-" и sideo "сидеть"

P.s. Сверху написали уже

А что мешает им просто передать исходники?

Когда нейросети поймут, сколько в действительности у людей должно быть пальцев и ног. У меня получалось генерировать картинки такого типа (в научных целях, конечно) через Stable Diffusion, и, скажем так, получался хоррор в стиле "фестиваль мяса", что сильно на любителя

Чем крипта отличается от билетов МММ, кроме того, что перешли на цифру?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность