Pull to refresh
64
1.2

Programmer

Send message

я имею в виду что сама программа chat.exe выдает ошибку при загрузке этой модели.

Ну какая это теория всего...

Для начала, мы слишком привязаны к человеческому понятию "наблюдателя", и вообще к человеческому сознанию и квалиа. Мы не имеем опыта, отличающегося от человеческого. Это вносит в подобные рассуждения весьма сильную субъективность. К счастью, прогресс в этом направлении вполне возможен - это дальнейшее развитие искусственного интеллекта и исследования в области прямого подключения к мозгу (связи типа мозг-компьютер и мозг-мозг), а также возможный контакт с внеземными цивилизациями.

Сейчас нам кажется что есть "бытие" и "сознание", и мы пытаемся по образу и подобию математики построить некие аналогии, найти симметрию и гармонию в этом. Я сам этим увлекаюсь. Например, если сознание невозможно без бытия, то и бытие невозможно без сознания? Или например, такая ассоциация: чем отличается осознающее существо от философского зомби? Не тем ли, чем реальная Вселенная отличается от ее полной математической модели? Есть ли это отличие или его нет в каждом случае?

Т.е. нам субъективно кажется, что сознание и бытие достаточно глубоко связаны. А вот так ли это на самом деле - пока непонятно, но кажется, наука имеет шансы постепенно приблизиться к ответам на эти вопросы.

Ну кстати ggml-alpaca-30b-q4.bin там нет, а ggml-model-q4_0.bin, которая есть, не загружается.

Из всего этого эпизодически пользовался только Foursquare, и то потому что однажды пробила ностальгия по ВУЗу в котором учился, а теперь там поставили пропускную систему с вертушками - так просто не попасть, а фотографий не было ввиду того что тогда когда я учился смартфонов еще не было. Foursquare вместе с Instagram оказались основными источниками фоток "изнутри".

Когда речь идет о чем-бы то ни было облачном, нужно сразу писать платно это или бесплатно. Если платно - то сколько стоит, если бесплатно - то как зарегистрироваться, нужны ли иностранные номера и VPN и т.п.

Языковые модели это просто сверхкомпактное сжатие всего того, что написано людьми в интернете. Так что, все эти случаи абсолютно предсказуемы.

Кстати, вот интересные кадры из Матрицы 4: некий язык программирования и некая среда разработки. Судя по всему, в языке сочетается привычный нам код на некотором неизвестном языке, но с английскими идентификатоарми, операторами и скобочками, и матричный код.

Так он вроде и в первой был (знаменитый телефон-слайдер?). Но по крайней мере атмосферность там не сломали.

Обычно использую camelCase (для переменных/полей+методов) или PascalCase (для типов). В основном ориентируюсь на стиль Qt, т.к. нередко его использую. Слипшиеся слова как раз не трудно читать, просто не нужно делать их слишком длинными. Трудно - разлипшиеся, имя не воспринимается как единое целое, текст программы "обедняется" за счет использования только одного регистра вместо двух. Но к сожалению в С++ это почему-то стандартный формат для библиотек.

Первая Матрица гениальна во всем. Это совершенно особенная эстетика и атмосферность, уникальнейшее сочетание факторов, делающее ее особенным фильмом. Заниматься декомпозицией не хочу, но наверное важные факторы - и четкое, бунтарско-романтическое разграничение добра и зла, и харизматичные герои/злодеи, и невероятно качественные спецэффекты, не вызывающие ощущение картонных декораций (как во многих киберпанк-фильмах), и многое другое.

Вторая и третья - качественные продолжения, сохраняющие эстетику и атмосферность, хотя и не привносящие каких-то фундаментально новых идей.

Четвертая - вообще ни о чем, эстетика и атмосферность потеряны полностью.

Жду Аниматрицу-2, думаю и надеюсь что формат аниме гораздо лучше подходит для таких историй, чем сиквелы со звездными актерами, постаревшими на 20 лет.

Очевидно, что в рамках некоторого целочисленного знакового типа отрицательных чисел на 1 больше чем положительных, и поэтому у INT_MIN нет соответствующего парного числа. Но дополнительный код - самая простая реализация целых чисел, позволяющая в том числе повышать разрядность вычислений за счет цепочек сложения с переносом (ADD/ADC, SUB/SBB).

А вот что интересно. Существуют ли процессорные архитектуры с более сложными аппаратными реализациями целых чисел? Например, можно код условного "-128" объявить как целочисленный NaN, что может быть весьма полезно для аппаратной реализации "нуллабельности" (optional<int>). И появляется симметрия, -INT_MIN всегда будет равно INT_MAX и наоборот. Разумеется, такое режим не должен быть единственным, от классического дополнительного кода не следует отказываться. Но в качестве расширения, управляемого какими-то префиксами ассемблерных команд - почему бы и нет? И если идти по этому пути, то можно реализовать и еще режимы, например вычисления с насыщением.

Это что-то типа RAII в С++.

А вам нужен переводчик именно со всех языков на все?

Я к тому, что учитывая относительно скромные ресурсы домашних компов, все-же имеет смысл думать над языковыми моделями, заточенными под конкретное применение. Перевод (с указанием конкретных языков), программирование, точные науки, биология и медицина, гуманитарные знания... Это здорово сэкономит ресурсы или расширит возможности самой нейросети, позволив вместо универсальных знаний обо всем на свете на всех языках мира загрузить более глубокие - на английском или русском.

Ничто не мешает иметь на диске несколько таких моделей и перезагружать их по мере необходимости.

Переводчики - да, полезная функция, но если чем-то жертвовать для запуска на домашнем компьютере, я бы пожертвовал переводом между разными языками (все равно почти вся информация мира есть на английском, и онлайн-переводчики никто не отменял). А дома... нужно то, что по тем или иным причинам забанено корпорациями. Также как и раньше: что-то мы берем с официальных сайтов, а что-то качаем с торрентов и прочих p2p.

Почему людям неинтересно читать то что выдает ИИ? Мне интересно. Для меня языковые модели - потрясающее средство закрытия гештальта, связанного с получением знаний в интересующих меня областях. Индивидуальный профессор, который всё объяснит и покажет на примерах. Если бы такая штука была когда я получал высшее образование - я бы вне всякого сомнения учился бы только на "отлично" и пошел бы дальше в науку (и не потому что ИИ писал бы за меня курсовики - а именно потому, что это максимально быстрый и удобный способ разжевать любой непонятный момент в лекциях и учебниках, не ограничивая себя в количестве итераций и способах рассмотрения вопроса).

А еще у языковых моделей простой английский, читаешь практически как на русском, без словаря и даже не задумываешься.

Правильная ссылка https://huggingface.co/Pi3141/alpaca-30B-ggml

а еще точнее https://huggingface.co/Pi3141/alpaca-30B-ggml/tree/main

Модель 13B неплохо работала на 32 гигах оперативки (хоть и медленно, но зато более-менее адекватно, даже код писала), вечером попробую 30B.

Вообще, тут многие экспериментируют с русским языком. Безусловно, для корпораций, у которых неограниченные ресурсы, это нужно и логично - и рано или поздно они доведут модели до совершенства на всех языках. А вот для домашнего применения, нужны ли данные на всех языках? Ведь где-то там в модели не только русский, но и немецкий, французский, испанский и т.д., возможно даже японский и китайский. И всё это утяжеляет модель. Интересно, возможно ли как-то профильтровать модель по языкам (самое простое - по кодировке входных токенов), оставив только английский?

Может они там вкладывают немалые деньги в биотехнологии омоложения, и уже есть результаты, а мы и не знаем)

Если предположить, что благодаря истинной (квантовой) случайности для каждого момента настоящего возможно множество вариантов будущего, то почему бы не быть и обратному - для каждого момента настоящего возможно множество вариантов прошлого, приводящих к данному настоящему. Но у людей настолько жестко в мозгах зашита концепция "одномерного однонаправленного времени", что отказаться от нее не так уж и просто. Правда, большинству даже многомерное время представить практически невозможно, хотя многомерное (>3) пространство - вполне можно.

Ну если обобщать, то это касается не только C#. Другие современные высокоуровневые компилируемые языки со статической типизацией, такие как Go и Swift, также обладают этими преимуществами - как перед более низкоуровневыми С/С++, так и перед интерпретируемыми динамическими JS/Python.

Ну это понятно почему - без явных релизов очередной версии с очередным номером интерес к продукту падает, что плохо сказывается на продажах.

Information

Rating
1,708-th
Registered
Activity