Комментарии / Профиль Krypt / Хабр

Пользователь

ПрофильСтатьиПостыНовостиКомментарии2.1K

Почта Mail.ru нерадиво блокирует целые проекты и теряет свою аудиторию

Krypt 1 окт 2024 в 18:33

Как бы логично что у вас в системе такое написанно: потому что она уже приняла такое решение. Вопрос в корректно ли она его приняла.

Итого, ваш ответ - отписка. Ну или ответ Капитана Очевидности, я не знаю...

Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

Krypt 30 сен 2024 в 10:37

На удивление да, 3 дня назад причём

Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

Krypt 29 сен 2024 в 21:38

Если вы хотите придраться к опечаткам, то в этом сообщении есть ещё как минимум три. Удачи в поисках.

Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

Krypt 28 сен 2024 в 21:08

Intel феерично зафакапили 13 и 14 поколения процессоров (постепенно в течении 6-24 месяцев выходят из строя из-за проблемного управления питанием, которое запрашивает завышенное напряжение). Им по сути гризит возврат по горантии каждого второго процессора выпущенного за последние 2 года. Я честно говоря не знаю, что и тут может спасти, кроме может быть прямого вмешательства США ("too big to fail").

Малые числа, большие возможности: как плавающая запятая ускоряет ИИ и технологии

Krypt 28 сен 2024 в 20:58

По моим (делитанстским) наблюдениям, бОльшее значение чем количество параметров имеет сколько памяти под эти параметры используются.

То есть, при одинаковом объёме используемой памяти модель с малым числом параметров в f16 (float 16 bit) даст такое же качество как Q4 (int 4 bit) с бОльшем количеством.

Многие отзываются, что Llama3 сильно страдает от квантования, например. Лично я замечаю разницу между f16 и Q6К - Q6K намного быстрее теряет когерентность и перестаёт следовать коммандам в длинных чатах.

Пользователи сообщили, что YouTube заработал в России без ограничений по замедлению у некоторых провайдеров

Krypt 21 сен 2024 в 08:45

"Был полностью заблокирован и продолжает быть" (Ростелеком)

Страницы загружаются, видео никогда не стартует.

Объективная оценка кандидатов: ключ к эффективному рекрутингу и успешной команде

Krypt 21 сен 2024 в 08:38

Вот последнее как раз решается просто - собеседование с камерой и созвоны с камерой позже, по крайней мере первое время (некоторые люди не любят использовать камеру по разным причинам).

Распределённый инференс llama.cpp через RPC

Krypt 17 сен 2024 в 00:12

Ну вообще по поводу быстродействия вопрос вполне себе практичный: как альтернатива, вы можете нафигать в систему ssd до сатурации pci-e по скорости и использовать прямой доступ GPU к этим самым ssd (nvidia gpu это умеют). Другой вопрос сколько это стоить будет, но "не сильно много"... А то llama3 q8 70b на CPU я тоже запустит могу, со скоростью 1.2 token/sec...

Распределённый инференс llama.cpp через RPC

Krypt 14 сен 2024 в 22:17

Любопытства ради: а какова производительность такого подхода? Скажем, 2 GPU в одной системе против 2х систем с 1 GPU? (все GPU одинаковые)

В моих (довольно скромных) экспериметнах бутылочным горлишком, например при inference llama3 q8 70b с помощью CPU был доступ к памяти - на практике выражалось в том, что увеличене потоков больше 2х не увеличивало производитекльность совершено. (Немного другой случай, но, имхо, показательный)

Так же lamma3 f16 8b на tesla p40 быстрее, чем на gtx 3060 Ti + tesla p40

Вышла Pixtral 12B — модель Mistral common с поддержкой картинок

Krypt 11 сен 2024 в 13:57

Зависит от лаптопа. Если у вас есть 8gb vram - старые модели работать будут
Вы можете запустить модель и в обычной RAM, но оно будет считать процессором в течении минуты-двух одну картинку

Генераторы порно и инструменты для мошенничества: инструменты в GPT Store вызвали вопросы

Krypt 6 сен 2024 в 10:31

Зайдите на любой популярный сайт связанный с AI артом. У них, как и у всех виртуальный арт-галерей что я знаю "двойное дно"...

3 самых очевидных способа вручную обнаружить текст от большой языковой модели

Krypt 1 сен 2024 в 13:07

У каждой LLM есть свой собственный стиль речи.
Из моих экспериметнов, Llama3 и Yi 1.5 Chat (Китайская нейросеть) говорят совершенно по разному, так как тренированны на разных датасетах, хотя архитектура одинаковая.

Кажется, что всё это, можно обойти с правильным system prompt, попросив LLM использовать (или избегать) определённый стиль. Просто люди ленивы и не заморачиваются, а ChatGPT - самая распространённая модель.

Microsoft передумала полностью отказываться от «Панели управления» в Windows

Krypt 27 авг 2024 в 08:17

Ничем из Панели Управления на постоянной основе мы и во времена XP не пользовались. Это собственно и есть панель для настроек, которые или устанавливаются раз и на всегда, или используют когда возникают проблемы.

Впрочем да, новые "Параметры" я использую регулярно - раздел Bluetooth. Потому что Майкрософт не смог сделать нормальный виджет для системного трея.

Google заблокировал YouTube-канал компании-разработчика инженерного программного обеспечения «Аскон»

Krypt 19 авг 2024 в 19:51

Компании США не могут состоять в юридических отношениях с подсанкционными организациями. Eula - юридические отношения.

«Яндекс Маркет» вводит сервисный сбор для пользователей, он будет фиксированным и составит 20 рублей за заказ

Krypt 19 авг 2024 в 19:48

Ну штош... Будем продолжать его не использовать.

Создание XCFramework из SPM пакета

Krypt 19 авг 2024 в 01:35

Хах! Вы мне сейчсас моего учителя из универа напомнили: он говорил: что если в книге написанно "это тривиально доказать" или "оставляю как упражнение читателю" - автор сам не знает доказательства :D

Когда я занимался этой задачей (подключить в проект собираемый Bazel'ом обновлённую версию AppMetrica) - всё, что я смог найти в интернете: так это что никто ещё не разобрался как это сделать. Я в итоге я просто стал патчить исходники, чтобы существующие инструменты могли собрать их. (Яндекс, фу, изменять расшинения заголовочных файлов с .h на .def - плохая идея)

-1

Создание XCFramework из SPM пакета

Krypt 16 авг 2024 в 19:45

У меня была такая задача (как возможное решение существовавшей проблемы), и я не уверен, что я сделал все описанные тут шаги, но проблема с которой я столкнулся и не смог побороть - в фреймворк как раз таки не были включены ресурсы.
Насколько я понимаю это решение так же не включит ресурсы?
Пакет, который я пытался собрать - AppMetrica

В РФ приняли закон о прогрессивной шкале НДФЛ

Krypt 10 июл 2024 в 11:01

Ну учитывая что его установили в 2022 в 0%... Тут скорее "халява кончилась". А каким этот налог был для it до 2022?

Ryzen 9 9900X конкурент всего лишь для core i7-14700K, но есть нюанс

Krypt 8 июл 2024 в 08:11

Не удивлён, тот же Windows так и не научился нормально e-core использовать. (скинуть 12 потоков 100% загрузки p-ядер на 4 e-core - как нефиг делать)

Записки хирурга. Распиливание слонов PostgreSQL наживую и без анестезии

Krypt 7 июл 2024 в 11:19

Эй, AliExpress Россия, а куда вам багрепорты отправлять?
У вас невозможно открыть спор потому что невозможно загрузить картинку

Запрос на http://aliexpress.ru/chat-api/v2/chats/attachment/upload возвращает ошибку 405

Бонус баг: иногда форма создания спора при изменении размера окна просто исчезает, без изменения статуса бота. И сделать ничего нельзя, бот думает что я создаю спор, видимых кнопок отмены нет, формы отмены нет даже после перезагрузке страницы.

1 2 ...

6 7

9 10 ...

103 104