Обновить
8K+
3
Олег@COBECT

Пользователь

1,2
Рейтинг
Отправить сообщение

TOON против TRON против JSON, YAML и CSV для LLM-приложений

Уровень сложностиПростой
Время на прочтение19 мин
Охват и читатели9.8K

Разные форматы данных существуют потому, что решают разные задачи. JSON строгий и ориентирован на машины. YAML удобен для чтения. CSV минималистичен. TOON чрезвычайно компактен и специально спроектирован, чтобы снижать токенную нагрузку на LLM. TRON расширяет JSON определениями классов для обратно совместимого сжатия.

Читать далее

Как использовать Emby на iOS без подписки Emby Premier

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.5K

Используете Emby в домашней сети, но не хотите покупать Emby Premier ради iOS-клиента? Разбираю простой и легальный способ пользоваться Emby на iPhone и iPad без подписки.

Читать далее

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.9K

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp. В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench, входящего в состав Llama.cpp.

Дисклеймер: Почему Llama.cpp, а не Ollama?

Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

Читать далее

Информация

В рейтинге
1 846-й
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Зарегистрирован
Активность

Специализация

Десктоп разработчик, Фулстек разработчик
Ведущий
Git
SQL
ООП
Docker
Java
REST
Английский язык
React