Pull to refresh
8K+
3
Олег@COBECT

User

1,2
Rating
Send message

TOON против TRON против JSON, YAML и CSV для LLM-приложений

Level of difficultyEasy
Reading time19 min
Reach and readers9.9K

Разные форматы данных существуют потому, что решают разные задачи. JSON строгий и ориентирован на машины. YAML удобен для чтения. CSV минималистичен. TOON чрезвычайно компактен и специально спроектирован, чтобы снижать токенную нагрузку на LLM. TRON расширяет JSON определениями классов для обратно совместимого сжатия.

Читать далее

Как использовать Emby на iOS без подписки Emby Premier

Level of difficultyEasy
Reading time4 min
Reach and readers5.5K

Используете Emby в домашней сети, но не хотите покупать Emby Premier ради iOS-клиента? Разбираю простой и легальный способ пользоваться Emby на iPhone и iPad без подписки.

Читать далее

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

Level of difficultyEasy
Reading time4 min
Reach and readers7.9K

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp. В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench, входящего в состав Llama.cpp.

Дисклеймер: Почему Llama.cpp, а не Ollama?

Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

Читать далее

Information

Rating
1,893-rd
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Registered
Activity

Specialization

Десктоп разработчик, Фулстек разработчик
Ведущий
Git
SQL
ООП
Docker
Java
REST
Английский язык
React