Ollama 0.7.0 теперь поддерживает мультимодальные модели на своем «движке»

Вышла Ollama версии 0.7.0, которая расширила поддержку мультимодальных моделей с помощью нового специально разработанного движка.

Вышла Ollama версии 0.7.0, которая расширила поддержку мультимодальных моделей с помощью нового специально разработанного движка.

В библиотеке Ollama, популярной платформы для локального запуска LLM, сегодня появились две новые модели: Mistral Small 3.1 и DeepCoder-14B-Preview.
Mistral Small 3.1 демонстрирует значительные улучшения в текстовой производительности, понимании мультимодальных данных и значительно расширенное окно контекста до 128 000 токенов. Модель превосходит сопоставимые модели, такие как Gemma 3 и GPT-4o Mini, при этом сохраняя впечатляющую скорость вывода в 150 токенов в секунду. Выпущена под разрешительной лицензией Apache 2.0, Mistral Small 3.1 предлагает гибкость для разработчиков и исследователей. И работает на одной RTX 4090 или Mac с 32 ГБ оперативной памяти. https://ollama.com/library/mistral-small3.1
DeepCoder-14B-Preview зарекомендовала себя как ведущая модель для логического анализа кода. Обученная на основе Deepseek-R1-Distilled-Qwen-14B с использованием распределенного RL, она достигает впечатляющей точности 60,6% Pass@1 на LiveCodeBench – улучшение на 8% – сопоставимой с производительностью o3-mini-2025-01-031 (Low) и o1-2024-12-17, при этом используя всего 14 миллиардов параметров. https://ollama.com/library/deepcoder

Модель Gemma 3 от Google уже доступна в Ollama в четырех вариантах с 1, 4, 12 и 27 миллиардами параметров.

Мощная рассуждающая языковая модель с открытым исходным кодом QwQ-32B теперь доступна в Ollama. Это среднеразмерная модель с 32.5 миллиардами параметров из серии Qwen разработана для выполнения сложных задач и демонстрирует конкурентоспособное качество по сравнению с другими reasoning моделями, такими как DeepSeek-R1.

Первое поколение моделей рассуждений от Qwen DeepSeek R1 с производительностью, сопоставимой с OpenAI-o1 уже доступно к установке в Ollama.

Phi-4 — новая открытая модель, разработанная Microsoft, уже доступна в Ollama. Модель имеет 14 миллиардов параметров.

Ирландский стартап Nexalus представил новый метод охлаждения центров обработки данных, который обещает повышенную эффективность отвода тепла. Их система основана на прямом охлаждении чипов жидкостью, где теплоноситель подается непосредственно на самые горячие точки компьютерных чипов через микроинжекторы.

Ollama обновилась до версии 0.5.1. В нее добавлена поддержка модели Llama 3.3 - 70B и структурированного вывода в JSON формате.

Пользователь с ником infinition выложил на GitHub файлы проекта Bjorn - инструмента, предназначенного для проведения комплексного сканирования сетей, оценки их уязвимости и даже выполнения атак на них.

Стартап Элона Маска xAI принял решение о смене поставщиков серверов для искусственного интеллекта, переместив свои заказы от проблемной компании Supermicro к более надежному партнеру — Dell. Это решение было принято в результате ряда экономических и политических скандалов, которые затронули работу Supermicro в последнее время.

В Ollama наконец то появилась долгожданная поддержка мультимодальной модели Llama3.2-vision. Эта модель оптимизирована для распознавания изображений, создания описаний к ним и ответов на общие вопросы об изображении.

В сентябре в HOSTKEY расширили количество доступных приложений, которые вы можете установить при заказе сервера. Мы добавили несколько новых приложений, которые повысят продуктивность разработчиков, специалистов по данным и тех, кто занимается электронной коммерцией.

Проект по воссозданию концепта Машины Тьюринга 1936 года из LEGO вызвал огромный интерес на платформе Lego Ideas. Модель, разработанная дизайнером Дэвидом Пуассоном, является точным представлением оригинальной идеи Алана Тьюринга.

ChatGPT по заверению разработчиков не распространяет опасную информацию, но похоже, его можно заставить выдавать пошаговые инструкции по созданию бомбы из удобрений.

Компания Toshiba анонсировала выход двух новых серий жестких дисков – MG11 и MA11 – которые являются настоящими «монстрами» в плане емкости хранения данных.

Китайская компания по производству полупроводников Loongson анонсировала новый GPU 9A2000, который стремиться бросить вызов господству уже устоявшихся игроков, таких как Nvidia и AMD.

На конференции IFA 2024 в Берлине компания AMD объявила о значительном шаге к унификации своих архитектур RDNA и CDNA под новой микроархитектурой, получившей название UDNA.

Теперь клиенты компании могут заказать выделенные и виртуальные серверы с новой версией ОС, предоставляющих новые возможности по функционалу, а также последние версии ПО для обеспечения совместимости и безопасности.

Хотим поделиться несколькими новостями об изменениях в нашей продуктовой линейке и объявить о снижении цены на некоторые позиции, включающие серверы на AMD 4 поколения, AMD Ryzen и NVidia H100.

AI-стартап Haiper открыл доступ всем желающим к своей генеративной модели. В текущий момент сервис позволяет генерировать видео по текстовому запросу или анимировать изображения, создавая итоговый видеоряд длиной в 2 секунды.