Search
Write a publication
Pull to refresh
31
54
Кирилл Филипенко @suncru

User

Send message

OpenAI возвращается к open-source: обзор моделей GPT-OSS-120b и GPT-OSS-20b

Reading time17 min
Views14K

Компания OpenAI, известная разработкой топовых языковых моделей, сделала важный шаг навстречу открытому сообществу, представив две передовые open-source модели — GPT-OSS-120b и GPT-OSS-20b. Этот релиз знаменует возвращение компании к изначальной идее открытого распространения своих технологий (или, скорее, является пиар-ходом компании в ответ на упреки в закрытости). Событие действительно знаковое, ведь впервые с момента выпуска GPT-2 в 2019 году компания делает веса своих крупных языковых моделей полностью доступными сообществу.

В статье мы подробно рассмотрим технические особенности этих моделей, их архитектуру и механизмы работы, результаты на основных бенчмарках, аспекты безопасности и лицензионную политику. Материал основан на официальной документации OpenAI, а также на подробной информации из репозитория на GitHub и публикациях на платформе Hugging Face.

Читать далее

Как устроены LLM-агенты: архитектура, планирование и инструменты

Reading time14 min
Views9.7K

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!
Читать дальше →

Почему при аутентификации в Linux пароль хуже ключа

Reading time15 min
Views17K

Привет, Хабр! На связи Кирилл, сисадмин в Selectel. Если вы только начинаете свой путь в системном администрировании, то наверняка задумывались, что происходит «под капотом» Linux при вводе логина и пароля. Давайте заглянем в потроха системы, чтобы: разобраться, как она удостоверяется в подлинности пользователя; сравнить привычные пароли и SSH-ключи; настроить сервер для безопасной работы. Добро пожаловать под кат.
Читать дальше →

Тестируем новые модели o3 и o4-mini от OpenAI

Level of difficultyEasy
Reading time11 min
Views8.5K

Привет! На связи Кирилл Филипенко, сисадмин в Selectel. Недавно OpenAI анонсировала два новых поколения моделей — o3 и o4-mini, которые стали частью линейки o-series. В статье разбираемся, за счет чего они получились мощнее, насколько дешевле обойдется их использование и какие кейсы стоит обязательно протестировать уже сегодня. В OpenAI уверены, что эти образцы задают новую планку того, каким должен быть AI-ассистент. Так ли это? Проверим под катом.
Читать дальше →

Google Firebase Studio – облачная AI-платформа для разработки приложений

Level of difficultyEasy
Reading time12 min
Views12K

Представьте, что вы можете разработать и задеплоить полностью работающее приложение, просто описав его словами. Google задает новый тренд в разработке программного обеспечения, представив Firebase Studio — платформу с интегрированным ИИ-ассистентом Gemini, способным автоматизировать значительную часть задач. В этой статье мы разберемся, почему некоторые сми называют Firebase Studio «убийцей Cursor», и покажем, как можно воплощать идеи в функциональные приложения буквально за несколько минут. Подробности под катом.
Читать дальше →

Reasoning-LLM: архитектура и обзор передовых моделей

Reading time24 min
Views9.3K

Reasoning-LLM — это большие языковые модели, нацеленные на логическое рассуждение при решении сложных задач. В отличие от обычных LLM, которые часто выдавали ответы сразу, такие модели способны «думать» пошагово — как человек, анализируя задачу и выстраивая цепочку вывода.

Появление reasoning-LLM связано с тем, что традиционные LLM (например, GPT-4 или Llama 3.1) хотя и хорошо справляются с языковыми и энциклопедическими запросами, нередко ошибались в задачах, требующих сложных вычислений, планирования или логического вывода. В этой статье мы подробно разберем, как работают reasoning-LLM, их внутреннее устройство (Transformer, self-attention, механизмы «мышления»). А еще — рассмотрим передовые модели (OpenAI o1, DeepSeek R1 и Claude 3.7 Sonnet), факторы, влияющие на их точность, и дадим практические рекомендации по применению.
Читать дальше →

Как установить MikroTik CHR в облаке? Шпаргалка

Level of difficultyEasy
Reading time4 min
Views25K

MikroTik Cloud Hosted Router (CHR) — удобное решение для создания виртуальных маршрутизаторов в облаке. С помощью него можно эффективно управлять сетевым трафиком, регулировать безопасность и оптимизировать работу в облачной среде.

Меня зовут Кирилл, в этой статье я подробно расскажу про установку и настройку MikroTik CHR на примере облачной платформы. Если вам интересно погрузиться в технические аспекты его конфигурации, добро пожаловать под кат!
Читать дальше →

Увеличиваем FPS в аниме с помощью нейросети и GPU Tesla T4

Reading time7 min
Views31K

Привет, Хабр! Я Кирилл, работаю в техподдержке Selectel. Как-то я решил посмотреть легендарное аниме 1995 года «Призрак в доспехах» и не смог сдержать слез. В первую очередь оттого, что частота кадров в этом аниме – убийственные для моего зрения 23 кадра в секунду. В силу особенностей жанра аниме частота кадров на некоторых отрезках видео может достигать до 12 в секунду.

Страдать я не хотел, поэтому начал гуглить, какое решение может предложить мне мир IT. В итоге наткнулся на крайне интересную технологию — интерполяцию, которая используется почти везде, но мы о ней очень мало знаем. Под катом рассказываю, как она, нейросеть RIFE и сервер с GPU помогли мне посмотреть «Призрака» без головной боли.
Читать дальше →

Information

Rating
57-th
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Registered
Activity