Статьи / Закладки / Профиль Amicable / Хабр

@Amicable^{read⁠-⁠only}

Пользователь

ПрофильЗакладки315

vyacheslavteplyakov 11 мая в 14:18

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Простой

17 мин

43K

Искусственный интеллект

Обзор

Из песочницы

Привет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических бенчмарках, а когда нужно написать работающий код, отрефакторить файл с багами или вытащить данные из HTML.

Вокруг локальных моделей сложилась странная ситуация. С одной стороны, их постоянно принижают: если это не последняя версия Opus с максимальным режимом размышления, то и пробовать не стоит. С другой — мало кто действительно разбирается, что стоит за запуском локальной модели. Поднять API через llama.cpp — это полдела. А вот как ты её запускаешь, в какой среде, с какими параметрами — эти вещи порой переворачивают результат с ног на голову. Получить плохой результат с локальной моделью на удивление легко. Получить хороший — надо попотеть.

При этом локальные модели нужны. Особенно когда начинаются истории про чувствительные данные, закрытые контуры и ситуации, когда облачный API просто не вариант.

Я посмотрел множество тестов на YouTube — ни один меня не устроил. Общая канва одинаковая: берут модель побольше, запускают без оглядки на оптимальность и дают задание уровня «напиши сортировку пузырьком». Серьёзно?

Я не разработчик и не кодер по профессии, но решил пойти другим путём. Тесты с подковыркой, реальная агентская среда, подбор параметров. И модели я выбрал не «чем больше, тем лучше», а те, которые реально влезают в 16 ГБ видеопамяти домашней видеокарты. Что из этого вышло — дальше по тексту.

+150

243

zarazaexe 25 апр в 07:32

Это — всё что вам надо знать о белых списках: как устроены и 6 способов обхода

Средний

10 мин

191K

Информационная безопасность * Сетевые технологии * IT-инфраструктура * Открытые данные * Реверс-инжиниринг *

Аналитика

Думаю, вы уже в курсе, что происходит в РФ с белыми списками: работают белые списки, ТСПУ в режиме drop-all пропускает только одобренные IP + SNI, рунет медленно, но верно становится интранетом

Мы просканировали 46 млн российских IP-адресов, нашли 63 тысячи выживших, разобрали работу ТСПУ. И главное - актуальные методы пробива (от Serverless-функций и покупки VPS с белым IP до туннелей через WebRTC).

+623

246

sergio5990 17 апр в 22:28

Пробуем использовать локальные LLM для написания кода

Средний

16 мин

57K

Программирование * Искусственный интеллект

Туториал

Рассмотрим альтернативу облачным моделям — локальный запуск LLM на своём компьютере.

Этот подход даёт полный контроль над данными, но требует понимания ресурсов, форматов моделей и особенностей настройки. В статье расскажу, как выбрать модель под ваше железо, запустить её с помощью LM Studio, подключить к агентам и что из этого вышло в эксперименте. И несколько рекомендаций для тех, кто задумывается о такой возможности.

+85

175

Shannon 29 июн 2025 в 08:46

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

21 мин

114K

Искусственный интеллект

Туториал

Релиз DeepSeek R2 официально отложен и пока R1 не потерял актуальность, попробуем запустить модель на домашнем ПК. Оригинальная DeepSeek R1 имеет размер 700гб, так как она обучалась в fp8, но если бы она обучалась в стандартных f16, её вес был бы 1400гб, а мы попробуем версию в 10 раз меньше. Запустим самый маленький 1.66-битный IQ1_S_R4 квант полноценной модели размером 130гб на игровом ПК, отдельно с 4090 и 4060ti. Загрузим туда очень-очень много контекста и проверим, такой квант всё ещё способен давать разумные ответы или нет.

+150

nocdeveloper 24 мар в 10:13

Как в Авито построили систему мониторинга BGP

Сложный

20 мин

12K

Блог компании AvitoTechDevOps * Сетевые технологии *

Туториал

Всем привет! Меня зовут Антон Ильичев, я сетевой инженер в Авито. В этой статье расскажу, зачем мы централизованно собираем и анализируем маршрутную информацию с сетевых устройств, причём тут протокол BMP и как устроена наша система мониторинга. В конце вас будет ждать лаба на docker-compose, которую вы можете запустить у себя и посмотреть на систему в действии.

Статья будет полезна в первую очередь сетевым инженерам, командам SRE и мониторинга, которые отвечают за доступность и качество сервиса.

+41

AmneziaLover 25 мар в 07:52

AmneziaWG 2.0: от маскировки трафика к мимикрии

Средний

10 мин

241K

Блог компании Amnezia VPNOpen source * Информационная безопасность * Сетевые технологии * IT-компании

Всем привет!

На связи команда разработчиков Amnezia. Сегодня хотим рассказать о важном обновлении нашего протокола – AmneziaWG 2.0, а также о том, как с его помощью можно развернуть собственный VPN на своем сервере.

AmneziaWG 2.0 – это уже не просто набор новых параметров в конфигурации, а заметный технологический шаг вперед в вопросе восстановления доступа к свободному интернету. Новая версия уже поддерживается в клиенте AmneziaVPN для десктопных приложений и Android у пользователей self-hosted.

+479

288

SrvTrantor 18 фев в 09:01

Шпаргалка по поиску узких мест в Linux: топ утилит на все случаи жизни

Простой

12 мин

37K

Блог компании RUVDS.comLinux * Системное администрирование * Серверное администрирование * Хостинг

Туториал

Многие уже видели старенькую схему Брендана Грегга, где каждой подсистеме сопоставлены CLI-утилиты. Она правда полезная, но когда «горит», мы бежим в интернет, а не выискиваем систему и команду. В статье я собрал тулзы с картинки, а также добавил опенсорсных утилит, которые пригодятся для мониторинга.

Читать

+154

juleek 28 фев 2020 в 06:51

DNS-поиск в Kubernetes

5 мин

37K

Блог компании ФлантKubernetes * Сетевые технологии * Системное администрирование *

Перевод

Прим. перев.: Проблема DNS в Kubernetes, а точнее — настройки параметра ndots, — на удивление популярна, причём уже не первый год. В очередной заметке по этой теме её автор — DevOps-инженер из крупной брокерской компании в Индии — в весьма простой и лаконичной манере рассказывает, о чём полезно знать коллегам, эксплуатирующим Kubernetes.

Одно из главных преимуществ развёртывания приложений в Kubernetes — беспроблемное обнаружение приложений. Внутрикластерное взаимодействие сильно упрощается благодаря концепции сервиса (Service), которая представляет собой виртуальный IP, поддерживающий набор IP-адресов pod'ов. Например, если сервис vanilla желает связаться с сервисом chocolate, он может обратиться напрямую к виртуальному IP для chocolate. Возникает вопрос: кто в данном случае разрешит DNS-запрос к chocolate и как?

Читать дальше →

+38

AKlimenkov 31 янв в 17:02

Заветные энциклопедии — ламповый мир знаний из советского детства

6 мин

32K

Профессиональная литература * Читальный залУчебный процесс в ITНаучно-популярноеКонтент и копирайтинг *

В детстве я всё время что-то записывал, конспектировал, оформлял, чертил и рисовал. Никаких компьютеров и смартфонов тогда не было, поэтому вся эта канцелярия была моей первой личной базой знаний. Мой детский мозг жадно находил, поглощал и накапливал информацию, и мне просто необходимо было фиксировать самые важные и интересные факты и знания в письменном виде.

Я очень любил ездить в гости к своим дедушке и бабушке. В их квартире стояли огромные шкафы с книгами от пола до потолка. Книги там были везде: я приезжал в этот дом, как в сказочную библиотеку, и часами копошился на полках.

+156

156

kubelet 15 дек 2025 в 05:42

Лучшие практики по настройке конфигураций в Kubernetes

Простой

9 мин

12K

Блог компании ФлантDevOps * Kubernetes * Open source * Системное администрирование *

FAQ

Перевод

В статье — проверенные практики от сообщества Kubernetes: от выбора версии API и работы с YAML до управления подами и лейблами. Плюс несколько советов от команды Deckhouse по работе с ресурсами и автомасштабированием.

+25

andrew526d 9 июл 2017 в 10:45

Алгоритм поиска наилучшего маршрута в linux

8 мин

26K

Алгоритмы * Высоконагруженные системы * Математика * Системное программирование *

В настоящее время в компьютерных сетях практически повсеместно используется протокол IP. Для того, чтобы отправить IP-пакет каждый маршрутизатор ищет в свой таблице маршрутизации наилучший маршрут для адреса назначения пакета. В данной статье я хочу описать алгоритм поиска наилучшего маршрута, реализованного в ядре linux.

Читать дальше →

+16

AlekseiPodkletnov 23 апр 2025 в 05:46

Весь китайский автопром от A(vatr) до Z(eekr)

19 мин

198K

ТранспортБизнес-модели * Автомобильные гаджетыРобототехникаПроизводство и разработка электроники *

Какие автомобильные компании Китая самые сильные и крупные? Какие марки самые популярные? Кто кого производит? Кто кем владеет? Кто с кем конкурирует? Раскладываем по полочкам, как устроена автомобильная индустрия Китая. После этой статьи у вас сложится цельная и понятная картинка.

+173

219

duckhawk 25 дек 2025 в 06:56

Как работают CSI-драйверы в Kubernetes: принципы, архитектура и жизненный цикл томов (подробный гайд)

Средний

38 мин

7.1K

Блог компании ФлантDevOps * Kubernetes * Системное администрирование * Хранение данных *

В статье подробно разбираем, как устроен CSI (Container Storage Interface), как проходит жизненный цикл тома от PVC до удаления и что на самом деле делают sidecar-контейнеры и драйверы.

+14

eucariot 4 янв в 14:42

Нейро сети для самых маленьких. Часть нулевая. Обзорная

Сложный

65 мин

50K

Сетевые технологии * Искусственный интеллектСистемное администрирование *

Туториал

Нейро сети для самых маленьких

Каждый раз, когда вы говорите нейросети «Спасибо», вы запускаете конвейер, в котором перемножаются сотни матриц с миллиардами элементов, и сжигаете электричества столько же, сколько светодиодная лампа за несколько секунд.

Это первая статья из небольшого цикла, посвящённого сетям для AI/ML-кластеров и HPC.

В этой серии мы коснёмся принципов работы и обучения моделей, параллелизации, технологий DMA и RDMA, сетевых топологий, InfiniBand и RoCE, а ещё пофилософствуем на тему общих и специальных решений.

Конкретно в этой статье мы разберёмся, что представляет из себя нейросеть, как она работает, как происходит её обучение, а самое главное, почему для неё нужны сотни дорогущих GPU-карточек и какая-то особенная сеть.

Рефрен сегодняшней истории: в нейросетях нет никакой магии — это просто множество простых операций над числами, которые выполняются на компьютерах со специальными чипами.
Магии нет ни в том, как они работают, ни в той инфраструктуре, на которой они запускаются.

Ныряем!

+120

AndreiYemelianov 14 июн 2016 в 09:09

Механизмы контейнеризации: cgroups

11 мин

153K

Блог компании Selectel

Продолжаем цикл статей о механизмах контейнеризации. В прошлый раз мы говорили об изоляции процессов с помощью механизма «пространств имён» (namespaces). Но для контейнеризации одной лишь изоляции ресурсов недостаточно. Если мы запускаем какое-либо приложение в изолированном окружении, мы должны быть уверены в том, что этому приложению выделено достаточно ресурсов и что оно не будет потреблять лишние ресурсы, нарушая тем самым работу остальной системы. Для решения этой задачи в ядре Linux имеется специальный механизм — cgroups (сокращение от control groups, контрольные группы). О нём мы расскажем в сегодняшней статье.

Читать дальше →

+20

nAbdullin 15 июл 2019 в 06:41

Создаем инфраструктуру как код с GitLab и Ansible

4 мин

45K

Блог компании СлёрмDevOps * Серверное администрирование * Системное администрирование *

Перевод

Вся мощь GitLab CI в демонстрации плейбуков Ansible при подходе «инфраструктура как код».

GitLab CI — это эффективный инструмент для самых разных сценариев, включая инфраструктуру как код. GitLab можно использовать с разными инструментами, но в этой демонстрации мы возьмем Ansible, потому что именно его чаще всего используют разработчики при подходе «инфраструктура как код». Вот демо с двумя маршрутизаторами из курса по сетям Ansible.

+22

Finnix 11 сен 2020 в 20:00

Оценка производительности CNI для Kubernetes по 10G сети (август 2020)

5 мин

9.4K

Блог компании СлёрмDevOps * Kubernetes * Серверное администрирование * Системное администрирование *

Перевод

TL;DR: Все CNI работают как надо, за исключением Kube-Router и Kube-OVN, Calico за исключением автоматического определения MTU — лучше всех.

Читать дальше →

+16

took_the_lead 30 янв 2025 в 06:09

Мануал по запуску полной модели DeepSeek-R1 локально (бюджет ~6k$)

4 мин

117K

Искусственный интеллектМашинное обучение * DevOps * Компьютерное железо

Туториал

Давеча наткнулся в экс-~~Твиттере~~ на интересный тред (https://x.com/carrigmat/status/1884244369907278106?s=52) о том, как запустить самую мощную (на сегодня) ИИ reasoning модель DeepSeek-R1 прямо у себя под столом.

DeepSeek-R1 — это одна из топовых моделей (из Китая), наделавших много шума (и не только), для задач логики, математики и программирования. Она настолько умная, что может (с некоторыми оговорками) "конкурировать" с решениями от OpenAI, но при этом её можно запустить локально, без интернета, ~~без смс~~ и полностью контролировать весь процесс.

Почему это круто?
* все данные остаются с вами, никакие сторонние сервисы не получат доступ к вашим запросам.
* запуск на своём железе избавляет от затрат на облачные сервисы.
* модель способна решать сложные задачи и выдавать результаты на уровне профессионалов.

В статье я расскажу:
* какое оборудование нужно для запуска DeepSeek-R1.
* чем локальный запуск отличается от серверного.
* какие возможности открывает эта модель и как она может быть полезна.
* как сохранить безопасность и приватность при работе с ИИ.

В этом мануале описано, как настроить локальный запуск модели DeepSeek-R1 Q8, сохраняя максимальное качество и производительность без дистилляции или уменьшенной квантизации. Общая стоимость сборки составит около ~$6,000, и ниже приведены все необходимые ссылки на компоненты и инструкции.

+25

AlexeyRybakov 3 фев 2025 в 13:49

Быстрое локальное развертывание DeepSeek

Простой

3 мин

129K

Искусственный интеллект

Туториал

В этой статье я поделюсь опытом быстрого локального развертывания модели DeepSeek — решения, которое позволяет не зависеть от облачных сервисов, сохранять конфиденциальность данных и тонко настраивать модель под собственные задачи.

Anna_sokol22 12 янв 2023 в 12:15

Ограничиваем число процессов в pod’е Kubernetes

3 мин

5.2K

Блог компании СлёрмKubernetes * DevOps * IT-инфраструктура *

Перевод

Если мы говорим о безопасности в Kubernetes, первым делом нужно защитить ключевые компоненты кластера (pod’ы) от внешнего воздействия и ограничить риски внутри самих pod’ов. Чем меньше процессов в pod’е, тем меньше уязвимостей в кластере.

В этой статье мы обсудим, почему рискованно сохранять в pod’е параметры количества процессов по умолчанию, и как решить проблему.

+18

2 3 ...

14 15