Статьи / Закладки / Профиль Volkov_Timm / Хабр

Как стать автором

@Volkov_Timm^{read⁠-⁠only}

Пользователь

ПрофильЗакладки107

RTFM13 27 авг 2024 в 00:49

Еще одна конфигурация на базе OpenWRT (+PC) для обработки трафика

Средний

4 мин

5.1K

Сетевые технологии *

Туториал

Recovery Mode

Последнее время на некоторых территориях тема обработки транзитного трафика на домашнем роутере стала популярна как никогда раньше. Интервал между новыми вызовами сократился с нескольких лет до нескольких дней. Задачи становятся всё интересней и сложней.

Перешитый на OpenWRT роутер пока справляется и наверное справлялся бы еще какое-то время. Но софт становится тяжелее, времени на его отладку и установку всё меньше. При всех преимуществах OpenWRT, начинают всплывать недостатки - специфическая архитектура и ограниченные ресурсы. Кроме того, роутер лично для меня место интимное и не всякий софт хочется на него ставить не глядя. Ситуация в моем случае усугубляется еще и тем, что настройка происходит удалённо через этот самый роутер, поэтому неудачные попытки чреваты большими сложностями.

Как и у многих, у меня рядом с роутером есть небольшой NAS на базе PC. Который с помощью второй сетевухи мог бы легко превратиться в роутер. Но как это сделать удаленно? И как сделать из сервера роутер, не трогая по-возможности сервер и роутер? Легко!

Подразумевается, что читатель имеет базовые навыки администрирования сетей и линукса.

Читать далее

+6

yakvenalex 17 июн 2024 в 03:00

Telegram Боты на Aiogram 3.x: Отправка и обработка медиа сообщений

14 мин

29K

Туториал

Приветствую вас! В очередной раз хочу поблагодарить за вашу поддержку и интерес к моему творчеству. Приятно осознавать, что информация, которой я делюсь, полезна многим из вас, а в некоторых случаях вызывает даже ажиотаж.

Сегодня мы вновь погрузимся в мир Telegram ботов на Aiogram 3.x и рассмотрим отправку и обработку медиа сообщений.

Если вы ещё не ознакомились с моей предыдущей статьей, где я подробно раскрывал основы работы с Message хендлером, настоятельно рекомендую это сделать. В той статье я рассмотрел такие важные аспекты, как:

Читать далее

+3

Sber 17 июн 2024 в 07:32

Почему «утекают» данные в больших языковых моделях. Часть 1

9 мин

3.2K

Блог компании СберИнформационная безопасность * Машинное обучение *

Обзор

При разработке чат-ботов на основе больших языковых моделей (Large Language Model, LLM) всё чаще становится актуальной проблема «утечки» конфиденциальных данных. Причём она сопряжена со множеством значимых негативных последствий, как для клиентов, так и для бизнеса.

Читать далее

+20

artemy_kravtsov 17 июн 2024 в 09:07

Краеугольные камни ClickHouse

Простой

21 мин

23K

Блог компании Wildberries & RussData Engineering * Хранение данных * Big Data * SQL *

Обзор

Привет, Хабр! Меня зовут Артемий Кравцов, я работаю инженером в Wildberries. Сегодня расскажу про то, что люблю – про ClickHouse. Моя цель – осветить некоторые ключевые особенности в архитектуре ClickHouse и в том, как он хранит данные.

Что такое куски и слияния? Как быть с частыми вставками? Как обновлять значения в строках? Что не так с точечными чтениями? Как сделать тяжёлый JOIN?

Статья рассчитана на тех, кто только знакомится с ClickHouse.

Читать далее

+37

SSul 17 июн 2024 в 09:13

NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей

Средний

9 мин

3K

Блог компании SimbirSoftПрограммирование * Машинное обучение *

Кейс

Привет, Хабр! Меня зовут Иван, я Data Science специалист SimbirSoft. Я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке.

Один из способов достижения экономического превосходства над конкурентами — это получение инструмента, оценивающего ситуацию на рынке сейчас и позволяющего делать точные достоверные прогнозы на будущее. И с помощью искусственного интеллекта, анализа данных, работы с временными рядами можно создать достаточно точный инструмент прогнозирования цен.

К нам обратился заказчик, который занимается продажами удобрений. Ему необходимо было протестировать различные подходы к прогнозированию цен на удобрения. Нашей задачей стало построить бейзлайн-модель и оценить, насколько перспективен подход с использованием новостей. Заказчик хотел, чтобы мы оценили предсказательную силу именно новостей, поэтому мы не использовали признаки из самого временного ряда цен (лаги/сезонность/тренд) и признаки, связанные с рынком.

Читать далее

+3

AlpineSlowpoke 17 июн 2024 в 09:23

Древние свитки CI/CD: смыслы, которые мы потеряли

Средний

8 мин

10K

Блог компании Конференции Олега Бунина (Онтико)Блог компании UzumАнализ и проектирование систем * DevOps *

Мнение

Привет, Хабр. Меня зовут Владимир Утратенко, я — Head of Infrastructure and Security в Uzum Market. У меня богатый опыт найма DevOps-инженеров, ведь последние 6 лет я — нанимающий менеджер. А ещё много лет подряд занимаюсь DevOps как моделью разработки. Сегодня мы поговорим про боли в CI/CD, которые часто упускают из вида DevOps-специалисты, лиды и CTO.

Читать далее

+17

lapkin25 17 июн 2024 в 09:41

Прогноз выгорания с помощью интерпретируемого метода машинного обучения

2 мин

3.2K

Машинное обучение *

Выгорание возникает вследствие несоответствия между целями человека и реальностью, что приводит к истощению ресурсов и снижению производительности труда.

Имея данные об отклонении ожиданий сотрудников компаний от реальности, поставим задачу спрогнозировать наличие выгорания у сотрудника. Будет предложен интерпретируемый метод машинного обучения, похожий на двухслойный персептрон, в котором все весовые коэффициенты имеют ясный смысл.

Читать далее

+1

deliro 17 июн 2024 в 14:59

Ускорение роутера в Django в 51 раз

Средний

6 мин

15K

Блог компании Точка БанкPython * Django *

История началась с разбора использования ресурсов приложением, которое занимается проксированием. Обнаружили, что довольно много времени оно тратит на выбор маршрута (роута), и решили ускорить этот процесс. Описанная в статье оптимизация не требует каких-то особых вложений, усилий или условий, поэтому приведенный код можно забрать к себе и использовать без каких-либо чрезмерных вмешательств.

Читать далее

+61

yakvenalex 18 июн 2024 в 03:00

Telegram Боты на Aiogram 3.x: Все про FSM простыми словами

Средний

17 мин

45K

Туториал

Друзья, приветствую! Сегодня мы коснемся важной и не такой уж сложной темы — реализации конечных автоматов состояний (FSM) в телеграм-ботах на Aiogram 3.x.

Для лучшего понимания рекомендую ознакомиться с моими предыдущими публикациями на тему Aiogram 3.x:

Читать далее

+2

yuriy_mikhaylov 18 июн 2024 в 06:41

Сделали собственную платформу под документацию API: стоила ли игра свеч

Средний

5 мин

3.6K

Блог компании Альфа-БанкПроектирование API * Разработка под e-commerce * Подготовка технической документации *

Обзор

Без толковой API-документации сложно делать открытый продукт и ждать, что его будут развивать пользователи. Часто владельцы сервисов занимаются документацией по остаточному принципу. В итоге разработчику достаётся запутанная инструкция, а интеграция усложняется или просто становится невозможной.

Мы осознали эту проблему до разработки открытого API и заранее спланировали, как сделать документацию понятной. Сегодня расскажу подробно про портал документации Alfa API. Как с ним быстро разобраться в технической реализации, а главное — улучшить впечатления от работы со сложным продуктом — узнаете в статье.

Читать далее

+20

xitren 18 июн 2024 в 07:00

Test Driven Development в Embedded, или Как увеличить производительность команды на 37%

Средний

10 мин

4K

Блог компании ЯндексУправление разработкой * Управление проектами * Agile * Робототехника

Современное развитие в области встроенной разработки и электроники с учётом бизнес-процессов ускоряется, часто следуя принципам Agile и Scrum. Применение этих методик требует осторожности из-за длительного производственного цикла встроенной разработки, который затрудняет быстрые изменения.

Меня зовут Арсентий Гусев, я руководитель группы embedded-разработки в отделе робототехники Яндекс Маркета. И мне бы хотелось рассказать об опыте, который приобрела наша команда в рамках работы над проектом складского робота. В этой статье определим критерии, предпосылки и предложим инструменты для ускорения разработки и снижения её стоимости.

Читать далее

+19

acenotass 18 июн 2024 в 09:09

Xray на VDS сервере и маршрутизаторе Keneetic

Средний

13 мин

120K

Информационная безопасность *

Туториал

Какие цели у этого руководства:
Обеспечение доступа через VDS сервер используя технологии xray, посредством маршрутизатора Keenetic и скрипта Xkeen.

Кому предназначено:
Для людей, которые хотят решить поставленную задачу, не вдаваясь во все тонкости настройки, выполняя инструкции шаг за шагом.

Читать далее

+7

technokratiya 18 июн 2024 в 09:58

Семь раз получи, один раз закэшируй

Простой

7 мин

2.3K

Анализ и проектирование систем *

В этой статье лид отдела аналитики Алексей Аксянов на реальном кейсе рассмотрит, как организовать кэширование данных в приложениях. Дальше его авторская колонка:

Я работаю аналитиком уже более 10 лет, и так уж сложилось, что зачастую разработчики ожидают от меня более «бизнесовые» постановки, предпочитая самостоятельно прорабатывать техническую составляющую решения. В этой статье мне хочется показать, что аналитикам можно и нужно копаться в технике. И в качестве примера мы будем разбирать такую технологию, как кэширование данных. По ходу повествования я постараюсь показать зоны ответственности бизнес-, системного аналитика и разработчика.

Читать далее

+1

Vyacheslav_Olegovich 18 июн 2024 в 10:26

Использование face_recognition и OpenCV для автоматического распознавания лиц и отправки уведомлений в Telegram

8 мин

7.5K

Python * Windows * DIY или Сделай самУмный дом

Из песочницы

Всем добра.

В наше время технологии распознавания лиц становятся все более популярными и востребованными в различных областях, начиная от безопасности и заканчивая маркетингом. В этой статье мы рассмотрим, как с помощью Python и библиотек face_recognition и OpenCV создать систему, которая будет распознавать лица, делать скриншоты при обнаружении лица в кадре и отправлять эти скриншоты в Telegram.

Проект «Кто приходил»

Проект «Кто приходил» представляет собой систему, которая использует технологии распознавания лиц для автоматического определения лиц в кадре, их идентификации и отправки уведомлений с изображениями в Telegram. Это может быть полезно для обеспечения безопасности, мониторинга доступа в определенные зоны или просто для наблюдения.

Читать далее

+3

Friflex_dev 18 июн 2024 в 11:10

История LLM-агентов: 10 ярких моментов

Простой

9 мин

1.7K

Блог компании FriflexМашинное обучение * Искусственный интеллект

Ретроспектива

Привет, Хабр! Меня зовут Руслан Гримов, я Head of ML в проекте idSport в компании Friflex. Мы разрабатываем продукты для оцифровки спорта и используем компьютерное зрение, чтобы организовывать трансляции партий на шахматных турнирах, а также распознавать и записывать интересные моменты в бильярде и футболе.

LLM-агенты связаны с моей работой скорее косвенно, но я вижу в них огромный потенциал и для развития наших продуктов, и для множества других задач. В этой статье собрал десять ярких моментов из истории LLM-агентов. Надеюсь, они помогут понять, какой впечатляющий путь проделали эти системы, и просто вас развлекут.

Как писал Пелевин, «в сущности, функция LLM – это доведенное до немыслимого совершенства автозаполнение. LLM не думает. Она тренируется на огромном корпусе созданных прежде текстов «…» и на этой основе предсказывает, как будет расти и развиваться новая последовательность слов, и как она, вероятней всего, развиваться не будет… Это похоже на процесс формирования юного члена общества на основе ежедневно поступающих вербальных инструкций, подзатыльников и наблюдения за тем, кому дают еду, а кому нет».

Это определение большой языковой модели (LLM) вольное, но довольно точное. LLM — это нейронная сеть, обученная на большом объеме текста. Она может анализировать, понимать и генерировать тексты на естественном языке, использовать обширные базы данных и понимать контекст.

Как развивалась идея о том, что машину можно научить понимать и создавать текст, как будто это пишет человек, расскажу дальше.

Читать далее

+2

badcasedaily1 18 июн 2024 в 11:36

Про что могут спросить аналитика данных о статистике на интервью: 3 темы

Простой

5 мин

8.4K

Блог компании OTUSPython * Программирование * Анализ и проектирование систем * Карьера в IT-индустрии

Привет, Хабр!

Когда проходит собес на позицию аналитика данных, одна из важных проверок - это знания по статистике. Компании хотят убедиться, что вы понимаете статистику и умеете применять ее на практике для принятия решений на основе данных.

В статье рассмотрим кратко три темы по статистике, которые часто задают на собеседованиях.

Читать далее

+9

yakvenalex 16 июн 2024 в 03:00

Telegram Боты на Aiogram 3.x: Message handler и трюки с текстом

Простой

12 мин

32K

Python * HTML *

Туториал

Приветствую! Благодарю за подписки, лайки и прочий позитивный отклик на мою деятельность. Продолжим.

Мы уже обсудили:

Текстовые клавиатуры

Инлайн клавиатуры

Командное меню

Встроенные фильтры и магические фильтры

Собственные фильтры

А это значит, что из базы остаётся только разобраться с сообщениями и работой с медиа. После этого можно будет переходить к более сложным и серьёзным темам, таким как: оплаты в боте, мидлвари, fsm-состояния, админ-панели и прочее. Но это всё потом, а сегодня мы рассмотрим следующие темы:

Читать далее

+5

beeline_cloud 16 июн 2024 в 11:36

Взять и захостить собственную LLM — зачем это нужно [и нужно ли вообще]

4 мин

14K

Блог компании Beeline CloudОблачные вычисления * Финансы в ITМашинное обучение *

ИТ-индустрия проявляет интерес к большим языковым моделям (LLM). Многие компании — в том числе стартапы и разработчики — предпочитают self-hosting открытых LLM работе с API проприетарных решений. Мы в beeline cloud решили обсудить плюсы и минусы такого подхода, в том числе с финансовой точки зрения.

Читать далее

+10

Alex_Mer5er 16 июн 2024 в 16:19

Мега-Учебник Flask Глава 14: Ajax (издание 2024)

Средний

17 мин

5K

Веб-разработка * Python * Flask *

Туториал

Перевод

Это четырнадцатая часть серии мега-учебника Flask, в которой я собираюсь добавить функцию перевода на живой язык, используя службу переводов Microsoft и немного JavaScript.

Начать изучение

+6

yakvenalex 14 июн 2024 в 03:00

asynpg-lite: Простой асинхронный менеджер для PostgreSQL на Python

Простой

15 мин

8.2K

Python * PostgreSQL * SQL *

Обзор

Друзья, в прошлых своих публикациях я рассказывал о том, что почти в каждом своем проекте использую свой класс для работы с базой данных PostgreSQL. На днях этот класс перерос в полноценную библиотеку asynpg-lite на базе asyncpg, которую каждый из вас может прямо сейчас установить и начать использовать.

Старался сделать взаимодействие с библиотекой интуитивно понятным для каждого, а чтобы было ещё проще – всю документация внутри библиотеки написал на русском языке.

Смысл этой библиотеки в том, чтобы каждый, даже если абсолютно не знаком с SQL-запросами, получил возможность взаимодействовать с базами данных PostgreSQL, используя стандартные питоновские списки, словари и строки.

Для тестирования примеров, которые я приведу, вам потребуется база данных PostgreSQL. Она может быть установлена как на вашем локальном компьютере, так и располагаться удаленно, например, на VPS-сервере.

Читать далее

+8

1