Статьи / Закладки / Профиль ozand / Хабр

Andrey Oz @ozand

Lead Data & CRM

Профиль Статьи Посты Новости Комментарии 1

akimovpro 14 дек 2023 в 10:08

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Средний

27 мин

78K

Машинное обучение*Искусственный интеллект

Обзор

Перевод

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

+25

lesovsky 12 мая 2014 в 15:15

10 способов сделать резервную копию в PostgreSQL

5 мин

282K

Системное администрирование*Администрирование баз данных*

Многие разговоры про бэкапы начинаются с присказки что люди делятся на две категории… так вот я отношусь к тем людям которые делают бэкапы. Правильно настроенное резервное копирование и проверка резервных копий укрепляет сон. А наличие заранее написаных и проигранных инструкций по восстановлению вообще укрепляет пищеварение и иммунитет. Так вот, за время работы с PostgreSQL мне довелось часто настраивать резервное копирование, при этом условия и требования были самые разные. Однако при этом набор инструментов за редким исключением оставался неизменным. В этой статье поделюсь своим опытом в деле, как можно брать резервные копии PostgreSQL.

Читать дальше →

+37

vrezvov 9 дек 2023 в 18:49

Автоматические бэкапы БД PostgreSQL по расписанию

Простой

6 мин

21K

Python*DevOps*

В этой статье я поделюсь скриптом для создания бэкапов БД PostgreSQL за определенный период (например: 1, 2, 3 дня, 1 неделя, 1 месяц, 6 месяцев, каждый год).
Объясню как запустить скрипт с помощью расписания crontab, покажу как настроить синхронизацию папки с бэкапами с облаком Yandex Disk.

ITSumma 18 мар 2022 в 10:28

Возвращаем RSS к жизни

6 мин

35K

Блог компании ITSummaСоциальные сети и сообществаСофтIT-стандарты*INFOLUST*

RSS-агрегатор NetNewsWire

Мы уже обсуждали, насколько важен и удобен RSS для профессиональной работы с источниками в интернете. Это единственный способ собрать огромный массив данных с тысяч сайтов, соцсетей, блогов, твиттер-аккаунтов, торрент-трекеров и др.

Вся информация накапливается в личном агрегаторе, доступна в удобное время, в том числе офлайн. Никогда ничего не теряется. Это особенно актуально сейчас, в условиях информационной блокады, периодических отключений интернета и угрозы полного шатдауна.

Читать дальше →

+72

14 ноя 2023 в 10:26

Рейтинг IT-брендов работодателей 2023

5 мин

133K

Блог компании IT-бренд работодателяIT-компанииКарьера в IT-индустрииИсследования и прогнозы в IT*

Всем привет! С 2020 года команда ЭКОПСИ и Хабра проводит Всероссийское исследование IT-брендов работодателей и делится результатами, чтобы соискатели с компаниями лучше понимали актуальную картину на рынке и друг друга. Результаты прошлогоднего исследования тут.

В этом году в контур опроса попало 23 806 респондентов. Он проходил с 15 июня по 15 сентября. Как и всегда, мы спрашивали IT-специалистов, насколько та или иная компания им известна как место работы + как они оценивают её привлекательность в качестве работодателя. Помимо общего рейтинга и паспорта исследования, под катом вы найдёте срезы по конкретным отраслям бизнеса и объёму IT-департаментов (для максимальной объективности результатов).

Поехали

+49

TomHunter 20 окт 2023 в 18:20

Проверяем контакты: OSINT и иные методы

14 мин

22K

Блог компании T.HunterИнформационная безопасность*

Обзор

Всем привет! Сегодня у нас большая обзорная статья о различных способах проверки контактов. Кратко пройдемся по всевозможным методам для сбора информации, составим список полезных в каждом случае сервисов и затронем ограничения того или иного способа. Начнем с самых азов для начинающих любителей OSINT и дойдем до неочевидных вариантов проверки потенциальных контактов. За подробностями добро пожаловать под кат!

badcasedaily1 20 окт 2023 в 18:23

Событийное логирование для аналитики и мониторинга работы телеграм-бота

9 мин

7.8K

Блог компании OTUSМессенджеры*Python*Программирование*Проектирование и рефакторинг*

Привет, Хабр! Меня зовут Артем.

По мере роста различной работы с телеграм ботом нашего корпоративного телеграм-бота, оптимизация и поддержание его стало более сложной задачей. В какой-то момент я осознал, что нужен надежный способ отслеживания происходящих событий в приложении. Это важно не только для решения проблем и багов, но и для оптимизации производительности и повышения общей эффективности работы.

В этой статье мы рассмотрим как реализовать событийное логирование для телеграм-бота.

itdog 14 окт 2023 в 14:39

Точечная маршрутизация по доменам на роутере с OpenWrt

Средний

13 мин

187K

Настройка Linux*Системное администрирование*Сетевые технологии*

Туториал

Статья о том, как настроить точечный обход блокировок по нужным доменам на роутере с OpenWrt. На мой взгляд, это самый удобный способ, который можно реализовать сейчас.

Я предоставляю уже готовый конфиг с самыми востребованными доменами, который можно дополнять.

Настроить роутер можно с помощью скрипта. Если вдруг не заведётся сразу, то другим скриптом можно найти, что не работает. Настройка с помощью Ansible никуда не делась, только модифицировалась и стала лучше.

Помимо инструкций по настройке туннелей Wireguard и OpenVPN, написал инструкцию по использованию технологий, которые помогут в обходе блокировок по протоколу: Shadowsocks, VLESS и прочими.

+27

EkaterinaMz 30 сен 2023 в 19:58

Что такое расширенные сниппеты и как с ними работать

Средний

4 мин

Поисковая оптимизация*

Мнение

Расширенный сниппет — это результат, который поисковая система показывает пользователю на первой позиции. Также его называют нулевой выдачей.

lebron32rus 29 сен 2023 в 15:16

Многопоточность в Python: очевидное и невероятное

Средний

4 мин

41K

Python*Программирование*Параллельное программирование*

Из песочницы

В данной статье я покажу на практическом примере как устроена многопоточность в Python, расскажу про потоки, примитивы синхронизации и о том зачем они нужны.

Изначально я планировал что это будет простая и короткая заметка, но пока готовил и тестировал код нашел интересный неочевидный момент связанных с внутренностями CPython, так что не спешите закрывать вкладку, даже если вы уверены что вы знаете о потоках в Python всё :)

+38

Vlad_Karmakov 15 сен 2023 в 11:54

Как оцифровать компанию, повысить оборот и удвоить рентабельность с 32% до 55%. Часть 2

Средний

9 мин

1.7K

Бизнес-модели*

Кейс

Recovery Mode

Как оцифровать компанию по мобильной и веб-разработке, с какими трудностями можно столкнуться в процессе диджитализации, а также какие преимущества дает цифровизация в настоящее время.

Kenya-West 15 сен 2023 в 12:15

Windows + WSL. Счастье виндузятника

Простой

6 мин

53K

Настройка Linux*

Мнение

Recovery Mode

TL;DR Почему на Хабре нет статей про то, как человек вполне доволен наличием WSL и активно ею пользуется? Неужели я один такой? Значит, пора ~~добавить воды~~ писать статью!

+24

badcasedaily1 28 авг 2023 в 12:54

Анализ текстовых данных с использованием тематического моделирования

14 мин

12K

Блог компании OTUSPython*Анализ и проектирование систем*

Анализ текстовых данных становится все более важным в наше время, когда огромные объемы информации генерируются и обмениваются каждую секунду. От социальных медиа до новостных порталов, от клиентских отзывов до академических статей — текстовые данные содержат бесценные знания и инсайты. Однако извлечение значимой информации из таких объемов текста может быть огромным вызовом.

Компании хотят понимать общественное мнение о своих продуктах и брендах, но анализировать миллионы постов и комментариев вручную практически невозможно. Вот где анализ текстовых данных и тематическое моделирование приходят на помощь. Эти методы позволяют автоматически выявлять темы, тональность и структуру текста, делая процесс анализа эффективным и масштабируемым.

+10

Telnov_WIKI 16 авг 2023 в 16:17

Тестирование и сравнительный анализ батареек AA формата

Простой

2 мин

6.1K

Энергия и элементы питания

Аналитика

Несколько лет назад делал пост про, то как я создаю глобальную базу знаний по батарейкам и аккумуляторам. Протестировал более 300 элементов питания и произвел более 1500 тестов.

В этой публикации будут разобраны результаты тестирования и сравнительный анализ 32 батареек AA.

Подробные графики можно посмотреть в базе данных. Цены и наличие батареек в продаже актуальны на 16.05.2023. Цены взяты с популярных маркетплейсов.

fenrrr 9 авг 2023 в 19:06

KPI внедрили, а аналитика спросить забыли…

Простой

7 мин

11K

Анализ и проектирование систем*Аналитика мобильных приложений*Управление продуктом*Управление персоналом*

Кейс

Неделю назад ко мне обратились с просьбой подсказать по одному рабочему кейсу.

В некоторых компаниях менеджерам (особенно тем, кто из руководителей отделов продаж перешли в бизнес-руководители IT) хлебом не корми - дай людям какой-нибудь план по эффективности ~~продаж~~ сотрудников составить.

А некоторые уникумы еще разделяют зп на базовый оклад и премиальную составляющую. Которую естественно можно резать при любом удобном или неудобном случае.

?А что, вы думали шутки про IT-заводы - это все шутки?

Перейдем же к сути кейса:

Как вы догадались уже из вступления, руководство компании X всем бизнес-аналитикам помимо базового оклада внедрило премию.
Сумму премии завязали на KPI.
KPI же определили метрикой количества багов / change request’ов после внедрения проекта...

Меня спросили мнения на тему, а насколько адекватная эта метрика, и какие еще метрики можно придумать, чтобы хоть немного повысить градус адекватности в компании.

Перед чтением статьи изучите ментальную карту в шапке, чтобы еще лучше погрузиться в контекст проблемы.

Я человек-действие, демагогию разводить не люблю, потому что если ситуация произошла - значит, нужно сделать выводы и попытаться ее решить.

Но для начала все же стоит разобраться в терминах и ограничениях по нашей задаче.

mskozlova 12 авг 2023 в 15:56

Просто добавь команд: как реализовать диалоговый Телеграм бот на основе шаблона

Простой

17 мин

16K

Python*Облачные сервисы*Serverless*

Туториал

В предыдущей статье я рассказала, как быстро создать инфраструктуру для диалогового бота на основе Yandex Serverless Functions и базы данных YDB. В качестве примера использовался примитивный бот, реализованный в моём репозитории ydb_serverless_telegram_bot.

Это вторая статья цикла – в ней я покажу, как воспользоваться шаблоном и добавить боту новые команды. В результате читатели смогут реализовать своего собственного бота на основе шаблона.

/start

tolstenkoaa 8 авг 2023 в 17:11

XPath — примеры запросов в html для парсинга сайта

9 мин

82K

Интернет-маркетинг*XML*

Recovery Mode

Парсим данные с сайтов при помощи XPath и Screaming Frog без помощи программистов. Синтаксис XPath для выбора, ссылка на удобное расширение для извлечения пути, примеры для парсинга любых данных + запись моего мастер-класса в гостях у Михаила Шакина.

Sargeras02 6 авг 2023 в 17:27

Базы Данных + Telegram Бот на C#. SKitLs Framework v.2

Сложный

16 мин

5.6K

Open source*.NET*Администрирование баз данных*C#*

Туториал

Не так давно опубликовал статью об экспресс-создании бота для Telegram на фреймворке SKitLs.Bots.Telegram. С тех пор внутренний состав фреймворка солидно изменился, вместе с тем были выпущены предварительные версии *.BotProcesses и *.DataBases и вторая версия ядра фреймворка.

В этой статье я бы хотел дать более детальный взгляд на возможности фреймворка, а также осветить новые возможности выпущенных расширений, в частности вариант реализации администрирования базы данных через клиент телеграма.

mskozlova 5 авг 2023 в 12:30

Создаём основу для диалогового Телеграм бота в облаке

Простой

7 мин

11K

Python*Облачные сервисы*Serverless*

Туториал

Из песочницы

У меня есть хобби — я учу финский язык. Просто так зубрить новые слова сложно, поэтому я решила написать бота для геймификации процесса. Бот поддерживает разные режимы тренировок, скоринг слов и объединение слов по темам, в общем — имеет довольно сложную ветвистую логику. В процессе создания бота мне удалось создать структуру кода и ресурсов, которая позволяет легко написать диалогового бота любой сложности, не рискуя запутаться и не беспокоясь о создании инфраструктуры. Ею и хочу с вами поделиться.

Это первая статья цикла, в ней я расскажу, как создать базу — шаблонного serverless бота на Python с использованием Yandex Cloud Functions и базы данных YDB с нуля.

В следующих статьях расскажу о том, как добавить боту свои команды, о структуре кода, настройке и обработке пользовательских стейтов, безопасной работе с базой данных, удобном логировании и тестировании бота, которые реализованы в шаблоне. В качестве примера буду использовать примитивного бота, реализованного в моём репозитории ydb_serverless_telegram_bot.

/start

TShevchenko 3 авг 2023 в 10:09

Какой должна быть user_story, и что общего у системных аналитиков и голливудских сценаристов

Простой

8 мин

15K

Блог компании Холдинг Т1Управление проектами*Управление разработкой*

Обзор

«Тарас, за что ты получаешь свои деньги? Ты же просто рассказываешь истории!»

За то, что я хорошо их рассказываю.

С user story всё как в Голливуде: кажется, что многие сериалы похожи друг на друга, но написать по-настоящему хороший сценарий даже для ремейка не так-то просто. Ты должен жить этим фильмом, должен знать, что ты хочешь показать, какие моменты взять из жизни и как их развернуть перед зрителем. И это стоит денег.

User story легко зафакапить. А так как от системного аналитика она сразу уходит к разработчикам, то ошибка может стоить очень дорого.

Я тот самый системный аналитик. Однажды в самом начале моей деятельности мы с Product Owner друг друга недопоняли и сделали совсем не то, чего хотел заказчик.

Моя команда работала с магазином для рыбаков и должна была создать весьма нетривиальную форму для заказов, позволяющую подбирать рыболовные снасти по определённым критериям.

PO имел в виду одно, я подумал что-то своё, задание ушло в команду. Ребята его внимательно прочитали и накодировали то, что поняли. Когда подошло время отдавать готовый продукт бизнесу, выяснилось, что мы сделали совсем не то, что имел в виду заказчик. Но т. к. мы всей командой от PO до тестировщиков были любителями рыбалки и, соответственно, целевой аудиторией сайта, то знали, как думает пользователь на самом деле, и нашли нестандартное классное решение. Заказчик посмотрел и сказал: «Слушайте, круто! Очень интересное решение! Я об этом даже не думал, когда вам говорил. Но ваш вариант мне нравится. Берём».

Решение получилось ровно таким, чтобы быть удобным целевой аудитории. Несмотря на user story. Бывает и так.

Читать дальше →

+14

3 4