Как стать автором
Обновить
0
0
Andrey Oz @ozand

Lead Data & CRM

Отправить сообщение

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Уровень сложностиСредний
Время на прочтение27 мин
Количество просмотров57K

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

Читать далее
Всего голосов 25: ↑25 и ↓0+25
Комментарии7

10 способов сделать резервную копию в PostgreSQL

Время на прочтение5 мин
Количество просмотров276K
Многие разговоры про бэкапы начинаются с присказки что люди делятся на две категории… так вот я отношусь к тем людям которые делают бэкапы. Правильно настроенное резервное копирование и проверка резервных копий укрепляет сон. А наличие заранее написаных и проигранных инструкций по восстановлению вообще укрепляет пищеварение и иммунитет. Так вот, за время работы с PostgreSQL мне довелось часто настраивать резервное копирование, при этом условия и требования были самые разные. Однако при этом набор инструментов за редким исключением оставался неизменным. В этой статье поделюсь своим опытом в деле, как можно брать резервные копии PostgreSQL.
image

Читать дальше →
Всего голосов 41: ↑39 и ↓2+37
Комментарии18

Автоматические бэкапы БД PostgreSQL по расписанию

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров19K

В этой статье я поделюсь скриптом для создания бэкапов БД PostgreSQL за определенный период (например: 1, 2, 3 дня, 1 неделя, 1 месяц, 6 месяцев, каждый год).
Объясню как запустить скрипт с помощью расписания crontab, покажу как настроить синхронизацию папки с бэкапами с облаком Yandex Disk.

Читать далее
Всего голосов 7: ↑4 и ↓3+3
Комментарии82

Возвращаем RSS к жизни

Время на прочтение6 мин
Количество просмотров33K

RSS-агрегатор NetNewsWire

Мы уже обсуждали, насколько важен и удобен RSS для профессиональной работы с источниками в интернете. Это единственный способ собрать огромный массив данных с тысяч сайтов, соцсетей, блогов, твиттер-аккаунтов, торрент-трекеров и др.

Вся информация накапливается в личном агрегаторе, доступна в удобное время, в том числе офлайн. Никогда ничего не теряется. Это особенно актуально сейчас, в условиях информационной блокады, периодических отключений интернета и угрозы полного шатдауна.
Читать дальше →
Всего голосов 63: ↑62 и ↓1+75
Комментарии73

Рейтинг IT-брендов работодателей 2023

Время на прочтение5 мин
Количество просмотров126K

Всем привет! С 2020 года команда ЭКОПСИ и Хабра проводит Всероссийское исследование IT-брендов работодателей и делится результатами, чтобы соискатели с компаниями лучше понимали актуальную картину на рынке и друг друга. Результаты прошлогоднего исследования тут.

В этом году в контур опроса попало 23 806 респондентов. Он проходил с 15 июня по 15 сентября. Как и всегда, мы спрашивали IT-специалистов, насколько та или иная компания им известна как место работы + как они оценивают её привлекательность в качестве работодателя. Помимо общего рейтинга и паспорта исследования, под катом вы найдёте срезы по конкретным отраслям бизнеса и объёму IT-департаментов (для максимальной объективности результатов).

Поехали
Всего голосов 42: ↑37 и ↓5+49
Комментарии66

Проверяем контакты: OSINT и иные методы

Время на прочтение14 мин
Количество просмотров19K

Всем привет! Сегодня у нас большая обзорная статья о различных способах проверки контактов. Кратко пройдемся по всевозможным методам для сбора информации, составим список полезных в каждом случае сервисов и затронем ограничения того или иного способа. Начнем с самых азов для начинающих любителей OSINT и дойдем до неочевидных вариантов проверки потенциальных контактов. За подробностями добро пожаловать под кат!

Читать далее
Всего голосов 7: ↑3 и ↓40
Комментарии2

Событийное логирование для аналитики и мониторинга работы телеграм-бота

Время на прочтение9 мин
Количество просмотров6.8K

Привет, Хабр! Меня зовут Артем.

По мере роста различной работы с телеграм ботом нашего корпоративного телеграм-бота, оптимизация и поддержание его стало более сложной задачей. В какой-то момент я осознал, что нужен надежный способ отслеживания происходящих событий в приложении. Это важно не только для решения проблем и багов, но и для оптимизации производительности и повышения общей эффективности работы.

В этой статье мы рассмотрим как реализовать событийное логирование для телеграм-бота.

Читать далее
Всего голосов 15: ↑11 и ↓4+9
Комментарии2

Точечная маршрутизация по доменам на роутере с OpenWrt

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров126K

Статья о том, как настроить точечный обход блокировок по нужным доменам на роутере с OpenWrt. На мой взгляд, это самый удобный способ, который можно реализовать сейчас.

Я предоставляю уже готовый конфиг с самыми востребованными доменами, который можно дополнять.

Настроить роутер можно с помощью скрипта. Если вдруг не заведётся сразу, то другим скриптом можно найти, что не работает. Настройка с помощью Ansible никуда не делась, только модифицировалась и стала лучше.

Помимо инструкций по настройке туннелей Wireguard и OpenVPN, написал инструкцию по использованию технологий, которые помогут в обходе блокировок по протоколу: Shadowsocks, VLESS и прочими.

Читать далее
Всего голосов 27: ↑27 и ↓0+27
Комментарии28

Что такое расширенные сниппеты и как с ними работать

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.9K

Расширенный сниппет — это результат, который поисковая система показывает пользователю на первой позиции. Также его называют нулевой выдачей.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Многопоточность в Python: очевидное и невероятное

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров37K

В данной статье я покажу на практическом примере как устроена многопоточность в Python, расскажу про потоки, примитивы синхронизации и о том зачем они нужны.

Изначально я планировал что это будет простая и короткая заметка, но пока готовил и тестировал код нашел интересный неочевидный момент связанных с внутренностями CPython, так что не спешите закрывать вкладку, даже если вы уверены что вы знаете о потоках в Python всё :)

Читать далее
Всего голосов 37: ↑34 и ↓3+38
Комментарии16

Как оцифровать компанию, повысить оборот и удвоить рентабельность с 32% до 55%. Часть 2

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.5K

Как оцифровать компанию по мобильной и веб-разработке, с какими трудностями можно столкнуться в процессе диджитализации, а также какие преимущества дает цифровизация в настоящее время.

Читать далее
Всего голосов 5: ↑3 и ↓2+3
Комментарии3

Windows + WSL. Счастье виндузятника

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров41K

TL;DR Почему на Хабре нет статей про то, как человек вполне доволен наличием WSL и активно ею пользуется? Неужели я один такой? Значит, пора добавить воды писать статью!

Читать далее
Всего голосов 31: ↑25 и ↓6+24
Комментарии87

Анализ текстовых данных с использованием тематического моделирования

Время на прочтение14 мин
Количество просмотров9.9K

Анализ текстовых данных становится все более важным в наше время, когда огромные объемы информации генерируются и обмениваются каждую секунду. От социальных медиа до новостных порталов, от клиентских отзывов до академических статей — текстовые данные содержат бесценные знания и инсайты. Однако извлечение значимой информации из таких объемов текста может быть огромным вызовом.

Компании хотят понимать общественное мнение о своих продуктах и брендах, но анализировать миллионы постов и комментариев вручную практически невозможно. Вот где анализ текстовых данных и тематическое моделирование приходят на помощь. Эти методы позволяют автоматически выявлять темы, тональность и структуру текста, делая процесс анализа эффективным и масштабируемым.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Тестирование и сравнительный анализ батареек AA формата

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров5.8K

Несколько лет назад делал пост про, то как я создаю глобальную базу знаний по батарейкам и аккумуляторам. Протестировал более 300 элементов питания и произвел более 1500 тестов.

В этой публикации будут разобраны результаты тестирования и сравнительный анализ 32 батареек AA.

Подробные графики можно посмотреть в базе данных. Цены и наличие батареек в продаже актуальны на 16.05.2023. Цены взяты с популярных маркетплейсов.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии2

KPI внедрили, а аналитика спросить забыли…

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров9K

Неделю назад ко мне обратились с просьбой подсказать по одному рабочему кейсу.

В некоторых компаниях менеджерам (особенно тем, кто из руководителей отделов продаж перешли в бизнес-руководители IT) хлебом не корми - дай людям какой-нибудь план по эффективности продаж сотрудников составить. 

А некоторые уникумы еще разделяют зп на базовый оклад и премиальную составляющую. Которую естественно можно резать при любом удобном или неудобном случае.

?А что, вы думали шутки про IT-заводы - это все шутки?

Перейдем же к сути кейса: 

Как вы догадались уже из вступления, руководство компании X всем бизнес-аналитикам помимо базового оклада внедрило премию. 
Сумму премии завязали на KPI.
KPI же определили метрикой количества багов / change request’ов после внедрения проекта...

Меня спросили мнения на тему, а насколько адекватная эта метрика, и какие еще метрики можно придумать, чтобы хоть немного повысить градус адекватности в компании.

Перед чтением статьи изучите ментальную карту в шапке, чтобы еще лучше погрузиться в контекст проблемы.

Я человек-действие, демагогию разводить не люблю, потому что если ситуация произошла - значит, нужно сделать выводы и попытаться ее решить.

Но для начала все же стоит разобраться в терминах и ограничениях по нашей задаче.

Читать далее
Всего голосов 8: ↑4 и ↓4+2
Комментарии15

Просто добавь команд: как реализовать диалоговый Телеграм бот на основе шаблона

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров14K

В предыдущей статье я рассказала, как быстро создать инфраструктуру для диалогового бота на основе Yandex Serverless Functions и базы данных YDB. В качестве примера использовался примитивный бот, реализованный в моём репозитории ydb_serverless_telegram_bot.

Это вторая статья цикла – в ней я покажу, как воспользоваться шаблоном и добавить боту новые команды. В результате читатели смогут реализовать своего собственного бота на основе шаблона.

/start
Всего голосов 6: ↑5 и ↓1+5
Комментарии0

XPath — примеры запросов в html для парсинга сайта

Время на прочтение9 мин
Количество просмотров62K

Парсим данные с сайтов при помощи XPath и Screaming Frog без помощи программистов. Синтаксис XPath для выбора, ссылка на удобное расширение для извлечения пути, примеры для парсинга любых данных + запись моего мастер-класса в гостях у Михаила Шакина.

Читать далее
Всего голосов 8: ↑6 и ↓2+6
Комментарии4

Базы Данных + Telegram Бот на C#. SKitLs Framework v.2

Уровень сложностиСложный
Время на прочтение16 мин
Количество просмотров5.1K

Не так давно опубликовал статью об экспресс-создании бота для Telegram на фреймворке SKitLs.Bots.Telegram. С тех пор внутренний состав фреймворка солидно изменился, вместе с тем были выпущены предварительные версии *.BotProcesses и *.DataBases и вторая версия ядра фреймворка.

В этой статье я бы хотел дать более детальный взгляд на возможности фреймворка, а также осветить новые возможности выпущенных расширений, в частности вариант реализации администрирования базы данных через клиент телеграма.

Читать далее
Всего голосов 4: ↑2 и ↓2+1
Комментарии2

Создаём основу для диалогового Телеграм бота в облаке

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров9.2K

У меня есть хобби — я учу финский язык. Просто так зубрить новые слова сложно, поэтому я решила написать бота для геймификации процесса. Бот поддерживает разные режимы тренировок, скоринг слов и объединение слов по темам, в общем — имеет довольно сложную ветвистую логику. В процессе создания бота мне удалось создать структуру кода и ресурсов, которая позволяет легко написать диалогового бота любой сложности, не рискуя запутаться и не беспокоясь о создании инфраструктуры. Ею и хочу с вами поделиться.

Это первая статья цикла, в ней я расскажу, как создать базу — шаблонного serverless бота на Python с использованием Yandex Cloud Functions и базы данных YDB с нуля.

В следующих статьях расскажу о том, как добавить боту свои команды, о структуре кода, настройке и обработке пользовательских стейтов, безопасной работе с базой данных, удобном логировании и тестировании бота, которые реализованы в шаблоне. В качестве примера буду использовать примитивного бота, реализованного в моём репозитории ydb_serverless_telegram_bot.

/start
Всего голосов 12: ↑9 и ↓3+6
Комментарии7

Какой должна быть user_story, и что общего у системных аналитиков и голливудских сценаристов

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров14K
image

«Тарас, за что ты получаешь свои деньги? Ты же просто рассказываешь истории!»

За то, что я хорошо их рассказываю.

С user story всё как в Голливуде: кажется, что многие сериалы похожи друг на друга, но написать по-настоящему хороший сценарий даже для ремейка не так-то просто. Ты должен жить этим фильмом, должен знать, что ты хочешь показать, какие моменты взять из жизни и как их развернуть перед зрителем. И это стоит денег.

User story легко зафакапить. А так как от системного аналитика она сразу уходит к разработчикам, то ошибка может стоить очень дорого.

Я тот самый системный аналитик. Однажды в самом начале моей деятельности мы с Product Owner друг друга недопоняли и сделали совсем не то, чего хотел заказчик.

Моя команда работала с магазином для рыбаков и должна была создать весьма нетривиальную форму для заказов, позволяющую подбирать рыболовные снасти по определённым критериям.

PO имел в виду одно, я подумал что-то своё, задание ушло в команду. Ребята его внимательно прочитали и накодировали то, что поняли. Когда подошло время отдавать готовый продукт бизнесу, выяснилось, что мы сделали совсем не то, что имел в виду заказчик. Но т. к. мы всей командой от PO до тестировщиков были любителями рыбалки и, соответственно, целевой аудиторией сайта, то знали, как думает пользователь на самом деле, и нашли нестандартное классное решение. Заказчик посмотрел и сказал: «Слушайте, круто! Очень интересное решение! Я об этом даже не думал, когда вам говорил. Но ваш вариант мне нравится. Берём».

Решение получилось ровно таким, чтобы быть удобным целевой аудитории. Несмотря на user story. Бывает и так.
Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии2

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность