Search
Write a publication
Pull to refresh
0
0
Aidarov Kirill @windweb

QA / Data Scientist / Economist / Skipper

Send message

Выбираем правильный инференс: Как мы сэкономили 70к $ на ЛЛМках

Reading time4 min
Views6.2K

Недавно ко мне обратились знакомые, которые активно впиливали LLM в своей продукт, однако их смущала стоимость такого решения - они платили около 8$/час за Huggingface inference Endpoint 24/7, на что уходили просто невиданные ~100 тысяч долларов в год. Мне нужно было заресерчить какие есть способы развертывания больших текстовых моделей, понять какие где есть проблемы и выбрать оптимальных из них. Результатами этого ресерча и делюсь в этой статье)

Читать далее

Как ускорить LLM-генерацию текста в 20 раз на больших наборах данных

Reading time7 min
Views15K

Всем привет, я Алан, разработчик-исследователь в MTS AI. В команде фундаментальных исследований мы занимаемся исследованием LLM, реализацией DPO и валидацией наших собственных языковых моделей. В рамках этих задач у нас возникла потребность в генерации большого количества данных с помощью LLM. Такая генерация обычно занимает много времени. Однако за последний год, с ростом популярности LLM, стали появляться различные инструменты для развертывания таких моделей. Одной из самых эффективных библиотек для инференса языковых моделей является библиотека vLLM. В статье показывается, как с помощью асинхронных запросов и встроенных особенностей vLLM можно увеличить скорость генерации примерно в 20 раз. Приятного чтения!

Читать далее

Tell me about yourself — вопросы для собеседования на английском (на примере Product manager, ответы + грамматика)

Reading time7 min
Views12K

Итак, ты решил сменить работу и исследовать для себя новые карьерные возможности на международном рынке. Английский на уровне В1+/В2, что уже само по себе заставляет тебя нервничать, ведь во всех вакансиях написано fluent English, а ты впадаешь в ступор от непонимания как правильно ответить на самый первый вопрос на собеседовании “Tell me about yourself”. А еще нужно создать достойное резюме и уметь рассказывать о своем опыте, чтобы повысить свои шансы. Всё это становится супер overwhelming, ты хватаешься за голову и понимаешь что не существует one-size-fits-all решения. 

Здесь я уже рассказывала как структурно отвечать на вопросы рекрутера, но данная статья посвящена именно self-pitch. Я поделюсь 2 способами создания эффективной самопрезентации, а в конце статьи ты можешь забрать шаблон и использовать его для создания ответа на вопрос “Tell me about yourself”. Если ты уже сделал всё по шаблону или у тебя есть другая версия рассказа о себе, ты можешь написать лично  автору и показать свой результат для обратной связи. 

Как рассказать о себе? Способ 1.

Self-pitch - это продающая самопрезентация о себе. Самое важное что нужно запомнить - Product managers tell stories. Навык рассказывать истории (сторителлинг) просто необходим для эффективных ответов на вопросы собеседования. 

Секрет классных историй позаимствуем у литературы/кинематографа. В оригинале это выглядит вот так, но мы немного модифицируем картинку.

Читать далее

Parallelism vs Concurrency: правильно подбираем инструменты

Reading time17 min
Views47K
Здравствуйте, уважаемые хабровчане! Мы решили возобновить публикации еще до окончания больших праздников, но в сегодняшней статье все-таки раскрыта тема справедливой раздачи подарков. Сама же статья, как понятно из названия, посвящена сравнительному анализу параллелизма и конкурентности.

Читать дальше →

Руководство по магическим методам в Питоне

Reading time28 min
Views646K
Это перевод 1.17 версии руководства от Rafe Kettler.


Содержание


  1. Вступление
  2. Конструирование и инициализация
  3. Переопределение операторов на произвольных классах
  4. Представление своих классов
  5. Контроль доступа к атрибутам
  6. Создание произвольных последовательностей
  7. Отражение
  8. Вызываемые объекты
  9. Менеджеры контекста
  10. Абстрактные базовые классы
  11. Построение дескрипторов
  12. Копирование
  13. Использование модуля pickle на своих объектах
  14. Заключение
  15. Приложение 1: Как вызывать магические методы
  16. Приложение 2: Изменения в Питоне 3


Вступление


Что такое магические методы? Они всё в объектно-ориентированном Питоне. Это специальные методы, с помощью которых вы можете добавить в ваши классы «магию». Они всегда обрамлены двумя нижними подчеркиваниями (например, __init__ или __lt__). Ещё, они не так хорошо документированны, как хотелось бы. Все магические методы описаны в документации, но весьма беспорядочно и почти безо всякой организации. Поэтому, чтобы исправить то, что я воспринимаю как недостаток документации Питона, я собираюсь предоставить больше информации о магических методах, написанной на понятном языке и обильно снабжённой примерами. Надеюсь, это руководство вам понравится. Используйте его как обучающий материал, памятку или полное описание. Я просто постарался как можно понятнее описать магические методы.
Читать дальше

Кто такой аналитик бизнес-данных по стандарту Guide to Business Data Analytics

Level of difficultyMedium
Reading time2 min
Views1.6K

Закончил перевод стандарта от Международного института бизнес-анализа (IIBA) Руководство по аналитике бизнес-данных. Стандарт выстроен примерно по той же схеме что и другие стандарты IIBA:

• Введение
• Области знаний (домены).
• Типовые задачи, которые решают аналитики.
• Техники (методы работы), которые используются для решения задач.

Кроме того, в отличие, например, от стандарта BABOK Guide, здесь присутствуют значительное количество практических примеров из реальной жизни – как та или иная компания решали свои проблемы с помощью аналитики данных, а также по каждому домену приводится разбор учебного кейса – в этом Руководство по аналитике бизнес-данных легче использовать как учебник, чем BABOK Guide.

Роль аналитика бизнес-данных в данном стандарте занимает примерно такое же место как роль бизнес-аналитика в BABOK Guide.

Читать далее

Краткий обзор NLP библиотеки SpaСy

Reading time5 min
Views37K

Обработка естественного языка(Natural Language Processing — NLP) сегодня становится очень востребованной, так как людям несомненно проще общаться с машинами также, как они общаются с людьми.


image


Поэтому сейчас, вместе с быстрым развитием этой области, всё больше сервисов используют NLP: чат-боты, в которых больше не нужно выбирать готовые ответы, голосовые ассистенты, электронная почта, чтобы автоматически сортировать письма и так далее. В этом посте я хочу рассказать об относительно новой Python библиотеке SpaCy, которая стала, если не индустриальным стандартом, как кричат заявляют сами создатели на сайте библиотеки: https://spacy.io/, то как минимум одним из самых популярных и удобных решений. Приятного чтения!

Читать дальше →

Автоматизируем поиск ценной информации в групповых чатах Telegram с помощью LLM

Level of difficultyMedium
Reading time17 min
Views20K

Устали мониторить бесконечные групповые чаты в Telegram в поисках важной информации? Решение есть! Пишем компактное приложение на Python, которое будет делать это за нас с использованием LLM.

Читать далее

Оптимизация нейронки в Tensorflow?

Level of difficultyEasy
Reading time6 min
Views3.8K

В отличие от Pytorch, где структура данных выстраивается налету после начала обучения нейронки – в TensorFlow граф статичен. В этой статье мы кратко расскажем про некоторые способы ускорения обучения путем изменения графа вычислений: XLA, GraphTransform Tool, квантизация, заморозка графа и сохранение легкого чекпоинта.  

Читать далее

Линейная регрессия. Основная идея, модификации и реализация с нуля на Python

Level of difficultyHard
Reading time16 min
Views46K

В машинном и глубоком обучении линейная регрессия занимает особое место, являясь не просто статистическим инструментом, но а также фундаментальным компонентом для многих более сложных концепций. В данной статье рассмотрен не только принцип работы линейной регрессии с реализацией с нуля на Python, но а также описаны её модификации и проведён небольшой сравнительный анализ основных методов регуляризации. Помимо этого, в конце указаны дополнительные источники для более глубокого ознакомления.

Читать далее

Как мы делаем веб-сервис для автоматизации рабочих задач на базе агентов LLM

Reading time9 min
Views5.3K

Друзья, всем привет! Сегодня хотим рассказать про то, как мы — Виталий, Даниил, Роберт и Никита — при поддержке AI Talent Hub, совместной магистратуры Napoleon IT и ИТМО, создаем Цифработа — сервис цифровых работников, который помогает оптимизировать временные затраты у сотрудников на выполнение рабочих задач с помощью агентов больших языковых моделей (LLM).

В данной статье мы вкратце рассмотрим, кто такие агенты, как они могут автоматизировать рабочие процессы, и обсудим ключевые вызовы, с которыми мы столкнулись при разработке сервиса. Сразу хочется отметить, что данная статья, скорее, служит обзором нашего решения проблемы и тех задач, над которыми мы работали, нежели преследует цель предоставить подробное руководство по применению агентов или проектированию архитектуры сервиса.

Предлагаем начинать!

Читать далее

Swagger (OpenAPI 3.0)

Reading time9 min
Views398K

Swagger - это фреймворк для спецификации RESTful API. Его прелесть заключается в том, что он дает возможность не только интерактивно просматривать спецификацию, но и отправлять запросы – так называемый Swagger UI. Также возможно сгенерировать непосредственно клиента или сервер по спецификации API Swagger, для этого понадобиться Swagger Codegen.

Читать далее

Ангелы Charles: Как сниффер поможет разработчикам мобильных приложений

Reading time11 min
Views16K

Charles называют самым популярным сниффером, инструментом для мониторинга трафика и подмены данных. Он работает как промежуточное звено между вебом или мобильным приложением (в нашем случае) и сервером. Этот инструмент хорошо знают тестировщики, но разработчикам тоже полезно знать и пользоваться его возможностями. В этой статье мы сосредоточимся на основных функциях Charles для мобильных приложений.

Читать далее

Как настроить Charles

Reading time5 min
Views112K

Приложение Charles Proxy - большой помощник и тестировщику, и разработчику. Мы хотим рассказать вам про функции «Чарльза», показать, как им пользуемся в своей работе. Но для начала поможем разобраться с приложением и правильно его настроить.

Читать далее

Опросил больше 1000 айтишников: вранье в резюме и котируемость курсов по «вкатыванию в IT»

Reading time7 min
Views135K

Получилось отследить довольно интересные тренды: как размер стажа в индустрии коррелирует с отношением к выдумыванию опыта в резюме, как в IT-среде на самом деле относятся к выпускникам школ в стиле «стань айтишником за год», а также рейтинг самых ненавидимых и респектуемых в среде профи школ.

Читать далее

IT-компаниям: что нужно контролировать, чтобы не потерять миллионы на налогах и штрафах от ФНС

Reading time7 min
Views3.1K

Статус IT-компании дает льготу по налогу на прибыль (0%) и страховым взносам (7,6% вместо 15–30%). Но чтобы спокойно применять льготы, нужно следовать некоторым условиям государства. Отслеживать и контролировать эти условия необходимо бухгалтерии и юридическому отделу. А что конкретно — читайте в статье.

Читать статью

Как создать экосистему и сколько это стоит

Level of difficultyMedium
Reading time22 min
Views2.3K

В этом большом материале я хочу поразмышлять на тему того, как из базового MVP стартапа сделать не просто продукт - а целую экосистему. Подумать над монетизацией и юнит-экономикой, посчитать затраты на разработку и потенциальные заработки. Все расчеты в материалах не достоверные, они показывают логику таких расчетов, а не реальную прибыль на проекте.

Читать далее

Как взламывают биометрию и заставляют нейросети придумывать способы атак: топ-6 докладов с PHDays о ML и AI

Level of difficultyEasy
Reading time4 min
Views3.8K

Машинное обучение — особенно генеративные нейронные сети, такие как ChatGPT, — меняет мир нечеловеческими темпами. Разработчиков на некоторых дистанционных собеседованиях просят направить веб-камеру на рабочее место и клавиатуру, чтобы понимать, самостоятельно ли соискатель выполняет задания. Amazon ограничивает авторов самиздата загрузкой на сайт трех книг в день — фанфики и другая проза создаются неестественно быстро для «кожаных мешков». Поумневшие чат-боты приводят к массовым увольнениям сотрудников поддержки, а дизайнеры опасаются уступить конкуренцию Midjourney и Playground v2.

Генеративный AI словно говорит человечеству: «Сосредоточьтесь на важном, а я займусь искусствами, этими избыточными павлиньими хвостами хомосапиенсов, и рутиной». Люди ставят задачи, а огромная AI-фабрика по созданию цифрового контента их выполняет. Мечта многих, получается, осуществилась? Но преступники тоже используют AI или находят способы обмануть умные системы. Об угрозах ML и AI, в том числе для информационной безопасности, мы будем говорить в традиционном треке на киберфестивале Positive Hack Days 2. У вас есть время подать заявку до 15 марта, чтобы поделиться своим исследованием с 23 по 26 мая на стадионе «Лужники». А сейчас расскажем о некоторых любопытных докладах прошлых лет на ML-треке PHDays.

Читать подборку

Схема создания контента во все социальные сети на месяц (тратя всего 3 часа)

Level of difficultyEasy
Reading time2 min
Views13K

Эта схема сильно ОБЛЕГЧАЕТ жизнь, если вы итак пытаетесь охватить все возможные каналы связи, до которых можете дотянуться (и это ПРАВИЛЬНО, это 100% верная стратегия).

И одновременно сильно УСЛОЖНЯЕТ вам всё, если вы до этого вели например только Инстаграм

В 2024 году развивать одну социальную сеть – запретительная роскошь. Каждый ресурс имеет свою аудиторию, и никогда не знаешь, какой инструмент сработает для тебя лучше. А используя секретное заклинание «Кросспостинг» можно присутствовать везде.

З.Ы. Да, лучше для каждой социальной сети делать уникальный контент, но это next level, для начала достаточно и простого кросспостинга.

Читать далее

На словах ты Лев Толстой, а на деле не можешь развернуть Nginx в Kubernetes

Level of difficultyEasy
Reading time3 min
Views26K

Привет! Меня зовут Леонид, я руководитель DevOps-юнита в KTS.

Как понять на собеседовании, что человек действительно умеет что-то делать руками, а не просто красиво говорит? 

В статье расскажу, как мы сделали аналог онлайн-код-интервью для DevOps-инженеров, чтобы точно увидеть уровень навыков и заинтересовать инженеров интересными задачами.

Читать далее

Information

Rating
Does not participate
Location
Сестрорецк, Санкт-Петербург и область, Россия
Registered
Activity

Specialization

Data Analyst, Data Scientist
Python
Pytorch
Keras
Pandas
SAP BI
Data Analysis
Web analyst
HTML
CSS
JavaScript