Pull to refresh
1
0
Георгий Мамедалиев @gerchik

User

Send message

Мам, а ты можешь принести твоего хлеба на год вперед? Или почему мое производство больше ничего не испечет

Level of difficultyEasy
Reading time13 min
Views26K

Производство хлеба «Никитин-хлеб» закрылось 8 октября 2024 года спустя ровно 9 лет: с 8 октября 2015 года.

Мы покупали новое оборудование, открывали новые точки, пекли по 1 700 буханок в день, но в 2024-м выручка резко упала, а расходы также резко выросли.

Пишу эту статью, пока глаз еще дергается, а в памяти свежи цифры и подробности, что значит 9 лет владеть и управлять хлебопекарным бизнесом.

Читать далее
Total votes 94: ↑75 and ↓19+77
Comments259

Операции машинного обучения (MLOps) для начинающих: полное внедрение проекта

Level of difficultyMedium
Reading time21 min
Views4.5K

Разработка, развёртывание и поддержка моделей машинного обучения в продакшене может быть сложной и трудоёмкой задачей. Здесь на помощь приходит Machine Learning Operations (MLOps) — набор практик, который автоматизирует управление ML-процессами и упрощает развёртывание моделей. В этой статье я расскажу о некоторых основных практиках и инструментах MLOps на примере реализации проекта от начала до конца. Это поможет вам эффективнее управлять ML-проектами, начиная с разработки и заканчивая мониторингом в продакшене.

Прочитав эту статью, вы узнаете, как:

— Использовать DVC для версионирования данных.
— Отслеживать логи, артефакты и регистрировать версии моделей с помощью MLflow.
— Развернуть модель с помощью FastAPI, Docker и AWS ECS.
— Отслеживать модель в продакшене с помощью Evidently AI.

Читать далее
Total votes 17: ↑17 and ↓0+22
Comments3

Kafka и картошка

Level of difficultyEasy
Reading time4 min
Views8.3K

Так уж получилось что как держатель профессии системного анализа я не раз в ходе занятий со студентами, собеседований, и ассесментов сталкивался с проблемой непонимания базовых принципов и ценностей работы сервисов очередей. Люди не понимают ни как оно работает ни для чего нужно. И раз уже до ИТ мне посчастливилось почти 10 лет отслужить в армии то пример, который очень зашел даже далеким от ИТ людям, со временем родился сам собой.

Итак, вводные данные: военная столовая, мы — проектировщики системы (командиры). Помимо вас в задаче имеется погреб с картошкой и необходимость ее почистить. Для этого у нас есть почти неограниченное количество не особо сообразительных исполнителей — солдат, которым можно поручить эту работу. Согласно нашим вводным солдаты, как и информационные системы, не умеют и не должны сами принимать решения, они делают только то, что мы им поручили.

Читать далее
Total votes 29: ↑24 and ↓5+24
Comments15

Как убить самоорганизацию в команде: вредные советы для лидера

Reading time12 min
Views28K

Привет, Хабр! Меня зовут Светлана Болсуновская, я стратегический коуч-консультант в YADRO. Многие компании перешли на гибридный формат работы, где команды нуждаются в особом подходе для поддержания самоорганизации — процесса, при котором люди выполняют задачи без постоянного контроля руководителя. Я поделюсь своими наблюдениями, почему в современных условиях самоорганизация не происходит «магически» и что должен (и не должен) делать тимлид, чтобы помочь команде достичь этой цели.

Читать далее
Total votes 39: ↑33 and ↓6+34
Comments47

Препарируем менеджмент гигантов Кремниевой долины. Четыре причины прочитать «Transformed»

Reading time5 min
Views5K
Всем привет! Сегодня я продолжаю свой рассказ о важнейшей литературе для любого менеджера, начатый в моей первой статье про литературу для тимлидов, и представляю вам книгу Марти Кагана «Transformed — Moving to the Product Operating Model».

Каган — один из наиболее ярких IT-менеджеров в Кремниевой долине. В своих статьях и книгах он разбирает менеджмент таких гигантов, как Amazon и Spotify, описывает свой взгляд на ведение бизнеса, а в этой книге объединил весь этот опыт и представил самостоятельную «инструкцию» по трансформации работы над продуктом.


Читать дальше →
Total votes 33: ↑32 and ↓1+37
Comments3

На сколько денег может рассчитывать ИТ-предприниматель в разных ветках развития

Reading time8 min
Views37K
1 миллион рублей в месяц — на руководстве проектом или на должности лида в условном Сбере или Яндексе. Там же вас и похоронят вместе со специализацией, но до пенсии работать будет очень комфортно.

2–4 миллиона — если заняться малым бизнесом по известной модели. Шаурма, недвижка, что-то ещё традиционное, в чём вы разбираетесь. Нужны софт-скилы, чтобы договариваться с администрацией, и несколько лет на развитие. Есть риски, но они обычно связаны с некомпетентностью или непониманием рынка.

Если хочется прыгнуть выше, то начинаются уже ИТ-стартапы, венчур. Там можно заработать примерно столько же, сколько в корпорации, но только в среднем. Лотерейное распределение — сотые доли процента стать единорогом, полпроцента — вырастить средний бизнес, 3–10 % — вырастить малый. Остальное — вы просто потеряете время и деньги.

image
Carta показывает стадии стартапов. Для 55 % через 5 лет ещё непонятно — это к вопросу скорости. 1,3 % успешны, 0,2 % суперуспешны, но там везде биотех, а не ИТ. Вот источник данных

Если что, я так уверенно про это всё рассказываю, потому что мой последний проект, который я делала 10 лет и в который вошёл Сбер с долей чуть больше 100 миллионов долларов (на развитие), через 2 года внезапно кончился. По условиям сделки я получила акции материнской компании СберГеймс. 24 февраля 2022 года стало понятно, что международных амбиций у СбераГеймс уже нет, мне нужно распускать штат в 200 человек, а моя доля была переоценена в 30 центов.

Мне немного жалко эти 10 лет и 10 лет работы команды. И я понимаю, что у меня осталось 1–2 попытки сделать что-то большое. И сейчас я занимаюсь как раз венчуром.
Читать дальше →
Total votes 58: ↑53 and ↓5+62
Comments90

Нейронные сети (инференс MNIST) на «3-центовом» микроконтроллере

Reading time5 min
Views9.4K

Вдохновившись на удивление высокой производительностью нейронных сетей и обучением с учётом квантования на микроконтроллере CH32V003, я захотел выяснить, как далеко эту идею можно развить. Насколько можно сжать нейронную сеть с сохранением высокой точности тестов на датасете MNIST? Когда речь идёт о крайне дешёвых микроконтроллерах, сложно предположить что-то более подходящее, чем 8-битные Padauk.

Эти устройства оптимизированы под простейшие и самые дешёвые приложения из доступных. Самая мелкая модель серии, PMS150C, оснащена однократно программируемой памятью в 1024 13-битных слова и 64 байтами RAM — на порядок меньше, чем в CH32V003. Кроме того, эта модель в противоположность намного более мощному набору инструкций RISC-V содержит коммерческий регистр-аккумулятор на основе 8-битной архитектуры.

Возможно ли реализовать механизм инференса MNIST, способный классифицировать рукописные числа, также и на PMS150C?
Читать дальше →
Total votes 78: ↑76 and ↓2+109
Comments5

Простой и быстрый тест LLM для прототипа: сравниваем 16 open-source-моделей на запросе с разной температурой

Level of difficultyEasy
Reading time16 min
Views3.9K

Привет, Хабр! Меня зовут Дмитрий Фролов, я ведущий разработчик в Центре компетенций Data Science МТС Диджитал. С ростом популярности LLM создание на них прототипа может прилететь даже тем, кто напрямую с ML не связан. Допустим, вы работаете аналитиком, а ваше начальство резко захотело генератор текста или отчетов в стиле клиентского менеджера с open-source LLM под капотом. Скорее всего, в таких задачах вы ни в зуб ногой, а разбираться с api и токенами нет времени и желания.

Самый простой способ выбрать подходящую модель для прототипа — взять несколько моделей, дать им одинаковый запрос и сравнить результаты. Так вы с минимальными усилиями получите наглядный пример их работы, оцените качество генерации и поймете, насколько перспективна модель для получения приемлемого результата.

Итак, велкам под кат, если вам интересно, как «на коленке» протестировать сразу шестнадцать LLM, какие результаты покажет тест и куда смотреть, если нужны более серьезные результаты.

Читать далее
Total votes 25: ↑24 and ↓1+32
Comments1

Кто стоит за убийством Google Search?

Level of difficultyMedium
Reading time14 min
Views36K

Это история о том, как умер Google Search, и о причастных к его смерти людях.

Начинается она 5 февраля 2019 года, когда Бен Гомес, глава Google Search, столкнулся с проблемой. Джерри Дишлер, на тот момент вице-президент и главный управляющий Google Ads, вместе с Шивой Венкатараманом, тогда вице-президентом по разработке систем Google Search и Ads, объявили «код жёлтый» в отношении доходности Google Search. Причиной такого шага стало, цитирую: «Стабильно низкие ежедневные показатели», а также вероятность того, что к концу квартала доходность этого сегмента окажется в значительном упадке.
Читать дальше →
Total votes 104: ↑99 and ↓5+127
Comments159

Обучение GigaChat с контекстом в сотни тысяч токенов

Level of difficultyMedium
Reading time13 min
Views3.1K

Помните фразу «640 килобайт памяти хватит всем»? Запросы человечества вечно растут, а индустрии надо поспевать.

Вот и с языковыми моделями так. Ещё недавно мы все удивлялись тому, на что они стали способны. А теперь нам этого мало: «ну хорошо, а может модель в диалоге учитывать то, что я сказал сотни реплик назад?»

Весной на нашей конференции I'ML Евгений Косарев (SberDevices) рассказал о том, как к увеличению контекста подошли при работе над GigaChat. А сейчас мы публикуем текстовую расшифровку его доклада. Ссылки на его видеозапись тоже прилагаем: YouTube, VK Видео.

Читать далее
Total votes 11: ↑11 and ↓0+18
Comments1

OpenTelemetry с нуля до 100: пример внедрения Норвежским управлением труда и соцобеспечения

Level of difficultyMedium
Reading time11 min
Views7.3K

Сейчас OpenTelemetry — это самый быстрорастущий проект CNCF. Опытом внедрения этого набора инструментов для отладки и анализа производительности распределённых систем поделился тимлид платформенной команды Норвежского управления труда и социального обеспечения. В переводе под катом вас ждёт тернистый путь от первых коммитов до реального применения OpenTelemetry в production, а также планы команды на будущее.

Читать далее
Total votes 25: ↑25 and ↓0+32
Comments4

Потребление ресурсов в Prometheus: кто виноват и что делать (обзор и видео доклада)

Level of difficultyEasy
Reading time14 min
Views5.3K

У Prometheus есть серьёзный недостаток — чрезмерное потребление ресурсов. Проблема может заключаться в недостаточном понимании инструмента и его неверном использовании. А Prometheus требует грамотного управления метриками и лейблами.

В своем докладе технический директор Deckhouse Observability Platform Владимир Гурьянов выяснил, кто виноват в этом и что делать.

Читать далее
Total votes 39: ↑39 and ↓0+49
Comments7

История Git: на этот раз не так весело

Reading time23 min
Views31K

Линус Торвальдс как-то написал в своей книге, что создавал Linux для развлечения, но в итоге это привело к революции. Git, его второе творение, также оказалось «случайной революцией» — и сегодня это стандартный инструмент для людей в ИТ. Однако процесс его создания был уже не таким «весёлым» — по крайней мере, для самого Линуса. 

Читать далее
Total votes 99: ↑98 and ↓1+114
Comments56

Почему Google Gemini не пользуется популярностью среди разработчиков?

Level of difficultyEasy
Reading time8 min
Views11K

Когда Google представила свою революционную ИИ-модель Gemini, разработчики замерли в ожидании прорыва. Но вместо обещанной простоты они столкнулись с неожиданными трудностями. Один из основателей стартапа провёл 4 часа, пытаясь настроить API соединение, в то время как конкуренты справляются за считанные минуты.

Почему, несмотря на все сложности, крупные компании еще выбирают Gemini, и сможет ли Google обойти своих конкурентов в этой гонке за искусственный интеллект?

Перейти к чтению
Total votes 7: ↑4 and ↓3+4
Comments5

Эхо Дайджест: преимущества и недостатки o1-mini по сравнению с Sonnet 3.5

Reading time6 min
Views1.1K

Промт для «Бога автоматизации»; Российская компания «Модуль» представила высокопроизводительный вычислительный модуль NM Quad; Демонстрация процесса взлома и получения доступа к отладочным меню первых трех поколений спутниковых ТВ-антенн Winegard; и многое другое.

Читать далее
Total votes 4: ↑4 and ↓0+6
Comments0

Как зелёная сова отхватила себе место на мировой арене: история успеха Duolingo

Reading time5 min
Views7.3K

Все мы знаем эту зеленую сову Дуолинго. Но вот какая работа была проделана для того, чтобы мы о ней знали - в этой статье. Разберемся, что вообще происходит, обсудим сервис в целом, а на десерт оставим коммерческий успех.

Читать далее
Total votes 9: ↑6 and ↓3+8
Comments18

Создание инструмента генерации кода с помощью Rust и локальных LLM от Ollama

Level of difficultyMedium
Reading time4 min
Views4K

Это реакция на выпуск ChatGPT o-preview. Попытка добавить логику в LLM с открытым исходным кодом, которые можно запустить дома на скромном GPU или даже на CPU

Сейчас я работаю над инструментом на основе Rust, который автоматизирует генерацию, компиляцию и тестирование кода с использованием больших языковых моделей (LLM). Идея заключается в том, чтобы взаимодействовать с LLM для генерации кода на основе предоставленных пользователем объяснений, компилировать код, разрешать зависимости и запускать тесты, чтобы убедиться, что все работает так, как ожидается.

Я хотел бы оптимизировать процесс кодирования функций на основе описаний на естественном языке. Я хотел создать систему, в которой я мог бы ввести объяснение того, что должна делать функция, и чтобы инструмент обрабатывал все остальное от генерации кода до тестирования.

Работа инструмента начинается с того, что запрашивает у пользователя объяснение функции, которую он хочет создать. Затем он взаимодействует с LLM для генерации кода функции, компилирует его и проверяет на наличие ошибок компиляции. Если ошибки обнаружены, инструмент пытается их устранить, возможно, путем добавления зависимостей или переписывания кода. После успешной компиляции кода он генерирует тесты для функции, запускает их и снова обрабатывает любые ошибки, итеративно улучшая код или тесты.

Первый шаг — получить объяснение от пользователя:

Читать далее
Total votes 8: ↑8 and ↓0+14
Comments13

Как самому обучить апскейлер на Real-ESRGAN Compact, и как правильно реставрировать старую анимацию с нейросетями

Level of difficultyEasy
Reading time11 min
Views2.4K

На данный момент присутствуют всего 3 популярные утилиты с разнообразными моделями апскейлинга. Это продукты компании Topaz LabsTopaz Video AI и Topaz Gigapixel. И отдельный проект с открытым кодом — ChaiNNer. С продуктами Topaz Labs, я уверен, знакомы многие. Однако что можно сказать о слоне в комнате — ChaiNNer? А ещё более интересный вопрос — как создать свой апскейлер?

Я создатель статьи про реставрацию Том и Джерри в 1440p. И вот, спустя более чем полгода, я снова горю желанием поделиться с вами моими новоприобретёнными знаниями. Статья разделена на две части: интересную для большинства и сугубо техническую, хоть и очень разжёванную, как раз по теме заголовка статьи.

Читать далее
Total votes 21: ↑21 and ↓0+31
Comments18

Как справиться с нагрузкой в черную пятницу? Автоскейлинг инференса на GPU в Kubernetes

Level of difficultyHard
Reading time10 min
Views3.9K

У многих наступление осени вызывает разные чувства и эмоции: от ностальгии во время просмотра Гарри Поттера под теплым пледом до депрессивных мыслей у дождливого окна в кофейне. Именно в этот период компании проводят масштабные мероприятия, одно из них — известная черная пятница. Клиенты пытаются «урвать» по хорошей скидке товары и купить подарки к Новому году. В связи с этим «атакуют» своим трафиком популярные сайты e-commerce, которые могут быть не готовы к такой нагрузке.

Ни для кого не секрет, как сохранить и инфраструктуру в пиковые нагрузки, и трафик клиентов. При этом не понести большие убытки. Деплоим сервис в облако, скейлим ресурсы по требованию и радуемся продажам! Но это в e-commerce, мы же с вами интересуемся ML production.

Привет, Хабр! Я — Антон, DevOps-инженер в команде Data/ML-продуктов Selectel. В этой статье расскажу, зачем нужен автоскейлинг GPU-ресурсов, как настроить масштабирование реплик в Kubernetes по трафику, а также как сделать свой высоконагруженный ChatGPT.
Читать дальше →
Total votes 33: ↑33 and ↓0+44
Comments0

Garak: инструмент Red-Team для поиска уязвимостей в LLM

Level of difficultyEasy
Reading time7 min
Views1.4K

«ChatGPT раскрывает личные данные реальных людей!», «Атака на ChatGPT по сторонним каналам!», «Чат-бот ChatGPT стал причиной утечки секретных данных!», «Хакеры стали использовать ChatGPT в схемах фишинга!». — Эти новостные заголовки раскрывают нам тёмную сторону больших языковых моделей. Да, они генерируют за нас контент и анализируют данные, но помимо удобства, приносят новые виды атак и уязвимостей, с которыми надо уметь бороться.

Меня зовут Никита Беляевский, я исследую аспекты безопасности LLM решений в лаборатории AI Security в Raft и хочу поделиться нюансами настройки и использования инструмента для выявления угроз в системах на основе LLM.

Читать далее
Total votes 9: ↑9 and ↓0+12
Comments0
1
23 ...

Information

Rating
Does not participate
Location
Dallas, Texas, США
Date of birth
Registered
Activity