Articles / Bookmarks / Profile of Rai220 / Habr

How to become an author

User

ProfileArticles7PostsNewsComments279

GrinRus May 12 at 12:00

Как довести фичу до продакшена без боли: пошаговый гайд от команды RuStore. Часть 2

5 min

695

VK corporate blogIT Standards*Project management*Development Management*Web services testing*

Tutorial

В первой части гайда RuStore по доставке фичей мы — техлид backend-команды Rustore Григорий Рябов и руководитель команды разработки RuStore: направление платежей, Александр Котельников, разобрали подготовительные этапы, которые закладывают прочный фундамент для всей разработки: от Kick-off и архитектурного планирования до Technical Design и тестовой стратегии.

Читать далее

+32

vorobeevich Mar 13 at 12:36

GigaChat 2.0 в API

Medium

14 min

20K

SberDevices corporate blogСбер corporate blogArtificial IntelligenceMachine learning*Big Data*

Review

Салют, Хабр! Время летит незаметно. Будто совсем недавно мы знакомили вас с GigaChat MAX, но мы не стоим на месте и сегодня готовы представить вам обещанный апгрейд. За полгода мы значительно улучшили обучающие данные, поработали над инфраструктурой обучения моделей, а также уделили особое внимание всему процессу Alignment-а, в том числе RLHF.

Представляем вам GigaChat 2 — полностью обновлённую линейку моделей в версиях Lite, Pro и Max. Все модели серьёзно улучшены: мы обновили pretrain’ы, улучшили большинство метрик по сравнению с предыдущими версиями, добавили поддержку контекста в 128 тысяч токенов, улучшили вызовы функций, и в целом повысили понимание инструкций.

GigaChat 2 — не просто сухие числа и технические улучшения. Теперь это надёжный помощник в повседневных задачах. Например, он легко оформит отчёт для работы, напишет чистый и эффективный код, поздравит с днём рождения или даст мудрый совет. Мы уверены: с ним вы сможете делать больше, быстрее и лучше как на работе, так и в жизни. Попробуйте GigaChat 2 уже сейчас в Playground — пользовательском интерфейсе для продвинутой работы с промптами!

+67

techevangelist Nov 27 2024 at 14:22

Task изнутри: управление потоками в .NET и создание своих планировщиков

Easy

5 min

6.5K

OTUS corporate blogC#*.NET*

Привет, Хабр! Сегодня поговорим о том, как работают задачи в .NET, зачем может понадобиться собственный TaskScheduler и как его реализовать.

Читать далее

+16

MaxRokatansky Nov 27 2024 at 18:12

Run, change, disrupt или как эффективно управлять различными видами деятельности в организации

5 min

2.4K

OTUS corporate blogProject management*Development Management*

Современные компании постоянно сталкиваются с необходимостью управлять множеством разных процессов и инициатив. Чтобы не запутаться в этом сложном мире и максимально эффективно использовать ресурсы, важно разделять проекты и задачи на три основные категории: run, change и disrupt. Это не просто модель для описания потоков работ — это практический подход к управлению деятельностью в организации, помогающий расставить приоритеты и распределить ресурсы с умом.

Читать далее

+14

MaxRokatansky Nov 28 2024 at 08:28

Фасилитация стратегической сессии по методике Уолта Диснея

5 min

2.9K

OTUS corporate blogProduct Management*Project management*

Методика Уолта Диснея — это подход к разработке идей, который сочетает креативность, реализм и критическое мышление. Она помогает командам генерировать смелые идеи, превращать их в реализуемые планы и находить решения для преодоления препятствий. Такой структурированный процесс часто применяется для стратегического планирования, инноваций и проектного менеджмента.

Уолт Дисней был придумал этот метод, поскольку был мастером креативного процесса. В основе его метода лежит смена ролей участников, что позволяет взглянуть на задачу с разных точек зрения. Эта методика может быть полезна в самых различных сферах: от разработки новых продуктов до трансформации бизнес‑процессов.

Методика предполагает разработку решения через одевание разных шапок последовательно. Давайте разберем каждую из них.

Читать далее

+12

badcasedaily1 Nov 28 2024 at 11:17

Динамические SQL-запросы в PostgreSQL: когда, зачем и как

Easy

4 min

8.7K

OTUS corporate blogPostgreSQL*SQL*Programming*Database Administration*

Review

Сегодня поговорим о мощной штуке в PostgreSQL, которая одновременно помогает и открывает портал в ад: динамические SQL‑запросы. Динамика — это когда SQL собирается на лету, а не пишется заранее статичным текстом. Звучит неплохо, но при неправильном подходе легко превращается в катастрофу.

Читать далее

+20

kmoseenk Nov 28 2024 at 14:13

Мастерство работы с Java Stream

Medium

14 min

14K

OTUS corporate blogJava*Programming*

Translation

Опираясь на свой повседневный опыт разработки, я составил подробное резюме основных моментов, сложных аспектов использования, типичных сценариев и других важных аспектов работы со Stream. Надеюсь, это поможет вам лучше понять Stream и применять его в разработке проектов более эффективно.

Читать далее

+23

Andrey_Biryukov Nov 28 2024 at 19:09

Безопасная разработка в Flask

6 min

2.9K

OTUS corporate blogProgramming*

Тема безопасной разработки актуальна для различных языков программирования и фреймворков, использующих данные языки. Ранее мы уже говорили о безопасной разработке на Python, а сегодня рассмотрим безопасную разработку в Flask, облегченном фреймворке, написанном на Python для разработки веб-приложений WSGI. Flask был разработан для быстрого и простого начала работы с возможностью масштабирования до сложных приложений.

По сути, Flask представляет собой набор библиотек и модулей, которые позволяют разработчикам веб-приложений писать приложения, не сильно беспокоясь о деталях низкого уровня, таких как протокол, управление потоками и так далее. При этом, в нем есть много интересных функций, таких как маршрутизация URL-адресов, механизм шаблонов и т.д.

Читать далее

+16

techevangelist Nov 29 2024 at 06:03

Что такое переобучение и как его избежать: основы

Easy

8 min

4.7K

OTUS corporate blogMachine learning*

Review

Если вы только начинаете свой путь в машинном обучении или уже успели столкнуться с его непредсказуемыми сюрпризами, то сегодняшняя статья для тех, кто хочет понять и победить переобучение (оно же overfitting).

С технической точки зрения, переобучение происходит, когда модель имеет слишком много параметров относительно объёма и разнообразия тренировочных данных. Модель начинает подстраиваться под шумы и случайные отклонения в данных, вместо того чтобы уловить истинные закономерности.

Читать далее

+19

techevangelist Nov 30 2024 at 09:37

Garbage Collection в Kubernetes: основы

Easy

9 min

2K

OTUS corporate blogKubernetes*IT Infrastructure*

Привет, Хабр! Сегодня мы рассмотрим механизмы garbage collection в Kubernetes: как удалять orphaned pods, утилизировать устаревшие данные и управлять томами.

Garbage Collection в Kubernetes — это автоматизированный процесс очистки неиспользуемых ресурсов, который предотвращает засорение кластера «мусором». Без GC кластер может превратиться в лабиринт забытых подов, устаревших ConfigMaps и ненужных томов, что очевидно приведет к снижению производительности и увеличению затрат.

Читать далее

+10

evgenijkkk Nov 2 2024 at 10:28

GigaChat MAX — новая, сильная модель GigaChat

Medium

22 min

38K

SberDevices corporate blogСбер corporate blogMachine learning*Artificial IntelligenceBig Data*

Review

Салют, Хабр! Прошедший сезон оказался богат на релизы: ровно год назад мы делились новостями о GigaChat Pro, затем весной рассказали об увеличении контекста и улучшении возможностей модели, а совсем недавно завершили обучение GigaChat Vision: мы научили GigaChat понимать картинки и уже пишем про это статью.

Наши модели непрерывно развиваются, обретая всё больше новых функций, и сегодня повод рассказать о них. Встречайте наш новый GigaChat MAX!

+105

badcasedaily1 Oct 19 2024 at 18:41

Регулярные выражения в SQL

6 min

28K

OTUS corporate blogSQL*

Review

Привет, Хабр!

Представьте, что вам нужно найти иголку в стоге сена, но стог — это ваша БД, а иголка — данные со сложным шаблоном. Деофлтные операторы LIKE и IN тут не помогут — слишком уж они прямолинейны. Но зато здесь отлично зайдут регулярные выражения, которые позволяют выполнять сложные поиски и преобразования строк.

Читать далее

+29

hukenovs Oct 16 2024 at 08:58

Bukva: алфавит русского жестового языка

Easy

7 min

5.9K

SberDevices corporate blogСбер corporate blogArtificial IntelligenceMachine learning*Data Mining*

Всем привет!

Недавно мы анонсировали словарь русского жестового языка (РЖЯ), а в этой статье поговорим про задачу распознавания алфавита РЖЯ, именуемого также дактильным алфавитом или дактилем. Предлагаем ознакомиться с нашей работой, в которой мы представим новый датасет Bukva — первый полноценный видеонабор данных для распознавания дактильной азбуки. Он содержит 3757 видеороликов с более чем 101 видео для каждой буквы дактиля, включая не только статические, но и динамические жесты. В статье расскажем, как мы собрали датасет для решения задачи и какие модели обучили в качестве бейзлайнов. Все данные и код открыты и доступны в репозитории команды.

Читать далее

+63

Lirol Oct 11 2024 at 08:43

LLM агент для работы с Google Spreadsheets

Medium

17 min

2.8K

SberDevices corporate blogMachine learning*Artificial Intelligence

Review

Салют, Хабр! На связи Арсенин Никита из команды R&D в SberDevices. Сегодня я хочу рассказать про одно из наших направлений исследований — разработку агентских систем на основе больших языковых моделей.

В этой статье мы постараемся сделать обзорный тур по ключевым технологическим аспектам проектирования и реализации LLM‑агентов, рассмотрим способы работы связок LLM и функций, некоторые компоненты мультиагентных систем, методы контролируемой генерации и повышения робастности. Кроме того, представим и подробно опишем архитектуру и способ построения одного из прототипов LLM‑агентов, нацеленных на выполнение задач в Google SpreadSheets.

Наш LLM‑агент был реализован при помощи SDK GigaChain и GigaGraph, адаптированными под работу с GigaChat. Вы можете посмотреть на итоговую версию Google SpreadSheets агента в репозитории или начать разработку своего агента с вводного туториала.

Читать далее

+21

hukenovs Oct 10 2024 at 07:52

Как научить LLM понимать видео? Обзор подходов

Medium

9 min

5.9K

Сбер corporate blogSberDevices corporate blogMachine learning*Image processing*Artificial Intelligence

Review

Всем привет! Сегодня поговорим про задачу понимания видео и эволюцию подходов к обучению мультимодальных больших языковых моделей для этой задачи.

Video Understanding — направление на стыке компьютерного зрения (CV) и обработки естественного языка (NLP), включающее в себя множество разнообразных задач на восприятие и интерпретацию видео. От базового распознавания предметов и объектов в видеоряде, локализации объектов в пространстве или во времени, подсчета предметов и людей, до генерации кратких или развернутых описаний видео и задач на рассуждения о причинах происходящего на видео, требующих глубокого понимания мира — от человеческой психологии до физических свойств объектов.

Читать далее

+34

artsokol Oct 8 2024 at 14:19

Перфоратор не помеха. Наслаждаемся «чистым» звуком с денойзером от SaluteJazz

Medium

14 min

5.1K

SberDevices corporate blogSoundVideo conferencing

Case

Представьте себе ситуацию: вы работаете на удаленке и должны принять участие в важной видеоконференции, а в этот момент домашняя кошка решила устроить спортивный забег, снося все на своем пути. В соседней комнате заплакал ребенок, а сосед именно в этот момент решил просверлить несколько отверстий под новую полочку. Могло бы случиться непоправимое, но во избежание катастрофы мы придумали своё решение, которое не даст вашим собеседникам заметить что‑то подозрительное.

Меня зовут Артем Соколов. Я и мои коллеги занимаемся направлением улучшения звука в команде SaluteSpeech. Мы в SberDevices разрабатываем и развиваем целую линейку В2В‑решений — от речевых сервисов до видеоконференцсвязи. И во всех наших продуктах стремимся использовать собственные технологии.

Один из флагманских продуктов, который мы создаём, — сервис для видеоконференций SaluteJazz. В первую очередь он ориентирован на бизнес‑коммуникации, которые предполагают высокое качество звука без посторонних шумов. За достаточно короткий срок мы подготовили и встроили в него собственный «шумодав» (он же денойзер). Про него и пойдет речь в этой статье.

Читать далее

+23

gracikk Oct 1 2024 at 11:35

DETR: Бесконечная история

Hard

13 min

3.4K

SberDevices corporate blogMachine learning*Artificial Intelligence

Review

Всем привет, с вами команда Layer!
Мы рады сообщить, что совсем скоро выйдет наша новая исследовательская работа, посвященная поиску моментов в видео, релевантных пользовательскому запросу. Мы хотим сделать эту работу как можно более доступной для каждого, кто хочет глубже разобраться в теме. Поэтому мы решили написать этот небольшой туториал, посвященный семейству моделей DETR, так как они используются не только для детекции котиков на картинках, но и в таких необычных доменах, как детекция моментов в видео. Мы уверены, что среди читателей многие знакомы с основами DETR, однако подозреваем, что не все могли следить за её развитием. Всё‑таки по сравнению с YOLO, DETRу пиара явно не достает. В этой статье мы предлагаем краткий обзор эволюции модели, чтобы помочь вам лучше ориентироваться в новых исследованиях. Если же вы впервые слышите о DETR или хотите освежить свои знания, то бегом читать — тык, если после прочтения остались вопросы, то можно ознакомиться с этими видео — тык, тык.

Давайте детальнее разберёмся, что ждёт вас в этом туториале. Сначала мы рассмотрим недостатки оригинальной версии DETR, а затем перейдём к архитектурным улучшениям, которые либо устранили эти проблемы, либо заметно их сгладили. Начнём с Deformable DETR — модели, которая оптимизировала вычисления. Затем обратим внимание на Conditional DETR и DAB DETR — архитектуры, которые существенно переосмыслили роль queries в модели. Далее мы погрузимся в особенности DN‑DETR, который стабилизирует one‑to‑one matching. После этого детально разберём DINO DETR — модель, которая объединяет и улучшает идеи DN‑DETR и DAB‑DETR, а также переизобретает RPN для детекционных трансформеров. И в завершение нашего путешествия мы познакомимся с CO‑DETR, который объединил классические детекторы, такие как ATSS, Faster RCNN, и модели типа DETR, установив новые SOTA метрики на COCO.

Читать далее

+22

alenusch Sep 25 2024 at 09:00

MERA v.1.2.0 Новая версия независимого бенчмарка, что поменялось?

Hard

11 min

2.1K

SberDevices corporate blogMachine learning*Natural Language Processing*

Review

Всем привет! С вами команда бенчмарка MERA, мы рады анонсировать долгожданное обновление и рассказать, что нового в нашем проекте.

В прошлом году Альянс в сфере искусственного интеллекта представил сообществу независимую площадку для оценки больших языковых моделей — MERA. Мы выпустили первую версию с текстовыми задачами и опубликовали методологию бенчмарка в академической статье. С этой работой мы выступили в августе на ACL-2024 в Бангкоке (ранг A* в рейтинге конференций в области вычислительной техники ICORE), ведущей международной конференции по обработке естественного языка. С момента релиза бенчмарка мы получили свыше 1000 сабмитов от более чем 100 пользователей сайта. Мы получили обратную связь, учли критику и предложения от участников NLP-сообщества и выпускаем новую версию текстовой модальности бенчмарка MERA.

Встречайте MERA v.1.2.0 🔥

+33

stalkermustang Sep 18 2024 at 05:00

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Easy

27 min

117K

Open Data Science corporate blogMachine learning*Artificial IntelligenceThe future is hereNatural Language Processing*

Review

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Давайте выясним →

+252

GolovinDS Aug 6 2024 at 16:30

SberBoom Home — новый этап в эволюции умных колонок

Medium

8 min

5.9K

SberDevices corporate blogSoundSmart HouseComputer hardwareManufacture and development of electronics*

Review

Салют, Хабр! Сегодня стартовали продажи сразу двух новых умных колонок от SberDevices: SberBoom Home и SberBoom Mini 2.

SberBoom Home — это новый этап в эволюции умных колонок SberBoom. Первая умная колонка SberBoom с LED-дисплеем и первая умная колонка SberBoom с Zigbee-модулем, который позволяет колонке выполнять функции хаба при управлении умным домом, а также поддерживает Zigbee-сценарии без интернета — все это SberBoom Home.

В сердце SberBoom Home динамик с неодимовым магнитом, специально подобранный для младших колонок семьи SberBoom. Он обеспечивает высокий уровень мощности при более компактных размерах, что позволило существенно увеличить полезный объем акустической камеры и тем самым получить четкий и сбалансированный звук.

За чистоту звука отвечает тонко настроенный программно-аппаратный комплекс, позволяющий передавать аудиосигналы с минимальным количеством искажений.

Финальное улучшение звука выполняется с помощью собственной технологии Salute Sound Processing , которая по специальному алгоритму динамически усиливает бас в нужных треках и подбирает оптимальный эквалайзер для текущей громкости музыки. Весь этот уникальный комплекс аппаратных и программных решений получил название Magnetic Sound. Подробнее про технологии Magnetic Sound и SSP расскажем в отдельных статьях, а сейчас давайте поговорим о том, из чего состоит девайс и как он создавался.

Читать далее

+21

1