Articles / Bookmarks / Profile of gerchik / Habr

Георгий Мамедалиев @gerchik

User

Profile Publications Comments 45Bookmarks 1.4K

Squirrelfm Apr 18 at 08:30

LLMOps: не разрешают использовать ChatGPT. Что можно сделать?

Easy

3 min

10K

Machine learning*Artificial IntelligenceRaft corporate blog

Review

Бывают ситуации, когда жизненные обстоятельства не позволяют использовать ChatGPT и приходится разворачивать LLM локально. Там можно остаться и без AI, а этого мужики точно не поймут. Есть ли какие-то способы решения этой проблемы?

Если у вас такая ситуация – можете выдохнуть, решение есть.

+40

ElladaNur Apr 16 at 11:44

Безопасность в Docker: от правильной настройки хоста до демона

12 min

18K

Information Security*Website development*Programming*Perfect code*Selectel corporate blog

Tutorial

Привет, Хабр! Меня зовут Эллада, я специалист по информационной безопасности в Selectel. Помогаю клиентам обеспечивать защиту инфраструктуры и участвую в разработке новых решений компании в сфере ИБ. И сейчас я начала больше погружаться в тему разработки и изучать лучшие практики по обеспечению безопасности приложений.

Все больше компаний используют контейнеры в разработке сервисов. Популярность технологии объяснима: с помощью контейнеров можно легко упаковать приложение вместе со всеми зависимостями в один образ. Его разработчики могут передавать между собой с уверенностью, что приложение запустится на любой платформе. Однако эта же популярность контейнеров приводит к рискам: в контейнерах широко распространена эксплуатация уязвимостей, которые во многом возникают из-за неаккуратного использования инструмента.

Сегодня сложно представить современное приложение без технологий контейнеризации. Поэтому я решила подробно изучить вопросы безопасности в этом направлении и собрала рекомендации, как лучше подойти к работе с Docker-платформой. Подробности под катом!

Читать дальше →

+68

hommforever Apr 16 at 13:01

Яндекс запустил Нейро. Рассказываем, как он работает

Medium

14 min

64K

Search engines*Яндекс corporate blogAlgorithms*Machine learning*Artificial Intelligence

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

+91

143

slava_rumin Apr 15 at 16:58

Как я делаю и продаю камни на маркетплейсах на 1,35 млн в месяц

Easy

7 min

178K

Start-up developmentBusiness Models*Lifehacks for geeks

Interview

В статье я расскажу, почему я работаю не на себя, а на Озон, как я победил алкоголизм у сотрудников, и сколько стоит сделать и продать камень.

В 2016-м году я встретил женщину. И вон он я с ипотекой, кредитом на бытовую технику и зарплатой в 25 000 ₽. Чтобы как-то сводить концы с концами я, версии 2017-го, решил взять ещё один кредит на бизнес по производству декоративных камней. Их используют для внутренней отделки помещений.

Оказалось, это огромный рынок, а для производства такого камня требуется только вода и гипс. Но есть нюансы.

+115

314

TimurTukaev Apr 15 at 15:52

HashiCorp обвинила сообщество OpenTofu в краже кода Terraform, но что-то пошло не так

Easy

8 min

23K

Open source*System administration*DevOps*Флант corporate blogIT-companies

Analytics

3 апреля на сайте InfoWorld вышла статья известного публициста на тему Open Source и юриста Matt Asay под названием «OpenTofu, возможно, демонстрирует нам, как не надо делать форк». Лидер-абзац в статье довольно жёсткий:

Не согласны с лицензией? Просто сделайте форк проекта, но не выкидывайте его код — говорите, что он всегда был доступен публично. Сравните код и лицензию HashiCorp с версией OpenTofu.

Разберемся в этой истории последовательно — кто прав, кто виноват и чем всё закончилось.

+78

Natyren Apr 15 at 10:58

Использование LLM в автоматизации рутинных задач

Medium

14 min

11K

Browser extensionsMachine learning*Artificial IntelligenceSberDevices corporate blog

Review

Всем привет!

На связи Георгий Бредис, Deep Learning Engineer из команды Intelligent Document Processing в SberDevices. Наша команда занимается задачами автоматизации бизнес-процессов путем извлечения информации из неструктурированного контента и созданием сервисов суммаризации и поиска на основе LLM. В данный момент мы исследуем новые способы извлечения информации из интерфейсов, что открывает новые возможности для автоматизации процессов в сфере RPA.

В этой статье речь пойдет об использовании больших языковых моделей для работы с браузером, как одного из самых распространенных примеров интерфейса.

+25

aansty4U Apr 12 at 18:18

Может ли ChatGPT заменить визит к врачу? Проверяем эффективность ChatGPT в определении диагноза и выборе лечения

Easy

10 min

4.7K

Artificial IntelligenceHealthBotHub corporate blog

Review

Сейчас люди многие важные проблемы решают с использованием сил искусственного интеллекта, однако вопросы здоровья всегда стоят остро и требуют большей квалификации.

Возможно ли заменить визит к врачу обращением к ChatGPT? Наверняка у многих есть плачевный опыт использования Google, когда на простые симптомы пищевого отравления Вам предоставляли всевозможные разновидности рака в качестве вероятного диагноза.

Есть ли шанс избежать этой проблемы и получить правильные рекомендации по перспективам обследований и вариантами лечения (с формулированием нескольких наиболее реалистичных диагнозов!)?

В данной статья я расскажу о тестировании ChatGPT в качестве квалифицированного специалиста в постановке верного диагноза, определении списка необходимых обследований и пути лечения. Ниже будут подробно представлены все методы исследования и его результаты!

Приятного прочтения :)

+15

s_valuev Dec 29 2023 at 13:40

«Возрождение» больших данных, оптимизация инференса LLM и новинки от AMD

Medium

7 min

3.8K

IT Infrastructure*Selectel corporate blogBig Data*Machine learning*Artificial Intelligence

Digest

Привет, Хабр! В новом выпуске собрал для вас полезные материалы, которые помогут лучше разобраться в темах ML, искусственного интеллекта и дата-аналитики. Вы узнаете, какие Ops-практики входят в систему MLOps, как выбрать СУБД для анализа данных и как построить платформу для DS/ML-разработчиков. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».

Читать дальше →

+27

roman-gorb Apr 2 at 10:01

Ускорение инференса LLM

Medium

13 min

9.5K

Programming*Яндекс corporate blogAlgorithms*Machine learning*Artificial Intelligence

Инференсом ML-модели называют процесс её работы на конечном устройстве. Соответственно, чем больше мы разгоняем инференс, тем быстрее работает модель. Скорость может зависеть от разных условий, например, от архитектуры, которую вы выбрали для модели, или от железа, на котором работает устройство. Кроме того, проблема тяжёлого инференса остро ощущается на больших языковых моделях (LLM) так остро, как ни на каких других моделях.

Меня зовут Роман Горб, я старший ML-разработчик в команде YandexGPT. Тема инференса LLM заинтересовала меня, потому что я занимался R&D в квантовании сеток для CV-задач. Сегодня я расскажу, как безболезненно увеличить скорость инференса. Сперва разберёмся, зачем это нужно, а потом рассмотрим разные методы ускорения и фреймворки, которые могут в этом помочь.

Ускоряемся

+30

InlyIT Mar 29 at 17:21

Как прорешать тысячу задач на Leetcode за триста дней

4 min

26K

Studying in ITInlyIT corporate blog

Translation

Привет, меня зовут Мэнси Эгэрвэл, я контент-менеджер в компании Favtutor. Недавно я добралась до отметки в тысячу решенных задач на Leetcode, и подумала, что хорошо бы поделиться своим опытом с другими.

В прошлом мой интерес часто привлекали зеленые метки и разнообразные значки в профилях у других людей, а теперь у меня самой есть такие. Вот как выглядит мой профиль на Leetcode в данный момент.

Однако, если взглянуть на статистику за 2022 год, то там не обнаружится почти ничего. Как можно видеть, произошли серьезные перемены!

Ниже вы найдете несколько уроков, которые я вынесла для себя, и ошибок, которых следует избегать, чтобы не тратить зря время и силы.

Читать дальше →

+13

amalakhov63 Mar 28 at 18:20

Давайте поговорим о Kubernetes

Medium

12 min

13K

DevOps*Kubernetes*

From sandbox

Всем привет! Меня зовут Андрей, я DevOps инженер.

Когда я начинал изучать Kubernetes (K8s), я перечитал много статей, и, что в статьях, что в документации, информация была сильно разрознена, обрывочна. Сложно было скомпоновать информацию в единое целое.

На тот момент, мне бы хотелось найти одну большую статью, пусть и не полностью, но достаточно подробно описывающую процессы управления кластером K8s, деплоя и обслуживания приложений в нём.

Примерно такую статью я постарался написать.

DAN_SEA Mar 28 at 16:00

Ботинки, лень и роботы

Medium

15 min

6.5K

RUVDS.com corporate blogDeveloping for Arduino*Wearable electronicsDIYElectronics for beginners

Review

Появившись в далёких восьмидесятых годах, фильм «Назад в будущее» до сих пор бередит сердца своих поклонников одной легендарной сценой, где Марти МакФлай легко надевает футуристичную обувь с автоматической затяжкой. С тех пор сформировалась целая армия поклонников такого решения, в которой кто-то просто с нетерпением ждёт наступления такого светлого будущего, а кто-то с инженерными знаниями пытается смастерить такое самостоятельно.

Читать дальше →

+54

Triumfrus Mar 28 at 18:09

Как мы прогнозируем объемы грузоперевозок на основе машинного обучения, используя MLflow

Easy

3 min

2.4K

Machine learning*Studying in ITTransportПервая грузовая компания (ПГК) corporate blog

Привет, коллеги! Меня зовут Александр Кузьмичев, и я ведущий специалист по анализу данных в Первой грузовой компании. Мы с коллегами разработали «Прогнозатор» — инструмент для оценки объемов грузоперевозок между ж/д станциями. В основе лежит открытая платформа MLflow, и сегодня я расскажу, чем она нам помогает.

Фотография Ainur Khakimov / Unsplash

Читать дальше →

ABurov30 Mar 28 at 16:20

Продуктовый подход к pet-проекту или как я разработал музыкальное веб-приложение

Medium

9 min

11K

Website development*Development of mobile applications*DIY

From sandbox

✏️ Technotext 2023

Что вам может дать продуктовый подход к pet-проекту? Если смотреть на pet-проект не как на лабораторную работу, а как на будущий продукт, начинаешь лучше понимать весь цикл разработки. При таком подходе ты сперва выступаешь в роли заказчика: определяешь, какую задачу пользователя решаешь, как это сделать наилучшим образом, а потом подбираешь технологии, которыми легче всего реализовать функционал или которые хочется попробовать. В тексте я расскажу о развитии моего pet-проекта по созданию музыкального стримингового веб-приложения и чему удалось научиться, используя данный подход.

+35

badcasedaily1 Mar 27 at 20:45

Это мы юзаем: библиотека Optuna в Python для оптимизации гиперпараметров

Medium

7 min

7.4K

Python*System Analysis and Design*Server optimization*Machine learning*OTUS corporate blog

Review

Привет, Хабр!

Гиперпараметры — это параметры, которые не учатся в процессе обучения модели. Они задаются заранее. От выбора гиперпараметров напрямую зависит качество и эффективность модели, а их оптимизация может улучшить результаты предсказаний.

Традиционный подход к оптимизации гиперпараметров включает в себя grid search и random search, иногда они могут быть неэффективными и времязатратными, особенно когда пространство гиперпараметров велико.

Когда я впервые столкнулся с необходимостью настроить сотни параметров в своей нейросети, задача показалась мне Сизифовым трудом. Каждый параметр мог значительно изменить результат, и пространство поиска казалось бесконечным. И немного просидев на стековерфлой я нашел либу Optuna, которая позоволила оптимизировать этот процесс.

Optuna решает проблему оптимизации гиперпараметров, предоставляя легковесный фреймворк для автоматизации поиска оптимальных гиперпараметров. Она использует алгоритмы, такие как TPE, CMA-ES, и даже поддерживает пользовательские алгоритмы.

Optuna полностью написана на Python и имеет мало зависимостей. В этой статье рассмотрим её основной функционал.

+19

aio350 Mar 28 at 11:01

Практическое руководство по Rust. Бонус

Medium

34 min

8.4K

Timeweb Cloud corporate blogRust*

Review

Hello world!

Представляю вашему вниманию бонусную часть практического руководства по Rust.

Другой формат, который может показаться вам более удобным.

Руководство основано на Comprehensive Rust — руководстве по Rust от команды Android в Google и рассчитано на людей, которые уверенно владеют любым современным языком программирования. Еще раз: это руководство не рассчитано на тех, кто только начинает кодить 😉

Читать дальше →

+28

oldadmin Mar 26 at 16:00

HDD, SSD или NVMe: что выбрать для виртуального сервера (тесты внутри)

Medium

6 min

14K

HostingData storage*RUVDS.com corporate blogData storages*Data storaging

Review

В сегодняшней статье разберём настройку одного из параметров конфигурации при заказе виртуального выделенного сервера. Речь пойдёт о типе накопителя, который будет использоваться для виртуалки. Попробуем вместе разобраться, чем виды накопителей отличаются друг от друга, и на что может повлиять тот или иной выбор.

Читать дальше →

+32

slivka_83 Mar 25 at 09:00

Самый лучший в мире курс по Машинному обучению — Алгоритмы Машинного обучения с нуля

1 min

25K

Python*Machine learning*Artificial Intelligence

Review

Краткий обзор курса, который я недавно закончил пилить на степике. Курс хардкорный :) В нем необходимо с нуля писать алгоритмы машинного. Наверное это один из лучший способов досконально разобраться в алгоритме.

Курс бесплатный: https://stepik.org/course/68260/promo

+31

vickylikh Mar 21 at 09:02

Будущее Kubernetes и DevOps: строим прогнозы на 10 лет

Easy

13 min

15K

IT Infrastructure*Research and forecasts in IT*DevOps*Флант corporate blogKubernetes*

Analytics

✏️ Technotext 2023

Мы спросили инженеров «Фланта» и экспертов из индустрии, как, по их мнению, будут развиваться Kubernetes, DevOps, Ops и Cloud Native-экосистема в ближайшее десятилетие. Наша задача была спрогнозировать будущее на основе тенденций в настоящем, а не просто «заглянуть в хрустальный шар» и пофантазировать. В результате родилась эта статья. Присоединяйтесь к нам в комментариях — давайте вместе подумаем, как будут выглядеть важные в нашей работе инструменты через 5–10 лет.

+29

AliveSubstance Mar 15 at 13:32

Безопасная параллельная разработка. Istio

Medium

6 min

4.6K

Programming*Альфа-Банк corporate blogMicroservices*Kubernetes*

Tutorial

Как-то в конторе появилась мысль, что надо бы продумать как нам распараллелить работу над одни микриком, так чтобы команды не пересекались друг с другом. Есть некоторые API над которыми работают несколько команд. Каждая работает над своей фичей локально и пишет тесты, а вот при деплое на стэнд получается столпотворение потому, что нужно изменения слить в одну ветку аля develop и её закинуть на тест. При этом могут быть конфликты при мерже кода или измениться проперти, которые не совместимы между разными ветка.

Мобильный банк сейчас обслуживает 450+ микриков. Над которыми работают более 90 команд. Так как у нас в проекте нет code ownership, то каждая команда вносит изменения в нужные им микрики. Чтобы избежать различного рода сложностей, которые приводят к увеличению времени time to market, нужно было развести разработку отдельных команд так, чтобы они не влияли друг на друга и могли работать параллельно.

+22

3 4 ...

65 66