Articles / Bookmarks / Profile of Laggg / Habr

How to become an author

Алексей Клоков @Laggg

ML/DL

Profile Publications 4Comments 11Bookmarks 30

goshkalinin Jun 13 2022 at 16:42

Barev Dzez! Сделал помогалку в изучении армянского алфавита

2 min

6.8K

Python*Learning languages

Technotext 2022

По приезду в Ереван я порвался на кучу маленьких Игорей от вывесок, меню, табличек и прочих инфоносителей. Мозг отказывался воспринять "S" как "Т" и совершенно не видел разницы между Ե и Է.

Букварь я себе, конечно, нашёл, но лень — штука непробиваемая.

Задача сформулировалась: "как бы так выучить алфавит, чтобы его не учить". Звучит оптимистично, люблю такое.

Проведя пару дней в тоскливых размышлениях, что придётся-таки учить азбуку, как все белые люди, я вспомнил эту картинку:

Читать далее

+11

MarselMM Dec 12 2023 at 15:35

Локальные GPT нейронный сети — устанавливаем на домашнем ПК, запускаем и проверяем на адекватность аналоги ChatGPT

18 min

24K

Machine learning*Artificial Intelligence

Есть много LLM нейронных сетей, создатели которых говорят, что они аналогичны, а может даже лучше ChatGPT версий 3.5 и 4.0. Давайте попробуем протестировать их, установив их на локальный компьютер, чтобы понять, действительно ли они так хороши.

Читать далее

+21

slamms Oct 7 2020 at 19:19

Жидкий металл для охлаждения ноутбуков — польза или вред?

9 min

96K

High performance*ASUS corporate blogComputer hardwareLaptopsCPU

Рад приветствовать, хабравчане! Меня зовут Влад Захаров, я руковожу отделом маркетинга ASUS в России, странах СНГ и Балтии. У нас есть что рассказать о продуктах, технологиях и внутренней кухне разработки, поэтому я тут. Будет круто, если у нас завяжется живой открытый диалог. Под катом – рассказ о том, что нового появилось в системах охлаждения игровых ноутбуков ASUS Republic of Gamers.

Читать далее

+64

apoltavcev Apr 14 2023 at 11:14

Победители Технотекста 2022

10 min

7.7K

HabrHabr corporate blogContent-marketing*Reading roomSocial networks and communities

Технотекст завершился, пора подводить итоги. Под катом набранные участниками баллы, откровения жюри и 32 отличных статьи из списка победителей.

А в комментариях быстрый конкурс-вечеринка. Хабр собирает советы для начинающих авторов, за лучшие рекомендации дарим мерч: ~~кофту~~ свитшот и ~~сумку~~ шоппер. Подробности — в первом комментарии.

Читать далее

+91

ligofff Apr 11 2023 at 12:29

Запуск аналогов ChatGPT на домашнем ПК в пару кликов и с интерфейсом

Easy

6 min

190K

Machine learning*Artificial Intelligence

Tutorial

--- Обновление статьи 9 Августа 2023 ---

В течении последнего полугода в сфере текстовых нейронок всё кипит - после слитой в сеть модели Llama, aka "ChatGPT у себя на пекарне" люди ощутили, что никакой зацензуренный OpenAI по сути им и не нужен, а хорошие по мощности нейронки можно запускать локально.

Основная проблема в том, что всё это требует глубоких технических знаний.

Но в этой статье я расскажу, как запустить добротную нейросеть на домашнем ПК с 16ГБ ОЗУ в несколько кликов. Буквально в несколько кликов - копаться в консоли не придётся.

Читать далее

+142

Nastaa Apr 7 2023 at 17:37

Начинаем работу с PyTorch 2.0 и Hugging Face Transformers

6 min

11K

Python*Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

Translation

В этом посте разберем работу с PyTorch 2.0 и Hugging Face Transformers на примере fine‑tune модели BERT для классификации текста.

PyTorch 2.0 лучше по производительности, скорости работы, более удобный для Python, но при этом остается таким же динамическим, как и ранее.

1. Настройка окружения и установка PyTorch 2.0.

2. Загрузка и подготовка датасета.

3. Fine‑tune и оценка модели BERT с помощью Hugging Face Trainer.

4. Запуск инференса и тестирование модели.

Читать далее

+13

kuznetsoff87 Apr 4 2023 at 12:03

Kandinsky 2.1, или Когда +0,1 значит очень много

Medium

8 min

77K

Сбер corporate blogImage processing*Machine learning*Popular scienceArtificial Intelligence

✏️ Technotext 2023

В ноябре 2022 года мы выпустили свою первую диффузионную модель для синтеза изображений по текстовым описаниям Kandinsky 2.0, которая собрала как позитивные, так и отрицательные отклики. Её ключевой особенностью была мультиязычность и использование двойного текстового энкодера на входе сети: XLMR-clip и mT5-small. Рефлексия после релиза подтолкнула нас к перестройке планов по развитию архитектуры и к сильному стремлению получить буст в качестве генераций, чтобы выйти на уровень аналогичных решений, названия которых слишком хорошо известны, чтобы их называть. В то же время мы могли наблюдать за появлением новых генеративных моделей и их файнтюнов, таких как ControlNet, GigaGAN, GLIGEN, Instruct Pix2Pix и др. В этих работах представлены и новые взгляды на генерацию, и новые возможности использования латентного пространства для внесения контролируемых изменений через текстовые промты, а также для смешивания изображений — возможности использования генеративных моделей расширяются постоянно. Бурное развитие прикладных кейсов привело к интенсивно нарастающему числу различных привлекательных для пользователей реализаций этих функций — визуализация городов, изображения известных личностей в нетипичных ситуациях и многие другие.

Читать далее

+100

pcdesign Apr 3 2023 at 15:05

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Easy

7 min

19K

Python*Artificial IntelligenceFlask*

Tutorial

Translation

От переводчика.

У меня накопилось куча всяких там данных, документов, pdf, doc, видосов на ютюбе, которые я бы хотел проиндексировать, и чтобы можно было по этой базе знаний у нейронки что-нибудь спрашивать.

Так же статья может пригодиться, если вы хотите собрать базу знаний по какой-то компании и затем заставить нейронку отвечать на вопросы пользователей. Например, чтобы ИИ прочитала кучу скучной документации, регламентов работы и прочего.

Пока выбираю, на чем это лучше сделать. Вот наткнулся на нижеследующий вариант, который решил попробовать.

Читать далее

+7

GolovinDS Apr 3 2023 at 17:32

Создаем чат-бот для распознавания изображений на основе нейронной сети MobileNetV2

Easy

9 min

5.1K

Machine learning*OTUS corporate blogArtificial Intelligence

Tutorial

Всем привет! Сегодня рассмотрим решение задачи многоклассовой класификации на основе датасета овощей и фруктов с помощью сверточной нейронной сети архитектуры MobileNetV2. А после этого еще создадим чат-бота, который будет классифицировать эти изображения.

Сегодня уже никого не удивишь чат-ботами, которые могут вести диалоги на естественном языке. В наши дни уже даже школьников учат создавать своих чат ботов. А почему бы тогда не создать бота, который может видеть. Рассмотрим процесс создания пока самого простого бота, который будет в качестве сообщения принимать фото и отвечать, что на нем изображено.

Читать далее

+12

Mdm3 Apr 18 2022 at 19:49

Нейронная сеть считает лес кругляк и распознает автомобильные номера. Как это сделано?

Medium

9 min

15K

Python*Artificial IntelligenceTensorFlow*

Technotext 2021

В статье покажем, как алгоритмы компьютерного зрения помогают решить задачу автоматического определения объема круглого леса в лесовозе по фотографии. Пройдем путь от идеи до прототипа. Расскажем, какие были выбраны решения и почему.

Необходимая подготовка читателя — должно быть общее представление о компьютерном зрении (computer vision) и нейронных сетях. Здесь не будет описаний, что такое сверточная нейронная сеть и т.п., статей по таким основам найдете много на хабре (вот хорошая Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей). В то же время, совсем новички могут получить представление, какие знания и компетенции нужны для решения подобных задач.

Читать далее

+26

Alice_point_py Sep 29 2022 at 01:49

Шахматы и вопрос разумности больших языковых моделей

23 min

11K

Machine learning*MeanoTek corporate blogPopular scienceArtificial IntelligenceNatural Language Processing*

Technotext 2022

Масштабирование больших языковых моделей (LLM) является захватывающей темой, поскольку рассматривается как один из лучших кандидатов на пути к ИИ человеческого уровня. Уже сейчас LLM могут отвечать на вопросы, генерировать реалистичные статьи и поддерживать, казалось бы, осмысленный разговор на широкий круг тем. Некоторые исследователи ИИ даже утверждают, что LLM возможно уже могут «слегка обладать сознанием», а журналисты выпускают статьи вроде «роботы захватят весь мир» с картинками терминаторов. Однако, скептики возражают, что большинство таких моделей — это просто большая ассоциативная память, без истинного понимания реальности и неспособная к определенным типам задач. Одна из таких задач, которая привлекла мое внимание — игра в шахматы. В то время как специализированные шахматные движки давно обыгрывают чемпионов мира, даже очень большие языковые модели, такие как GPT-3 с сотнями миллиардов параметров едва справляются с такой простой задачей как мат в один ход. А с такими способностями к стратегии, эти модели едва ли справятся с завоеванием мира. Поэтому как шахматист со стажем и по совместительству разработчик нейросетей я решила попробовать устранить этот недостаток.

Читать дальше →

+90

NapoleonIT May 4 2022 at 08:24

Как узнать принцессу среди 500 амурских тигров с помощью vision transformers

5 min

2.5K

Image processing*HackathonMachine learning*

Technotext 2022

Рассказываем, как мы, ML princesses [Napoleon IT] стали победителями кейса от Минприроды «Защита редких животных», и решили задачу по созданию сервиса, способного распознавать в дикой природе особо редкий вид хищников- амурского тигра. Десятый региональный хакатон проходил в рамках федерального проекта «Искусственный интеллект».

Читать далее

+5

dimanosov007 Oct 5 2022 at 10:49

Дообучение EasyOCR

4 min

18K

Python*Data Mining*Machine learning*Artificial Intelligence

Tutorial

Technotext 2022

Всем привет!

Представляю краткий tutorial по дообучению EasyOCR. возможно обучение на Google colab.

Читать далее

+4

Razant Jan 8 2022 at 17:45

GPT для чайников: от токенизации до файнтюнинга

13 min

90K

Semantics*Programming*Machine learning*Natural Language Processing*

Tutorial

Technotext 2022

К моему удивлению, в открытом доступе оказалось не так уж много подробных и понятных объяснений того как работает модель GPT от OpenAI. Поэтому я решил всё взять в свои руки и написать этот туториал.

Читать далее

+29

antoleb Jan 17 2023 at 00:57

Как работают text2image модели?

6 min

18K

Image processing*Mathematics*Machine learning*Artificial Intelligence

Review

✏️ Technotext 2023

Вы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации.

Читать далее

+77

AbellAI Aug 9 2020 at 23:54

Как работает Object Tracking на YOLO и DeepSort

12 min

70K

Mathematics*Machine learning*Artificial Intelligence

Object Tracking — очень интересное направление, которое изучается и эволюционирует не первый десяток лет. Сейчас многие разработки в этой области построены на глубоком обучении, которое имеет преимущество над стандартными алгоритмами, так как нейронные сети могут аппроксимировать функции зачастую лучше.

Но как именно работает Object Tracking? Есть множество Deep Learning решений для этой задачи, и сегодня я хочу рассказать о распространенном решении и о математике, которая стоит за ним.

Итак, в этой статье я попробую простыми словами и формулами рассказать про:

YOLO — отличный object detector
Фильтры Калмана
Расстояние Махаланобиса
Deep SORT

Читать дальше →

+14

Sagidullin Dec 8 2022 at 15:50

Что такое MLOps? Самый подробный текст про работу с ML-системами, который вы найдете в интернете

25 min

21K

High performance*IT Infrastructure*Selectel corporate blogMachine learning*DevOps*

Technotext 2022

В этом материале мы подробно разбираем концепцию MLOps. Более того, делаем это тремя способами. Сначала теоретически — через самую толковую, на наш взгляд, схему MLOps. Затем — концептуально, через артефакты, которые заложены в подходе. И наконец, через понимание MLOps как информационной системы.

Сохраняйте текст в закладки, потому что на данный момент это, возможно, самое полное описание MLOps на русском языке (и не перевод очередной англоязычной статьи!). Подарим мерч Selectel тому, кто пришлет ссылку на более развернутое описание концепции в комментариях.

Читать дальше →

+43

AdminVPS Dec 1 2022 at 15:53

Защищайся! Простые и не очень правила настройки безопасности для VPS/VDS на Linux

12 min

19K

HostingInformation Security*Server optimization*Server Administration*AdminVPS corporate blog

Все, что смотрит в бесконечную даль Интернета, находится в той или иной степени под угрозой атаки вездесущими ботами, хакерами, школьниками и прочими темными сущностями глобальной сети. Это не в последнюю очередь касается мощностей арендных серверов (выделенных или VPS/VDS). Провайдер может обеспечивать базовый функционал защиты от атак на свою инфраструктуру, но то, что юзер творит со своей машиной, провайдера абсолютно не касается. Разве что за доп. плату он может добавить некоторые настройки к VPS, мониторить и фильтровать трафик, поступающий с определенной интенсивностью. Поэтому хочешь не хочешь, а приходится задуматься об обеспечении безопасности своего сервиса вот этими вот маленькими ручками, желательно с минимальными временными и материальными издержками.

Под катом рассмотрим несколько простых настроек, которые сведут к минимуму угрозу для вашего VPS, а в конце статьи рассмотрим пару более сложных, но эффективных техник защиты. Примеры команд приведены для ОС Ubuntu.

Поехали!

+4

Stepan_Burmistrov Jan 7 2023 at 19:42

Как хостить телеграм-бота (и другие скрипты на Python) на Repl.it бесплатно 24/7

3 min

119K

HostingPython*Lifehacks for geeks

Tutorial

Очень часто возникающий вопрос: где можно разместить скрипты на Python, Flask-приложение, телеграм или дискорд ботов?

Один из вариантов — на своем компьютере при наличии внешнего IP-адреса и опыта в настройке проброса портов на роутере.

Цель этот статьи - подробная инструкция, как сделать хостинг Python-скриптов бесплатно и доступным 24/7 на примере телеграм-бота

Читать далее

+17

pavelkochkin1 Jul 24 2021 at 11:47

Docker для Data Scientist'a

5 min

12K

Big Data*Machine learning*Artificial Intelligence

Tutorial

Часто у начинающих Data Scientists возникает вопрос, как демонстрировать работу своих моделей другим людям. Банальный пример - прикрепить ссылку на гитхаб репозиторий в отклике на вакансию или показать свое “детище” знакомым со словами “смотрите, что умею”.

Читать далее

+5

1