Статьи / Закладки / Профиль rotor / Хабр

Валерий Дмитриев@rotor

Пользователь

ПрофильСтатьи8ПостыНовостиКомментарии258

@bugman 22 мар 2023 в 21:10

Как настроить Alpaca (аналог ChatGPT) на своём арендованном сервере. Гайд для самых маленьких

Простой

4 мин

47K

Искусственный интеллект

Туториал

После публикации https://habr.com/ru/news/t/723638/ меня попросило несколько человек написать гайд для новичков, как же это всё запустить поиграться где-нибудь на арендованном сервере, если локальная машина не позволяет? На всё про всё нам потребуется минут 20 и сто рублей денег.

Но уже появились бесплатные варианты на HuggingFace

+28

@o_O_Tync 6 янв 2010 в 04:13

Ввод произвольных символов при помощи Compose Key: настройка

5 мин

35K

Настройка Linux *

Многие знают, что в Linux есть специальная кнопка: Compose. Её действие аналогично виндовым сочетаниям Alt+NumPad (Например, нажатие Alt+0169 даёт символ ©), но не требует хранить перед глазами таблицу кодов символов :) Если настроить правый Alt как Compose Key, то нажав RAlt+O+C получаем тот же значок копирайта: ©.

В статье я опишу способ назначения произвольных сочетаний клавиш для символов. Это будет удобно в первую очередь математикам: не нужно будет лазить в таблицу символов чтобы ввести «∀ε>0 ∃δ(ε)≕δ>0: ∀x∈O(x₀) |f(x)<A|» в любом приложении, поддерживающем юникод. Кроме математических символов, будут доступны всевозможные стрелочки (→⇖⇔⟲⟽), галочки (✘), буллеты (•‣★), кавычки («»), длинное тире (—), дроби(⅓, ⅞), диа⃫кр͎е̃ти⃰ческие зн⃫аки и всё что душе угодно в необъятном юникоде! :)

Хочу так же

+42

@Firemoon 21 фев 2023 в 09:37

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

Средний

18 мин

59K

Блог компании SelectelC++ * Python * ВидеокартыИскусственный интеллект

Туториал

Не так давно в интернете появилась душещипательная история, как пользователь hackdaddy8000 сперва создал виртуальную девушку, а затем усыпил ее. Моральный и мемный аспект этого события обсуждали в комментариях под новостями.

Поговорим о технической стороне. Как повторить этот шедевр и можно ли обойтись без сервисов OpenAI, которые сложно оплатить в России? И главное — сколько придется инвестировать в виртуальную подругу.

Читать дальше →

+107

@AlNinyo 14 янв 2015 в 09:57

Мучения с LED cube 4x4x4 (Arduino+74HC595)

4 мин

70K

Arduino *

Из песочницы

Здравствуйте, дорогие хабравчане!

Наконец-то у меня есть, что вам рассказать и показать. Надеюсь, рассказ будет интересен не только мне.

Я расскажу о своём опыте работы с Ardiuno UNO и даже покажу, что у меня в итоге получилось. Если вам ещё не надоело подобное — добро пожаловать под кат.

Читать дальше →

+23

@Amvera_Speech 9 фев 2023 в 10:12

Предоставляем бесплатное облачное распознавание речи ASR

Простой

2 мин

3.9K

Блог компании AmveraГолосовые интерфейсы * Машинное обучение * Семантические сети * Open source *

В этой статье мы, расскажем, как сделали первое действительно бесплатное облачное распознавание речи и как им воспользоваться.

Разработчики систем распознавания речи, как правило, используют поминутную тарификацию распознавания. В одной из прошлых статей я уточнял почему считаю это далеко не всегда правильным (если кратко, то при такой тарификации вендоры округляют длительность в большую сторону, а значит, за распознавание коротких записей вы заметно переплачиваете, а при большом трафике это очень дорого).

Давайте теперь разберемся, действительно ли для вендоров экономически оправданно брать деньги с хобби-проектов и небольших компаний, которым нужно распознавать не миллионы, а всего лишь десятки или сотни минут в день.

@Rai220 24 янв 2023 в 13:59

Переносим свою картину мира в чат-бота на базе GPT-3

4 мин

49K

Машинное обучение * Искусственный интеллект

Туториал

Думаю, все уже наслышаны о потрясающих возможностях ChatGPT и GPT-3, многие уже вдоволь наигрались с ними, а новые стартапы на их основе льются на нас каждый проливным дождём! Возможности ChatGPT в решении некоторых текстовых задач потрясают, порой кажется, что имеешь дело с настоящим разумом.

У меня возникла идея - что если попробовать доучить сеть так, чтобы она имитировала картину мира определенного человека? (Да, снова Черное Зеркало). Классический подход с pre-prompt для этого не подходит, так как хочется заложить в сеть побольше знаний (а также реально поменять веса связей), поэтому будем использовать fine-tune (дообучение на небольшом датасете и небольшом числе итераций). Такая опция доступна пользователям openAI за небольшую плату ($0.5-1 в моих примерах).

В этой статье я покажу как можно обучить GPT-3 (в версии davinchi-003) на своей картине мира и засунуть её внутрь телеграм-бота, потратив на всё всего несколько долларов.

Код бота доступен в репозитарии.

+42

@dvlunin 17 янв 2023 в 09:13

Критерий Манна-Уитни — самый главный враг A/B-тестов

17 мин

80K

Блог компании AvitoTechАналитика мобильных приложений * Статистика в IT

Всем привет! Меня зовут Дима Лунин, я аналитик в компании Авито. В этой статье я расскажу про критерий Манна-Уитни и проблемы при его использовании.

Если вы анализировали A/B-тест, где вас интересовал прирост или падение какой-то метрики, то наверняка использовали критерий Манна-Уитни. Я хочу рассказать про подводные камни этого критерия, и почему мы в компании его не используем. А в конце вы поймёте, откуда такой холиварный заголовок)

+24

@antoleb 16 янв 2023 в 21:57

Как работают text2image модели?

6 мин

22K

Обработка изображений * Математика * Машинное обучение * Искусственный интеллект

Обзор

✏️ Технотекст 2023

Вы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации.

+77

@akuprin 19 дек 2022 в 18:38

Нестандартный полиморфизм. Паттерн Type Erasure

Средний

15 мин

14K

C++ *

Обзор

Из песочницы

Нестандартный полиморфизм. Паттерн Type Erasure.

Посмотрим на проблему, решим ее обычным полиморфизмом и пройдем небольшими шагами к более элегантному решению с помощью современного паттерна.

+14

@kmoseenk 20 дек 2022 в 15:55

Почему оценка задач сломала Agile

7 мин

18K

Блог компании OTUSУправление продуктом * Agile * Управление проектами * Управление разработкой *

Перевод

Трудно утверждать, что методология Agile неэффективна. Практически все команды разработки программного обеспечения стараются ей следовать. Простой способ начать внедрять гибкую методологию — это добавить пару ее компонентов в рабочий процесс. Одним из самых популярных и при этом важных компонентов считается оценка в Story Points. Однако сколько команд оценивали ее реальное влияние? На самом ли деле оценка времени, затраченного на каждую задачу, приносит пользу? По моему опыту, это не так.

Чтобы оставаться гибкими, нам следует знать преимущества и риски используемых инструментов, в частности плюсы и минусы оценки в Story Points. В этой статье мы рассмотрим, возможно ли точное планирование итераций и гибкость без оценки времени каждой отдельной задачи.

+13

@honyaki 20 дек 2022 в 13:59

Алгоритмы диапазонов C++20 — 7 немодифицирующих операций

13 мин

10K

Блог компании SkillfactoryC++ * Алгоритмы * Программирование *

Перевод

Библиотека Ranges для C++20 предлагает альтернативы для большинства алгоритмов. На этот раз я хочу показать вам десять немодифицирующих операций. Мы сравним их со «старой» стандартной версией и увидим их преимущества и ограничения.

Подробности — к старту нашего курса по разработке на C++.

Читать дальше →

@rotor 22 сен 2022 в 11:03

Как полюбить задачи регрессии

5 мин

8.1K

Data Mining * Алгоритмы * Машинное обучение * Data Engineering *

Cезон Data Mining

У задач классификации, в отличии от задач регрессии, есть одно очень приятное свойство:
большинство ML алгоритмов решения задач классификации выдают не просто ответ, а некоторую оценку уверенности модели в ответе. То есть помимо метрик самой модели мы обладаем оценкой вероятности для конкретного ответа на конкретном примере. Это здорово помогает в принятии решений.
Неправда ли хотелось бы иметь что-то такое и для задач регресии?

12 авг 2022 в 10:52

8 каверзных вопросов по С++

1 мин

11K

Программирование * C++ *

Команда C++-программистов — @starik-2005, @PyLounge, @markwatney, @dmitrmax и @rssdev10 — собрала 8 экспертных вопросов по C++. Давайте посмотрим, что их вопросам сможет противопоставить команда хабрачитателей.

Осторожно, в комментариях будут спойлеры. Там от лица C++-команды выступят @rotor и @PyLounge: они объяснят, если в вопросах будет что-то непонятно.

P.S. Если хотите поучаствовать в создании будущих квизов, пишите редактору: тг, Хабр.

Дать каверзные ответы

+15

@basalov_yurij 17 авг 2022 в 10:03

Как с помощью BERT организовать поиск похожих текстов

5 мин

8.4K

Машинное обучение * Поисковые технологии *

Технотекст 2022

Что нужно, чтобы с помощью BERT организовать поиск похожих текстов, а также как можно решить задачу многоклассовой классификации нестандартным способом.

@MaxRokatansky 28 авг 2019 в 15:02

Интерпретируемая модель машинного обучения. Часть 2

4 мин

16K

Блог компании OTUSМашинное обучение * Big Data *

Перевод

Всем привет. Считанные дни остаются до старта курса «Machine Learning». В преддверии начала занятий мы подготовили полезный перевод, который будет интересен как нашим студентам, так и всем читателям блога. И сегодня делимся с вами завершающей частью данного перевода.

Partial Dependence Plots

Partial Dependence Plots (графики частичной зависимости или же PDP, PD-графики) показывают незначительное влияние одного или двух признаков на прогнозируемый результат модели машинного обучения ( J. H. Friedman 2001 ). PDP может показать связь между целью и выбранными признаками с помощью 1D или 2D графиков.

Читать дальше →

@Efaldgent 26 апр 2022 в 11:00

Причинно-следственный анализ в машинном обучении

15 мин

35K

Блог компании Open Data ScienceBig Data * Машинное обучение * Искусственный интеллектНаучно-популярное

Что появилось первым: курица или яйцо?
Статистики давно уже нашли ответ на этот вопрос.
Причем несколько раз.
И каждый раз ответ был разным.

А если серьезно, то для машинного обучения становятся все более актуальными вопросы причинно-следственного анализа (causal inference) - когда главной целью моделирования является не прогноз и его качество, а то, как мы можем принимать решения на основе нашего алгоритма. И как это повлияет на мир, в котором эта модель будет действовать. Сделает ли модель его лучше, чем он был? Или наоборот.

Под катом я расскажу о причинно-следственном анализе, его ключевых методах и применении в машинном обучении. В следующей статье побеседуем о ключевых трендах в развитии методов причинно-следственного анализа в машинном обучении в 2020-2021 гг.

+24

@crazyhatter 30 авг 2018 в 08:39

Анатомия рекомендательных систем. Часть вторая

12 мин

41K

Блог компании ГК ЛАНИТМашинное обучение * Алгоритмы * Data Mining * Big Data *

Неделю назад я делал здесь обзор существующих алгоритмов рекомендаций. В этой статье я продолжу данный обзор: расскажу об item-based варианте коллаборативной фильтрации, о методах, основанных на матричных разложениях, проблемах тестирования, а также о менее «раскрученных» (но не менее интересных) алгоритмах.

Читать дальше →

+36

@klimensky 1 фев 2022 в 10:50

Право на код: может ли работодатель отобрать ваш личный проект и как от этого защититься

10 мин

12K

Блог компании Get me ITУправление проектами * Развитие стартапаЗаконодательство в ITIT-компании

Для начала представим типичную ситуацию: работаете вы в компании, а по выходным/вечерам пилите собственный пет-проект. Его замечает аудитория и возможно он даже стал приносить какие-то деньги. А теперь, уважаемые знатоки, вопрос: может ли компания, в которой вы работаете «ради денег» — отобрать ваше детище? И как защитить свой интеллектуальный труд от посягательств со стороны такого работодателя? Мы поговорили с юристами и теперь расскажем, что сделать, чтобы потом не пришлось идти в суд.

Приятного чтения!

+15

@InlyIT 29 дек 2021 в 05:49

История о том, как я наладил производство бумажных вебсайтов и купил сто записных книжек с Alibaba

6 мин

14K

Блог компании InlyITИскусственный интеллектРазвитие стартапа

Перевод

Если вкратце: я открыл бизнес, чтобы дать людям возможность создавать сайты на бумаге. По ходу дела я завирусился на Твиттере, заработал тысячу долларов за два дня и просадил 720 долларов на сотню блокнотов с Alibaba.

Однажды мне в голову пришел любопытный вопрос: «Можно ли создать вебсайт на листе бумаги?». Я тот самый человек, который как-то раз скупил 300 казахских доменов с эмоджи, но даже по моим меркам идея выглядела несколько странной.

Однако примерно в то же время у меня зародились планы начать вести новенький с иголочки блог о своей повседневной жизни. Перед глазами стали возникать картины: сижу я такой в халате с чашкой чая и шариковой ручкой, и каким-то образом делаю записи в онлайн-блоге непосредственно из записной книжки. Эта мысль показалась мне крайне забавной.

Так можно ли делать сайты на листе бумаги? Я решил, что, по крайней мере, стоит попробовать.

Читать дальше →

+53

@iraelisova 23 мар 2021 в 11:03

Туториал по uplift моделированию: метрики. Часть 3

9 мин

47K

Блог компании МТСData Mining * Математика * Машинное обучение * Искусственный интеллект

Туториал

В предыдущих туториалах (часть 1, часть 2) мы изучали методы, моделирующие uplift. Это величина, которая оценивает размер влияния на клиента, если мы взаимодействуем с ним. Например, отправляем смс или пуш уведомление. Давайте обсудим: как измерять качество uplift моделей?

Читать про uplift метрики

1 2 3 4

6 7 ...

53 54