Articles / Bookmarks / Profile of rotor / Habr

Валерий Дмитриев @rotor

Пользователь

ProfileArticles8PostsNewsComments255

rajce Aug 30 2023 at 17:19

10 полезных ИИ, которые облегчат вашу жизнь

Easy

4 min

63K

BotHub corporate blogCloud services*Artificial Intelligence

Review

Искусственный интеллект активно внедряется в нашу повседневную жизнь, предлагая полезные инструменты для решения различных задач. Рассказываем о 10 полезных инструментах на базе ИИ для решения повседневных задач.

Узнайте, как автоматизировать рутинные операции с помощью умных ассистентов. Читайте наш обзор и выбирайте самые полезные инструменты для себя!

+14

itglobalcom Aug 24 2023 at 09:00

GPT-4, Claude 2 и Llama 2: какая языковая модель не отлынивает от ответов

3 min

13K

ITGLOBAL.COM corporate blogResearch and forecasts in IT*Artificial Intelligence

Аналитическая компания Arthur AI провела тестирование моделей искусственного интеллекта, представленных Meta, OpenAI, Cohere и Anthropic. В статье разбираем, какие из них наиболее склонны к вымыслу или галлюцинациям.

TilekSamiev Aug 24 2023 at 08:01

Perfusion. Это как Midjourney, только лучше

Easy

7 min

21K

Timeweb Cloud corporate blogArtificial IntelligenceMachine learning*Image processing*Working with 3D-graphics*

Review

Когда дело доходит до автоматического создания изображений на основе собственных идей, на помощь приходят две самых популярных среди пользователей нейросети — DALL-E 2 и Midjourney. Обе являются инструментами, способными создавать реалистичные изображения с хорошим качеством. Эти ИИ обычно понимают, чего вы хотите, и пытаются генерировать новые изображения, в том числе что-то похожее на конкретный пример, но часто можно увидеть, что результат совершенно не соответствует запросам. Что ж, это изменится с новой моделью от NVIDIA — Perfusion, нейросетью, которая позволяет создавать изображения из описаний на естественном языке.

В отличие от своих тяжеловесных конкурентов, Perfusion выделяется компактным размером моделей всего в 100 КБ и 4-минутным временем обучения. Perfusion предлагает пользователям возможность комбинировать различные настраиваемые элементы с набором изображений, которые функционируют как «концепции». Модель способна изучить «концепцию» объекта (например, вещи, животного или человека), а затем генерировать эти концепции в новых сценариях.

Читать дальше →

+16

antoshkka Aug 17 2023 at 10:24

Первые новинки C++26: итоги летней встречи ISO

11 min

27K

Яндекс corporate blogC++*IT Standards*Compilers*Programming*

На недавней встрече комитет C++ активно взялся за C++26. Уже есть первые новинки, которые нас будут ждать в готовящемся стандарте C++:

улучшенный static_assert,
переменная _,
оптимизация и улучшение для std::to_string,
Hazard Pointer,
Read-Copy-Update (так же известное как RCU),
native_handle(),
целая вереница классов *function*,
множество доработок по constexpr,
std::submdspan,
и прочие приятные мелочи.

Рассмотрим новинки на примерах

+62

119

Vadim170 Aug 16 2023 at 23:28

Как дообучить LLaMA бесплатно и без программирования: как создать тупого друга

Medium

5 min

68K

Python*Machine learning*Artificial Intelligence

Tutorial

В этой статье я расскажу как я смог бесплатно и без мощного железа дообучить LLaMA на диалогах с друзьями в ВК, чтобы сделать чат бота, который копирует наш стиль общения, оживляет разговор в чате и просто пишет странные и смешные вещи. В статье будет мало терминов, тут я простым языком расскажу как вы можете обучить большую языковую модель.

+14

NeoNs Jan 8 2011 at 20:16

Алгоритмы поиска в строке

4 min

192K

Algorithms*

From sandbox

Постановка задачи поиска в строке

Часто приходится сталкиваться со специфическим поиском, так называемым поиском строки (поиском в строке). Пусть есть некоторый текст Т и слово (или образ) W. Необходимо найти первое вхождение этого слова в указанном тексте. Это действие типично для любых систем обработки текстов. (Элементы массивов Т и W – символы некоторого конечного алфавита – например, {0, 1}, или {a, …, z}, или {а, …, я}.)

Наиболее типичным приложением такой задачи является документальный поиск: задан фонд документов, состоящих из последовательности библиографических ссылок, каждая ссылка сопровождается «дескриптором», указывающим тему соответствующей ссылки. Надо найти некоторые ключевые слова, встречающиеся среди дескрипторов. Мог бы иметь место, например, запрос «Программирование» и «Java». Такой запрос можно трактовать следующим образом: существуют ли статьи, обладающие дескрипторами «Программирование» и «Java».

Поиск строки формально определяется следующим образом. Пусть задан массив Т из N элементов и массив W из M элементов, причем 0<M≤N. Поиск строки обнаруживает первое вхождение W в Т, результатом будем считать индекс i, указывающий на первое с начала строки (с начала массива Т) совпадение с образом (словом).
Пример. Требуется найти все вхождения образца W = abaa в текст T=abcabaabcabca.

Образец входит в текст только один раз, со сдвигом S=3, индекс i=4.

Читать дальше →

+46

AndrewShmig Apr 20 2023 at 12:03

DataHub: как делиться структурированными данными и получать за них донаты?

Easy

4 min

1.8K

Data Mining*Big Data*Open data*Data storage*

Tutorial

Привет! Меня зовут Андрей Шмиг, я основатель и разработчик платформы DataHub - Crowd Data Sourcing at Hand, своего рода GitHub для данных. В этой статье речь пойдёт о том, как создать FREE и SPONSORED репозитории данных, а так же в чем их отличия.

AndrewShmig Jun 8 2019 at 16:24

Введение в свёрточные нейронные сети (Convolutional Neural Networks)

8 min

65K

Big Data*Artificial IntelligenceMachine learning*

Tutorial

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

Выход новых лекций запланирован каждые 2-3 дня.

Читать дальше →

+11

bugman Mar 22 2023 at 21:10

Как настроить Alpaca (аналог ChatGPT) на своём арендованном сервере. Гайд для самых маленьких

Easy

4 min

43K

Artificial Intelligence

Tutorial

После публикации https://habr.com/ru/news/t/723638/ меня попросило несколько человек написать гайд для новичков, как же это всё запустить поиграться где-нибудь на арендованном сервере, если локальная машина не позволяет? На всё про всё нам потребуется минут 20 и сто рублей денег.

Но уже появились бесплатные варианты на HuggingFace

+28

o_O_Tync Jan 6 2010 at 04:13

Ввод произвольных символов при помощи Compose Key: настройка

5 min

33K

Configuring Linux*

Многие знают, что в Linux есть специальная кнопка: Compose. Её действие аналогично виндовым сочетаниям Alt+NumPad (Например, нажатие Alt+0169 даёт символ ©), но не требует хранить перед глазами таблицу кодов символов :) Если настроить правый Alt как Compose Key, то нажав RAlt+O+C получаем тот же значок копирайта: ©.

В статье я опишу способ назначения произвольных сочетаний клавиш для символов. Это будет удобно в первую очередь математикам: не нужно будет лазить в таблицу символов чтобы ввести «∀ε>0 ∃δ(ε)≕δ>0: ∀x∈O(x₀) |f(x)<A|» в любом приложении, поддерживающем юникод. Кроме математических символов, будут доступны всевозможные стрелочки (→⇖⇔⟲⟽), галочки (✘), буллеты (•‣★), кавычки («»), длинное тире (—), дроби(⅓, ⅞), диа⃫кр͎е̃ти⃰ческие зн⃫аки и всё что душе угодно в необъятном юникоде! :)

Хочу так же

+42

Firemoon Feb 21 2023 at 09:37

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

Medium

18 min

54K

Selectel corporate blogC++*Python*Video cardsArtificial Intelligence

Tutorial

Не так давно в интернете появилась душещипательная история, как пользователь hackdaddy8000 сперва создал виртуальную девушку, а затем усыпил ее. Моральный и мемный аспект этого события обсуждали в комментариях под новостями.

Поговорим о технической стороне. Как повторить этот шедевр и можно ли обойтись без сервисов OpenAI, которые сложно оплатить в России? И главное — сколько придется инвестировать в виртуальную подругу.

Читать дальше →

+107

AlNinyo Jan 14 2015 at 09:57

Мучения с LED cube 4x4x4 (Arduino+74HC595)

4 min

69K

Developing for Arduino*

From sandbox

Здравствуйте, дорогие хабравчане!

Наконец-то у меня есть, что вам рассказать и показать. Надеюсь, рассказ будет интересен не только мне.

Я расскажу о своём опыте работы с Ardiuno UNO и даже покажу, что у меня в итоге получилось. Если вам ещё не надоело подобное — добро пожаловать под кат.

Читать дальше →

+24

Amvera_Speech Feb 9 2023 at 10:12

Предоставляем бесплатное облачное распознавание речи ASR

Easy

2 min

3.4K

Amvera corporate blogOpen source*Semantics*Machine learning*Voice user interfaces*

В этой статье мы, расскажем, как сделали первое действительно бесплатное облачное распознавание речи и как им воспользоваться.

Разработчики систем распознавания речи, как правило, используют поминутную тарификацию распознавания. В одной из прошлых статей я уточнял почему считаю это далеко не всегда правильным (если кратко, то при такой тарификации вендоры округляют длительность в большую сторону, а значит, за распознавание коротких записей вы заметно переплачиваете, а при большом трафике это очень дорого).

Давайте теперь разберемся, действительно ли для вендоров экономически оправданно брать деньги с хобби-проектов и небольших компаний, которым нужно распознавать не миллионы, а всего лишь десятки или сотни минут в день.

Rai220 Jan 24 2023 at 13:59

Переносим свою картину мира в чат-бота на базе GPT-3

4 min

48K

Machine learning*Artificial Intelligence

Tutorial

Думаю, все уже наслышаны о потрясающих возможностях ChatGPT и GPT-3, многие уже вдоволь наигрались с ними, а новые стартапы на их основе льются на нас каждый проливным дождём! Возможности ChatGPT в решении некоторых текстовых задач потрясают, порой кажется, что имеешь дело с настоящим разумом.

У меня возникла идея - что если попробовать доучить сеть так, чтобы она имитировала картину мира определенного человека? (Да, снова Черное Зеркало). Классический подход с pre-prompt для этого не подходит, так как хочется заложить в сеть побольше знаний (а также реально поменять веса связей), поэтому будем использовать fine-tune (дообучение на небольшом датасете и небольшом числе итераций). Такая опция доступна пользователям openAI за небольшую плату ($0.5-1 в моих примерах).

В этой статье я покажу как можно обучить GPT-3 (в версии davinchi-003) на своей картине мира и засунуть её внутрь телеграм-бота, потратив на всё всего несколько долларов.

Код бота доступен в репозитарии.

+42

dvlunin Jan 17 2023 at 09:13

Критерий Манна-Уитни — самый главный враг A/B-тестов

17 min

56K

AvitoTech corporate blogMobile App Analytics*Statistics in IT

Всем привет! Меня зовут Дима Лунин, я аналитик в компании Авито. В этой статье я расскажу про критерий Манна-Уитни и проблемы при его использовании.

Если вы анализировали A/B-тест, где вас интересовал прирост или падение какой-то метрики, то наверняка использовали критерий Манна-Уитни. Я хочу рассказать про подводные камни этого критерия, и почему мы в компании его не используем. А в конце вы поймёте, откуда такой холиварный заголовок)

+24

antoleb Jan 16 2023 at 21:57

Как работают text2image модели?

6 min

20K

Image processing*Mathematics*Machine learning*Artificial Intelligence

Review

✏️ Technotext 2023

Вы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации.

+77

akuprin Dec 19 2022 at 18:38

Нестандартный полиморфизм. Паттерн Type Erasure

Medium

15 min

13K

C++*

Review

From sandbox

Нестандартный полиморфизм. Паттерн Type Erasure.

Посмотрим на проблему, решим ее обычным полиморфизмом и пройдем небольшими шагами к более элегантному решению с помощью современного паттерна.

+14

kmoseenk Dec 20 2022 at 15:55

Почему оценка задач сломала Agile

7 min

17K

OTUS corporate blogDevelopment Management*Project management*Agile*Product Management*

Translation

Трудно утверждать, что методология Agile неэффективна. Практически все команды разработки программного обеспечения стараются ей следовать. Простой способ начать внедрять гибкую методологию — это добавить пару ее компонентов в рабочий процесс. Одним из самых популярных и при этом важных компонентов считается оценка в Story Points. Однако сколько команд оценивали ее реальное влияние? На самом ли деле оценка времени, затраченного на каждую задачу, приносит пользу? По моему опыту, это не так.

Чтобы оставаться гибкими, нам следует знать преимущества и риски используемых инструментов, в частности плюсы и минусы оценки в Story Points. В этой статье мы рассмотрим, возможно ли точное планирование итераций и гибкость без оценки времени каждой отдельной задачи.

+13

honyaki Dec 20 2022 at 13:59

Алгоритмы диапазонов C++20 — 7 немодифицирующих операций

13 min

8.5K

Skillfactory corporate blogC++*Algorithms*Programming*

Translation

Библиотека Ranges для C++20 предлагает альтернативы для большинства алгоритмов. На этот раз я хочу показать вам десять немодифицирующих операций. Мы сравним их со «старой» стандартной версией и увидим их преимущества и ограничения.

Подробности — к старту нашего курса по разработке на C++.

Читать дальше →

rotor Sep 22 2022 at 11:03

Как полюбить задачи регрессии

5 min

7.6K

Data Mining*Algorithms*Machine learning*Data Engineering*

Data Mining Season

У задач классификации, в отличии от задач регрессии, есть одно очень приятное свойство:
большинство ML алгоритмов решения задач классификации выдают не просто ответ, а некоторую оценку уверенности модели в ответе. То есть помимо метрик самой модели мы обладаем оценкой вероятности для конкретного ответа на конкретном примере. Это здорово помогает в принятии решений.
Неправда ли хотелось бы иметь что-то такое и для задач регресии?

1 2 3

5 6 ...

52 53