Статьи / Закладки / Профиль Glitrsartra / Хабр

@Glitrsartra

Пользователь

Профиль Публикации Комментарии 3Закладки 19

ivankarmanow 6 мая 2023 в 12:54

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

Средний

12 мин

98K

Мессенджеры*Python*Программирование*API*Искусственный интеллект

Туториал

Привет, Хабр! Продолжаю серию статей про разработку telegram-ботов на библиотеке aiogram и языке программирования Python. Хочется отметить, что статья не является документацией или учебником. Я просто рассказываю пошагово как разработать полнофункционального бота, стараясь затронуть как можно больше тем.

В предыдущей части мы настроили окружение и среду разработки и теперь готовы начать писать бота. В этой статье мы создадим меню и базовую логику взаимодействия с пользователем, а также подключим API OpenAI

einhorn 14 мая 2023 в 18:43

PromptGPT: оптимизируем промт для GPT-4

Средний

14 мин

13K

Python*Визуализация данных*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

ivankarmanow 28 апр 2023 в 01:02

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Простой

7 мин

211K

Python*

Туториал

Из песочницы

Нетипичный туториал по разработке Telegram-бота на Python и Aiogram 3. В отличие от большинства гайдов и туториалов про разработку ботов «для новичков», здесь будут рассмотрены все аспекты создания бота, от установки редактора кода до подключения оплаты и развёртывания на сервере. В первой части мы рассмотрим подготовку окружения, файловую структуру бота и напишем первый рабочий код бота.

ziyodulla-baykhanov 8 мая 2023 в 11:32

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Средний

15 мин

125K

Python*Julia*Машинное обучение*Искусственный интеллект

Мнение

Из песочницы

Перевод

Mojo — это новый язык программирования, основанный на Python, который устраняет имеющиеся у него проблемы производительности и развёртывания.

Об авторе: Джереми Говард (Jeremy Howard) — Data Scientist, исследователь, разработчик, преподаватель и предприниматель. Джереми является одним из основателей исследовательского института fast.ai, занимающегося тем, чтобы сделать глубокое обучение более доступным, а также он является почётным профессором Университета Квинсленда. Ранее Джереми был выдающимся научным сотрудником в Университете Сан‑Франциско, где он был основателем Инициативы Уиклоу «Искусственный интеллект в медицинских исследованиях».

Mojo – это Python++

+43

272

vikdovnar 27 апр 2023 в 10:46

Сколько нужно отзывов, чтобы у вас покупали?

2 мин

2.3K

Интернет-маркетинг*Управление e-commerce*Управление продажами*

Есть определенная планка доверия, после которой у вас начинают покупать. Давайте разберемся, какая она по части отзывов. Сколько их нужно, чтобы прокачать ваш аккаунт на WB, Ozon и Авито?

Казалось бы, простая (но очень важная тема) - сколько же отзывов нам нужно для старта продаж. Чтобы люди начали доверять нашему аккаунту. Мы в агентстве Hooglink.Agency эмпирическим путем вывели эту цифру, что касается продаж на Авито и Юла.

Но наш пытливый ум начал искать какую-нибудь статистику, чтобы понять, а реально есть какая-то волшебная граница? И мы наткнулись на исследование СберМегаМаркета, который эту цифру выводит.

oldadmin 9 мая 2023 в 13:00

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Простой

5 мин

18K

Блог компании RUVDS.comЗаконодательство в ITИстория ITСофт

Часто можно услышать, что пиратское ПО является причиной сбоев в работе компьютера, утечек данных и т. п. В этой статье разберёмся, через какие этапы прошла борьба пиратов и разработчиков, к чему это привело, и опасно ли устанавливать нелицензионное ПО сейчас.

Читать дальше →

+18

UMNODigital 30 мар 2023 в 13:47

Ищем кейсы для внедрения проектов IIoT

Простой

9 мин

1.4K

Интернет вещейМонетизация IT-систем*Управление проектами*Разработка для интернета вещей*IT-инфраструктура*

Меня зовут Дмитрий Серов, и я являюсь руководителем направления промышленного интернета вещей в компании UMNO.digital. В ИТ-индустрии я работаю около 20 лет, последние 5 из которых занимаюсь проектами IIoT в таких отраслях как телеком, сельское хозяйство, ЖКХ, сейчас развиваю это направление для ж/д и промышленных предприятий.

Я часто сталкиваюсь с ситуациями, когда при работе с проектами нет очевидных узких мест и болевых точек производственной системы, которые надо решить с помощью цифровизации. Чаще задача от бизнеса звучит как общее повышение эффективности активов. В этом случае встает вопрос: «Как найти кейсы для цифровизации, которые дадут ожидаемый результат и повысят эффективность производства?». В этой статье я поделюсь своим опытом и расскажу, о проблемах, с которыми сталкиваюсь при поиске кейсов, а также, как можно искать точки старта для начала работы с такими проектами.

Digital_League 5 мая 2023 в 10:56

Улучшаем лендинг на основе метрик, а не мнений: гайд

12 мин

4.8K

Блог компании Лига Цифровой ЭкономикиВеб-аналитика*Повышение конверсии*

Привет, Хабр! Меня зовут Андрей Устьянцев, и я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Занимаясь digital-маркетингом с 2006 по 2019 год, в какой-то момент я осознал очевидную сейчас многим истину. Эффективность рекламной кампании в интернете зависит не только от качества настройки ее параметров, но и от продающего качества лендинга, на который ведется рекламный трафик.

Но как измерить качество? Оперирование субъективными мнениями дизайнеров и результатами опросов в «экспертных сообществах» (в духе «подскажите, что не так»), как я могу судить по моему опыту, ни к чему в итоге не приводит.

Поэтому я разработал систему формирования метрик (сухих объективных цифр), на основе которых можно оцифровать качество лендинга.

Коротко — суть:

Ingirov 7 мая 2023 в 08:41

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Простой

5 мин

46K

Карьера в IT-индустрииЛайфхаки для гиковМозгЗдоровье

В прошлой статье я говорил о том, что поиск себя и попытки найти дело своей жизни часто проваливаются. А сейчас поговорим о том, почему даже если вам очень нравится, то чем вы занимаетесь (да еще и получается к тому же), шансов на успех меньше, чем хотелось бы.

+51

111

kms82 9 мая 2023 в 08:42

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

13 мин

15K

Искусственный интеллектБудущее здесь

Из песочницы

Я материалист, и поэтому мне радостно видеть впечатляющие успехи больших языковых моделей как то GPT или PaLM. Тут и осмысленный диалог, и программирование, и сочинение сказок, и написание дипломов, и постановка диагнозов, и попытка jailbreak-а. Bing так вообще угрожает и может демонстрировать влюбленность. Эта радость - она от подтверждения правоты, что мы являемся пусть сложными, но всё таким биологическими машинами, и следовательно мы полностью познаваемы, что трансцендентной души у нас нет, что после смерти ничего не будет, а самосознание является феноменом развитой нервной системы.

Примечательно то, что публичный прорыв с большими языковыми моделями случился внезапно. Не было какой-то долгой разбежки на протяжении десятков лет (сама GPT модель разрабатывалась с середины 2018, что по меркам истории просто мгновение). ChatGPT выпрыгнул как чёрт из табакерки в конце 2022 и явил собой качественно новое явление. Явление, которое подтверждает второй закон диалектики: количество переходит в качество. Просто возьми много-много текстов, заставь нейросеть на трансформер-архитектуре предсказывать очередное слово и вуа-ля - получи на выходе почти мыслящую сущность. Если угодно, то душа, сознание и характер распределятся у неё где-то на миллиардах весов, как и у каждого из нас в мозгу.

Интересный вопрос - а что такого выучила та же GPT, что позволяет ей вести разумный диалог? За счёт чего магия? При этом помним, что модель не является просто сборищем ответов на заранее известные вопросы. То есть она не похожа на Граммофон из “Сумма технологии” С. Лема, на который записано 100 триллионов ответов. Модель умеет генерировать новое, умеет понимать контекст. По мне, так модель выявила внутреннюю логику и закономерности повествования, следуя которым можно получить любой текст. Эта логика представлена в виде внутренней системы понятий и смыслов, которые активируются в зависимости от текущего диалога. И когда мы что-то спрашиваем у модели, то для неё это может выглядеть так: сюжетная линия №3429643, ситуация №93752, роли №122997 и №88223, действующее лицо №33554, стилистика №7622 и т.д. Соединив и перемножив всё это вместе, получаем небольшой репертуар слов, из которого можно выбрать очередное. Так как всевозможных комбинаций этих сущностей просто космическое, то модель в состоянии генерировать новое и постоянно удивлять нас.

126

vamedvedev 28 апр 2023 в 18:51

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Простой

6 мин

5.6K

БиотехнологииНаучно-популярноеЧитальный зал

Обзор

Майклу Нгуену за 40, однако он называет свой биологический возраст: от 27 до 29 лет. Нгуен начинает утро с «биозаряда» электромагнитными импульсами, ест один раз в день и принимает много добавок, включая рапамицин, который, по его словам, «обращает старение вспять». Он также пьёт средство от диабета, делает инъекции богатой тромбоцитами плазмы, чтобы остановить выпадение волос, и дремлет в гипербарической камере.

Осенью 2021 года Нгуен открыл «Дом долголетия» — частный клуб, в котором людям обещают, что их жизнь продлится до 120 лет. При этом у них не будет хронических и умственных заболеваний.

Пожизненное членство стоит $100 тысяч.

-5

BraveSoftware 4 мая 2023 в 12:01

Поисковик Brave: окончательно рвём связи с Bing

Простой

3 мин

3.1K

Блог компании BraveПоисковые технологии*

Кейс

Перевод

Теперь абсолютно каждый результат Поиска Brave получен исключительно из нашего собственного индекса. Мы окончательно избавились от любых запросов по API к Bing (раньше они составляли примерно 7% от поисковой выдачи).

virtual_explorer 4 мая 2023 в 15:04

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

9 мин

20K

Блог компании FirstVDSХранение данных*Машинное обучение*Развитие стартапаИскусственный интеллект

Перевод

Перед небольшим загородным домом на окраине Гамбурга в северной Германии на почтовом ящике карандашом нацарапано единственное слово — «ЛАЙОН». Это единственный признак того, что этот дом принадлежит человеку, стоящему за огромными усилиями по сбору данных, и без которого тот бум искусственного интеллекта, который во всю силу происходит сейчас, мог бы и не случиться.

+25

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

PromptGPT: оптимизируем промт для GPT-4

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Сколько нужно отзывов, чтобы у вас покупали?

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Ищем кейсы для внедрения проектов IIoT

Улучшаем лендинг на основе метрик, а не мнений: гайд

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Поисковик Brave: окончательно рвём связи с Bing

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

Информация

Специализация