Pull to refresh
0
0
Send message

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

Level of difficultyMedium
Reading time12 min
Views93K

Привет, Хабр! Продолжаю серию статей про разработку telegram-ботов на библиотеке aiogram и языке программирования Python. Хочется отметить, что статья не является документацией или учебником. Я просто рассказываю пошагово как разработать полнофункционального бота, стараясь затронуть как можно больше тем.

В предыдущей части мы настроили окружение и среду разработки и теперь готовы начать писать бота. В этой статье мы создадим меню и базовую логику взаимодействия с пользователем, а также подключим API OpenAI

Читать далее
Total votes 6: ↑5 and ↓1+4
Comments20

PromptGPT: оптимизируем промт для GPT-4

Level of difficultyMedium
Reading time14 min
Views12K

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments6

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Level of difficultyEasy
Reading time7 min
Views192K

Нетипичный туториал по разработке Telegram-бота на Python и Aiogram 3. В отличие от большинства гайдов и туториалов про разработку ботов «для новичков», здесь будут рассмотрены все аспекты создания бота, от установки редактора кода до подключения оплаты и развёртывания на сервере. В первой части мы рассмотрим подготовку окружения, файловую структуру бота и напишем первый рабочий код бота.

Читать далее
Total votes 8: ↑7 and ↓1+7
Comments24

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Level of difficultyMedium
Reading time15 min
Views124K

Mojo — это новый язык программирования, основанный на Python, который устраняет имеющиеся у него проблемы производительности и развёртывания.

Об авторе: Джереми Говард (Jeremy Howard) — Data Scientist, исследователь, разработчик, преподаватель и предприниматель. Джереми является одним из основателей исследовательского института fast.ai, занимающегося тем, чтобы сделать глубокое обучение более доступным, а также он является почётным профессором Университета Квинсленда. Ранее Джереми был выдающимся научным сотрудником в Университете Сан‑Франциско, где он был основателем Инициативы Уиклоу «Искусственный интеллект в медицинских исследованиях».

Mojo – это Python++
Total votes 64: ↑45 and ↓19+43
Comments272

Сколько нужно отзывов, чтобы у вас покупали?

Reading time2 min
Views2.2K

Есть определенная планка доверия, после которой у вас начинают покупать. Давайте разберемся, какая она по части отзывов. Сколько их нужно, чтобы прокачать ваш аккаунт на WB, Ozon и Авито?

Казалось бы, простая (но очень важная тема) - сколько же отзывов нам нужно для старта продаж. Чтобы люди начали доверять нашему аккаунту. Мы в агентстве Hooglink.Agency эмпирическим путем вывели эту цифру, что касается продаж на Авито и Юла.

Но наш пытливый ум начал искать какую-нибудь статистику, чтобы понять, а реально есть какая-то волшебная граница? И мы наткнулись на исследование СберМегаМаркета, который эту цифру выводит.

Читать далее
Total votes 8: ↑5 and ↓3+4
Comments20

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Level of difficultyEasy
Reading time5 min
Views18K

Часто можно услышать, что пиратское ПО является причиной сбоев в работе компьютера, утечек данных и т. п. В этой статье разберёмся, через какие этапы прошла борьба пиратов и разработчиков, к чему это привело, и опасно ли устанавливать нелицензионное ПО сейчас.
Читать дальше →
Total votes 55: ↑30 and ↓25+18
Comments74

Ищем кейсы для внедрения проектов IIoT

Level of difficultyEasy
Reading time9 min
Views1.4K

Меня зовут Дмитрий Серов, и я являюсь руководителем направления промышленного интернета вещей в компании UMNO.digital. В ИТ-индустрии я работаю около 20 лет, последние 5 из которых занимаюсь проектами IIoT в таких отраслях как телеком, сельское хозяйство, ЖКХ, сейчас развиваю это направление для ж/д и промышленных предприятий.

Я часто сталкиваюсь с ситуациями, когда при работе с проектами нет очевидных узких мест и болевых точек производственной системы, которые надо решить с помощью цифровизации.  Чаще задача от бизнеса звучит как общее повышение эффективности активов. В этом случае встает вопрос: «Как найти кейсы для цифровизации, которые дадут ожидаемый результат и повысят эффективность производства?». В этой статье я поделюсь своим опытом и расскажу, о проблемах, с которыми сталкиваюсь при поиске кейсов, а также, как можно искать точки старта для начала работы с такими проектами.

Читать далее
Rating0
Comments0

Улучшаем лендинг на основе метрик, а не мнений: гайд

Reading time12 min
Views4.5K

Привет, Хабр! Меня зовут Андрей Устьянцев, и я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Занимаясь digital-маркетингом с 2006 по 2019 год, в какой-то момент я осознал очевидную сейчас многим истину. Эффективность рекламной кампании в интернете зависит не только от качества настройки ее параметров, но и от продающего качества лендинга, на который ведется рекламный трафик.

Но как измерить качество? Оперирование субъективными мнениями дизайнеров и результатами опросов в «экспертных сообществах» (в духе «подскажите, что не так»), как я могу судить по моему опыту, ни к чему в итоге не приводит.

Поэтому я разработал систему формирования метрик (сухих объективных цифр), на основе которых можно оцифровать качество лендинга.

Коротко — суть:

Читать далее
Total votes 4: ↑3 and ↓1+2
Comments0

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Level of difficultyEasy
Reading time5 min
Views45K

В прошлой статье я говорил о том, что поиск себя и попытки найти дело своей жизни часто проваливаются. А сейчас поговорим о том, почему даже если вам очень нравится, то чем вы занимаетесь (да еще и получается к тому же), шансов на успех меньше, чем хотелось бы.

Читать далее
Total votes 81: ↑57 and ↓24+51
Comments111

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

Reading time13 min
Views15K

Я материалист, и поэтому мне радостно видеть впечатляющие успехи больших языковых моделей как то GPT или PaLM. Тут и осмысленный диалог, и программирование, и сочинение сказок, и написание дипломов, и постановка диагнозов, и попытка jailbreak-а. Bing так вообще угрожает и может демонстрировать влюбленность. Эта радость - она от подтверждения правоты, что мы являемся пусть сложными, но всё таким биологическими машинами, и следовательно мы полностью познаваемы, что трансцендентной души у нас нет, что после смерти ничего не будет, а самосознание является феноменом развитой нервной системы. 

Примечательно то, что публичный прорыв с большими языковыми моделями случился внезапно. Не было какой-то долгой разбежки на протяжении десятков лет (сама GPT модель разрабатывалась с середины 2018, что по меркам истории просто  мгновение). ChatGPT выпрыгнул как чёрт из табакерки в конце 2022 и явил собой качественно новое явление. Явление, которое подтверждает второй закон диалектики: количество переходит в качество. Просто возьми много-много текстов, заставь нейросеть на трансформер-архитектуре предсказывать очередное слово и вуа-ля - получи на выходе почти мыслящую сущность. Если угодно, то душа, сознание и характер распределятся у неё где-то на миллиардах весов, как и у каждого из нас в мозгу.

Интересный вопрос - а что такого выучила та же GPT, что позволяет ей вести разумный диалог? За счёт чего магия? При этом помним, что модель не является просто сборищем ответов на заранее известные вопросы. То есть она не похожа на Граммофон из “Сумма технологии” С. Лема, на который записано 100 триллионов ответов. Модель умеет генерировать новое, умеет понимать контекст. По мне, так модель выявила внутреннюю логику и закономерности повествования, следуя которым можно получить любой текст. Эта логика представлена в виде внутренней системы понятий и смыслов, которые активируются в зависимости от текущего диалога. И когда мы что-то спрашиваем у модели, то для неё это может выглядеть так: сюжетная линия №3429643, ситуация №93752, роли №122997 и №88223, действующее лицо №33554, стилистика №7622 и т.д. Соединив и перемножив всё это вместе, получаем небольшой репертуар слов, из которого можно выбрать очередное. Так как всевозможных комбинаций этих сущностей просто космическое, то модель в состоянии генерировать новое и постоянно удивлять нас. 

Читать далее
Total votes 32: ↑16 and ↓16+2
Comments126

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Level of difficultyEasy
Reading time6 min
Views5.6K

Майклу Нгуену за 40, однако он называет свой биологический возраст: от 27 до 29 лет. Нгуен начинает утро с «биозаряда» электромагнитными импульсами, ест один раз в день и принимает много добавок, включая рапамицин, который, по его словам, «обращает старение вспять». Он также пьёт средство от диабета, делает инъекции богатой тромбоцитами плазмы, чтобы остановить выпадение волос, и дремлет в гипербарической камере.

Осенью 2021 года Нгуен открыл «Дом долголетия» — частный клуб, в котором людям обещают, что их жизнь продлится до 120 лет. При этом у них не будет хронических и умственных заболеваний. 

Пожизненное членство стоит $100 тысяч.

Читать далее
Total votes 18: ↑6 and ↓12-5
Comments18

Поисковик Brave: окончательно рвём связи с Bing

Level of difficultyEasy
Reading time3 min
Views3K

Теперь абсолютно каждый результат Поиска Brave получен исключительно из нашего собственного индекса. Мы окончательно избавились от любых запросов по API к Bing (раньше они составляли примерно 7% от поисковой выдачи).

Читать далее
Total votes 8: ↑7 and ↓1+9
Comments13

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

Reading time9 min
Views20K

Перед небольшим загородным домом на окраине Гамбурга в северной Германии на почтовом ящике карандашом нацарапано единственное слово — «ЛАЙОН». Это единственный признак того, что этот дом принадлежит человеку, стоящему за огромными усилиями по сбору данных, и без которого тот бум искусственного интеллекта, который во всю силу происходит сейчас, мог бы и не случиться.

Читать далее
Total votes 23: ↑20 and ↓3+25
Comments14

Information

Rating
Does not participate
Registered
Activity

Specialization

Sales manager, Sales Analyst
Senior
From 300,000 ₽
Python