Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров91K

Привет, Хабр! Продолжаю серию статей про разработку telegram-ботов на библиотеке aiogram и языке программирования Python. Хочется отметить, что статья не является документацией или учебником. Я просто рассказываю пошагово как разработать полнофункционального бота, стараясь затронуть как можно больше тем.

В предыдущей части мы настроили окружение и среду разработки и теперь готовы начать писать бота. В этой статье мы создадим меню и базовую логику взаимодействия с пользователем, а также подключим API OpenAI

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии17

PromptGPT: оптимизируем промт для GPT-4

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров12K

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии6

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров185K

Нетипичный туториал по разработке Telegram-бота на Python и Aiogram 3. В отличие от большинства гайдов и туториалов про разработку ботов «для новичков», здесь будут рассмотрены все аспекты создания бота, от установки редактора кода до подключения оплаты и развёртывания на сервере. В первой части мы рассмотрим подготовку окружения, файловую структуру бота и напишем первый рабочий код бота.

Читать далее
Всего голосов 8: ↑7 и ↓1+7
Комментарии23

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров123K

Mojo — это новый язык программирования, основанный на Python, который устраняет имеющиеся у него проблемы производительности и развёртывания.

Об авторе: Джереми Говард (Jeremy Howard) — Data Scientist, исследователь, разработчик, преподаватель и предприниматель. Джереми является одним из основателей исследовательского института fast.ai, занимающегося тем, чтобы сделать глубокое обучение более доступным, а также он является почётным профессором Университета Квинсленда. Ранее Джереми был выдающимся научным сотрудником в Университете Сан‑Франциско, где он был основателем Инициативы Уиклоу «Искусственный интеллект в медицинских исследованиях».

Mojo – это Python++
Всего голосов 64: ↑45 и ↓19+43
Комментарии272

Сколько нужно отзывов, чтобы у вас покупали?

Время на прочтение2 мин
Количество просмотров2.2K

Есть определенная планка доверия, после которой у вас начинают покупать. Давайте разберемся, какая она по части отзывов. Сколько их нужно, чтобы прокачать ваш аккаунт на WB, Ozon и Авито?

Казалось бы, простая (но очень важная тема) - сколько же отзывов нам нужно для старта продаж. Чтобы люди начали доверять нашему аккаунту. Мы в агентстве Hooglink.Agency эмпирическим путем вывели эту цифру, что касается продаж на Авито и Юла.

Но наш пытливый ум начал искать какую-нибудь статистику, чтобы понять, а реально есть какая-то волшебная граница? И мы наткнулись на исследование СберМегаМаркета, который эту цифру выводит.

Читать далее
Всего голосов 8: ↑5 и ↓3+4
Комментарии20

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров18K

Часто можно услышать, что пиратское ПО является причиной сбоев в работе компьютера, утечек данных и т. п. В этой статье разберёмся, через какие этапы прошла борьба пиратов и разработчиков, к чему это привело, и опасно ли устанавливать нелицензионное ПО сейчас.
Читать дальше →
Всего голосов 55: ↑30 и ↓25+18
Комментарии74

Ищем кейсы для внедрения проектов IIoT

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.4K

Меня зовут Дмитрий Серов, и я являюсь руководителем направления промышленного интернета вещей в компании UMNO.digital. В ИТ-индустрии я работаю около 20 лет, последние 5 из которых занимаюсь проектами IIoT в таких отраслях как телеком, сельское хозяйство, ЖКХ, сейчас развиваю это направление для ж/д и промышленных предприятий.

Я часто сталкиваюсь с ситуациями, когда при работе с проектами нет очевидных узких мест и болевых точек производственной системы, которые надо решить с помощью цифровизации.  Чаще задача от бизнеса звучит как общее повышение эффективности активов. В этом случае встает вопрос: «Как найти кейсы для цифровизации, которые дадут ожидаемый результат и повысят эффективность производства?». В этой статье я поделюсь своим опытом и расскажу, о проблемах, с которыми сталкиваюсь при поиске кейсов, а также, как можно искать точки старта для начала работы с такими проектами.

Читать далее
Рейтинг0
Комментарии0

Улучшаем лендинг на основе метрик, а не мнений: гайд

Время на прочтение12 мин
Количество просмотров4.4K

Привет, Хабр! Меня зовут Андрей Устьянцев, и я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Занимаясь digital-маркетингом с 2006 по 2019 год, в какой-то момент я осознал очевидную сейчас многим истину. Эффективность рекламной кампании в интернете зависит не только от качества настройки ее параметров, но и от продающего качества лендинга, на который ведется рекламный трафик.

Но как измерить качество? Оперирование субъективными мнениями дизайнеров и результатами опросов в «экспертных сообществах» (в духе «подскажите, что не так»), как я могу судить по моему опыту, ни к чему в итоге не приводит.

Поэтому я разработал систему формирования метрик (сухих объективных цифр), на основе которых можно оцифровать качество лендинга.

Коротко — суть:

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров45K

В прошлой статье я говорил о том, что поиск себя и попытки найти дело своей жизни часто проваливаются. А сейчас поговорим о том, почему даже если вам очень нравится, то чем вы занимаетесь (да еще и получается к тому же), шансов на успех меньше, чем хотелось бы.

Читать далее
Всего голосов 81: ↑57 и ↓24+51
Комментарии111

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

Время на прочтение13 мин
Количество просмотров15K

Я материалист, и поэтому мне радостно видеть впечатляющие успехи больших языковых моделей как то GPT или PaLM. Тут и осмысленный диалог, и программирование, и сочинение сказок, и написание дипломов, и постановка диагнозов, и попытка jailbreak-а. Bing так вообще угрожает и может демонстрировать влюбленность. Эта радость - она от подтверждения правоты, что мы являемся пусть сложными, но всё таким биологическими машинами, и следовательно мы полностью познаваемы, что трансцендентной души у нас нет, что после смерти ничего не будет, а самосознание является феноменом развитой нервной системы. 

Примечательно то, что публичный прорыв с большими языковыми моделями случился внезапно. Не было какой-то долгой разбежки на протяжении десятков лет (сама GPT модель разрабатывалась с середины 2018, что по меркам истории просто  мгновение). ChatGPT выпрыгнул как чёрт из табакерки в конце 2022 и явил собой качественно новое явление. Явление, которое подтверждает второй закон диалектики: количество переходит в качество. Просто возьми много-много текстов, заставь нейросеть на трансформер-архитектуре предсказывать очередное слово и вуа-ля - получи на выходе почти мыслящую сущность. Если угодно, то душа, сознание и характер распределятся у неё где-то на миллиардах весов, как и у каждого из нас в мозгу.

Интересный вопрос - а что такого выучила та же GPT, что позволяет ей вести разумный диалог? За счёт чего магия? При этом помним, что модель не является просто сборищем ответов на заранее известные вопросы. То есть она не похожа на Граммофон из “Сумма технологии” С. Лема, на который записано 100 триллионов ответов. Модель умеет генерировать новое, умеет понимать контекст. По мне, так модель выявила внутреннюю логику и закономерности повествования, следуя которым можно получить любой текст. Эта логика представлена в виде внутренней системы понятий и смыслов, которые активируются в зависимости от текущего диалога. И когда мы что-то спрашиваем у модели, то для неё это может выглядеть так: сюжетная линия №3429643, ситуация №93752, роли №122997 и №88223, действующее лицо №33554, стилистика №7622 и т.д. Соединив и перемножив всё это вместе, получаем небольшой репертуар слов, из которого можно выбрать очередное. Так как всевозможных комбинаций этих сущностей просто космическое, то модель в состоянии генерировать новое и постоянно удивлять нас. 

Читать далее
Всего голосов 32: ↑16 и ↓16+2
Комментарии126

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.6K

Майклу Нгуену за 40, однако он называет свой биологический возраст: от 27 до 29 лет. Нгуен начинает утро с «биозаряда» электромагнитными импульсами, ест один раз в день и принимает много добавок, включая рапамицин, который, по его словам, «обращает старение вспять». Он также пьёт средство от диабета, делает инъекции богатой тромбоцитами плазмы, чтобы остановить выпадение волос, и дремлет в гипербарической камере.

Осенью 2021 года Нгуен открыл «Дом долголетия» — частный клуб, в котором людям обещают, что их жизнь продлится до 120 лет. При этом у них не будет хронических и умственных заболеваний. 

Пожизненное членство стоит $100 тысяч.

Читать далее
Всего голосов 18: ↑6 и ↓12-5
Комментарии18

Поисковик Brave: окончательно рвём связи с Bing

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3K

Теперь абсолютно каждый результат Поиска Brave получен исключительно из нашего собственного индекса. Мы окончательно избавились от любых запросов по API к Bing (раньше они составляли примерно 7% от поисковой выдачи).

Читать далее
Всего голосов 8: ↑7 и ↓1+9
Комментарии13

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

Время на прочтение9 мин
Количество просмотров20K

Перед небольшим загородным домом на окраине Гамбурга в северной Германии на почтовом ящике карандашом нацарапано единственное слово — «ЛАЙОН». Это единственный признак того, что этот дом принадлежит человеку, стоящему за огромными усилиями по сбору данных, и без которого тот бум искусственного интеллекта, который во всю силу происходит сейчас, мог бы и не случиться.

Читать далее
Всего голосов 23: ↑20 и ↓3+25
Комментарии14

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Sales manager, Sales Analyst
Senior
От 300 000 ₽
Python