Articles / Bookmarks / Profile of Glitrsartra / Habr

@Glitrsartra

User

Profile Publications Comments 3Bookmarks 19

ivankarmanow May 6 2023 at 12:54

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

Medium

12 min

93K

Instant Messaging*Python*Programming*API*Artificial Intelligence

Tutorial

Привет, Хабр! Продолжаю серию статей про разработку telegram-ботов на библиотеке aiogram и языке программирования Python. Хочется отметить, что статья не является документацией или учебником. Я просто рассказываю пошагово как разработать полнофункционального бота, стараясь затронуть как можно больше тем.

В предыдущей части мы настроили окружение и среду разработки и теперь готовы начать писать бота. В этой статье мы создадим меню и базовую логику взаимодействия с пользователем, а также подключим API OpenAI

einhorn May 14 2023 at 18:43

PromptGPT: оптимизируем промт для GPT-4

Medium

14 min

12K

Python*Data visualization*Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

ivankarmanow Apr 28 2023 at 01:02

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Easy

7 min

192K

Python*

Tutorial

From sandbox

Нетипичный туториал по разработке Telegram-бота на Python и Aiogram 3. В отличие от большинства гайдов и туториалов про разработку ботов «для новичков», здесь будут рассмотрены все аспекты создания бота, от установки редактора кода до подключения оплаты и развёртывания на сервере. В первой части мы рассмотрим подготовку окружения, файловую структуру бота и напишем первый рабочий код бота.

ziyodulla-baykhanov May 8 2023 at 11:32

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Medium

15 min

124K

Python*Julia*Machine learning*Artificial Intelligence

Opinion

From sandbox

Translation

Mojo — это новый язык программирования, основанный на Python, который устраняет имеющиеся у него проблемы производительности и развёртывания.

Об авторе: Джереми Говард (Jeremy Howard) — Data Scientist, исследователь, разработчик, преподаватель и предприниматель. Джереми является одним из основателей исследовательского института fast.ai, занимающегося тем, чтобы сделать глубокое обучение более доступным, а также он является почётным профессором Университета Квинсленда. Ранее Джереми был выдающимся научным сотрудником в Университете Сан‑Франциско, где он был основателем Инициативы Уиклоу «Искусственный интеллект в медицинских исследованиях».

Mojo – это Python++

+43

272

vikdovnar Apr 27 2023 at 10:46

Сколько нужно отзывов, чтобы у вас покупали?

2 min

2.2K

Internet marketing*E-commerce management*Sales management*

Есть определенная планка доверия, после которой у вас начинают покупать. Давайте разберемся, какая она по части отзывов. Сколько их нужно, чтобы прокачать ваш аккаунт на WB, Ozon и Авито?

Казалось бы, простая (но очень важная тема) - сколько же отзывов нам нужно для старта продаж. Чтобы люди начали доверять нашему аккаунту. Мы в агентстве Hooglink.Agency эмпирическим путем вывели эту цифру, что касается продаж на Авито и Юла.

Но наш пытливый ум начал искать какую-нибудь статистику, чтобы понять, а реально есть какая-то волшебная граница? И мы наткнулись на исследование СберМегаМаркета, который эту цифру выводит.

oldadmin May 9 2023 at 13:00

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Easy

5 min

18K

RUVDS.com corporate blogLegislation in ITHistory of ITSoftware

Часто можно услышать, что пиратское ПО является причиной сбоев в работе компьютера, утечек данных и т. п. В этой статье разберёмся, через какие этапы прошла борьба пиратов и разработчиков, к чему это привело, и опасно ли устанавливать нелицензионное ПО сейчас.

Читать дальше →

+18

UMNODigital Mar 30 2023 at 13:47

Ищем кейсы для внедрения проектов IIoT

Easy

9 min

1.4K

IT Infrastructure*Development for IOT*Project management*Monetization of IT systems*IOT

Меня зовут Дмитрий Серов, и я являюсь руководителем направления промышленного интернета вещей в компании UMNO.digital. В ИТ-индустрии я работаю около 20 лет, последние 5 из которых занимаюсь проектами IIoT в таких отраслях как телеком, сельское хозяйство, ЖКХ, сейчас развиваю это направление для ж/д и промышленных предприятий.

Я часто сталкиваюсь с ситуациями, когда при работе с проектами нет очевидных узких мест и болевых точек производственной системы, которые надо решить с помощью цифровизации. Чаще задача от бизнеса звучит как общее повышение эффективности активов. В этом случае встает вопрос: «Как найти кейсы для цифровизации, которые дадут ожидаемый результат и повысят эффективность производства?». В этой статье я поделюсь своим опытом и расскажу, о проблемах, с которыми сталкиваюсь при поиске кейсов, а также, как можно искать точки старта для начала работы с такими проектами.

Digital_League May 5 2023 at 10:56

Улучшаем лендинг на основе метрик, а не мнений: гайд

12 min

4.5K

Web analytics*Increasing Conversion Rate*Лига Цифровой Экономики corporate blog

Привет, Хабр! Меня зовут Андрей Устьянцев, и я ведущий аналитик направления Big Data в Лиге Цифровой Экономики. Занимаясь digital-маркетингом с 2006 по 2019 год, в какой-то момент я осознал очевидную сейчас многим истину. Эффективность рекламной кампании в интернете зависит не только от качества настройки ее параметров, но и от продающего качества лендинга, на который ведется рекламный трафик.

Но как измерить качество? Оперирование субъективными мнениями дизайнеров и результатами опросов в «экспертных сообществах» (в духе «подскажите, что не так»), как я могу судить по моему опыту, ни к чему в итоге не приводит.

Поэтому я разработал систему формирования метрик (сухих объективных цифр), на основе которых можно оцифровать качество лендинга.

Коротко — суть:

Ingirov May 7 2023 at 08:41

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Easy

5 min

45K

IT careerLifehacks for geeksBrainHealth

В прошлой статье я говорил о том, что поиск себя и попытки найти дело своей жизни часто проваливаются. А сейчас поговорим о том, почему даже если вам очень нравится, то чем вы занимаетесь (да еще и получается к тому же), шансов на успех меньше, чем хотелось бы.

+51

111

kms82 May 9 2023 at 08:42

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

13 min

15K

Artificial IntelligenceThe future is here

From sandbox

Я материалист, и поэтому мне радостно видеть впечатляющие успехи больших языковых моделей как то GPT или PaLM. Тут и осмысленный диалог, и программирование, и сочинение сказок, и написание дипломов, и постановка диагнозов, и попытка jailbreak-а. Bing так вообще угрожает и может демонстрировать влюбленность. Эта радость - она от подтверждения правоты, что мы являемся пусть сложными, но всё таким биологическими машинами, и следовательно мы полностью познаваемы, что трансцендентной души у нас нет, что после смерти ничего не будет, а самосознание является феноменом развитой нервной системы.

Примечательно то, что публичный прорыв с большими языковыми моделями случился внезапно. Не было какой-то долгой разбежки на протяжении десятков лет (сама GPT модель разрабатывалась с середины 2018, что по меркам истории просто мгновение). ChatGPT выпрыгнул как чёрт из табакерки в конце 2022 и явил собой качественно новое явление. Явление, которое подтверждает второй закон диалектики: количество переходит в качество. Просто возьми много-много текстов, заставь нейросеть на трансформер-архитектуре предсказывать очередное слово и вуа-ля - получи на выходе почти мыслящую сущность. Если угодно, то душа, сознание и характер распределятся у неё где-то на миллиардах весов, как и у каждого из нас в мозгу.

Интересный вопрос - а что такого выучила та же GPT, что позволяет ей вести разумный диалог? За счёт чего магия? При этом помним, что модель не является просто сборищем ответов на заранее известные вопросы. То есть она не похожа на Граммофон из “Сумма технологии” С. Лема, на который записано 100 триллионов ответов. Модель умеет генерировать новое, умеет понимать контекст. По мне, так модель выявила внутреннюю логику и закономерности повествования, следуя которым можно получить любой текст. Эта логика представлена в виде внутренней системы понятий и смыслов, которые активируются в зависимости от текущего диалога. И когда мы что-то спрашиваем у модели, то для неё это может выглядеть так: сюжетная линия №3429643, ситуация №93752, роли №122997 и №88223, действующее лицо №33554, стилистика №7622 и т.д. Соединив и перемножив всё это вместе, получаем небольшой репертуар слов, из которого можно выбрать очередное. Так как всевозможных комбинаций этих сущностей просто космическое, то модель в состоянии генерировать новое и постоянно удивлять нас.

126

vamedvedev Apr 28 2023 at 18:51

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Easy

6 min

5.6K

Review

Майклу Нгуену за 40, однако он называет свой биологический возраст: от 27 до 29 лет. Нгуен начинает утро с «биозаряда» электромагнитными импульсами, ест один раз в день и принимает много добавок, включая рапамицин, который, по его словам, «обращает старение вспять». Он также пьёт средство от диабета, делает инъекции богатой тромбоцитами плазмы, чтобы остановить выпадение волос, и дремлет в гипербарической камере.

Осенью 2021 года Нгуен открыл «Дом долголетия» — частный клуб, в котором людям обещают, что их жизнь продлится до 120 лет. При этом у них не будет хронических и умственных заболеваний.

Пожизненное членство стоит $100 тысяч.

-5

BraveSoftware May 4 2023 at 12:01

Поисковик Brave: окончательно рвём связи с Bing

Easy

3 min

Search engines*Brave corporate blog

Case

Translation

Теперь абсолютно каждый результат Поиска Brave получен исключительно из нашего собственного индекса. Мы окончательно избавились от любых запросов по API к Bing (раньше они составляли примерно 7% от поисковой выдачи).

virtual_explorer May 4 2023 at 15:04

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

9 min

20K

FirstVDS corporate blogData storage*Machine learning*Start-up developmentArtificial Intelligence

Translation

Перед небольшим загородным домом на окраине Гамбурга в северной Германии на почтовом ящике карандашом нацарапано единственное слово — «ЛАЙОН». Это единственный признак того, что этот дом принадлежит человеку, стоящему за огромными усилиями по сбору данных, и без которого тот бум искусственного интеллекта, который во всю силу происходит сейчас, мог бы и не случиться.

+25

За границей Hello World: полный гайд по разработке Telegram ботов на Python + Aiogram 3. Часть 2: Меню и OpenAI API

PromptGPT: оптимизируем промт для GPT-4

За границей Hello World: полный гайд по разработке Telegram ботов с помощью Python и Aiogram 3. Часть 1

Mojo может стать крупнейшим достижением в области разработки языков программирования за последние десятилетия

Сколько нужно отзывов, чтобы у вас покупали?

Как пираты боролись с разработчиками и что не так с пиратскими копиями ПО

Ищем кейсы для внедрения проектов IIoT

Улучшаем лендинг на основе метрик, а не мнений: гайд

Неочевидная причина, почему 90% ваших начинаний проваливаются, толком не начавшись

Что нас ждёт после появления сильного ИИ или неотвратимая логика социально-технологического развития

Внутри «Дома долголетия»: криотерапия, электромагнитные импульсы и пересадка фекалий за $100 тысяч

Поисковик Brave: окончательно рвём связи с Bing

Будущее индустрии ИИ стоит на бесплатной базе данных простого учителя школы

Information

Specialization