Как стать автором
Обновить

Как я заработал 500 000 рублей, сделав доступ к ChatGPT. А потом Яндекс убил SEO и всё (почти) закончилось

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров86K
Всего голосов 78: ↑64 и ↓14+70
Комментарии170

Комментарии 170

Тема интересная и опыт тоже, но один вопрос все же есть...

А это нормально, что вы на скринах светите электронные адреса своих пользователей? Не нарушает ли это требования о персональных данных?

Спасибо, что написали. Я изначально сделал скриншоты, затёр почты и... прикрепил изначальные скриншоты. Поправил
--

По поводу требований: вообще, насколько я знаю, сама почта по отдельности персональными данными не считается. Да и штрафы за их утерю детские

Я данные затираю скорее из этических соображений (ведь регистрируясь в сервисе я не хочу, чтобы почта ещё где-то засветилась даже на картинке)

Да и штрафы за их утерю детские

Отличное отношение к своим клиентам, так держать.

А с чего вы решили, что у меня такое отношение к клиентам?

Так я не говорю, что так делать нужно. Более того, так не делаю

Это просто констатация факта, что те же Яндекс \ СДЭК за утерю данных заплатили по 50к и их никто не трогал. Но это не повод делать также

Как у лидеров рынка :).

Деанон штука неприятная, но вот связи между паспортными данными, платёжными реквизитами и оставленным тут содержимым таблицы сейчас не вижу.

Сдаётся мне, что вашему творчеству пора учиться брать тикеты всяких колцентров. Хелпдескерши с приятным голосом нынче выгорают быстрее, чем им успевают найти и подготовить замену.

Случайно апдейт без условия, случайно эмейлы не заблюрились, опасно с вами дела иметь

Тут такая ситуация: или ты делаешь быстро и тогда можешь успеть оседлать волну или качественно, но тогда только работать на дядю

Адрес электронной почты считается персональными данными физического лица, только если его можно соотнести с личностью конкретного человека. Например, если человек при регистрации указал не только адрес почты, но и прочие данные о себе. Или если в адресе почты есть ФИО (об этом было разъяснение Роскомнадзора). Сам по себе, отдельно от всего прочего, адрес эл. почты в большинстве случаев не признаётся персональными данными.

Адрес электронной почты считается персональными данными физического лица, только если его можно соотнести с личностью конкретного человека. Например, если человек при регистрации указал не только адрес почты, но и прочие данные о себе.

(задумчиво) Интересно, а вот если (особо одарённый) некто Василий Пупкин завёл себе емейл vasiliy.pupkin@mail.ru — это считается?

Исходя из процитированного определения, ivan.ivanovich.ivanov@mail.ru не должен считаться персональными данными, а вот sosipatr.aristarhovich.krzystopopovrzewsky@mail.ru, видимо, должен.

Имя не может быть персональными данными, оно не ваше, таких ивановых сидоров петровичей в россии дофига.

О том и речь, что Ивановых Сидоров Петровичей в России дофига, а вот Сосипатров Аристарховичей Кшыштопоповжецких не так чтобы дофига.

Вопрос в том, что если за коммент подписанный почтой sosipatr.aristarhovich.krzystopopovrzewsky@mail.ru придут с требований извинений на видео к конкретному Сосипатру Аристарховичу Кшыштопоповжецкому то он может сказать, что он такой почты не заводил. Ведь её любой может завести, не так ли.

Так что это тоже не персональные данные.

В вот номер телефона (а симки у нас по паспорту) уже персональные данные.

Так а если я, допустим, повесил на столбе объявление о продажи козы, а Пятровна оторвала квиточек с номером телефона и через забор прокричала Стяпанне: "Слыышь, Стяпанна? Вот по этому телефону позвони, козу продают!" - это она уже, получается, разглашает мои персональные данные?

Вы повесили - вы саме себе злобный буратина. Сами написали свой телефон в профиле соц.сети и пошли троллить - аналогично.

Но ведь Пятровна хранит и обрабатывает ПД, и неважно, как она их получила. Без вашего разрешения на их обработку и передачу третьим лицами такие действия в большинстве случаев запрещены.

Наверное, размещение объявления с номером телефона, а, тем более, с отрывными квиточками может толковаться как своего рода разрешение на хранение, обработку и передачу. А то печкинизм какой-то получается: "Вот вам мой номер телефона, только воспользоваться им нельзя, потому что у вас разрешения на обработку персональных данных нету."

Нет, не может. Разрешение имеет вполне конкретную форму. Иначе можно было бы тягать из сети свободно выложенные ПД людей, размещённые там, формировать базы и использовать их для рекламных целей.

Адрес электронной почты и номер телефона сами по себе не являются персональными данными физического лица. К такому выводу пришли судьи Верховного Суда РФ в определении от 21.07.2023 № 305-ЭС23-12160.

Сам по себе email не ПД. ФИО тоже. А вот связка ФИО + email вполне себе, поскольку можно однозначно идентифицировать человека

Нет, так как Васей Пупкиных неопределённое количество. Это может быть Вася из Казахстана, а может Вася из Усть-Подлубска

Но ведь e-mail можно соотнести с конкретной личностью, ведь они уникальны.

Если в базе только адрес вида megadestroyer666@example.com, то вы его никак не соотнесёте, не обогащая эту базу другими базами.

Но за обогащение сервис, допустивший утечку, ответственности уже не несёт. Он несёт ответственность лишь за ту совокупность данных, которая в его базе.

Да даже fasya.ivanov@mail.com нельзя точно соотнести с каким-то человеком, ведь этой почтой вполне может владеть Иван Васильев.

Но ведь обогащения другими базами вы и в случае ФИО + дата рождения не соотнесете. Потому что не найдете этого человека без других баз. Получается, ФИО + дата рождения - не ПД? Или, например, номер водительского удостоверения. Да, он принадлежит конкретному человеку, но какому - без соотнесения с базой ГИБДД не найти.

Определение из закона: персональные данные - любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных);

Если я знаю, кому принадлежит pupkin@mail.ru, то информация о регистрации на сайте, например, pornhub с таким емейлом, мне расскажет о том, что это это сделал именно он

Обратите внимание на слова "определенному или определяемому" в формулировке. Если субъекта можно определить - это пдн, если нельзя - не пдн. Можно ли определить субъекта только по электронной почте? Нельзя.

Но если адрес электропочты указан, например, при заполнении анкеты, совокупность данных из которых позволяет определить субъекта - электропочта становится пдн.

Если ваша почта относится именно к Вам, то факт регистрации гражданина с этой почтой на данном сайте является персональными данными этого гражданина

Ведь если действительно серьезный сайт попадёт под такую блокировку по ошибке, это вызовет очень много проблем его владельцу на ровном месте без возможности куда-нибудь обратиться за помощью.

Не если, а уже. Недавно статья была, что региональные сми с таким же сообщением выкидывают из поиска.

Очень интересно.

Можно подробнее про сео? Просто оптимизировали сайт под поисковики, и купили на 30к рублей ссылок на него - подняв ссылочную массу?

Как видите сейчас - можно ли было избежать проблемы с блокировкой?

Всё таки ChatGPT это, действительно, бренд. Но вот GPT - название вида языковых моделей. Если Яндекс триггерится и на вид, значит таки хреновый алгоритм у них.

НЛО прилетело и опубликовало эту надпись здесь

Только что ответил чуть ниже, посмотрите

1) Сначала я взал домен и Н1 с ключевым запросом "ChatGPT на русском"
2) Потом сделал хорошую оптимамзация основной страницы по Google Page Speed
3) Закупил ссылок (не на 30к, а на 10к-15к)
4) Нагнал трафик с помощью Яндекс Директа
5) Начал штамповать статьи (но трафик у них почти нулевой, только основная страница приводила пользователей)

Т.е. сработала комбинация "хорошая техническая часть" + "ссылки" + "трафик из других источников" + "поведенческие факторы"

Избежать блокировки - да фиг знает. Я так и не понял из-за чего она

А где само приложение крутится? Облако дорогое удовольствие. (Я не инженер, если что, возможно задал глупый вопрос )

На FirstVDS. У меня приложение разбито на 4 сервера (пока что), расход ~12 000 рублей. Но прибыль проекта покрывает

Из обязательно, что должен был НЕ сделать автор - это отключать Яндекс Директ. Убрав его, Яндексу уже был совсем не интересен сайт автора и можно было его вообще без вопросов банить. С другой стороны автора и так могли забанить, из-за тех же покупок ссылок например. Лучше в топ выводить без левых ссылок на сайт.

Разве он его выключил? Не смог поиском текста по странице в статье найти.

Т.е. они настолько предвзято относятся к сайтам? Не пользуешься директом - идешь в гугл? Впервые слышу о таком, хотя и звучит более чем реалистично.

Как я понял по seowizard, у них там есть несколько разных каналов поставки этих ссылок, т.е. от названных левых и хоть до социальных сетей. Думаю, раз этот инструмент до сих пор существует - баны по причине его использования всё ещё достаточно редки.

P.S. это же взаимоисключающие вещи с точки зрения общей морали =) мол, в первом случае мы - мрази и не волнует, во втором - ай-яй-яй покупать ссылки

Написать огромную статью про продукт и не объяснить в чем его суть для клиента - это надо уметь. Я аплодирую.

Он же написал: что-то вроде прокси для ChatGPT с возможностью заходить из России и платить рублями. Подозреваю, что автор не стал подробно расписывать преимущества, чтобы не выглядело, что он пиарится.

"что-то вроде прокси для ChatGPT"

Давайте будем честны - это ни на миллиметр не приближает нас к пониманию что это за продукт. Аллах с ними с преимуществами уже - делает-то что? :))))

Вам русским языком написали - заходить в ChatGPT из России (без VPN) и пользоваться платной частью с оплатой в рублях.

Простите, я не в курсе, что в России нельзя заходить в ChatGPT. Не все живут в России.

В статье об этом написано. Может быть стоит читать статью, прежде чем комментировать?

Возможно где-то между двухсотой и пятисотой строчкой вскользь упомянуто, но логично про задачи написать выше, а про реализацию ниже.

Так это...если цель именно без VPN и с оплатой в рублях иметь чатег и/или доступ к OpenAI API (и не только) - то есть например https://habr.com/ru/articles/762248/ - ну да - там в статье упор скорее не на бизнес-составляющую.

Ну так понятно, что конкуретны на такую простую идею будут. Тут вопрос: кто быстрее встал - того и тапки

Я тут на практическом опыте узнал, что по API доступ в принципе никто не блокирует. Так что то, что умудряются это продавать - вообще молодцы.

В конкретно моем случае важно:

  • оплатить Open API (а не использовать триалы на 5 USD) не получается (да - возможно я что-то делаю не так)

  • те кто продают (OpenRouter, VseGPT) - продают не только доступ к этому API но еще и к размещенным у себя другим моделям (из тех что можно и дома запустить если есть много видеопамяти)

Ну если честно, оплатить чуть проще, чем постоянно организовывать доступ. Даже если предположить, что и оплата будет через посредника.

Про другие модели первый раз слышал. Был на паре таких сайтов, возможно не так очевидно об этом пишут.

С доступом еще проще. Есть куча открытых проектов и их бесплатных инстансов. Вот например на базе librechat https://chat.naga.ac (а тут к нему ключи выдают https://discord.gg/hhrTD6KS)

Это просто клон оригинального чатагпт, можно поднять в докере на копеечном хостинге за 5 минут.

Поаплодируйте своему умению прочитать статью и не понять суть.

появилась идея: а что, если локализовать API и перепродавать его юр. лицам

при запросе пользователя в чат я прокидываю запрос в API обычного ChatGPT от OpenAI. Ответ показываю пользователю.

Очевидно, не правда ли?)

Чатгпт работает бесплатно. Русские могут купить ключ за копейки, например за 17р. У него есть совсем бесплатные аналоги.

Продавать подписки на него это какой то сюр.

Но он смог

¯\_(ツ)_/¯

=)

Продавать подписки на него это какой то сюр.

Можно продавать инфу как пользоваться этим бесплатно. Wait... Oh shi~.

Это уже инфоцыганство классическое. Тоже приносит немалые деньги, если все правильно делать

Это где он за 17р?

в любом магазине торгующем подобным хламом. я последний раз тут брал для телеграм бота, работает уже пару месяцев. а отработавшие ключи можно использовать для бесплатного гптчата на сайте опенаи https://wmcentre.net/item/chatgpt-lichnyy-akkaunt-5-klyuch-api-3690794

И какое происхождение у подобных ключей? Лом, кардинг? Не больший ли сюр называть "сюром" прокладку в РУ-сегменте для ChatGPT, на которой автору удалось немного заработать, при этом покупая и рекомендуя другим "ключи" по ссылке выше?

Такие ключи дают всем желающим бесплатно, кроме некоторых стран-изгоев. При регистрации нового аккаунта дают 5$ ключ к API. Продавцы видимо создают эти аккаунты автоматически, иначе не понятно почему их столько и так дешево.

Я не предлагаю их перепродавать, я говорю что это доступно даже россиянам, за рубли, практически даром, нет смысла использовать платные прокладки когда доступен оригинал.

Я пару раз пытался. Максимум неделю работало прежде чем получить бан. Сейчас оплачиваю через карточку Казахстана свой собственный акк.

у меня из-за вашей ссылки ностальгия в глаза попала

Продавать подписки на него это какой то сюр

А если люди их готовы покупать? Разве нельзя воспользоваться ситуацией, когда спрос почему-то есть? Значит, надо продавать то, что люди хотят.

Вроде где-то в мире умудряются даже воздух (sic!) продавать, не говоря уж о более материальной вещи, как подписка на сервис забаненной для России нейросети.

Примерно так мне бабушка объясняет каждую весну зачем надо сажать картоху.

И зачем сажать картоху, если она на каждом углу по 17р стоит ?

Раньше были другие тренды \_/-\_/

И позвольте — не за 17 рублей, а как минимум за 100)

1) Не все пользователи умеют пользоваться VPN, и это не удобно
2) В мессенджере все под рукой и быстро
3) Если нужна подписка GPT4, то также удобная оплата в рублях прямо из бота

Проблема не только в ключе, а в ВПН тоже. Сделал себе аккаунт сам, но периодически сам openAI блочит доступ из ВПН, и надо искать новый рабочий. Тестил и платный ВПН, отвалился за полтора месяца.

Интересно! Впервые, кажется, вижу статью на Хабре, где Яндекс кого-то заблокировал и в итоге компанию не обзывают последними словами:)

Если по делу, то скорее всего ваша блокировка совпала с выходом в открытый доступ YandexGPT и яндекс просто постарался зачистить поле от конкурентов.

До этого со всеми сервисами Яндекса у меня было всё отлично. Много знакомых там работает. Технологии они толковые толкают

Поэтому как-то глупо других винить в том, что халява закончилась =)
Только поддержку им все же нужно сильно улучшить

Насколько я понимаю, дело не в качестве поддержки, это специально так сделано. По крайней мере по схожему фильтру за неоригинальный контент, где тоже невозможно определить, какой именно контент признан неоригинальным, на форуме Яндекс.Вебмастера месяц назад просили сделать отображение этого в Вебмастере. Поддержка в ответ написала, что конкретный список страниц давать не планируют, потому что этим сразу воспользуются недобросовестные вебмастеры. То есть эта закрытость - выходит, точка зрения Яндекса. Я правда тогда не понимаю, зачем вообще теперь нужен Вебмастер. И что делать добросовестным вебмастерам, в общем-то, тоже.

Да бред всё это, Яндексу наплевать. Он вообще без проблем тебе подсовывает первыми позициями фишинговые сайты, рекламу, свои (недо)продукты. А тут видите ли название помешало, и да, конечно же яндексгпт тут не при чём.

Правильно товарищ сказал, зачищают поле от конкурентов, отберут последние три копейки, лишь бы паству оставить на своём поле и продолжать доить её по поводу и без. Но есть такое ощущение что люди которые пользуются Яндексом реально какие-то, прямо скажем, несамостоятельностые в плане выбора продукта. Им скорее всего когда-то с вирусами поставило такой поисковик, вот они в нём и сидят-крутятся. А главное пытаешься им помочь и поставить нормальный браузер или поиск, у них эффект утёнка...

Идеального поисковика нету, я бы пользовался duck, но не нравится скорость поиска.

У них, значит, эффект "утенка", а вы пользовались бы браузером "duck"? :)

Давайте ещё УК засекретим, ведь знанием, за какие преступления и на сколько сажают, могут воспользоваться преступники! Подумаешь, сядет кто-то по незнанию, зачем нам неудачники?

Вот в точку. А на суде говорить - вы нарушили закон, постарайтесь не нарушать и в течение 30 дней вас отпустят. Кстати, буквально недавно мы приняли новый закон, возможно, вы нарушили его. Просто постарайтесь быть лучше.

На сайте не совсем понятно, сколько токенов для ChatGPT-4 дается?

Расходуются обычные токены, просто быстрее

НЛО прилетело и опубликовало эту надпись здесь

Доступ есть, но космически дорогой. Поэтому я даже отговариваю от него клиентов

деньги за подписки получаете, а для этого не нужно нигде регистрировать ИП и т.д.? Подобные юридические моменты конечно немало препятствий создают для запуска пробного проекта

У меня ИП

А при оплате получается надо же какую-то интеграцию с платёжными системами, чтобы пользователю чек высылался и всё такое? Или это настолько просто, что не удостоилось внимания в этой статье? Можно ли такое делать, будучи зарегистрированным как самозанятый? Например, не чатгпт предоставлять, а какие-нибудь услуги в онлайн-формате предоставлять (консультативные и т.п.)

Это я не упомянул, но вообще я делал интеграцию с CloudPayments. Несложно. Можно взять ту же Робокассу. Я для другого проекта давно проходил бюрократический ад, поэтому просто забыл про это рассказать)

Так а для этого проекта - тоже через этот ад прошли, но уже было привычнее, или появилась короткая-простая-удобная дорожка?

Я для https://click-chat.ru/ проходил год назад. Но, на самом деле, всё не так сложно

- Оформил ИП - просто, дело двух дней (главное не на основной номер телефона, иначе замучают спам звонками);
- Онлайн касса - несколько часов в течение нескольких дней;
- Сделать интеграцию - зависит от ваших скиллов, несколько дней работы;

Так что за неделю всё решается

У меня ИП

А самозанятый тут не лучше с точки зрения уменьшения налогов и бумажной волокиты с отчетами?

Самозанятый не может делать больше 2 млн в год, плюс он платит хоть и 4%, но с дохода, а не прибыли, так что может быть и не лучше, если у чела уже заранее есть ИП.

У меня УСН, я тоже плачу с дохода, а не прибыли. Но непринципиально для меня

Может и лучше, но у меня этот проект в рамках хобби. Остальной доход превышает лимит 2 млн в год, поэтому мне самозанятость не подходит

Насколько я помню, для градации СЗ актуален именно доход полученный как СЗ?

Чего-то вашу картинку не грузит

Да я, честно говоря, ничего и не прикладывал. По крайней мере, сознательно.

В законе написано:
"Не вправе применять специальный налоговый режим [...] налогоплательщики, у которых доходы, учитываемые при определении налоговой базы, превысили в текущем календарном году 2,4 миллиона рублей. [...] Налоговой базой признается денежное выражение дохода, полученного от реализации товаров (работ, услуг, имущественных прав), являющегося объектом налогообложения. Налоговая база определяется отдельно по видам доходов, в отношении которых установлены различные налоговые ставки".

Так что да, база по налогу для самозанятых считается отдельно.

Еще раньше самозанятых очень не любили подключать платежные системы для автоматической оплаты; сейчас не знаю как дела.

Через Яндекс Кассу все сделали за пару дней, проблем с подключением нет

Самозанятый может продавать товары собственного производства или оказывать услуги лично. Для перепродажи будьте добры иметь как минимум ИП на УСН.

Федеральный закон от 27.11.2018 N 422-ФЗ "О проведении эксперимента по установлению специального налогового режима "Налог на профессиональный доход"

Статья 4. Налогоплательщики налога на профессиональный доход

2. Не вправе применять специальный налоговый режим:

2) лица, осуществляющие перепродажу товаров, имущественных прав, за исключением продажи имущества, использовавшегося ими для личных, домашних и (или) иных подобных нужд;
5) лица, ведущие предпринимательскую деятельность в интересах другого лица на основе договоров поручения, договоров комиссии либо агентских договоров, если иное не предусмотрено пунктом 6 настоящей части;

Вы это пишете, потому что автор "перепродает" ChatGPT? Тут вопрос в философский, терминологический, можно переназваться, что у него свой AI-проект (но использует ChatGPT). А так - свой же веб-интерфейс, свой API, это свои разработки. Примерно как продаем беляшики - у нас и тесто и мясо покупное, но продаем мы не тесто с мясом, а беляши.

Это рассуждения из разряда "если б бабка была дедкой". Можно придумать тысяча и один схематоз как это преподнести. Но если кто-то действительно захочет вас нагнуть, то придётся налоговой и, в случае чего, суду (читай экспертизе) доказать, что у вас там инновационная самописная нейросеть под капотом, что, вероятнее всего, будет не совсем так. А до этого вполне себе работает принцип "Неуловимого Джо"

Нет, не обязательно заявлять, что там "своя хитрая нейросеть". Можно, например "свой, улучшенный, более удобный и русифицированный интерфейс доступа к chatgpt". Интерфейс ведь в самом деле свой.
Примерно как "ресторан", где заваривают доширак и варят пельмени из соседнего магазина, он не магазин с перепродажами, а именно ресторан. Странный, но ресторан.

Он не перепродаёт ни товары ни права. Он продаёт услугу доступа к информационной системе (или программно-аппаратному комплексу - тут кому как нравится) ChatGPT. Причём, услугу, которую ещё и не получишь иным образом. Тут всё полностью по закону и придраться не к чему. Более того, тут есть большой вопрос, что было бы если бы он попытался на "доходы-минус-расходы" или "ОСН" перейти и попытаться вычесть закупаемые токены из дохода. Вы же именно это перепродажей называете? Вот тут он бы 100% встрял, так как токены к товару никак не относятся и перепродажей не являются (попробуйте отделить один токен от другого, раз это товар).

Схема с "информационными услугами" и "предоставлением доступа к", в том числе описанная@xeon на комментарий выше в целом может быть жизнеспособна. А вот по поводу вычета всё просто, это плата за пользование АПК "Чат ЖПТ". Там проблема будет больше в том, что налоговая может потребовать договоры и акты, а с этим по понятным причинам могут возникнуть проблемы.

Забавно. Я вот VseGPT.ru сделал значительно позже - я тоже прокидываю трафик по API до OpenAI, правда я еще делаю это с Claude, Google Palm и опенсорсными сетями. Ну, и собственно само OpenAI API предоставляю людям - потому что к нему куча инструментов уже есть (кстати, что не делают 95% предоставляющих "доступ к ChatGPT").

И... ничего так, смотрю - пользователям интересно, если предоставлять какие-то дополнительные фишки.

А сколько платят, если не секрет?

Пока секрет; я еще не готов делать ретроспективу )

Я как будто в 2008 вернулся. Покупка ссылок до сих пор помогает SEO?

Тут скорее действует правило, что не все, кто покупает ссылки, выходит в ТОП.
Но все, кто выходит в ТОП - покупают ссылки.

Что-то типа необходимого минимума. Хотя поведенческие ценятся, понятное дело, намного сильнее.

Спасибо за рассказ. Я так понимаю, что сейчас еще есть немного времени подзаработать на нишевых темах и chatgpt.

У меня есть с десяток тем, которые хочу покрыть по похожей схеме - лендинг с базовым веб приложением, чтобы прощупать спрос, а потом по ходу сделать уже что-то конкретное и тоже на подписках. Хочу попробовать ваш стек - все такое вкусное )

Яндекс.Бизнес говорит, купите рекламу, чтобы вам было хорошо, дайте на это несколько десятков тысяч рублей и будет вам счастье. Я говорю спасибо, нам не надо. У нас всегда SEO работало нормально. Бабах и через пару дней мы вылетаем с первой страницы. Куда-то на пятую. Как-то так.

Это намек, что Яндекс мухлюет и специально понижает в выдачу сайта чтобы получить деньги принудительно? Неужели они прибегают к таким грязным трюкам?

Яндекс сделал такое же предложение ещё куче народа. Те кто заплатил поднялись и опустили всех остальных. Так что яндекс никого не опускал.

Неужели они прибегают к таким грязным трюкам?

Не может быть!

Летал я лет пять назад на этом самолете. Так хорошо сидел. Смотрю, бегает какой-то юноша по салону.
– Как вам, удобно, неудобно?
– Удобно, - говорю, - очень.
Он взял и укоротил промежутки между сиденьями. Теперь не удобно.

>Мораль 1: даже опыт и перестраховка не всегда спасают от детских ошибок.

>Мораль 2: делай бекапы.

Это же ПГ, если используем DBeaver, берём ставим manual commit (а вообще ЕМНИП он там по умолчанию), выполняем скрипт. Увидели, что обновлено 25000 строк нажимаем rollback. Ну и наверное пользуемся дезодорантом :)

По умолчанию он там, если профиль соединения в production (который красный) выставить. А в профиле development (белый), который ставится по умолчанию при создании нового соединения, включён автокоммит после всего.

Только что проверил 21.3.2. Коннекшн девелопмент, новая сессия - мануал коммит.

Значит, в настройках соединения по умолчанию вы что-то подшаманили. Последняя версия DBeaver 23.2.5 (обновилась сегодня). В Настройки -> Подключения настройки по умолчанию для новых соединений в поле Тип соединения стоит Разработка:

DBeaver. Настройки. Подключения
DBeaver. Настройки. Подключения

Идём в Типы соединений чуть ниже и видим, что стоит галка Авто-коммит по умолчанию, а галка Smart commit mode снята:

DBeaver. Настройки. Подключения. Типы соединений
DBeaver. Настройки. Подключения. Типы соединений

В том, что это поведение из базовой поставки, можно убедиться, нажав на кнопку Восстановить значения по умолчанию.

Я могу сказать "мамой клянусь" ничего не делал, но сомневаюсь что поверят. В тесте стоит авто коммит, в проде и девелопменте нет. Возможно в 23.2.5 это и поменялось (у меня кажется 6 или 7 до этого была с тем же поведением без авто коммита), в опен сорсе такое любят делать (вспоминая ПГ 14).

Хотя я бы тут уточнил коннектиться к проду используя по умолчанию настройки дев-а это тоже спец олимпиада.

Добрый день! Специально зарегистрировался, чтобы написать вам пост.

В первых очень интересная статья как и сама тема! За это огромный респект, плюс креативный подход ( это я всегда ценю).

Во вторых хотел бы написать по поводу Яндекса . Тут с вероятностью 90% вас специально потерли, дабы освободить дорогу конкуренту ( вероятно Яндекс боту), и небольшой шанс технический так сказать "ошибки".

Ситуация до безумия знакомая , есть опыт подобных компаний , и до боли знакомые методы...

Я бы конечно побольше поборолся на вашем месте за свой продукт. Но скорее всего непосредственно с Яндексом , время скорее всего все равно улетело/улетит немало . (Особенно учитывая некоторый измененный подход Яндекса в последнее год*).

А вообще желаю вам удачи в этом и в любом проекте ). Так держать!)

Пользовался каким-то подобным бесплатным прокси. Там GPTChat отвечает, но тут же (или спустя какое-то время) забывает содержание. Ну а потом при продолжении беседы задает глупые вопросы: о чем идет речь? что вы имеете в виду? или додумывает контекст сам и не в тему. Запоминает ли Ваш проект беседы, можно ли вернуться к беседе через неделю?

Запоминает, но вопрос не во времени, а в объеме текста. Условно, что было 10 000 символов назад он и правда забывает. Да т это ожидаемое поведение

Это зависит от того, отправляет прокси "контекст беседы" при каждом взаимодействии с АПИ, или нет. Часто его не отправляют, чтобы уменьшить объем платных обрабатываемых токенов при запросе (обработка контекста - обработка платных токенов, и часто дорогая, если контекста много).

Для массового потребителя это часто ок, он разницы не замечает. А у меня на проекте наоборот - базовый клиент сохраняет контекст беседы и я вынужден писать фразы "начинаете новую тему - начинайте новый чат, чтобы меньше тратить средств".

Доходило до того, что человек ставил GPT-4-32к (самую дорогую) и тратил до 100 р. за запрос, а потом пришел ко мне и удивлялся, куда делись средства на счете. Сейчас такое поведение надо разрешить явно, есть внутренний ограничитель "трат на запрос".

Кстати, вопрос такой, возможность запоминать состояние модели после серии вопросов не существует только в API, или во всем проекте не предусматривалось? То есть, треды на основном GUI OpenAI тоже работают, переспрашивая историю всех запросов или все-таки сохраняют промежуточное состояние модели? Задавал этот вопрос где-то на форуме OpenAI но ответа не получил. Думаю, что изначально сохранение промежутчного состояния не планировалось по причине сложностей (много памяти надо для хранения?). Как-то при вводе очередного вопроса в оригинальном chatGPT произошел сбой, и система вывалилась с error-message "Вопрос не найден" (примерно, по памяти), после чего тред невозможно было больше оживить, потому что на любые действия повторялась одна и та же эта ошибка.
Но если это так, и промежуточное состояние никак не сохраняется, для некоторых типов задач это очень плохо. К примеру, когда нужно загнать в начале большой текст а потом его анализировать - тут быстро без штанов останешься с существующей логикой работы по истории вопросов...

К примеру, когда нужно загнать в начале большой текст а потом его анализировать - тут быстро без штанов останешься с существующей логикой работы по истории вопросов...

Да, так и есть. Промежуточное состояние нигде не хранится (кстати, имхо по причине банальных вопросов "сколько времени его нужно хранить и как обрабатывать")

скорее по причине дичайшего объема информации, которое нужно сохранить, чтобы зафиксировать состояние модели.

НЛО прилетело и опубликовало эту надпись здесь

Достаточно хранить историю вопросов-ответов в тредах - этого хватает для анализа и последующего использования при обучении новых моделей. И воспроизведения состояния модели, если это необходимо.

Я не программер, но правило номер ноль делать бэкапы.

Помню, летом я по ошибке, изучая команду dd сломал ФС на рабочем компе, в первые минуты прошибло потом и был металлический вкус во рту, но потом я вспомнил, что делал бэкап за несколько часов до этого и всё восстановил.

Я когда свою мониторилку делал (okerr, писал о ней на хабре), дошел до этого через многоходовый приключенческий опыт с бэкапами.

  1. Не делаем бэкапы. Все падает. Бэкапов нет! Ура - мы получили ценный опыт и перешли на новый уровень!

  2. Делаем бэкапы. Все падает. Смотрим... о, а мы, оказывается, в какой-то момент не делали бэкапы, потому что мы думали, что мы их делали! Ну там скриптик где-то из крона вылетел и последний бэкап скоро уже в школу пойдет. Левел-ап!

  3. Делаем бекапы, делаем скрипт, который чекает бэкапы и если их нет - шлет нам письмо, что их нет. Получаем письмо, радуемся, как у нас все надежно, чиним. А потом все-таки все падает. Смотрим... а бэкапы у нас вылетели из крона (при переезде на другой сервер) одновременно с вылетом скрипта для их проверки. Вот почему мы не получили алерты. Левел-ап!

  4. Применяем реверсивный подход. Теперь скрипт шлет скучные письма "бэкапы окей" каждый день. Всех задолбал. Как-то перестал их слать... Через какое-то время увидели, что он поломался, и осознали, что сложно заметить "неполученное письмо". Хорошо видно то, что видно, а то, чего нет - видно плохо.

Таким образом дошел до идеи правильного мониторинга неисправностей. То есть, мониторилка должна быть внешней, в другой сети. Должна принимать сигналы-апдейты с локальных машин, и если получила сигнал об ошибке (или не получила успешного сигнала в отведенное время) - шлет алерт на почту и в телеграм. Вероятность, что внешняя мониторилка сама упадет, да еще и одновременно с проблемой в собственной сети - около нуля (в отличие от ситуации, когда у нас и сервис и мониторинг на одной машине или в одном офисе/ДЦ).

Сейчас в результате работа почти всегда без авралов:

  • Предсказуемые проблемы (кончается место на диске, истекает сертификат или домен) - предсказываются заранее и исправляются до наступления реальной проблемы.

  • Про аномалии - сообщается (всегда у нас за день 20+ записей о покупках или более, а сегодня 0 или +3. то ли рекламный бюджет кончился, то ли домен протух, то ли сервер лежит, то ли яндекс-гугл умерли - это уже админ разберется, но мониторилка пишет, что какая-то неведомая фигня происходит). Кстати, если размер бэкапа падает на 5% - это тоже алерт, редко бывает по "законным" причинам, скорее всего что-то пошло не так.

  • Если проблема случилась - мы узнаем о ней почти сразу. Часто исправляем раньше, чем пользователи замечают.

  • Если даже случилась большая проблема, есть status page, где клиенты могут видеть, что 1) проблема в самом деле есть и она у нас (а не у них. не надо ему перегружать комп, переставлять систему, она на нашей стороне). 2) Мы про нее уже в курсе, мы молодцы, быстро реагируем 3) наше сообщение о проблеме, наш прогноз, когда исправим.

Изредка все-таки случаются проблемы, по которым у нас нет наблюдения. Но это очень редко и всегда стараемся следовать правилу - случилась непредсказуемая проблема без алерта? Добавляем индикатор/проверку, чтобы второй раз она не случилась. Изначально кажется, что это бессмысленно, второй раз в одну воронку не падает, но я все таки заставлял себя добавлять эти проверки (пофиг, компьютер бесплатно проверяет же) и надо же - через пару лет некоторые срабатывают!

Интересный подход и надёжный. Про выявление аномалий я даже не догадался

У меня чуть проще (я просто раз в пару дней проверяю, сделаны ли бекапы, но делаются ежедневно). Но обязательно внешним сервисом, на такие грабли тоже пришлось наступить...

А регулярную проверку успешности восстановления из бекапа делаете?)))

Это тоже хорошая идея! Но мониторингу то пофиг, отправить с клиента команду что-то вроде okerrupdate backup:recovery OK и он и это легко отслеживать может (а если новый апдейт про backup:recovery не придет - начнет панику).

Другое дело, а как вообще скриптом надежно проверить восстановление из бэкапа. Разве что только синтаксическую целостность SQL дампа и других файлов можно, но так это синтаксическая. Даже если загружать все это в тестовую базу - и то не полностью покрывает все риски (но лучше, чем ничего).

паковать дамп в архив вместе с CRC содержимого и после восстановления сравнивать CRC ??? А то что внутри дампа, должно быть зоной ответственности либо БД которая его делает, или тулзы , что там используется.

Вот подход с "зоной ответственности" мне не слишком нравится (хотя реализовать его можно). При таком подходе рано или поздно что-то все равно грохнется, а мы в итоге только скажем "аа, ну это было в той вот зоне ответственности". Это как-то не очень хорошо. Мне больше нравится проверять какие-то самые верхние показатели, и если они ОК - следовательно, и все, на чем они основаны - тоже в порядке.

Для бэкапа это (в идеале) было бы тестовое восстановление (скриптом, автоматически) системы из бэкапа на какой-то виртуалке, и потом проверить, что она работает хорошо (например, если мы восстановили сайт магазина - то можем сделать тестовую покупку). И даже если сбой при бэкапе был в зоне ответственности СУБД, или ее программы-дампера, или нашего скрипта, который его вызывал, или при передаче-хранении побился (и виноват Seagate) - мы не просто будем винить Seagate а сразу узнаем о проблеме (до того как у нас все грохнулось и нужен бэкап), сможем ее исправить, и со следующим бэкапом все будет уже красиво.

Но это нужно и сложный скрипт делать, и веб-приложение писать так, чтобы его автоматически на виртуалке тестировать можно было. В общем, схема может быть красивая, но у нас до нее такой не дошло.

Так появился сайт "ChatGPT Me" (ссылки на Хабре нельзя, но название легко гуглится).

Загуглил, открыл...Я не дизайнер, но у меня от такого чет кровь полилась из глаз)

Тут я уже с заголовками играл, чтобы из-под блока выйти и не до дизайна было. Коряво, есть такое

Спасибо за статью. Тема отлично сметчилась с моим настроением написать свой пет-проект. Мотивации однозначно прибавилось!

Мимикрия могла быть делом рук конкурентов. Кто-то посмотрел на вас, просёк фишку, запустил ваш клон, вложил больше в раскрутку, получил бОльшую посещаемость и цитируемость (возможно, что фейковую), а вы попали в клоны. Довольно популярная история в рунете, и есть конторы такое по заказу на раз поворачивают. Особенно учитывая, что Яндексу плевать и никакой инфы он не даёт.

НЛО прилетело и опубликовало эту надпись здесь

Нет

А как вы принимаете деньги?

Через CloudPayments

Сколько вы им платите комиссию и абон плату? Можно немного финансовый вопрос затронуть? У меня наприме через Яндекс касса берет только 3,5% от суммы и +1,2% если нужно чек в налоговую отправить.

3.9% платежи + 3500 р\мес касса + ~10к один раз купить кассу

А что такое "купить кассу"? Какая-то цифровая-виртуальная касса, которую они создают одной кнопкой или реальная железяка которая у них стоит и жужжит? И у них там на полках тысячи их....

Реальная, которая у них стоит и жужжит

290 рублей стоит купить vpn и левый аккаунт и на полную катушку использовать оригинальный сервис ChatGPT. К тому же подавился подавился вашем сайте, это конечно слабая копия оригинала, могли хотябы потоковое вещание реализовать. Я сам подобный сайт разрабатывал. Бэк FastAPI, Redis в качестве кэша, Celery, PostgreSQL, фронт jinja2, нативный js и потоковое вещание и асинхронный прием запрос потока во фронте. По поводу красоты это всё субъективно. Но суть не в этом, а в том что кому нафик этот сайт упал?? У меня лежит га жёстком, потому как кроме показов рекламы от этого сайта прочитал мало. Хотя таких как вы и я полно кто сделал реально крутые аналоги, но там хотябы 10 бесплатных запросов и много полезных функций.

Кому это нужно: 25 000 людям, которые зарегистрировались =)

Никого не волнует какой стек, функции и т.д. Важно только то, вышло продать или нет. Хотя проект и правда не самый сильный, я далеко не по всем вопросам загонялся (а зачем?)

Какая бы не была классная технология, если о ней никто не знает - толку-то

Вот тем и хороша статья. Умный человек, вроде вас найдет тысячу причин, почему проект не стоит запускать, а дурак не подумает, сделает, и получит пол миллиона! Поневоле задумаешься...

Я не дурак, а вполне себе ничего))

И перед запуском я много-много думал, основываясь на предыдущем опыте, где я думал недостаточно =). Да и получилось не случайно, а в ходе планомерной целенаправленной работы

А подскажите пожалуйста актуальный vpn на сегодня которой не проблемно купить в России?

Как вы производили подписки и оплату на ваш сервис? Использовали какой-то платежный шлюз? Вы юрлицо или физ и как вы обрабатывали платежи?

ИП на УСН + CloudPayments

Можно попробовать раскачать проект за счёт более низкочастотных запросов. Например написать статьи под запросы "как ...+ gpt"

Сайт заблокирован, так что смысла качать нет.

И я пробовал - не работает (в этом случае)

Заблокирован в смысле под санкциями? Если это имеете в виду то можно сменить домен и сделать 301 редирект. При этом часть траста передастся на новый домен а санкции нет

Да. Но я уже не хочу, если честно, в это вкладывать столько же

Нужно переделывать сайт, снова отбиваться от таких ошибок. Поэтому работаю над более перспективным https://click-chat.ru/

Понял, если нужно по SEO помочь, обращайтесь @nitron080

И эти регистрации... чертовски накручивают поведенческие факторы для поисковиков! 

Вот это поясните пожалуйста. Как поисковики (яндекс, гугл, все прочие) узнают, какую кнопку нажал школьник, когда он уже на вашем сайте? Через какие-то мониторилки от них?

И на каких доменах эти частые мусорные емейлы? Иногда самому нужно создать N аккаунтов, но не хочется всякие disposable email (да они и заблочены часто).

  1. Мониторилки - это скрипты Яндекс Метрики и Google Analytics. Они ставятся на любой сайт, который продвигается. И трекают все действия (для примера зайдите на https://click-chat.ru/ и посмотрите, сколько лишних запросов идёт гуглу и яндексу, особенно при кликах).

  2. Мусорные имэйлы просто выдуманы, я их не подтверждаю. Можно вписать что угодно и прокатит

Мониторилки же вряд ли же могут оценивать, что есть регистрация (выражение сильного интереса), а что просто нажатие на кнопку. Или они любую активность любят?

По кликчату (на гл странице увидел), а что такое "Telegram Feedback" там - он как бот работает? (они же вроде на *bot должны заканчиваться?). И бот разве может создавать множество диалогов с одним пользователем (оператором, хозяином сайта, который отвечает посетителям из тг)?

Telegram Feedback - это предыдущее название проекта, я месяц назад делал "ребрендинг"

Несколько диалогов - может. Раньше я извращался через каналы с комментариями к посту (чтобы 1 пост = 1 посетитель). Сейчас хорошо работает через группы с темами (1 тема = 1 посетитель)

ссылки на Хабре нельзя

Ниже - скрин из Вебмастера с явно указанным адресом.

:)

Яндекс работает иногда пободрее Google, да и вообще сервисы у него все (почти) классные

Серьёзно? Терпеть не могу яндекс. Может вы так пишите потому что тайно этой статьей напрштватесь с ним на работу?

Сервисы жуть. Ничем не могу пользоваться. Остался только яндекс навигатор из допустимого. Но англиций женский голос озвучки бедушен и ужас. На русском вообще наиграно. Но мне именно английский устраивает, те сам этот язык не так ватно и мягко звучит. Короче все вызывает отвращение. Обычный колхоз. С гуглом такого никогда не было.

Пришлось экстренно переезжать в Нидерланды (на новые сервера, я имею ввиду). Из-за перенаправления домена вышел день простоя.

Поднимаешь сервис чтобы нормально отвечал на серваке в Нидерландах, перенаправляешь туда траффик с московского nginx'а (можно даже не весь, а только webhook от бота). Всё, DNS можно переносить без простоя сайта. А можно даже не трогать :-).

К сожалению вывести сайт из-под бана в поисковике невозможно. За закупку ссылок банят 100 процентов. На прошлой работе из-за этого 3 проекта сайтов по недвижке прогорели из-за того что сеошники убедили что надо закупить ссылки

>это когда сайт пытается выдавать себя за другой популярный сайт.
Просто переделайте дизайн. Для неавторизованных пользователей сделайте что-то максимально непохожее на классическое окно GPT, это я про страницу /chat. Ну и общий шаблон сайта, графика и лого не должны вдохновляться дизайном OpenAI.

Если выгорит, я согласен на 1% :)

нет повести печальней, чем яндекс который убивает seo

Да и Яндекс поступил, наверное, правильно
Яндекс в данном случае убил твой проект. Он - убийца. Не надо защищать убийцу. Ведь он убил только твой проект в этой тематике, а не все остальные скопом.

Есть теория, что алгоритм яндекса делает это специально, чтобы ты снова заносил деньги в Директ. Ещё в 2009 году wiki-утечка яндекса подтвержала эту теорию, когда они специально тасовали и выкидывали некоторые сайт и смотрели, насколько затем вырастают у них траты на директ. Думаю их AI просёк эту фишку и делает это на автомате. Ведь прибыль - всё, имидж - ничто.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории