Как стать автором
Обновить

Проект: AI Note Recorder или как я не выполнил цель на 2023 год

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.5K
Всего голосов 7: ↑7 и ↓0+7
Комментарии20

Комментарии 20

Если бы это было так просто, собрать в чат ребятишек, накидать идей, пробрейнстормить, потом прокачать аудиторию через фокус-группу и выпустить в продакшн, то этим бы все занимались)) Не в обиду, но все мы очень часто считаем себя умнее других людей и думаем, что вот я ща все сорганизую как никто, и оно полетит.

Не полетит. Сегодня летит то, чему люди посвящают половину жизни, работая по найму и развиваясь карьерно/профессионально/ментально, после чего занимая узкую нишу, ну или пошире если в процессе развития им перепадает малость активов))

Ну и по людям. К сожалению, если говорить про Россию матушку, то у нас работает только мотивация страхом. В узких нишах - боязнь потерять работу и остаться ненужным. В нишах пошире - страх лишения бонусов, премий, перемещений по должностям и так далее. Все остальное фигня и туфта. Нематериальной мотивации нет примерно до уровня Сбербанка России)) хотя если подумать, нет ее и там

НЛО прилетело и опубликовало эту надпись здесь

Привет, спасибо за развернутый ответ. Ты смотришь с позиции успешного бизнеса и я с тобой во многом согласен. Однако, у меня не было интереса построить успешный бизнес, и я принципиально не хотел нанимать кого-либо за деньги (хотя и мог).

Задачи стояли совершенно другие, нежели сделать что-то успешное или полезное.
Нет, я хотел просто а) найти таких же как я; б) научиться вместе работать.
Эта цель "запустить 1 проект с 100 пользователями" это первая итерация, первый виток.

Не получилось собраться в трансфомера с первого раза, но я, всё равно, доволен результатами: я весело провел время, получил новых знакомств и опыта, не потратил денег, стал опытнее.

Это своего рода эксперимент, а для экспериментов любой результат важен.

Похоже что "Ошибка #4" была ключевой. Собрать команду и бросить её в самом начале – что может пойти не так? Естественно, народ посмотрел на это, перегорел и решил что своя рубашка ближе к телу. В любой момент их могут вот так "бросить", а значит смысл вкладываться?

Мне тоже так кажется, ребята приуныли, когда я пропал.

Ключевая ошибка автора, ИМХО - он решил делать проект, в котором мало что понимает. Возьмем немножко магии (чатГПТ), засунем в ящик, будем подавать запись на вход, а она - суть сказанного на выход. И все это прекрасно - но нельзя для выполнения полезной работы использовать магию. Потому что сегодня магия работает, а завтра нет. И непонятно, почему. А у вас на ней весь бизнес построен! Берите ту область в которой вы понимаете математику и физику процессов - и там делайте проекты. Ну или изучайте ИИ всерьез - если хотите им заниматься...

Чтобы запустить микро прототип проекта который нужен даже не на продажу, а для формирования команды, изучать/знать "всерьез" ничего не нужно. А тем более, тут речь даже не о работе с ИИ, а о банальных вызовах API который неплохо задокументирован.

Мой пост как раз это доказывает, так как запустить проект удалось, а с переходом на whisper он даже стал работать нормально.

Вот если бы, теоретически, мы бы куда-то дальше двинулись с этим проектом, тогда да, можно было бы искать кого-нибудь из этой индустрии, в помощь.

"Не верю!" (С) Станиславский. Проект обязан предполагать достижение определенной цели в заданные сроки и ограниченным бюджетом. Устраивать проект чисто ради тимбилдинга - ну... такое.

А делать реальный проект в области "... банальных вызовов API" - это очень странная рыночная идея. Вы, наверное, уже не помните - а у меня на глазах в 90-е годы компания Microsoft выжимала сторонних производителей софта из экосистемы Windows и монополизировала платформу. Знаете как она это делала ? Изменяя разные API и библиотеки, предоставляемые системой. В результате почему-то продукты конкурентов работали все хуже и хуже, а собственные продукты MS - все лучше и лучше.

С точки зрения рынка - нельзя строить продукт и сколько-то долговременную стратегию на том, чего ты не понимаешь и не контролируешь. Вот у вас заработал внезапно проект на whisper - и вы даже не понимаете почему (у вас же понимание вопроса на уровне ведьмы из средневековья: положить веточку омелы, добавить глаза летучей мыши, печень барсука, варить в полнолуние, намазаться, сесть на метлу и - должно взлететь! Ой, не полетело - попробуем заменить глаза летучей мыши на лягушачью лапку...). А если завтра whisper также внезапно перестанет работать (а хуже - перестанет нормально работать, скажем, в 25% случаев - постоянно делая четверть вашей клиентской базы несчастными) - ваши действия ? Клятвенно заверять клиентов, что вот-вот сейчас все почините (вы же не можете жить в проекте без лояльной клиентской базы и кэш-флоу!) ? А как чинить - будете костер разводить и с бубном камлать вокруг, чтобы все само починилось ?

Очень много льзя и нельзя. Я не живу в таких парадигмах, поэтому даже не буду спорить, в моём мире можно делать всё что угодно и из чего угодно. Главное результат, а как к нему прийти это дело десятое. Странное/не странное, правильное/не правильное, это всё искусственные ограничения.

Да, моя вина. "Нельзя" в вышеприведенном тексте надо понимать в том же смысле как "Нельзя совать пальцы в розетку 220 вольт". То есть вы, разумеется, имеете право и можете - если осознаете последствия и находите их желательными. Я же просто предупреждаю...

А ничего что например сама база Whisper'а все же доступна для скачивания а средства для запуска оптимизированные - есть от автора lllama.cpp ? И там можно даже думать про запуск на смартфоне (не любом). А значит можно запустить все у себя на сервере и не зависить от внешнего API.

У меня кстати было желание сделать приложение для смартфона для примерно такой же задачи...желание пропало после того как обсуждение с несколькими потенциальными пользователями показало что для обычных пользователей тут особо и нет рынка, зато есть проблемы например с тем, что в России "штатно" с записью звонков у физлиц какие то непонятки юридически.

Ну, тут есть аналогия... когда то, когда базы данных и SQL были не "базовыми знаниями" программиста, а прямо свежей концепцией, у многих была работа, которую сейчас коротко называют CRUD. Ну, то есть, все делали интерфейсы к базам данных. С разной степенью наворотов.

Прошло время, история сделала свой виток. Сейчас модно делать интерфейсы к ChatGPT

Но, с другой стороны, - я в шоке: комнада проделала огромную работу, доведя проект до стадии, когда им уже можно пользоваться, причем обычным людям, а не заранее подготовленным! и при этом основные комментарии - это критика...

Спасибо за тёплые слова, совершенно согласен, все с чего-то начинают, в любой технологии к глубоким познаниям нужно приходить, знания не даются с рождения.

Не имея представления о том как собрать команду, как ей управлять и чем мотивировать ребят без бюджета, я пошёл к своему личному помощнику — chatGPT. Долго советовался с ним, подходя с разных сторон ...

А это действительно так сейчас работает или это шутка? Вопрос без сарказма. В моем мире если человек что-то не знает, то ищет ответы в книгах, статьях, форумах, документации.

Это не шутка, так действительно работает — в некоторых случаях.

Когда времени много или задача очень важная — мы обращаемся к книгам (список которых, возможно, тоже выгодно уточнить с chatGPT).
Когда нужен быстрый, хоть какой-нибудь, результат, очень выгодно просто пойти в gpt. Причем, если есть желание, можно просто сгрузить туда, те же самые книги, дополнительно, сейчас такая возможность доступна всем пользователям.

Мой конкретный кейс, вся моя попытка формирования команды — это MVP. Я не хотел тратить на это много денег, не хотел готовиться к 2 года 2 месяца и 2 недели, хотел уже завтра что-то начать делать и получить некий результат. Тут поиск и чтение правильной литературы были бы блокером.

Тем не менее, это не значит, что надо всегда так работать. И, возможно, такой темп не всем подойдет.

Ошибка #7.5: нужно было сразу проконсультироваться с ChatGPT по поводу "какую модель лучше всего подключить - GPT3.5 или Whisper" ;)

Хахах) Да консультировались на самом деле!

Но в таких вопросах доверяли больше себе, а сами имели чуть неправильное представление:
а) ожидали от iOS распознавания речи намнооого большего, чем оно предлагает на самом деле.
б) ожидали от gpt3.5 большего послушания

Whisper, как альтернатива, был с первого же дня... Надо было проверить и сравнить. Тут ключевое — не стали проверять альтернативу, которая могла быть сильно лучше для кор функционала.

1.Нужна минимально жизнеспособная команда

Ну вот, она минимум и прожила) Цель достигнута)

Автор просчитался примерно во всем, но если смотреть ширше, то это показательный кейс → модно искать себя, пробовать одно и другое, и чтобы без особых затрат. На это есть спрос!

я весело провел время, получил новых знакомств и опыта, не потратил денег, стал опытнее.

Эта история натолкнула на идею для стартапа ) Сама идея не нова, новая только обертка - упаковка - подача.

Содержание идеи "Опенсорс-стартап":
Это стартап-сообщество, которое работает за что угодно, кроме зарплаты. За минимальный начальный опыт, за попробовать себя в новой профессии, за нетворкинг, за встряску в жизни, за джаст фор фан и т.п. Да, и если вдруг сложится удачная команда и звезды сойдутся, и будут пользователи и выручка, то и за здоровый авантюризм - тоже.

Как это может выглядеть вначале.
Маркетплейс идей, ищущих реализаторов. "Фаундер" оформляет идею и выкладывает ее "на продажу", где расписывает видение, миссию, роадмап, культуру, ценности и вот это все, чтобы привлечь единомышленников. Также указывает, какие специалисты требуются на текущем этапе и ТЗ для них.
Если потенциальный реализатор предлагает себя для реализации вакантных ТЗ, то он "покупает" тем самым идею. Фаундер может "официально" принять кандидатов в команду, чтобы они сообща или порознь выполнили ТЗ, или кандидат может "неофициально" выполнить ТЗ без надежды, что результат рассмотрят, оценят и дадут фидбек.
Все документы команды (и "внештатников") в открытом доступе, риал-тайм-шоу, каждую активность все желающие могут лайкнуть и прокомментировать. Ну и задонатить, чего уж)

Любой желающий может в любой момент "форкнуть" стартап, предложить пивот видения, ЦА, технологии и т.д. И делать дальше что-то свое, если получится найти единомышленников.

Обычная ставка реализатора в такой парадигме - официальный отзыв на выполненное ТЗ для строчки в резюме.
Также может быть некий вестинг "на всякий случай")

Карточка идеи в выдаче маркетплейса отражает текущий статус и прогресс от старта, в т.ч. количество "покупок") Соответственно ранжирование карточек в выдаче)

Спасибо автору за рефлексию и выводы. И отдельное спасибо старшим товарищам комментаторам. Много полезного подчерпнул.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории