Причем я сомневаюсь, что проблема решится просто увеличением размера датасета для тренировки (т.е. GPT5/6/7 и т.д.).
Пока что это правило работает, и нет никаких оснований полагать, что тренд не продолжится. Более того, тысячи исследователей по всему миру прямо сейчас пытаются обучать следующие версии моделей на синтетических данных, сгенерированных текущими сетями.
Специализированные модели могут иметь успех, но проблема в том, что они обучаются на коде, т.е. они обучаются как писать
Нет, все "специализированные" модели все равно начинают с пре-трейна на обширных пластах интернета. Иначе модель просто не научилась бы писать связный текст.
Экспансия никак не противоречит удержанию. Наоборот, чем меньше юзеров одновременно имеют ваше приложение на телефоне, тем сложнее ему будет расти. У вас нет (и не может быть) никаких хороших инструментов разделения оттока на тех, кто нашел пару, и тех, кому не понравилось ваше приложение - а значит вы не сможете измерять эффект новых фичей на шанс найти пару.
Вы идете на очень древний рынок, где уже давно есть устоявшаяся бизнес модель. Думаете, до вас никто не пытался такое сделать?
Потому что их заявленная цель - долгосрочные знакомства - напрямую противоречит их модели монетизации. И ваша модель точно такая же. Ваш бизнес не заинтересован в том, чтобы люди формировали длительные отношения, ведь тогда они перестанут использовать ваш сайт. Вы неизбежно начнёте манипулировать алгоритмом матча, чтобы пользователи задерживались на дольше.
Поэтому самые лучшие приложения - это те, где нет никаких сложных фильтров, анкет и алгоритмов. Типа боты в ТГ или группы в ВК. А ещё лучше - знакомства ИРЛ
Во всех рассуждениях о найме и том, как надо проводить собеседования, я вижу пугающее отсутствие каких-либо эмпирических данных об эффективности того или иного метода отбора.
Понятно, что полноценные исследования могут проводить либо очень большие компании, либо агенства. Но даже им очень тяжело оценить свой уровень ложно-отрицательных ошибок - разве что случайным образом брать тех, кого забраковал HR/нанимающий менеджер, и смотреть, как они будут работать.
С другой стороны, даже если такие исследования кто-то делает, то публиковать их результаты - не в интересах команий/агенств, т.к. кандидаты могут прочесть его и начать мимикрировать под хороших кандидатов.
К сожалению, провести честный А/Б тест на эффект курсов на трудоустройство - задача невыполнимая по многим причинам. Поэтому и прибегают к простой статистике "процент трудоустроившихся от числа выпускников".
Нет никаких оснований думать, что способность нейросетей "понимать" хуже по сравнению с человеческим мозгом. Просто даже самая большая нейросеть гораздо меньше мозга и методы обучения скорее всего менее эффективны.
Так одногруппник-то ваш, наверное, не был как минимум мидлом к выпуску! А вот Вася с задней парты, он 4 года работал! И в 22 года стал тим-лидом в ООО "Паршивая галера".
А если серьезно:
95%-ам программистов достаточно образования уровня профильного ПТУ. Там и докер использовать научат, и ЖС, и питону не хуже чем на курсах гик-практикумов. Все остальное, что отличает джуна от сеньора, это по большей части софт скиллы и опыт, которым ну никак не обучишь.
Для оставшихся 5% вакансий, есть элитные вузы типа МФТИ, куда идут сразу очень умные ребята, которых за первые 2 года обучат всему, чему только можно.
Из предыдущих пунктов следует, что никакое массовое высшее ИТ образование попросту не нужно. Оно лишь обесценивает дипломы тех немногих, кто реально учился, а не работал, и кто сможет написать свой докер.
Как хорошо, что в рыночной экономике не бывает игр с нулевой суммой. И у продавца, и у покупателя всегда есть опция не заключать сделку (вариант с нулевой полезностью для обоих). А значит, любая совершенная сделка была как минимум в благо одному из них, т.е. сумма полезностей выше нуля.
Менеджер, принимающий решение о найме, никакими средствами не обладает. Он точно такой же наемный работник.
Капиталисты нынче вообще не любят вмешиваться в управление компанией: покупают себе пакет акций, нанимают CEO и прочий высший менеджмент, а дальше он уже сам разбирается, кого и где нанимать.
> В пределе экономический интерес работодателя состоит в том, чтобы работник работал по 18 часов в сутки, да ещё и деньги за это ему свои отдавал. Работодатель владеет некоторыми активами, но чтобы те приносили прибыль, ему нужны сотрудники.
Это какая-то марксистская чушь, полностью игнорирующая 1) структуру владения и управления в компаниях; 2) теорию (повторяющихся) игр. По факту в 99% случаев тебя нанимает не капиталист, а менеджер, который является точно таким же наемным работником. И нанимает он тебя для того, чтобы ты помог выполнить его задачи в рамках выделенного бюджета. В первую очередь он заинтересован в том, чтобы ты продуктивно работал каждый рабочий день на протяжении нескольких лет. И он отлично понимает, что 18 часов в сутки бесплатно никто работать не сможет.
Глаза немного вытекают от велосипедных решений того, что уже давно есть в Langchain: промптинг, многопоточный вызов, валидация ответа с помощью pydantic, ретрай в случае провала проверки и т.д.
Плохо - не разбираться в ошибках до конца. Надо копать глубже. Да, это утомительно. Но только часы, проведенные в попытках докопаться до причин поломок, дадут тебе прогресс в понимании слоев современного ИТ стека.
Ну да, в нем нет ни одного абстрактного метода, т.к. в вашем примере кошки и собаки ходят и говорят совершенно одинаково.
> В классе ТypeAnymal у вас name_type и класс аттрибут, и инстанс атрибут.
Согласен, надо было убрать инит и создавать экземпляры как TypeAnimal(type_animal="mammalian").
Это я к чему такой зануда? Это я к тому, что раз уж вы приводите примеры абстракций, то пусть эти примеры будут настоящими. Игрушечными, но настоящими. А иначе совсем непонятно, зачем эти абстракции нужны.
Пока что это правило работает, и нет никаких оснований полагать, что тренд не продолжится. Более того, тысячи исследователей по всему миру прямо сейчас пытаются обучать следующие версии моделей на синтетических данных, сгенерированных текущими сетями.
Нет, все "специализированные" модели все равно начинают с пре-трейна на обширных пластах интернета. Иначе модель просто не научилась бы писать связный текст.
Эти другие пойдут в тиндер и будут сидеть там годами, ни разу даже не узнав про приложение автора
Экспансия никак не противоречит удержанию. Наоборот, чем меньше юзеров одновременно имеют ваше приложение на телефоне, тем сложнее ему будет расти. У вас нет (и не может быть) никаких хороших инструментов разделения оттока на тех, кто нашел пару, и тех, кому не понравилось ваше приложение - а значит вы не сможете измерять эффект новых фичей на шанс найти пару.
Вы идете на очень древний рынок, где уже давно есть устоявшаяся бизнес модель. Думаете, до вас никто не пытался такое сделать?
>Почему сервисы знакомств так неэффективны
Потому что их заявленная цель - долгосрочные знакомства - напрямую противоречит их модели монетизации. И ваша модель точно такая же. Ваш бизнес не заинтересован в том, чтобы люди формировали длительные отношения, ведь тогда они перестанут использовать ваш сайт. Вы неизбежно начнёте манипулировать алгоритмом матча, чтобы пользователи задерживались на дольше.
Поэтому самые лучшие приложения - это те, где нет никаких сложных фильтров, анкет и алгоритмов. Типа боты в ТГ или группы в ВК. А ещё лучше - знакомства ИРЛ
Во всех рассуждениях о найме и том, как надо проводить собеседования, я вижу пугающее отсутствие каких-либо эмпирических данных об эффективности того или иного метода отбора.
Понятно, что полноценные исследования могут проводить либо очень большие компании, либо агенства. Но даже им очень тяжело оценить свой уровень ложно-отрицательных ошибок - разве что случайным образом брать тех, кого забраковал HR/нанимающий менеджер, и смотреть, как они будут работать.
С другой стороны, даже если такие исследования кто-то делает, то публиковать их результаты - не в интересах команий/агенств, т.к. кандидаты могут прочесть его и начать мимикрировать под хороших кандидатов.
Эскалировать ситуацию к вышестоящему начальству - нее.
Попытаться связаться с этим же начальством после "увольнения" - нее.
Раскрывать клиентов компании - даа.
Раскрывать имя тимлида - нее.
Автор, ваше весьма странное поведение заставляет сомневаться в правдивости истории.
Но ведь в ТГ тоже есть "настоящее end2end шифрование"...
Мда, пока ИИ от Яндекса до ChatGPT-4 не дотягивает...
К сожалению, провести честный А/Б тест на эффект курсов на трудоустройство - задача невыполнимая по многим причинам. Поэтому и прибегают к простой статистике "процент трудоустроившихся от числа выпускников".
Нет никаких оснований думать, что способность нейросетей "понимать" хуже по сравнению с человеческим мозгом. Просто даже самая большая нейросеть гораздо меньше мозга и методы обучения скорее всего менее эффективны.
Так одногруппник-то ваш, наверное, не был как минимум мидлом к выпуску! А вот Вася с задней парты, он 4 года работал! И в 22 года стал тим-лидом в ООО "Паршивая галера".
А если серьезно:
95%-ам программистов достаточно образования уровня профильного ПТУ. Там и докер использовать научат, и ЖС, и питону не хуже чем на курсах гик-практикумов. Все остальное, что отличает джуна от сеньора, это по большей части софт скиллы и опыт, которым ну никак не обучишь.
Для оставшихся 5% вакансий, есть элитные вузы типа МФТИ, куда идут сразу очень умные ребята, которых за первые 2 года обучат всему, чему только можно.
Из предыдущих пунктов следует, что никакое массовое высшее ИТ образование попросту не нужно. Оно лишь обесценивает дипломы тех немногих, кто реально учился, а не работал, и кто сможет написать свой докер.
Как хорошо, что в рыночной экономике не бывает игр с нулевой суммой. И у продавца, и у покупателя всегда есть опция не заключать сделку (вариант с нулевой полезностью для обоих). А значит, любая совершенная сделка была как минимум в благо одному из них, т.е. сумма полезностей выше нуля.
Менеджер, принимающий решение о найме, никакими средствами не обладает. Он точно такой же наемный работник.
Капиталисты нынче вообще не любят вмешиваться в управление компанией: покупают себе пакет акций, нанимают CEO и прочий высший менеджмент, а дальше он уже сам разбирается, кого и где нанимать.
> В пределе экономический интерес работодателя состоит в том, чтобы работник работал по 18 часов в сутки, да ещё и деньги за это ему свои отдавал. Работодатель владеет некоторыми активами, но чтобы те приносили прибыль, ему нужны сотрудники.
Это какая-то марксистская чушь, полностью игнорирующая 1) структуру владения и управления в компаниях; 2) теорию (повторяющихся) игр. По факту в 99% случаев тебя нанимает не капиталист, а менеджер, который является точно таким же наемным работником. И нанимает он тебя для того, чтобы ты помог выполнить его задачи в рамках выделенного бюджета. В первую очередь он заинтересован в том, чтобы ты продуктивно работал каждый рабочий день на протяжении нескольких лет. И он отлично понимает, что 18 часов в сутки бесплатно никто работать не сможет.
Глаза немного вытекают от велосипедных решений того, что уже давно есть в Langchain: промптинг, многопоточный вызов, валидация ответа с помощью pydantic, ретрай в случае провала проверки и т.д.
О, на тему того, как люди с разными родными языками и из разных культур произносят одинаковые названия и термины из мира ИТ, можно книгу писать.
SQL: эс-ку-эль или сиквел?
Python: пай(тх)он или питон?
API: апи или эй-пи-ай?
git: гит, джит или гет (да, такой вариант тоже есть в США)?
Прыгнуть в Линукс - хорошо, одобряем.
Прыгнуть в Докер - тоже хорошо.
Плохо - не разбираться в ошибках до конца. Надо копать глубже. Да, это утомительно. Но только часы, проведенные в попытках докопаться до причин поломок, дадут тебе прогресс в понимании слоев современного ИТ стека.
Виноват, ошибся. Подсветка подвела.
> Класс Anymal - не абстрактный
Ну да, в нем нет ни одного абстрактного метода, т.к. в вашем примере кошки и собаки ходят и говорят совершенно одинаково.
> В классе ТypeAnymal у вас name_type и класс аттрибут, и инстанс атрибут.
Согласен, надо было убрать инит и создавать экземпляры как
TypeAnimal(type_animal="mammalian")
.Это я к чему такой зануда? Это я к тому, что раз уж вы приводите примеры абстракций, то пусть эти примеры будут настоящими. Игрушечными, но настоящими. А иначе совсем непонятно, зачем эти абстракции нужны.
Немного переписал ваш код, чтобы было в полтора раза короче и понятнее:
Спойлер
Теперь неизменяемые свойства кошек и собак содержатся в определении класса, и их не надо:
1) Каждый раз прописывать руками при инициализации экземпляра
2) Бегать искать по определениям разных классов с непонятным функционалом.