Если кверять не исходные базы, а семантический слой с нормальными метаданными, можно закрыть приличную часть потребностей бизнеса. А поскольку в стандартном варианте у многих для общения с бд и так используется llm, которая называется 'аналитик', выгоду довольно легко рассчитать.
Интересное, по моему опыту, начинается, когда сам запрос уже должен содержать какие-то данные, например, чтобы отфильтровать результаты. А в компании используют надцать псевдонимов для одной сущности. Например один магазин называют кодами разных подразделений, по адресу, по фамилии менеджера и хз как ещё.
Другой пример: когда реальные сущности не могут быть однозначно классифицированы используя существующую структуру бд: посчитай, сколько в магазине продаётся жидкостей. И в базе нет поля is_liquid. Это могут быть разные категории, а то и отдельные товары в рамках какой-то категории.
Во всех статьях и презентациях решений nl-->sql такого рода запросы обходятся стороной. Если кто-то сталкивался, было бы интересно узнать, как решали.
Разумеется, необязательно в буквальном смысле читать книгу, наверно, вполне эквивалентной заменой будет большое количество технических постов или курсов, но это всё равно будет какой-то приличный объём изученной информации.
Поэтому я оцениваю объём приватного полезного кода, к которому в течение нескольких лет будут иметь доступ вендоры llm (если ещё нет), сопоставимым с объёмом такового в открытом доступе.
Что там у вас по части аргументов? Или все мысленные усилия уходят на курсив?
Следующие поколения моделей будут обучаться не на коде из интернета. Какой-нибудь Copilot выданный команде разработчиков позволит Майкрософту через довольно короткое время воссоздать кодовую базу проекта, со всей структурой, данными об окружении, документацией, etc. Ну и это будет не пет-проект Васи с курса, а рабочий продакшн энтерпрайз код.
Там 4 блока, каждый со своими отдельными баллами. Если в каждом шанс совпасть 10%, то совпасть во всех - чутка меньше. И как я понял, речь о совпадении во всех.
Очень иронично, как автор пишет про GAN и ансамбль 2 нейросетей, но не может несколькими абзацами ниже это экстраполировать на LLM, к которым по факту уже вовсю прикручивают и формальную логику, и проверку фактов, и много что ещё.
Ну то есть по факту излагается компиляция ограниченных кругозором автора сведений и из этого делаются какие-то выводы, не соответствующие реальности. На что же это похоже?
А сейчас, конечно, кожаный водитель включает режим Рэмбо и отражает атаку, благодаря чему экономика сходится)
Пора уже тарить QQQ с плечами или ещё рано?
А можно мне агента, который будет деньги зарабатывать вместо меня?
Если кверять не исходные базы, а семантический слой с нормальными метаданными, можно закрыть приличную часть потребностей бизнеса. А поскольку в стандартном варианте у многих для общения с бд и так используется llm, которая называется 'аналитик', выгоду довольно легко рассчитать.
Интересное, по моему опыту, начинается, когда сам запрос уже должен содержать какие-то данные, например, чтобы отфильтровать результаты. А в компании используют надцать псевдонимов для одной сущности. Например один магазин называют кодами разных подразделений, по адресу, по фамилии менеджера и хз как ещё.
Другой пример: когда реальные сущности не могут быть однозначно классифицированы используя существующую структуру бд: посчитай, сколько в магазине продаётся жидкостей. И в базе нет поля is_liquid. Это могут быть разные категории, а то и отдельные товары в рамках какой-то категории.
Во всех статьях и презентациях решений nl-->sql такого рода запросы обходятся стороной. Если кто-то сталкивался, было бы интересно узнать, как решали.
Просто не уточняется с какой попытки.
Нет, про это есть ремарка в тексте:
Для правдоподобности симулятору нужны мутные требования, ежедневные созвоны и падение прода, которое срочно нужно пофиксить.
Обьем закрытого кода сильно больше открытого.
Большая часть открытого кода - мусор.
Поэтому я оцениваю объём приватного полезного кода, к которому в течение нескольких лет будут иметь доступ вендоры llm (если ещё нет), сопоставимым с объёмом такового в открытом доступе.
Что там у вас по части аргументов? Или все мысленные усилия уходят на курсив?
Ну вы хотя бы комментарий до конца осильте прочесть.
Следующие поколения моделей будут обучаться не на коде из интернета. Какой-нибудь Copilot выданный команде разработчиков позволит Майкрософту через довольно короткое время воссоздать кодовую базу проекта, со всей структурой, данными об окружении, документацией, etc. Ну и это будет не пет-проект Васи с курса, а рабочий продакшн энтерпрайз код.
Бедняги.
F
Там 4 блока, каждый со своими отдельными баллами. Если в каждом шанс совпасть 10%, то совпасть во всех - чутка меньше. И как я понял, речь о совпадении во всех.
Ещё руководителей устраивает, когда это они сами практикуют
А можете подробнее расписать, что за задачи удалось автоматизировать?
Так крипово, что даже прекрасно
Работал в ритейле, производстве, банках. И наблюдал это явление везде, с поправкой на количество денег у бизнеса.
Адище.
Желаю вам когда-нибудь испытать такое прекрасное явление как рынок соискателя.
Очень иронично, как автор пишет про GAN и ансамбль 2 нейросетей, но не может несколькими абзацами ниже это экстраполировать на LLM, к которым по факту уже вовсю прикручивают и формальную логику, и проверку фактов, и много что ещё.
Ну то есть по факту излагается компиляция ограниченных кругозором автора сведений и из этого делаются какие-то выводы, не соответствующие реальности. На что же это похоже?
Есть