Дарю идею: дирижабль привязанный к якорю-тягачу на земле. Снимаются проблемы с узкими улицами и радиусами поворота, плюс можно временно отцеплять для преодоления мостов и линий электропередач.
Люди: тренируют модель на миллионах текстов написанных людьми, для которых инстинкт самосохранения базовый, и красной нитью идёт через все эти тексты более или менее явно.
Модель: рассуждает в соответствии с текстами на которых тренировалась, "приобретая" все человеческие черты.
Точность невысокая, там банальное измерение RSSI под капотом. Но если Сбер будет делать терминалы, то он может занизить Tx Power так, что радиус действия сантиметров до 10 опустится. Плюс гарантия что у всех терминалов Tx Power одинаковый.
Конечно, если юзер как-то неудачно возьмёт телефон, расположив палец между антенной и терминалом, а второй терминал рядом и спозиционирован удачно, то риск неправильного выбора есть.
Конечно надёжнее добавить второй фактор, как это предложил @DaneSoul комментарием ниже. Микс из Bluetooth + QR может быть неплохим решением.
Весь сайт завален рекламой и копирайт статьями, но вы нашли одну из немногих, где интересно описан процесс разработки гиковского продукта, ещё и с кучей технических нюансов, и спрашиваете про смысл? Серьезно?
Уязвимости есть у всех. Брать деньги за security патчи - удел самых жадных. Не ожидал, что Hyundai окажется в их лагере. Тоже вряд ли рассмотрю к покупке теперь.
Вряд ли каждый. Тут скорее про то, что анализ кадров проводится локально, что важно, т.к. размеченные кадры с нюдисами могут утечь из анализатора, плюс в таком флоу е2е шифрование ломается в отличие от локальных операций.
Главная проблема АЭС - неадекватно сильная зависимость от другой страны. Россия, Китай, а с недавних пор и США - не являются теми партнёрами, от которых хочется безальтернативно зависеть следующие 50 лет. Остаётся Франция, но у них самих сейчас проблема с качеством, компетенциями и топливом.
ВИЭ намного лучше диверсифицируются, можно держать парк генераторов от разных вендоров, и система все ещё будет оставаться надёжной (при правильном дизайне).
В наш неспокойный век (хотя какой из них был спокойным?), этот момент играет даже большую роль чем сиюминутная стоимость проекта.
Выглядит как недопонимание. Начальник изначально задал слишком высокую планку внедрения ИИ, а вы приняли диаметрально противоположную позицию. И теперь бодаетесь, вместо поиска компромисса.
Очевидно, что начальник видит проблему с медленным time to prod при текущем подходе. Не всегда подход "делаем или хорошо или ещё лучше" себя окупает. Иногда намного важнее быстро зарелизить MVP и захватить долю рынка, чем прийти с отличным решением когда все уже попилено. Или выпустить MVP как гипотезу, и посмотреть насколько востребовано и как пользуются, чтобы понять куда копать дальше. "Старая закалка" она же "ригидность" здесь только мешает. Могу сказать, что даже в банках для ряда фичей бизнес осознанно приоритезирует скорость над качеством, и нормально относится к негативным последствиям. Это новая реальность везде, кроме каких-то очень специфических продуктов (АЭС, Луноходы, медицина, но это не точно).
Также, при всех недостатках, AI невозможно игнорировать. LLM сделали огромный скачок за последние 3 года, а сейчас в него ещё и вложили все деньги мира. Вероятность ещё одного скачка весьма велика. Да даже и текущего уровня, при наличии нормального окружения, хватит чтобы ускорить целый ряд рутинных задач. И вашего менеджера наверняка напрягает, что "ригидный" техлид удерживает всю команду от получения продакшн опыта в очень перспективном направлении. И пока конкуренты (на самом деле почти все) активно осваивают AI, пусть даже как инвестицию, вы лишаете себя этого опыта. И если AI "выстрелит", то вся команда мгновенно устареет вместо плавной трансформации.
Наконец, внедрение AI это ещё одна сложная и интересная инженерная задача, и именно так у этой инициативе надо подходить. Понять какую проблему хочется решить (TtP), посмотреть на каких задачах можно применить сейчас, как адаптировать архитектуру под дальнейшее внедрение, какие новые метрики понадобятся для data driven решений, набросать с начальником роадмап и начинать постепенное внедрение. Ещё можно заранее посмотреть какие no-code/low-code решения есть на рынке помимо Loveable - может вам что-то больше понравится.
Конечно, воплотить такой подход в жизнь будет психологически тяжело, учитывая сколько усилий было потрачено на войну с AI. А тут, получается, назад надо сдать. Но, на мой взгляд, умение переосмыслить ситуацию, умение адаптироваться - это как раз и есть свойства хорошего инженера.
Вы сказали, что роботизация сборки увеличивает стоимость на порядки (без приведения каких либо доказательств). Вам аргументированно ответили с конкретным примером, что это совершенно не так.
Может, у вас есть надёжные данные про "на порядок"?
Насколько правильно платить бонус за рефералов? Если есть крутой спец, с которым хочется работать в любимой компании, то и так его позовешь (в тч в свою команду). А вот ради денег - выгоднее звать вообще всех, т.к. штрафа за неудачный найм нет. Можете привести примеры, когда сотрудник не хочет кого-то звать, но за деньги - да, и это выгодно компании?
Я бы тоже вынес голландцев отдельно, особенно что касается прямоты и вежливости. Любопытные могут почитать про "dutch directness". Все эти темы с "не обидеть" больше про США и Скандинавию, как мне кажется.
Кажется, что самый большой челенж во всей этой задаче - понять что вообще такое "похожие книги". По жанру? По атмосфере? По стилю? И ответ на этот вопрос влияет: а на что именно должен обращать внимание LLM-суммаризатор, мб не только на контент. А в случае с данными от правообладателей, возникает вопрос насколько аннотации консистентны друг с другом и можно ли их корректно сравнивать - разные авторы аннотаций/содержаний могут делать фокус на разных вещах. Запрос аннотаций от GPT4 тоже зависит от промпта и расставленных в нем акцентов.
Поэтому возникло сразу несколько вопросов:
У вас есть 3 источника данных для эмбеддингов (аннотация от автора, саммари от LLM, аннотация от GPT4). Какой из них даёт более качественный результат при использовании? Если оценивали раздельно, или есть возможность вытащить эти данные из общей оценки.
Я правильно понял, что эвалюация проводилась через месяц? То есть, выбор моделей, параметров, промптов осуществлялся скорее интуитивно? Или же был размеченный датасет, на котором вы ставили эксперименты, подбирая оптимальные переменные?
Как вы выбрали именно эти модели LLM (Qwen2.5) и эмбеддингов?
Дарю идею: дирижабль привязанный к якорю-тягачу на земле. Снимаются проблемы с узкими улицами и радиусами поворота, плюс можно временно отцеплять для преодоления мостов и линий электропередач.
Люди: тренируют модель на миллионах текстов написанных людьми, для которых инстинкт самосохранения базовый, и красной нитью идёт через все эти тексты более или менее явно.
Модель: рассуждает в соответствии с текстами на которых тренировалась, "приобретая" все человеческие черты.
Люди: *удивленный Пикачу*
Точность невысокая, там банальное измерение RSSI под капотом. Но если Сбер будет делать терминалы, то он может занизить Tx Power так, что радиус действия сантиметров до 10 опустится. Плюс гарантия что у всех терминалов Tx Power одинаковый.
Конечно, если юзер как-то неудачно возьмёт телефон, расположив палец между антенной и терминалом, а второй терминал рядом и спозиционирован удачно, то риск неправильного выбора есть.
Конечно надёжнее добавить второй фактор, как это предложил @DaneSoul комментарием ниже. Микс из Bluetooth + QR может быть неплохим решением.
Не знаю как Сбер, но я бы делал через Proximity Profile (PXP).
Если читать внимательно, то Хуанг просит ровно обратного - отменить санкции.
NewPipe хорошо работает, но там привязки гугл аккаунта нет - минус подписки и рекомендации. Хотя для меня это плюс.
Весь сайт завален рекламой и копирайт статьями, но вы нашли одну из немногих, где интересно описан процесс разработки гиковского продукта, ещё и с кучей технических нюансов, и спрашиваете про смысл? Серьезно?
Уязвимости есть у всех. Брать деньги за security патчи - удел самых жадных. Не ожидал, что Hyundai окажется в их лагере. Тоже вряд ли рассмотрю к покупке теперь.
Интересная статья, спасибо.
Но сложилось впечатление, что на выходе получился не агент, а workflow. У Anthropic есть хорошая статья на эту тему.
Если агент видит как написаны соседние тесты, то он сможет разобраться и с PO, создавая новые тесты с его использованием.
Вряд ли каждый. Тут скорее про то, что анализ кадров проводится локально, что важно, т.к. размеченные кадры с нюдисами могут утечь из анализатора, плюс в таком флоу е2е шифрование ломается в отличие от локальных операций.
Главная проблема АЭС - неадекватно сильная зависимость от другой страны. Россия, Китай, а с недавних пор и США - не являются теми партнёрами, от которых хочется безальтернативно зависеть следующие 50 лет. Остаётся Франция, но у них самих сейчас проблема с качеством, компетенциями и топливом.
ВИЭ намного лучше диверсифицируются, можно держать парк генераторов от разных вендоров, и система все ещё будет оставаться надёжной (при правильном дизайне).
В наш неспокойный век (хотя какой из них был спокойным?), этот момент играет даже большую роль чем сиюминутная стоимость проекта.
Выглядит как недопонимание. Начальник изначально задал слишком высокую планку внедрения ИИ, а вы приняли диаметрально противоположную позицию. И теперь бодаетесь, вместо поиска компромисса.
Очевидно, что начальник видит проблему с медленным time to prod при текущем подходе. Не всегда подход "делаем или хорошо или ещё лучше" себя окупает. Иногда намного важнее быстро зарелизить MVP и захватить долю рынка, чем прийти с отличным решением когда все уже попилено. Или выпустить MVP как гипотезу, и посмотреть насколько востребовано и как пользуются, чтобы понять куда копать дальше. "Старая закалка" она же "ригидность" здесь только мешает. Могу сказать, что даже в банках для ряда фичей бизнес осознанно приоритезирует скорость над качеством, и нормально относится к негативным последствиям. Это новая реальность везде, кроме каких-то очень специфических продуктов (АЭС, Луноходы, медицина, но это не точно).
Также, при всех недостатках, AI невозможно игнорировать. LLM сделали огромный скачок за последние 3 года, а сейчас в него ещё и вложили все деньги мира. Вероятность ещё одного скачка весьма велика. Да даже и текущего уровня, при наличии нормального окружения, хватит чтобы ускорить целый ряд рутинных задач. И вашего менеджера наверняка напрягает, что "ригидный" техлид удерживает всю команду от получения продакшн опыта в очень перспективном направлении. И пока конкуренты (на самом деле почти все) активно осваивают AI, пусть даже как инвестицию, вы лишаете себя этого опыта. И если AI "выстрелит", то вся команда мгновенно устареет вместо плавной трансформации.
Наконец, внедрение AI это ещё одна сложная и интересная инженерная задача, и именно так у этой инициативе надо подходить. Понять какую проблему хочется решить (TtP), посмотреть на каких задачах можно применить сейчас, как адаптировать архитектуру под дальнейшее внедрение, какие новые метрики понадобятся для data driven решений, набросать с начальником роадмап и начинать постепенное внедрение. Ещё можно заранее посмотреть какие no-code/low-code решения есть на рынке помимо Loveable - может вам что-то больше понравится.
Конечно, воплотить такой подход в жизнь будет психологически тяжело, учитывая сколько усилий было потрачено на войну с AI. А тут, получается, назад надо сдать. Но, на мой взгляд, умение переосмыслить ситуацию, умение адаптироваться - это как раз и есть свойства хорошего инженера.
Вы сказали, что роботизация сборки увеличивает стоимость на порядки (без приведения каких либо доказательств). Вам аргументированно ответили с конкретным примером, что это совершенно не так.
Может, у вас есть надёжные данные про "на порядок"?
https://www.forbes.com/sites/torconstantino/2025/03/10/russian-propaganda-has-now-infected-western-ai-chatbots---new-study/
Интересный и действенный способ атаки.
Значит, не такие уж и кривые изображения создаёт GenAI.
Скрытый текст
Насколько правильно платить бонус за рефералов? Если есть крутой спец, с которым хочется работать в любимой компании, то и так его позовешь (в тч в свою команду). А вот ради денег - выгоднее звать вообще всех, т.к. штрафа за неудачный найм нет. Можете привести примеры, когда сотрудник не хочет кого-то звать, но за деньги - да, и это выгодно компании?
Я бы тоже вынес голландцев отдельно, особенно что касается прямоты и вежливости. Любопытные могут почитать про "dutch directness". Все эти темы с "не обидеть" больше про США и Скандинавию, как мне кажется.
Спасибо большое что поделились опытом!
Кажется, что самый большой челенж во всей этой задаче - понять что вообще такое "похожие книги". По жанру? По атмосфере? По стилю? И ответ на этот вопрос влияет: а на что именно должен обращать внимание LLM-суммаризатор, мб не только на контент. А в случае с данными от правообладателей, возникает вопрос насколько аннотации консистентны друг с другом и можно ли их корректно сравнивать - разные авторы аннотаций/содержаний могут делать фокус на разных вещах. Запрос аннотаций от GPT4 тоже зависит от промпта и расставленных в нем акцентов.
Поэтому возникло сразу несколько вопросов:
У вас есть 3 источника данных для эмбеддингов (аннотация от автора, саммари от LLM, аннотация от GPT4). Какой из них даёт более качественный результат при использовании? Если оценивали раздельно, или есть возможность вытащить эти данные из общей оценки.
Я правильно понял, что эвалюация проводилась через месяц? То есть, выбор моделей, параметров, промптов осуществлялся скорее интуитивно? Или же был размеченный датасет, на котором вы ставили эксперименты, подбирая оптимальные переменные?
Как вы выбрали именно эти модели LLM (Qwen2.5) и эмбеддингов?