Pull to refresh
1
Дмитрий Горохов@TakeshiDev

Бизнес-аналитик

Send message

Решение заняло куда больше времени, чем я ожидал. У стажера без ИИ ушло в районе 2-3 часов на решение.

Собственно вот тут гораздо большая проблема чем кажется.

Даже вы, как постановщик задачи уже оцениваете скорость работы джуна с учётом нейросетей. Если даже сеньор потратил 30 минут, то для джуна 2-3 часа отличное время, особенно если он раньше с такой задачей не сталкивался, а хочется быстро, качество и хорошо бы, чтобы за копейки.

Или человечий язык by design разбитый на токены просто сухая статистика

Ну, в общем-то да. Есть тема, в виде направления вектора, в нем есть наиболее вероятные слова и сочетания которые идут друг за другом. По идее там идёт сложение векторов, т.е. после выбора первого слова идёт расчет вероятность появления следующего и т.д.

Человеческий мозг тоже на это способен на самом деле мы так часто слышим родную речь, что мы можем угадать что человек сказал, хотя мы слышали только два слова из предложения.

Низкая вероятность - маркер для останова.

помимо причины уже указанной в другом коменте.

Если мы будем стопорить модель когда вероятности низки, то она просто будет бустить рандомную вероятность, ведь мы ее наказываем и за отсутствие ответа, потому что иначе она просто на всё будет отвечать "не знаю", ведь это эффективнее.

То есть confidence — это не вероятность, а почти константа, которую модель приклеивает к ответу «на автомате». Она не несёт информации о том, права модель или нет: коррелирует не с правильностью, а в лучшем случае с тем, насколько уверенно модель звучит

Да, это в целом заложено в названии. Абсолютно бесполезный параметр на холодных ответах, которые больше всего подходят для задач с повторяемым результатом. Потому что сама нейронка бустит вероятности первых 3-4 вариантов, что приводит к тому что она практически всегда уверена в своих ответах. Он может быть полезен на теплых ответах, но стабильности там добиться гораздо сложнее и использование токенов будет больше в разы.

Чтобы пароль было сложнее подобрать, он должен содержать как минимум 16 знаков — и включать в себя случайные заглавные и строчные буквы, цифры и символы

Согласно последним рекомендациям NIST специальные символы не обязательны, потому что создают паттерны, известные хакерам. Такие как подмена букв идентичными символами (по типу Leet speak) или завершение пароля спецсимволом для удовлетворения требованиям такого пароля.

расходы на токены превращаются в сознательную альтернативу расширению штата, а не в финансовую проблему

А откуда этот вывод вообще взялся? Раньше расходы на токены были финансовой проблемой и не являлись альтернативой найму? А чем являлись?

Не знаю насчёт хостеров, но Гугл точно не все запросы и требования выполняет, и требует решения судов и корректные обоснования в этих решениях (я уж молчу, что количество запросов из России в десятки раз больше).

Пример:

Запрос

Мы получили распоряжение суда удалить десятки страниц, написанные блогером о скандале с политиками штата.

Результат

Мы не удовлетворили этот запрос

Это кстати может быть связано с ограничением на стороне России, многие государственные (и около государственные) сайты блокируют доступ из стран, которые считаются недружественными.

Сайт Госдумы например требует российский IP для доступа

Штрафы - плохое решение практически всегда. В данном случае сотрудник не будет пользоваться вашими нейронками, вот и всё.

А продолжение запроса того же запроса как распределяется?

Если был короткий запрос, потом длинный в одном контексте, он модель будет переключать? И если да - это точно эффективно менять источник ответа в рамках одного контекста?

Зачем им врать?

Так ведь

На этом строят enterprise-продажи.

Как раз чтобы продать!

В январе 2024го года в СМИ утекли переписки OpenAI. Там один из сотрудников представил подробные расчеты, согласно которым достигнуть AGI невозможно из-за фундаментальных физических ограничений. На что Альтман и топ менеджеры в переписке согласовали утаить эту инфу от инвесторов, потому что важна сиюминутная прибыль и вообще "через десять лет мы будем другой компанией"

Не, я тоже сначала так прочитал.

Он говорит, что "профессионал легко найдет работу", но не "профессионала на работу легко найти".

Просто пойму что количество специалистов гораздо меньше количества вакансий.

Правда с высокой долей вероятности этот специалист будет искать не через агрегатов вакансий типа ХХ, а через социальные связи...

Брать деньги с людей, у которых нет дохода - гениальная схема. Давайте ещё питьевую воду в Африке добывать.

Далеко зашёл. Я дропнул на моменте когда на нейронку переложили агрегацию данных. Она вам таких результатов и сводных нагалюцинирует - закачаешься. Да и ресеч тоже.

Выглядит так, будто в нейронку закинули запрос "расскажи про кейсы внедрения в компании"

На что только не пойдет айтишник, чтобы уложить пользователя в прокрустово ложе своей готовой модели

Может дело в том, что вы пытаетесь использовать модель таким образом, для которого она не предназначена? Канбан в разработке предназначается для отображения задач в разных статусах и отслеживания как нагрузки различных участников процесса, так и этапов прохождения задачи. Отслеживать статус когда что-то друг под другом, что-то рядом - сложно, поэтому это и не нужно и не делалось. Нет такой задачи в канбане, которая бы потребовала такое отображение.

Мне нужно располагать колонки канбана друг под другом.

Исходя из всех ваших комментариев, вам нужно группировать задачи в рамках одного экрана с минимизацией свободного пространства с возможностью перетаскивания этих задач между группами.

Кажется что-то такое можно сделать в Notion.

Когда до такой схемы камбана дойдут лет через пять, будут разводить руками, как не видели очевидное.

Не дойдут, потому что это не канбан.

Отдельно отмечу эту цитату:

Зачем - это мое дело.

С таким подходом вы инструмент не найдете и не создадите. Инструмент должен решать определенную задачу иначе вы получите бесполезное решение, которым будут пользоваться 1,5 землекопа и инструмент умрет. Он должен закрывать определенные боли, а что вы хотите видеть, как пользователь изменится десятки раз за время разработки. Поэтому все и спрашивают про решаемую задачу, а не как оно выглядеть должно. Вон в таблицах же получилось сделать, в чем проблема?

Вообще я тоже удивился, но тут не ясно что имеется ввиду: чипы не проверялись и итоговая продукция бракованной получилась или при корпусировании такой объем брака. Если первое, то это ок, потому что учитывается брак производства, там и до 90% брака доходит (последние данные по Интел).

Если только при корпусировании - то это очень много.

Большая просьба: прикрепляйте ссылки на исследования где их упоминаете. Мне вот стало интересно, что за исследование такое про западную и восточную Германию, а найти его не могу

Или классическое "заказать звонок" где кроме номера и нет ничего. Ну или есть выбор продукта. В обоих случаях это не ПД.

Также выше говорили, что данные с какой страницы был запрос не собрать - почему? Это как-то идентифицирует человека? Нет. У вас Метрика вообще может запись экрана делать и это тоже человека не раскрывает.

есть ли какие-то известные языки текстового описания процессов

Любой человеческий язык позволит тебе текстом описать процесс... Просто будет это на ещё большем количестве страниц, чем диаграмма.

Да и насчёт понятности текста - не согласен. Если мы говорим о больших процессах, в которых много ветвлений и возвратов к предыдущим шагам - текст не позволит быстро понять что как и куда работает.

Запусти программиста с минимальными вводными в код, который он не писал и он будет несколько часов разбираться что и как работает (если будут комменты к каждой вызываемой функции - будет быстрее, но мы все знаем, что это редкость).

1

Information

Rating
Does not participate
Location
Подгорица, Подгорица, Черногория
Registered
Activity

Specialization

Системный аналитик, Бизнес-аналитик
Средний