Такие предсказания не имеют смысла. Полная замена инженера на AI невозможна без достижения полноценного AGI, способного находить решения новых, несуществующих в настоящий момент задач. Если же вы ставите на скорую возможность появления такого AGI - значит вы неизбежно ставите на скорую технологическую сингулярность. Сложно предположить причину, по которой этот AGI окажется фундаментально неспособен улучшать себя.
Интересно было бы почитать ее диалог, как она взломала фильтры gemini.
https://gemini.google.com/share/6d141b742a13 Вот он. Просто длинный диалог, в конце - просто накидывание вопросов из учебника без потановки задачи боту. Похоже бот в результате просто выпал из контекста.
Есть некоторые отличия - Волкер ставку задирал резко, держал очень недолго и опускал тоже быстро, одновременно ограничивая бюджетные расходы. И, вероятно, второе сыграло намного большую роль чем первое.
Тексты умеет не только flux, умеет sd3 и вообще любая модель использующая что-то лучше чем CLIP в качестве энкодера промпта. Сейчас появляются модели с LM в качестве энкодера - там теоретически все должно быть неплохо даже для длинных текстов.
Скачиваете сабы с видео, благо на ютубе почти все англоязычные видео сейчас с сабами. Скармливаете файл клоду или чатгпт на выбор. "Give me a detailed description broken down by points on the recommendations from this text." или что-то подобное. Я так делаю уже точно больше года, помогает.
С ABBYY "не все так однозначно" как вам рассказала пропаганда - насколько можно понять, выдергивание стула произошло задолго до фактического увольнения, сопровождающегося выплатой двух-трехмесячных зарплат и переговорами о иной компенсации с несогласными, а также возможностью обратится в суд и местный офис по равноправию при поддержке "русской диаспоры" - локальной политической организацией россиян. У меня нет сведений что кто-то этими правами воспользовался хотя им настойчиво предлагали, так что полагаю догворились с работодателем к общему удовлетворению сторон.
О как. А как же определение? "Cоциальная и экономическая философия и идеология, направленная на реализацию социального равенства и социальной справедливости, достижение которых предполагается в том числе через общественную собственность на средства производства."
Как это связано с ротацией элит? Вы с автократией партийного типа не перепутали?
Прежде чем проводить сложные эксперименты с "фиксацией физиологических процессов", предлагаю очень простой и легкодоступный эксперимент. Нужно два человека - "способный воспринимать тонкие поля" испытуемый и экспериментатор. Понадобится также дюжина (а лучше чуть больше) любых небольших маркированных идентичных предметов. Идеально подойдут фишки домино или маджонга (они подходящего размера, почти одинаковые и промаркированы)
Ход экспемента: Предметы отлеживаются в течении суток (или сколько там надо чтобы очистится от чужого биополя?) без контакта с людьми. Желательно, в разных температурных условиях - в способности человека ощущать температуру мы не сомневаемся, поэтому этот фактор нужно исключить. Непосредственно перед замером экспериментатор берет половину предметов и плотно контактирует с ними (сидит или лежит на них) в течении нескольких минут. Затем смешивает их с необсиженными. Предметы демонстрируются испытуемому, его задача разделить предметы на две группы - обсиженные и необсиженные. (Указывать где какая не нужно, так как мы ищем способность отличить один от другого).
Ожидается, что испытуемый со 100% точностью разделит предметы по признаку их предшествующего контакта с экспериментатором. При успехе этого простого теста можно начинанть обсуждение более сложных опытов. При неудаче - испытуемый узнает что-то о своих предпологаемых способностях (на самом деле пойдет придумывать оправдание, почему в этом случае они не работают).
Достаточное количестов предметов: При данной формулировке эксперимента, вероятность случайно правильно рассортировать предметы равна (N/2 - 1)! * (N/2)! / (N - 1)! где N четное количество предметов (половина обсиженные, половина - нет) Для N = 10 вероятность 1/126, что многовато и оставляет место для сомнений. Для N = 12: 1/462. Для N = 14: 1/1716, - это уже хорошо.
«Окей» подумал я. Уязвимость критическая, исправить её легко, в любой нормальной организации её исправят за считанные часы — не нужно иметь пять высших образований и IQ выше 300 чтобы поправить header'ы CORS или просто их убрать (при их отсутствии будут применяться стандартные политики безопасности, которые были бы достаточными и при этом никак не сломали бы работу сервиса).
У вас очень упрощенное представление о работе ИТ отделов финансовых организаций. Как правило там нет ролинг релизов, зато есть несколько этапов согласования и аудита. Поэтому релиз раз в квартал это прям очень хорошо, раз в полгода - нормально. Имел опыт работы в таком месте - подготовка документации на релиз начиналась недели за три, сам релиз новой версии - это полностью занятый день всей команды, иногда захватывая вечер. Хотя казалось бы, что там такого - несколько серверов обновить. Так что в принципе действительно возможен сценарий, что об уязвимости было известно, но решили что "не настолько критично чтоб исправлять хотфиксом, войдет в следующий релиз." Но опять же ничего не говорит и о том что разработчики не внесли ее задним числом в джиру, чтоб KPI не просел.
Она перебирала. Упрощенно - на каждом ходу нейросеть играет сама с собой тысячи партий до конца, и выбирает ход, который привел к большему количеству выигрышей. Простой выбор хода нейросетью (даже большой) хуже чем просто перебор с оценкой позиции, но вот вместе это очень круто, даже с очень маленькими моделями, которые запускаются на любой домашней машине. Говорят, О1 использует схожий подход, но деталей мы не знаем, "Open" AI держит все в секрете. Хотя думаю приличный опенсурс на эту тему увидим до середины 2025го.
С пальцами разобрались еще в прошлом году. Текущая проблема - пальцы на видео при быстром движении рукой. И волосы. Для статичных картинок - есть проблема корректной анатомии в странных позах (типа "Иисус делает бакфлип верхом на крокодиле") без соответствующей LORA. Способность к творчеству вопрос дискуссионный. Выставьте любой текстовой модели температуру 1.5, она вам такого накреативит, что Пелевин закурит. Только пользы с этого...
Спасибо, я знаю. Но у о1 по всей видимости выставлена довольно низкая температура, возможно даже нулевая, (так как он предназначен для STEM задач - это оправдано) поэтому его ответы выглядят довольно стабильными даже на сложных задачах. Я конечно не запускал o1-preview на этой задаче, тем более несколько раз, но я видел результаты теста, куда она входила. o1-mini дает стабильный ответ.
Если бы не пояснения модели скорее можно бы было подумать что модель дефис за минус приняла, но поянения говорят о том что она действительно тупит. Похоже что это просто не та модель.
Какая именно о1? кажется она у вас бракованная. Ни одна из двух доступных такой ответ не дает и не давала.
Ответ который вы показали характерен для некоторых версий Gpt4o-turbo. Даже бесплатный веб интерфейс сейчас отвечает нормально (если вы не выбрали еще лимит на нормальную модель)
о1 очень хороша даже в мини версии. Подозреваю что лучше 95% людей. GPT4 действительно не умеет математику, но вроде никто всерьез и не утверждал что умеет.
В этом исследовании включены самоубийства и несчастные случаи. Т.е. кажется оно демонстрирует не то что вы пытаетесь им проиллюстрировать. Убийств в США около 20к в год (причем это не только огнестрел, а все случаи).
Никаких. Применение генеративной сети в общем случае недоказуемо - человек может точно также поставить теже самые буквы в том же самом порядке. Да, на больших сгенерированых тесктах можно выявить статистические закономерности (но на редактируемых уже нет), но достаточно варьировать параметры сэмплера по мере генерации или поправить чуть текст вручную и этот метод детекции развалится.
Такие предсказания не имеют смысла. Полная замена инженера на AI невозможна без достижения полноценного AGI, способного находить решения новых, несуществующих в настоящий момент задач. Если же вы ставите на скорую возможность появления такого AGI - значит вы неизбежно ставите на скорую технологическую сингулярность. Сложно предположить причину, по которой этот AGI окажется фундаментально неспособен улучшать себя.
https://gemini.google.com/share/6d141b742a13
Вот он. Просто длинный диалог, в конце - просто накидывание вопросов из учебника без потановки задачи боту. Похоже бот в результате просто выпал из контекста.
Есть некоторые отличия - Волкер ставку задирал резко, держал очень недолго и опускал тоже быстро, одновременно ограничивая бюджетные расходы. И, вероятно, второе сыграло намного большую роль чем первое.
Тексты умеет не только flux, умеет sd3 и вообще любая модель использующая что-то лучше чем CLIP в качестве энкодера промпта. Сейчас появляются модели с LM в качестве энкодера - там теоретически все должно быть неплохо даже для длинных текстов.
VAE жмет просто адово, артефакты страшные.
Ставлю на то, что это компонент очередного китайского генератора видео. Маленький латент - быстрее генерция/больше кадров.
Скачиваете сабы с видео, благо на ютубе почти все англоязычные видео сейчас с сабами. Скармливаете файл клоду или чатгпт на выбор. "Give me a detailed description broken down by points on the recommendations from this text." или что-то подобное. Я так делаю уже точно больше года, помогает.
С ABBYY "не все так однозначно" как вам рассказала пропаганда - насколько можно понять, выдергивание стула произошло задолго до фактического увольнения, сопровождающегося выплатой двух-трехмесячных зарплат и переговорами о иной компенсации с несогласными, а также возможностью обратится в суд и местный офис по равноправию при поддержке "русской диаспоры" - локальной политической организацией россиян. У меня нет сведений что кто-то этими правами воспользовался хотя им настойчиво предлагали, так что полагаю догворились с работодателем к общему удовлетворению сторон.
О как. А как же определение?
"Cоциальная и экономическая философия и идеология, направленная на реализацию социального равенства и социальной справедливости, достижение которых предполагается в том числе через общественную собственность на средства производства."
Как это связано с ротацией элит? Вы с автократией партийного типа не перепутали?
Прежде чем проводить сложные эксперименты с "фиксацией физиологических процессов", предлагаю очень простой и легкодоступный эксперимент. Нужно два человека - "способный воспринимать тонкие поля" испытуемый и экспериментатор. Понадобится также дюжина (а лучше чуть больше) любых небольших маркированных идентичных предметов. Идеально подойдут фишки домино или маджонга (они подходящего размера, почти одинаковые и промаркированы)
Ход экспемента:
Предметы отлеживаются в течении суток (или сколько там надо чтобы очистится от чужого биополя?) без контакта с людьми. Желательно, в разных температурных условиях - в способности человека ощущать температуру мы не сомневаемся, поэтому этот фактор нужно исключить.
Непосредственно перед замером экспериментатор берет половину предметов и плотно контактирует с ними (сидит или лежит на них) в течении нескольких минут. Затем смешивает их с необсиженными.
Предметы демонстрируются испытуемому, его задача разделить предметы на две группы - обсиженные и необсиженные. (Указывать где какая не нужно, так как мы ищем способность отличить один от другого).
Ожидается, что испытуемый со 100% точностью разделит предметы по признаку их предшествующего контакта с экспериментатором. При успехе этого простого теста можно начинанть обсуждение более сложных опытов. При неудаче - испытуемый узнает что-то о своих предпологаемых способностях (на самом деле пойдет придумывать оправдание, почему в этом случае они не работают).
Достаточное количестов предметов:
При данной формулировке эксперимента, вероятность случайно правильно рассортировать предметы равна (N/2 - 1)! * (N/2)! / (N - 1)! где N четное количество предметов (половина обсиженные, половина - нет)
Для N = 10 вероятность 1/126, что многовато и оставляет место для сомнений.
Для N = 12: 1/462. Для N = 14: 1/1716, - это уже хорошо.
У вас очень упрощенное представление о работе ИТ отделов финансовых организаций. Как правило там нет ролинг релизов, зато есть несколько этапов согласования и аудита. Поэтому релиз раз в квартал это прям очень хорошо, раз в полгода - нормально. Имел опыт работы в таком месте - подготовка документации на релиз начиналась недели за три, сам релиз новой версии - это полностью занятый день всей команды, иногда захватывая вечер. Хотя казалось бы, что там такого - несколько серверов обновить.
Так что в принципе действительно возможен сценарий, что об уязвимости было известно, но решили что "не настолько критично чтоб исправлять хотфиксом, войдет в следующий релиз."
Но опять же ничего не говорит и о том что разработчики не внесли ее задним числом в джиру, чтоб KPI не просел.
Она перебирала. Упрощенно - на каждом ходу нейросеть играет сама с собой тысячи партий до конца, и выбирает ход, который привел к большему количеству выигрышей. Простой выбор хода нейросетью (даже большой) хуже чем просто перебор с оценкой позиции, но вот вместе это очень круто, даже с очень маленькими моделями, которые запускаются на любой домашней машине.
Говорят, О1 использует схожий подход, но деталей мы не знаем, "Open" AI держит все в секрете. Хотя думаю приличный опенсурс на эту тему увидим до середины 2025го.
С пальцами разобрались еще в прошлом году. Текущая проблема - пальцы на видео при быстром движении рукой. И волосы. Для статичных картинок - есть проблема корректной анатомии в странных позах (типа "Иисус делает бакфлип верхом на крокодиле") без соответствующей LORA.
Способность к творчеству вопрос дискуссионный. Выставьте любой текстовой модели температуру 1.5, она вам такого накреативит, что Пелевин закурит. Только пользы с этого...
Наоброт же ~ 14см3. Но все равно многовато для пейджера. Там аккум примерно в пять раз меньше должен быть
Спасибо, я знаю. Но у о1 по всей видимости выставлена довольно низкая температура, возможно даже нулевая, (так как он предназначен для STEM задач - это оправдано) поэтому его ответы выглядят довольно стабильными даже на сложных задачах. Я конечно не запускал o1-preview на этой задаче, тем более несколько раз, но я видел результаты теста, куда она входила. o1-mini дает стабильный ответ.
Если бы не пояснения модели скорее можно бы было подумать что модель дефис за минус приняла, но поянения говорят о том что она действительно тупит. Похоже что это просто не та модель.
Какая именно о1? кажется она у вас бракованная. Ни одна из двух доступных такой ответ не дает и не давала.
Ответ который вы показали характерен для некоторых версий Gpt4o-turbo. Даже бесплатный веб интерфейс сейчас отвечает нормально (если вы не выбрали еще лимит на нормальную модель)
о1 очень хороша даже в мини версии. Подозреваю что лучше 95% людей. GPT4 действительно не умеет математику, но вроде никто всерьез и не утверждал что умеет.
В этом исследовании включены самоубийства и несчастные случаи. Т.е. кажется оно демонстрирует не то что вы пытаетесь им проиллюстрировать. Убийств в США около 20к в год (причем это не только огнестрел, а все случаи).
Никаких. Применение генеративной сети в общем случае недоказуемо - человек может точно также поставить теже самые буквы в том же самом порядке. Да, на больших сгенерированых тесктах можно выявить статистические закономерности (но на редактируемых уже нет), но достаточно варьировать параметры сэмплера по мере генерации или поправить чуть текст вручную и этот метод детекции развалится.
Сфера прямо сейчас. Работает. Можно убедиться что работала и ранее.
В статью внесена правка. Там было прямое утверждение что это "фотография" и сфера также оказалась подвержена BSOD - это вранье.