Pull to refresh
4
0
Илья @edge790

User

Send message

Скажу честно, я сомневаюсь, что продукты этой компании лучше чем gitlab, но умловиях "блокировки лицензий" переходить на откровенно русофобский gitlab - сомнительное решение.

"ИИ Общего назначения" и "программа которая хорошо справляется с некоторыми задачами" - это разные вещи.

Например: GIMP хорошо справляется с редактированием изображений, но это не значит что завтра я доверяю ему везти мою машину.

IQ не отражает уровень интеллекта.

Мне кажется удивительным насколько много людей верят в IQ, с учётом того что верить в него будут скорее те кто считают что он у них "выше среднего", но в то же время считают что по таким тестам с картинками можно исчерпывающе сказать что-то об интеллекте человека.

IQ тесты это один из самых больших скамов в мире, и то что OpenAI решили в нем посодействовать - ещё одно подтверждение того, что OpenAI любят "приукрасить" свои достижения

Удивительно, что ваш комментарий настолько же верен насколько и абсолютно ошибочен.

Вы правы что в консистентности шкала не линейная а логарифмическая - получить 90% верных ответов вместо 80%, гораздо сложнее чем 60% вместо 50%

Но проблема в том, что предположительно, LLM уже видела ответы для этих вопросов, а следовательно если она выдавала бы и 100% это было не так уж и удивительно.

Может ли она "понять" задачу которую она никогда не видела и дать на него правильный ответ - это другой вопрос.

Некоторые думали что может, т.к. она объясняет смысл анекдотов, а потом выяснилось, что она их может объяснить потому что она уже видела объяснения.

Мы не можем сказать когда она "понимает" а когда она "вспоминает", причем мы не можем даже сказать "понимает" ли она вовсе, но мы точно можем сказать что интеллекта как такового у нее нет, т.к. на выходе это сэмплер, который берёт вероятности слов выдаваемые сетью и выбирает случайное слово, по заданным правилам.

Т.е. в конце концов это "Цепь Маркова на стероидах" и это сильно ограничивает количество работ которые ей можно доверить.

gradle это билд система, у которой совершенно другие разработчики не связанные с android studio и intellij

То, что нужно скачать SDK, я думаю, и так понятно и долго вдаваться в подробности не буду, но , если кратко, то чтобы не требовалось скачать 50 версий по 20 гб SDK всех версий, чтобы разрабатывать под конкретную, а скачать только её.

Для оффлайн разработки вы качаете её отдельно и ставите на флешку, указывая до неё путь.

Мой предыдущий комментарий все так же верен: вы можете сделать себе носитель со все и инструментами необходимыми для оффлайн разработки, некоторые знакомые это делали (т.к. у них требования разрабатывать на устройстве без доступа к интернету)

Это не соответствует действительности.

Вы можете скачать идею и оффлайн ключ активации и активировать ее так. Вы можете скачать fallback версию идеи и ключ ее активации - она будет активна пожизненно.

Для самой идеи вы можете выставить настройки прокси сервера, который идея будет использовать, и соответственно ничего не мешает вам прописать там несуществующий прокси, чтобы она не могла выходить в интернет, и она успешно со всем этим будет работать.

В статье описана проблема с тем что не получаются новые апдейты для установленных плагинов / невозможность установить новые через встроенный менеджер, но плагины можно устанавливать оффлайн из локальных директорий, т.е. даже и это позволит их использовать без интернета.

Во-первых: не стресс тестирование а сразу посыл куда подальше, по причине "не хочу возиться с вашими технологиями" (на что он имеет полное право, но, я думаю, требует уточнения, чтобы было понятно за что выступал Филхо и почему его развернули)

Во-вторых: стресс-тестирование людей - это впринципе плохо, потому что задевает только тех кто действительно переживает за проект, не трогая людей которым наплевать и которые там чисто ради денег, а стресс-тестирование в опенсорес - это полнейшая ересь. С таким подходом в опенсорсе останутся только бюрократы.

В-третьих: не провалил, а сделал правильное решение. Если тебе не рады и твой труд не ценят - нечего надрываться, умные люди везде нужны, но видимо не в этой кодовой базе.

По поводу "я устал я мухожук": если твои патчи отклоняют просто потому что они на расте (что ты и пытаешься сделать), то я не вижу причины продолжать пытаться это делать.

Код отклоняли не потому что он плохой, не потому что были сомнения что он будет работать, а просто потому что ментейнер не хотел принимать его в кодовую базу, потому что "если я зарефакторю си, я не буду лезть править Раст - я же его не знаю".

Что, в целом, валидное замечание - в опенсорсе последнее слово всегда за мэнтейнером. Но это не делает работу "некто из Microsoft" хуже, и в таких обстоятельствах его "я устал я мухожук" - единственное верное решение, имхо.

никто не заставляет начать писать на расте.

Далее цитата из самой статьи:

если он рефакторит код и сломает программы на Rust, он не хочет идти и исправлять их, потому что он не знает языка,

Т.е. нет, буквально конфликт в том, что чтобы Раст работал в ядре, нужно чтобы и те кто разрабатывает на Си, умели исправлять код написанный на расте.

Потому что когда они рефакторят сишный код, ломается так же и код написанный на расте, который нужно исправлять.

Результат работы модели LLM - это вероятности следующего токена.

Дальше сэмплер выбирает один из предложенных вариантов, с учётом вероятностей.

Т.е. например:

Текст "были у бабуси два весёлых" и модель выдает:

  • 98% "Гуся"

  • 1.6% "Кота"

  • 0.2% "сына"

Но тут появляется проблема в том, что в большинстве случаев ответ всегда одинаковый.

И это плохо, когда например ты просишь рассказать LLM сказку, т.к. она в большинстве случаев будет одна и та же про одних и тех же персонажей. Или советы куда поехать отдыхать будут одни и те же с одними и теми же городами.

Поэтому придумали настройку для сэмплера: "температуру" - чтобы сделать менее вероятные варианты более вероятными.

Температура 0.0 - даёт наиболее вероятный вариант.

Температура 1.0 - даёт самые случайные ответы

Температура 0.7 - соответственно скорее случайный ответ чем точный.

Температура не универсальна и ее использование должно зависеть от контекста - например низкая температура для точных ответов и вычислений, но высокая для более "творческих" ответов, которые не требуют точности: такие как рассказать сказку, описать какое-то явление понятными словами и простым языком и т.д.

Так что да, тут температура скорее всего СЛИШКОМ высока. 0.2 и ниже, скорее всего, давали бы более точные ответы.

Upd: Вот YouTube Short от 3 Brown 1 Blue который отлично и кратко объясняет температуру, правда на английском языке и там значения температуры немного другие, т.к. они не в диапазоне [0, 1] https://youtube.com/shorts/XsLK3tPy9SI

Давайте все же определимся

благодаря поддержке в пресловутые 86%

Или

зафиксировать факт карусели

Разве это не противоречие? Зачем с поддержкой в 86% лояльных избирателей необходимы "карусели"?

Отмечу что иногда HRV позволяет узнать о том что заболел утром, когда симптомы полноценно проявятся вечером.

Ну и по комментарию очень много вопросов:

Сборная одной страны, это человек 30? Можно ли считать это достаточной контрольной группой? Дополнительно, а как они измеряли? Среднее за ночь, как обсуждается в соседней ветке, или перед и после занятий? Сколько лет проводилось исследование? Какой разброс без замеров HRV, какой разброс с замерами HRV? Как замерялись успехи? Что есть успех? Количество заболеваний, количество травм или успехи по каким-то конкретным метрикам (скорость бега, продолжительность бега на определенном темпе и т.д.)?

Интерпретировать можно по разному, но в целом: HRV в средних значениях - можно тренироваться, HRV слишком низкий / слишком высокий - лучше подождать денёк и посмотреть на самочувствие завтра.

Проблемок с интерпретируемостью по среднему HRV за ночь у меня за пол года не наблюдалось, обычно если он низкий то на следующий день/вечер заболеешь.

Спустился в комментарии чтобы сказать абсолютно тоже самое, но прочитал ваш комментарий восхитился и обзавидовался белой завистью.

Мне 29, начал бегать год назад, из чего удалось достичь: полумарафон за 02:02:22. С начала этого года приобрел Garmin Epix 2 Pro, до них были Huawei Watch GT 3

На хуавеях определял усталость по Resting Heart Rate(сердцебиение в состоянии покоя) для меня за первый месяц бега средние значения опустились где-то с 60 до 50 (ещё бросил курить, что скорее всего повлияло, до этого курил 10 лет). Соответственно если оно было 55+ то значит перетренировался либо на следующий день заболею.

С Garmin перешёл на overnight average HRV, периодически посматривая на оба показателя, но в конце концов сошёлся на том что HRV значительно (если по ощущениям то где-то в 1 из 3 случаев я скорее по самочувствию на момент и на следующий день согласен с тем что показывает HRV)

Из минусов: в случае проблем со сном метрика отваливается / показывает выбивающиеся результаты. Но в целом, рекомендую.

Статичные замеры HRV через Health Snapshot (часы просят сидеть прямо и ничего не делать 2 минуты, пока они замеряют показатели дыхания, сердцебиения и HRV) слишком разнятся для меня. Замеры через Polar HU10 через программу часов "HRV Stress" тоже доверия не вызвали, но и сказать что они точно не правы Я тоже не могу, хотя, по правде говоря, использовал всего несколько раз, и в разное время (перед выходом на уличный забег, чтобы пытаться понять какой маршрут выбрать).

Ну и прикреплю свой график HRV для статистики. Красные треугольники - болел с температурой 39.5

Upd: Добавил спойлер с Resting Heart Rate для сравнения и HRV с сайта для консистентного графика, чтобы было легче сравнить с RHR. По ним видно что когда болел, на HRV это явно видно, а вот RHR немного выше "фона", из-за чего не сразу понятно.

Resting Heart Rate

HRV Status

Пунктир - среднее за ночь (Overnight Average), точки / квадратики / треугольники - среднее за 7 дней

Минусы:
  1. ограничения по времени. В популярные игры типа доты/старкрафта бОльшая часть людей играет много, но «заходами». В итоге подписка N-минут в месяц — самая неудобная из возможных
  2. те самые популярные дота + ск2 + кс: го слишком чувствительны к пингу — а тут ещё латенси из-за особенностей системы. С вашей системой игроки играют в неравном положении и по-сути это обман игроков(хотя на безрыбье это и может кому-то пригодиться).
  3. учитывая что для них не нужен мощный компьютер, playkey с учётом недостатков сказанных выше и вовсе скорее минус, чем плюс.

Плюсы:
  1. игры с графикой и на «быстро пробежать, посмотреть сюжет и удалить» заходят на ура

Замечания:
  • Необходимость покупки игр отдельно
  • Нет «аренды» игр
  • Бесплатные популярные игры плохо подходят для этого сервиса(дота)


На данный момент для большей части геймеров, сервис скорее боль, чем панацея.
Странно, что нет ни слова про серию Fable — герой начинает маленьким мальчиком, а со временем становится известным героем. Мнение окружающих меняется, а сам герой может изменить мир (решения, которые он принимает став правителем в 3-ей части, хороший пример).
Ну а по теме: это просто не выгодно. Современные игры — пройти сюжетку полюбоваться свободой и купить следующую.
Сравните линейку игр BioWare: Baldur's Gate, Neverwinter Nights, Star Wars: Knights of the Old Republic, Jade Empire, Mass Effect, Dragon Age.
С каждой игрой всё меньше ролёвки и больше фильма.

По поводу спам-кликов и высокого APM в целом: обычно же делают, что каждое действие агента(которое не дает reward) уменьшает reward, из-за чего агент учится делать всё наиболее рационально. Интересно использовалось ли это в AlphaStar?
Мне кажется, тогда мы бы видели средний APM в районе 100, просто потому что в "ответственные" моменты он бы выдавал >2000 apm.

Впервые AI хоть как-то обыграл человека в эту игру, и в целом хоть в какую-то игру

такого рода.
OpenAI в доте?
AI сделанные без машинного обучения?
Есть сообщество которое соревнуется в "ботостроении" на основе первого старкрафте и показывают хорошие результаты, но обыгрываются профессионалами банальными тактиками, наподобие той, которой победил MaNa (варп-призма + обс)


Даже просто вот это наше overprobing

Я все ещё не определился — это баг, связанный с тем что они сначала специально тренировали только на добыче минералов (см. Материалы на их сайте) без "настоящих матчей" или они просто приспособились играть друг против друга ("мета", "баланс" и "стратегии" зависят в большОй степени от игроков) — потому что отличный контроль при атаке приведет к убийству рабочих.
Так же по поводу баланса — взгляните на юнитов которых строил бот — сталкер или сталкеры + дизрапторы — он тоже о многом говорит, так как эти юниты при нечеловеческом контроле гораздо лучше.
Я это к тому что люди у него не многому научатся. Его тактики — это тактики для идеального контроля, который пока ни один игрок в мире не может осуществить(и возможно не сможет никогда)
Также, по поводу "учиться у бота" — насколько ужасные размеры были в узких проходах — это отдельный разговор. Это такая ошибка, которую увидели игроки всех уровней.


Это офигенно в том числе и чисто эстетически.

Просто бот vs человек с огромной долей хайпа. Опять же посмотрите на любительских ботов для первого ск. Некоторые вещи они делают лучше, а как показала последняя игра с MaNa — он подвержен некоторым таким же хитростям

С ограниченным пулом 5-ых игроков в доте уже обыграл OpenAi. Ещё летом.

Злоупотребление подобными правилами является проблемой, да.
Как в примере с CoC, когда сторонние люди, не относящиеся к проекту и не вложившие в него больших усилий могут убрать с проекта человека, посветившего огромное количество времени и усилий этому проекту.


Но в пределах разумного эти правила необходимы для современного общества. Необходимо понимание того, что люди разные, у них свои страхи и переживания, и относиться к особенностям личности с уважением, не упрекая их в том что, в общем случае, тебя не касается(ориентация, цвет кожи, религия) и не оказывает негативного влияния на окружающих.


С проблемой пренебрежения нужно бороться чётко сформулировав границу между приемлемым и неприемлемым поведением. Например, чтобы удивленный возглас "Боже мой" считался устоявшимся фразеологизмом, не имеющем отношения к религии.


В целом, не следует из более формального общения делать драму (как же я теперь без "шуток про блондинок" и тому подобного). Я напоминаю, что речь идёт о рабочей среде.

Information

Rating
4,626-th
Location
Воронеж, Воронежская обл., Россия
Registered
Activity