Pull to refresh
4
0.5
Илья @edge790

User

Send message

Удивительно, что ваш комментарий настолько же верен насколько и абсолютно ошибочен.

Вы правы что в консистентности шкала не линейная а логарифмическая - получить 90% верных ответов вместо 80%, гораздо сложнее чем 60% вместо 50%

Но проблема в том, что предположительно, LLM уже видела ответы для этих вопросов, а следовательно если она выдавала бы и 100% это было не так уж и удивительно.

Может ли она "понять" задачу которую она никогда не видела и дать на него правильный ответ - это другой вопрос.

Некоторые думали что может, т.к. она объясняет смысл анекдотов, а потом выяснилось, что она их может объяснить потому что она уже видела объяснения.

Мы не можем сказать когда она "понимает" а когда она "вспоминает", причем мы не можем даже сказать "понимает" ли она вовсе, но мы точно можем сказать что интеллекта как такового у нее нет, т.к. на выходе это сэмплер, который берёт вероятности слов выдаваемые сетью и выбирает случайное слово, по заданным правилам.

Т.е. в конце концов это "Цепь Маркова на стероидах" и это сильно ограничивает количество работ которые ей можно доверить.

gradle это билд система, у которой совершенно другие разработчики не связанные с android studio и intellij

То, что нужно скачать SDK, я думаю, и так понятно и долго вдаваться в подробности не буду, но , если кратко, то чтобы не требовалось скачать 50 версий по 20 гб SDK всех версий, чтобы разрабатывать под конкретную, а скачать только её.

Для оффлайн разработки вы качаете её отдельно и ставите на флешку, указывая до неё путь.

Мой предыдущий комментарий все так же верен: вы можете сделать себе носитель со все и инструментами необходимыми для оффлайн разработки, некоторые знакомые это делали (т.к. у них требования разрабатывать на устройстве без доступа к интернету)

Это не соответствует действительности.

Вы можете скачать идею и оффлайн ключ активации и активировать ее так. Вы можете скачать fallback версию идеи и ключ ее активации - она будет активна пожизненно.

Для самой идеи вы можете выставить настройки прокси сервера, который идея будет использовать, и соответственно ничего не мешает вам прописать там несуществующий прокси, чтобы она не могла выходить в интернет, и она успешно со всем этим будет работать.

В статье описана проблема с тем что не получаются новые апдейты для установленных плагинов / невозможность установить новые через встроенный менеджер, но плагины можно устанавливать оффлайн из локальных директорий, т.е. даже и это позволит их использовать без интернета.

Во-первых: не стресс тестирование а сразу посыл куда подальше, по причине "не хочу возиться с вашими технологиями" (на что он имеет полное право, но, я думаю, требует уточнения, чтобы было понятно за что выступал Филхо и почему его развернули)

Во-вторых: стресс-тестирование людей - это впринципе плохо, потому что задевает только тех кто действительно переживает за проект, не трогая людей которым наплевать и которые там чисто ради денег, а стресс-тестирование в опенсорес - это полнейшая ересь. С таким подходом в опенсорсе останутся только бюрократы.

В-третьих: не провалил, а сделал правильное решение. Если тебе не рады и твой труд не ценят - нечего надрываться, умные люди везде нужны, но видимо не в этой кодовой базе.

По поводу "я устал я мухожук": если твои патчи отклоняют просто потому что они на расте (что ты и пытаешься сделать), то я не вижу причины продолжать пытаться это делать.

Код отклоняли не потому что он плохой, не потому что были сомнения что он будет работать, а просто потому что ментейнер не хотел принимать его в кодовую базу, потому что "если я зарефакторю си, я не буду лезть править Раст - я же его не знаю".

Что, в целом, валидное замечание - в опенсорсе последнее слово всегда за мэнтейнером. Но это не делает работу "некто из Microsoft" хуже, и в таких обстоятельствах его "я устал я мухожук" - единственное верное решение, имхо.

никто не заставляет начать писать на расте.

Далее цитата из самой статьи:

если он рефакторит код и сломает программы на Rust, он не хочет идти и исправлять их, потому что он не знает языка,

Т.е. нет, буквально конфликт в том, что чтобы Раст работал в ядре, нужно чтобы и те кто разрабатывает на Си, умели исправлять код написанный на расте.

Потому что когда они рефакторят сишный код, ломается так же и код написанный на расте, который нужно исправлять.

Результат работы модели LLM - это вероятности следующего токена.

Дальше сэмплер выбирает один из предложенных вариантов, с учётом вероятностей.

Т.е. например:

Текст "были у бабуси два весёлых" и модель выдает:

  • 98% "Гуся"

  • 1.6% "Кота"

  • 0.2% "сына"

Но тут появляется проблема в том, что в большинстве случаев ответ всегда одинаковый.

И это плохо, когда например ты просишь рассказать LLM сказку, т.к. она в большинстве случаев будет одна и та же про одних и тех же персонажей. Или советы куда поехать отдыхать будут одни и те же с одними и теми же городами.

Поэтому придумали настройку для сэмплера: "температуру" - чтобы сделать менее вероятные варианты более вероятными.

Температура 0.0 - даёт наиболее вероятный вариант.

Температура 1.0 - даёт самые случайные ответы

Температура 0.7 - соответственно скорее случайный ответ чем точный.

Температура не универсальна и ее использование должно зависеть от контекста - например низкая температура для точных ответов и вычислений, но высокая для более "творческих" ответов, которые не требуют точности: такие как рассказать сказку, описать какое-то явление понятными словами и простым языком и т.д.

Так что да, тут температура скорее всего СЛИШКОМ высока. 0.2 и ниже, скорее всего, давали бы более точные ответы.

Upd: Вот YouTube Short от 3 Brown 1 Blue который отлично и кратко объясняет температуру, правда на английском языке и там значения температуры немного другие, т.к. они не в диапазоне [0, 1] https://youtube.com/shorts/XsLK3tPy9SI

Давайте все же определимся

благодаря поддержке в пресловутые 86%

Или

зафиксировать факт карусели

Разве это не противоречие? Зачем с поддержкой в 86% лояльных избирателей необходимы "карусели"?

Отмечу что иногда HRV позволяет узнать о том что заболел утром, когда симптомы полноценно проявятся вечером.

Ну и по комментарию очень много вопросов:

Сборная одной страны, это человек 30? Можно ли считать это достаточной контрольной группой? Дополнительно, а как они измеряли? Среднее за ночь, как обсуждается в соседней ветке, или перед и после занятий? Сколько лет проводилось исследование? Какой разброс без замеров HRV, какой разброс с замерами HRV? Как замерялись успехи? Что есть успех? Количество заболеваний, количество травм или успехи по каким-то конкретным метрикам (скорость бега, продолжительность бега на определенном темпе и т.д.)?

Интерпретировать можно по разному, но в целом: HRV в средних значениях - можно тренироваться, HRV слишком низкий / слишком высокий - лучше подождать денёк и посмотреть на самочувствие завтра.

Проблемок с интерпретируемостью по среднему HRV за ночь у меня за пол года не наблюдалось, обычно если он низкий то на следующий день/вечер заболеешь.

Спустился в комментарии чтобы сказать абсолютно тоже самое, но прочитал ваш комментарий восхитился и обзавидовался белой завистью.

Мне 29, начал бегать год назад, из чего удалось достичь: полумарафон за 02:02:22. С начала этого года приобрел Garmin Epix 2 Pro, до них были Huawei Watch GT 3

На хуавеях определял усталость по Resting Heart Rate(сердцебиение в состоянии покоя) для меня за первый месяц бега средние значения опустились где-то с 60 до 50 (ещё бросил курить, что скорее всего повлияло, до этого курил 10 лет). Соответственно если оно было 55+ то значит перетренировался либо на следующий день заболею.

С Garmin перешёл на overnight average HRV, периодически посматривая на оба показателя, но в конце концов сошёлся на том что HRV значительно (если по ощущениям то где-то в 1 из 3 случаев я скорее по самочувствию на момент и на следующий день согласен с тем что показывает HRV)

Из минусов: в случае проблем со сном метрика отваливается / показывает выбивающиеся результаты. Но в целом, рекомендую.

Статичные замеры HRV через Health Snapshot (часы просят сидеть прямо и ничего не делать 2 минуты, пока они замеряют показатели дыхания, сердцебиения и HRV) слишком разнятся для меня. Замеры через Polar HU10 через программу часов "HRV Stress" тоже доверия не вызвали, но и сказать что они точно не правы Я тоже не могу, хотя, по правде говоря, использовал всего несколько раз, и в разное время (перед выходом на уличный забег, чтобы пытаться понять какой маршрут выбрать).

Ну и прикреплю свой график HRV для статистики. Красные треугольники - болел с температурой 39.5

Upd: Добавил спойлер с Resting Heart Rate для сравнения и HRV с сайта для консистентного графика, чтобы было легче сравнить с RHR. По ним видно что когда болел, на HRV это явно видно, а вот RHR немного выше "фона", из-за чего не сразу понятно.

Resting Heart Rate

HRV Status

Пунктир - среднее за ночь (Overnight Average), точки / квадратики / треугольники - среднее за 7 дней

Минусы:
  1. ограничения по времени. В популярные игры типа доты/старкрафта бОльшая часть людей играет много, но «заходами». В итоге подписка N-минут в месяц — самая неудобная из возможных
  2. те самые популярные дота + ск2 + кс: го слишком чувствительны к пингу — а тут ещё латенси из-за особенностей системы. С вашей системой игроки играют в неравном положении и по-сути это обман игроков(хотя на безрыбье это и может кому-то пригодиться).
  3. учитывая что для них не нужен мощный компьютер, playkey с учётом недостатков сказанных выше и вовсе скорее минус, чем плюс.

Плюсы:
  1. игры с графикой и на «быстро пробежать, посмотреть сюжет и удалить» заходят на ура

Замечания:
  • Необходимость покупки игр отдельно
  • Нет «аренды» игр
  • Бесплатные популярные игры плохо подходят для этого сервиса(дота)


На данный момент для большей части геймеров, сервис скорее боль, чем панацея.
Странно, что нет ни слова про серию Fable — герой начинает маленьким мальчиком, а со временем становится известным героем. Мнение окружающих меняется, а сам герой может изменить мир (решения, которые он принимает став правителем в 3-ей части, хороший пример).
Ну а по теме: это просто не выгодно. Современные игры — пройти сюжетку полюбоваться свободой и купить следующую.
Сравните линейку игр BioWare: Baldur's Gate, Neverwinter Nights, Star Wars: Knights of the Old Republic, Jade Empire, Mass Effect, Dragon Age.
С каждой игрой всё меньше ролёвки и больше фильма.

По поводу спам-кликов и высокого APM в целом: обычно же делают, что каждое действие агента(которое не дает reward) уменьшает reward, из-за чего агент учится делать всё наиболее рационально. Интересно использовалось ли это в AlphaStar?
Мне кажется, тогда мы бы видели средний APM в районе 100, просто потому что в "ответственные" моменты он бы выдавал >2000 apm.

Впервые AI хоть как-то обыграл человека в эту игру, и в целом хоть в какую-то игру

такого рода.
OpenAI в доте?
AI сделанные без машинного обучения?
Есть сообщество которое соревнуется в "ботостроении" на основе первого старкрафте и показывают хорошие результаты, но обыгрываются профессионалами банальными тактиками, наподобие той, которой победил MaNa (варп-призма + обс)


Даже просто вот это наше overprobing

Я все ещё не определился — это баг, связанный с тем что они сначала специально тренировали только на добыче минералов (см. Материалы на их сайте) без "настоящих матчей" или они просто приспособились играть друг против друга ("мета", "баланс" и "стратегии" зависят в большОй степени от игроков) — потому что отличный контроль при атаке приведет к убийству рабочих.
Так же по поводу баланса — взгляните на юнитов которых строил бот — сталкер или сталкеры + дизрапторы — он тоже о многом говорит, так как эти юниты при нечеловеческом контроле гораздо лучше.
Я это к тому что люди у него не многому научатся. Его тактики — это тактики для идеального контроля, который пока ни один игрок в мире не может осуществить(и возможно не сможет никогда)
Также, по поводу "учиться у бота" — насколько ужасные размеры были в узких проходах — это отдельный разговор. Это такая ошибка, которую увидели игроки всех уровней.


Это офигенно в том числе и чисто эстетически.

Просто бот vs человек с огромной долей хайпа. Опять же посмотрите на любительских ботов для первого ск. Некоторые вещи они делают лучше, а как показала последняя игра с MaNa — он подвержен некоторым таким же хитростям

С ограниченным пулом 5-ых игроков в доте уже обыграл OpenAi. Ещё летом.

Злоупотребление подобными правилами является проблемой, да.
Как в примере с CoC, когда сторонние люди, не относящиеся к проекту и не вложившие в него больших усилий могут убрать с проекта человека, посветившего огромное количество времени и усилий этому проекту.


Но в пределах разумного эти правила необходимы для современного общества. Необходимо понимание того, что люди разные, у них свои страхи и переживания, и относиться к особенностям личности с уважением, не упрекая их в том что, в общем случае, тебя не касается(ориентация, цвет кожи, религия) и не оказывает негативного влияния на окружающих.


С проблемой пренебрежения нужно бороться чётко сформулировав границу между приемлемым и неприемлемым поведением. Например, чтобы удивленный возглас "Боже мой" считался устоявшимся фразеологизмом, не имеющем отношения к религии.


В целом, не следует из более формального общения делать драму (как же я теперь без "шуток про блондинок" и тому подобного). Я напоминаю, что речь идёт о рабочей среде.

Ваш список запрещенных шуток: про ориентацию, про пол, про религию, про воинскую обязанность(?)

Не мой, а краткий пересказ правил компании в которой я раньше работал.
От себя добавил бы ещё шутки про "пора рожать" для девушек и про детей в целом, потому что это деликатная тема, но, к сожалению, подобное тоже периодически всплывает.


У других людей другие запретные темы, в итоге придем к тому, что шутить вообще нельзя.

Смысл не столько в шутках, сколько в ущемлении людей. Для вас возможно это будет "просто шутка", а некоторых это может сильно зацепить. Та же тема про воинскую обязанность — некоторые просто посмеются, а человек может действительно переживать по этому поводу, что ему придётся расстаться со своими родственниками, друзьями и коллегами на год. Если задуматься, это достаточно депрессивная тема, поэтому не стоит "давить на больное".
Эти "запреты" скорее общие рекомендации, потому что шутки на эту тему зачастую бывают оскорбительными, либо болезненными, для многих людей. В остальном можно полагаться на собственные чувства.
Из важных запретных тем, которые я, к сожалению, забыл указать есть ещё "шутки" про инвалидность.


в итоге придем к тому, что шутить вообще нельзя.

Нужно понимать что вы не в баре с друзьями, а среди коллег, которые могут иметь разную ориентацию, религию, принадлежать разным культурам и быть по разному воспитанными. Поэтому темы для шуток желательно ограничить. Для вас, возможно, подобные шутки не значат ничего, а на моей памяти есть случай, когда девушку довели до слёз шуткой про то, что она ходила курить с другими сотрудниками. Таких случаев в рабочей среде быть не должно.


Программист ведь творческая личность, по-другому никак, и запретами его творчество можно только подавить. Ну и результат труда будет соответствующий.

Я не думаю что отказ от шуток которые могут задеть чувства других сотрудников помешает вам писать хороший код. А вот задетые чувства сотрудников могут негативно сказаться как на их производительности, так на межличностные отношения с командой. Этого нужно избегать, пускай и ценой "шуток".

Крайне не согласен с мнением изложенным в статье. По пунктам:
"Это должен быть матёрый сисадмин со стальными яйцами" — никто никому ничего не должен.
"который плачет от шуток про ориентацию" — это плохие шутки и их не должно быть в "рабочей среде". Ровным счётом как и половых (например про "тупых блондинок"), религиозных, относительно воинской обязанности сотрудников.
"что нельзя критиковать людей, нельзя вообще высказвать им негативную оценку" — да, нельзя. Человек приложил усилия и написал код. То что он не соотвествует какому-то требованию, о котором он мог и не знать — это уже другой разговор. Но в целом: "критиковать людей нельзя" — правильная точка зрения. Не забывайте что это для вас "программирование — это субкультура" или, скорее, "культ", а для большинства людей это просто работа, на которую они ходят просто потому что получают за это деньги. Оскорблять людей за их работу неправильно. Критиковать тоже нужно правильно.
По поводу оценки кода — меня учили не критиковать код, а указывать на более подходящие варианты, или проблемные моменты. Да, допустим, программист сделал обход связанного списка вместо доставания по хешу из ассоциативного массива. Не нужно говорить что "это говнокод", "это <плохое> решение" нужно сразу сказать что это можно сделать лучше.


Удивительно что многие поддерживают мнение указанное в статье. "IT-не детский сад, а место для суровых людей которые могут и 'куда-подальше послать' " — это плохое мнение, которое может отсеять потенциальных специалистов.
Не говоря уже о том, что в нашей профессии часто приходится общаться с людьми, а аргументы в статье говорят о том что хороший айтишник — тот который не знает как это правильно делать

Я хз откуда цифра в 30 гб на современные игры, т.к. у меня игр 5 стоит на ~100 гб.


SSD для работы — хорошая штука.
Для системы SSD тоже заходит хорошо.


Но он явно не идеален и порой RAID0 (или RAID#) из N HDD неплохо заходит.


Для себя решил систему + работу ставить на SSD, медиа на HDD

Information

Rating
1,921-st
Location
Воронеж, Воронежская обл., Россия
Registered
Activity