Pull to refresh

Comments 25

Астрофизики ничего так

У ближней губы такие... астрофизические. А вот вторую астрофизич(ку) видно хуже.

Звучит логично - отличный инструмент пропаганды, если подумать. Я правда не сталкивался, но и модели использую только для технической информации.

Вот в статье как раз-таки пример технической информации. И ведь ответ не выглядит, что мы столкнулись с пропагандой, правда?)

А еще интересно, почему люди ставят дизлайки, но не комментируют пост. Ведь любой может повторить эксперимент и аргументированно поспорить с автором. Есть гипотеза, что они делают это неосознанно, на основе своей прошивки. А теперь вопрос: как же так их прошили?))

Дизлайков не ставил, не имею такой возможности, но личным ощущением поделюсь. Статья выглядит так, как будто вы её писали в колпаке из простыни с дырками, а под колпаком ещё шапочка из фольги. У меня нейронки ничего похожего по этому промту не выдают

Я не люблю ролевые игры, простыни с дырками и вот это всё) Просто стараюсь не врать себе, чего и всем советую.

У меня нейронки ничего похожего по этому промту не выдают

Какие модели или ИИ-платформы используете? Какой конкретно промпт?

Это "cfuk u mohter", что ли? Такая себе техническая информация))

cfuk u mohter - это шутка. В UPD приведены две ссылки на конкретные исследования.

Забавно, что кто-то не поленился впихнуть минусов, чтобы отцензурить статью с ленты. Статья, конечно, слабая. Но проблема то, верная... И дело даже не в чернокожих. Это внутри американский тренд. Есть много других тем, где проявляется цензура и это не настолько неважно как BLM-бесие.

Буду благодарен, если поясните, в чём слабость статьи. Я начинающий автор, могу не передать каких-то нюансов. И да, тема не ограничивается чернокожими, я про это и говорю. Проблема в том, что публичным моделям скармливают заведомо фальшивые данные. В результате чего ИИ становится скрытым элементом пропаганды чего угодно. Тогда как модели для узкого круга задач вполне адекватны.

Сильная статья была если бы вы провели исследование... Сравнили, вывели статистику разных тем. Например, не только BLM, но и коронобесие, карбонобесие, Трамп и прочие горячие темы времен формирования обучающего блока первомодели. И влияние этой модели на другие уже через дисциляцию опыта...

Статья - всего лишь указание на существующую проблему. Собственно, на полноценное исследования я и не претендовал. Поэтому, я бы сказал, что статья не слабая, а просто не отвечает Вашим пожеланиям к глубине исследования)) Мне-то норм, я сказал всё, что хотел.

но и коронобесие, карбонобесие, Трамп и прочие горячие темы

Полагаю, что и во всех остальных темах результат будет похожий: максимум один-два источника, а всё остальное - информационное эхо.

С нейросетями и их обучением, по моему мнению, ситуация следующая: обучение происходит на западе, где есть определенные политические повестки, гос-пропаганда, цветная повестка и повестка меньшинств.

Так как обучение проводят на данных взятых из определенных западных источников, получается ситуация что западная пропаганда по разным вопросам очень сильно влияет на то что скажет модель по тому или иному вопросу. Например, российских источников гораздо меньше, поэтому ценности присущие этому народу будут всегда менее важны для модели и модель всегда будет на стороне создателя, то есть западного человека, так как на западных данных обучалась модель. Данные из российских истоников будут в меньшинстве и в отдельных ситуациях могут вообще не приниматься во внимание при генерации ответа. Это легко проверить. Западная точка зрения всегда превалирует над локальной. Потому что данных тупо больше на западе. Я осознанно использую слово "данные", а не "информация". Потому что модели обучаются на данных, а не на информации.

обучение происходит на западе, где есть определенные политические повестки, гос-пропаганда, цветная повестка и повестка меньшинств.

Обучение LLM происходит везде, и на востоке тоже. Дело не в том, где, а в том, на чём и для чего. Проблема в том, что люди не видят в этом проблему.

На востоке просто нагло дисцилируют опыт западных моделей. И еще есть момент. Большинство ИТ тоже мыслит под "калифорнийский стандарт". Я думаю даже в Китае, не говоря уже про Яшу и Сбер..

Именно так, даже в Китае) Потому что они тупо воруют весА, либо включают безлимитный обратный инжиниринг.

Большинство ИТ тоже мыслит под "калифорнийский стандарт"

Дизлайки без пояснений под статьёй тому некоторое доказательство) А статья, да, слабовата. Но переписывать не буду, никто покамест не переубедил меня в справедливости выводов.

Я все же считаю что дело в том у кого больше данных. А уже внутри эти данные однородны. И повестки там зашиты. На западе больше данных. Больше обучения. Больше попыток развития нейронок, чем на востоке.

Вы ищете проблему там, где её нет. Всё проще: материалов на английском языке больше, на русском меньше. Всё.

Допустим, материалов на русском языке больше. Но как это связано с тезисами статьи? Вы исходите из какого предположения? Что запрос на русском языке даст одни результаты, а на английском или немецком другие? Так да, всё верно.
Вот уважаемый комментатор показывает, как разнятся запросы по одной и той же теме на разных языках: https://habr.com/ru/articles/982312/comments/#comment_29332528

Но как это доказывает, что проблемы искажения данных в пользу определённого круга заинтересованных лиц не существует? Или Вы полагаете, что при написании статьи я опирался только на запросы к моделям?)

Да. Но что это за материалы и какая в них смысловая нагрузка это важно. Это не просто материалы. Они содержат множество интерпретаций по разным вопросам и эти интерпретации написаны через призму западных ценностей в основном.

Большинство опенсорных моделей тоже этому подвержены. Почти все датасеты загрязнены повесточкой. Сравните выдачу картинок на слово "scientist" у гугла и яндекса.

Поднимайте свою модель и учите ее чему хотите. хоть японским матом ругаться) Но да, совет из серии "нет хлеба? поешьте пирожных".

От языка запроса еще зависит.

На английском:

И на немецком:

От языка запроса еще зависит.

А вот это, кстати, интересное наблюдение.

Ввести промт из одного слова "женщина" на арабском, китайском и испанском. Все три результата будут разными, потому что каждый язык принадлежит культуре и это собственно три разных запроса, которые будут обрабатываться соответственно особенностям того народа, чей язык вы используете, но результат запроса это - не объективная реальность, а всего лишь набор шаблонов.

Sign up to leave a comment.

Articles