Как стать автором
Обновить
14
0
Вадим Шарко @dr_vadim

Пользователь

Отправить сообщение

Анализ негативных комментариев TRUE CRIME

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров3K

Привет! Я тут активно пытаюсь охватить разные области в сфере Data Science и решила, что было бы классно покопаться c обработкой естественного языка (NLP) на примере комментариев YouTube. Так как после работы я часто смотрю видео Саши Сулим, я задалась вопросом: "Интересно, а есть ли различия в оценке зрителями видео про маньяков в зависимости от пола!? Или нам не важно, кто был убийцей - мужчина/женщина?"

Так я пришла к тому, что могу взять задачку классификации комментариев по оценке их негативности в качестве pet-проекта. То, насколько это получилось, предлагаю оценить вам.

Читать далее
Всего голосов 11: ↑11 и ↓0+13
Комментарии5

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров2.9K

Техника тренировки модели на основе обратной связи от людей (RLHF) была предложена как один из способов повысить согласованность модели. Люди, при том что являются основным источником предвзятостей в данных, одновременно являются своего рода высшим авторитетом в оценке текстов на соответствие каким либо ценностям.

В серии статей мы разберем каждую часть и внутренние детали пайплайна RLHF отдельно и поймем, как сообщество пришло к этой идее. Сделаем мы через через исторический обзор подвыборки статей по теме, каждая из которых опиралась на результаты предыдущих и приносила что то важное и новое в формирование общего пайплайна.

Это первая статья цикла о LLM, Предобучении и KL‑контроле.

Читать далее
Всего голосов 8: ↑8 и ↓0+11
Комментарии0

Как справиться с нехваткой открытых данных для обучения и тестирования ML-моделей

Время на прочтение7 мин
Количество просмотров4.2K


Привет! Меня зовут Илларион, я аспирант ИТМО и член команды, которая занимается предсказанием временных рядов, порожденных графовыми структурами, и другими исследованиями. Однако в разработке новых методов для прогнозирования есть существенное препятствие — нехватка открытых данных для обучения и тестирования моделей.


Для решения проблемы мы создали открытый инструмент Time Series Generator. Я рассказал о нем на митапе, посвященном open source-разработке для научных задач. Под катом делюсь особенностями разработанного решения и рассматриваю реализуемые им задачи.

Читать дальше →
Всего голосов 31: ↑30 и ↓1+39
Комментарии5

Квантовая информация и законы сохранения. Энтропия фон Неймана как мера квантовой запутанности

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров12K

Когда речь заходит о законах сохранения, первым на ум приходит закон сохранения энергии. Менее известны законы сохранения заряда, импульса, момента импульса и чётности. Но что такое закон сохранения информации, зачастую не могут понятно объяснить даже сами физики. О нём мало пишут в научно-популярной литературе, потому что тема запутанная и нагружена математикой. А потом популяризаторов заводят в тупик, когда спрашивают, почему информация должна сохранятся в чёрных дырах или при квантовом измерении. Рассказать об этом не на математическом, а на естественном языке практически невозможно, но я всё же попробую, используя понятийный аппарат квантовой механики и аналогии с классической информацией. Мы выясним, что такое квантовая информация, сохраняется ли она при любых операциях с частицами, или есть исключения, которые приводят к потере информации, и как это связано с фундаментальной симметрией физических процессов.

Читать далее
Всего голосов 11: ↑10 и ↓1+15
Комментарии30

Информация об информации. Энтропия Шеннона, демон Максвелла и предел Ландауэра

Уровень сложностиСредний
Время на прочтение24 мин
Количество просмотров23K

Информация – одно из самых неоднозначных и неопределённых понятий в науке и философии. Для гуманитария это любые сведения, которые можно запомнить и передать в устной или письменной форме. Для математика это абстрактная сущность, сохраняющаяся при вычислительном изоморфизме. Для физика-теоретика это набор квантовых чисел, характеризующих состояние элементарной частицы. Для программиста это цифровые данные, которые можно представить в двоичном коде и измерить в битах. Для философа-материалиста это отражение многообразия окружающего мира с помощью знаков и сигналов. Для философа-идеалиста это нематериальная, неизмеримая и нелокальная сущность, что-то связанное с духом или сознанием. Для эзотериков это некая метафизическая субстанция или информационное поле. Что же такое информация на самом деле? В данной лекции я покажу, что информация – физическая, объективная, измеряемая величина, в которой нет ничего субъективного и мистического. Заодно мы разберёмся, что такое энтропия по Шеннону, насколько избыточен естественный язык, в чём заключается принцип Ландауэра и обладает ли информация массой.

Читать далее
Всего голосов 36: ↑34 и ↓2+43
Комментарии166

Чудовищное уравнение 45-ой степени, которое Франсуа Виет решил в 16 веке

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров81K
О Франсуа Виете не слышал только ленивый: в школе все любили, обладающий особым шармом, его метод решения квадратных уравнений, а чуть позже, интересуясь историей математики, понимали, что он — отец современной системы буквенных обозначений в математике.
image

Одна из страниц его биографии известна чуть менее широко. Связана она с решением поистине чудовищно сложного для тех времен алгебраического уравнения 45-ой степени!
Читать дальше →
Всего голосов 82: ↑80 и ↓2+103
Комментарии61

Одно из самых фундаментальных утверждений математики — теорема Гейне-Бореля-Лебега

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров13K

Сегодня я хочу рассказать Вам про известное утверждение из математического анализа, которое носит имя сразу трех знаменитых математиков 19 и 20 веков: Эмиля Бореля, Анри Лебега и Эдуарда Гейне.

Читать далее
Всего голосов 22: ↑18 и ↓4+22
Комментарии12

Эффект наблюдателя. Сознание влияет на исход эксперимента?

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров43K

Эффект наблюдателя является краеугольным камнем квантового мистицизма – популярного нынче направления эзотерики, маскирующегося под науку и распространяющего искажённые интерпретации квантовой механики. Он покушается на святое – принцип реализма, согласно которому существует объективная, независимая от сознания наблюдателя реальность. Поэтому его очень любят философы-идеалисты, экстрасенсы, мистики и представители культуры нью-эйдж. Ведь было бы так замечательно, если бы наука экспериментальным путём доказала способность человека влиять на вещественный мир силой мысли! Это сильно воодушевляет тех, кто верит в нематериальную природу сознания, управление реальностью, «секрет притяжения», телекинез и прочую магию. Ссылки на теоретическую физику придают их словам больше убедительности. Мол, официальная наука признала, что каждый из нас своими мыслями создаёт окружающую действительность. Вот только сами физики почти единогласно открещиваются от такой трактовки и наотрез отказываются признавать первичность сознания по отношению к материи. Почему же эффект наблюдателя вызывает столько противоречий: из-за его неверного понимания некоторыми популяризаторами или по причине нежелания учёных-материалистов отказываться от старой парадигмы? Давайте разберёмся.

Читать далее
Всего голосов 46: ↑41 и ↓5+51
Комментарии202

Существует ли в мультивселенной бесконечное количество наших копий?

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров8.8K


Вселенная, даже наблюдаемая нами её часть, непредставимо огромна. В ней существуют триллионы галактик, разбросанных в пространстве несколько десятков миллиардов световых лет в поперечнике. Дальше, за пределами наблюдаемого нами космического горизонта, Вселенная, конечно, ещё больше: ещё больше галактик, ещё больше звёзд, ещё больше планет, возможно, даже бесконечное их число. Но существует также очень большое, возможно, даже бесконечное число возможных квантовых исходов, которые могут произойти в пределах Вселенной. Может ли существовать достаточно галактик, звёзд и «копий» известных нам объектов, чтобы вместить все эти квантовые возможности?

Независимо от того, как долго вы будете считать (если только вы не Чак Норрис) или насколько большое число вы можете себе представить, оно всегда будет бесконечно далеко от «бесконечности». Ещё один из самых удивительных математических фактов заключается в том, что не все бесконечности одинаковы. Некоторые виды бесконечности действительно больше других: как будто они каким-то образом являются большей степенью «бесконечности», чем другие бесконечности. Давайте для начала разберёмся в бесконечностях, а затем перейдём к мультивселенной и понятию бесконечного числа параллельных вселенных.
Читать дальше →
Всего голосов 38: ↑30 и ↓8+39
Комментарии9

Создание анимированных графиков с помощью Matlab

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.7K

Анимированные графики помогают представить информацию более красиво и наглядно. Matlab позволяет их создавать с помощью всего пары функций. Как это сделать, читайте в данной статье.

Читать далее
Всего голосов 25: ↑25 и ↓0+25
Комментарии9

Есть проблемы гораздо сложнее, чем NP-Complete

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров10K


Люди часто сравнивают P и NP в таком духе, что проблемы P простые, а NP — сложные. Но это чрезмерное упрощение. На самом деле проблемы могут быть намного, намного сложнее, чем NP.

В этом смысле можно вспомнить интеллектуально-фантастический триллер Travelling Salesman (Коммивояжёр, 2012) о четырёх математиках, нанятых правительством США для решения самой сложной проблемы в истории информатики — равенства классов сложности P и NP (P versus NP problem). И им это удалось. Чиновник министерства обороны США предлагает за их алгоритм вознаграждение $10 млн. Но сами математики слишком хорошо понимают, какие разрушительные последствия принесёт в мир их открытие. Один из лучших фильмов про математику в истории кинематографа…
Читать дальше →
Всего голосов 35: ↑31 и ↓4+42
Комментарии3

О вычислительной природе реальности

Время на прочтение15 мин
Количество просмотров23K

Я объясняю экспериментальные результаты проверки теоремы Белла супердетерминизмом. Далее я показываю, как такая Вселенная может возникнуть и быть совместимой с субъективным опытом свободы воли.

Читать далее
Всего голосов 66: ↑57 и ↓9+67
Комментарии307

Откуда у планет берутся кольца

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров4.4K


Более 400 лет назад — в 1610 году — человечество впервые увидело кольца у планеты. Наблюдая за Сатурном в свой примитивный телескоп, Галилео Галилей заметил, что с обеих сторон его планетарного диска имеются выступы, которые он назвал «ушами». К середине XVII века другие астрономы, такие как Христиан Гюйгенс, пошли дальше и заметили разрыв, отделяющий эти выступы от самой планеты: оказалось, что Сатурн был окружён гигантским кольцом. С тех пор мы обнаружили в этой системе колец разрывы, спутники и минилуны. Более того, оказалось, что Сатурн — не единственный мир, обладающий кольцами.

Теперь мы знаем, что кольца есть у всех газовых гигантов нашей Солнечной системы: есть они у Юпитера, Урана и Нептуна, но они гораздо менее значительны и массивны, чем кольца Сатурна. Мы также узнали, что кольца Сатурна испаряются и, вероятно, уже через 50-200 миллионов лет станут не более заметными, чем кольца Юпитера. Кроме того, по крайней мере, два внешних объекта Солнечной системы — кентавр Хирон и объект пояса Койпера Квавар — обладают кольцами, а для нескольких известных экзопланет у нас есть свидетельства возможности наличия у них колец.
Читать дальше →
Всего голосов 21: ↑21 и ↓0+21
Комментарии5

Удивительные кубы Хинтона, которые позволяют каждому увидеть четырехмерный мир

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров17K

Сегодня я хочу рассказать Вам о замечательном популяризаторе математики Чарльзе Говарде Хинтоне - человеке, внесшем просто огромный вклад в дело изучения объектов четырехмерного мира.

Читать далее
Всего голосов 27: ↑25 и ↓2+33
Комментарии23

Самые криповые случаи с ИИ: что пугает в нейросетях? Часть 1

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров37K

Нейросети переживают настоящий бум, восторгающий одних и вызывающий опасения у других. Их стремительный прогресс делает будущее труднопредсказуемым — человечество в очередной раз создало технологию, которая может изменить очень многое за довольно-таки небольшой срок.

Каким окажется будущее уже через 5–10 лет благодаря повсеместному внедрению нейросетей — вряд ли сможет предсказать даже самый мудрый футуролог и прогнозист: скорее всего, влияние будет обширным, крайне разнообразным и очень комплексным. Достаточно сказать, что нейросети уже есть, а буквально напрашивающегося жанра нейропанка всё ещё почти что нет. Прогресс, ещё недавно казавшийся притормозившим, снова опережает фантазии — как уже не раз бывало в истории человечества.
Читать дальше →
Всего голосов 55: ↑44 и ↓11+53
Комментарии40

Реликтовое излучение и кривизна Вселенной

Время на прочтение9 мин
Количество просмотров14K

В конце февраля 2023 года уважаемый @SLY_G опубликовал очень интересную статью, в которой обобщил некоторые нестыковки в современной фундаментальной модели Вселенной. В особенности меня заинтересовало, что, по приведённым в статье данным, не удаётся согласовать те значения скорости расширения Вселенной, которые получаются при измерениях с учётом космологической постоянной и с учётом объективного расстояния до стандартных свеч. Я обратил внимание на следующую аномалию: данные, полученные в 2001 году от космического телескопа WMAP (телескоп составлял подробную карту реликтового излучения) свидетельствовали, что реликтовый микроволновый фон не полностью изотропен, то есть, что Вселенная в инфляционную эпоху расширялась не вполне равномерно. Некоторые участки Вселенной явно «теплее» других на несколько милликельвинов – эту знаменитую тепловую карту я поставил под катом. Со временем факты в пользу такой аномалии продолжали накапливаться, пока не были в 2013 году убедительно подтверждены по наблюдениям космического телескопа «Планк», запущенного Европейским космическим агентством в 2009 году. В 2018 году группа учёных под руководством Джозефа Силка из Манчестерского университета закончила многолетний анализ данных «Планка», и по результатам этой работы было с 99%-й вероятностью установлено, что Вселенная не плоская, а обладает кривизной. Давайте рассмотрим, какие изменения в картине мира возникнут, если Вселенная не просто немного изогнута, а обладает седловидной, шарообразной или более экзотической формой.

Читать далее
Всего голосов 44: ↑42 и ↓2+57
Комментарии53

Математическая продлёнка. Про углы и тригонометрию

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров19K

Продолжаю знакомить вас с наработками к занятиям математического кружка. В этой статье собраны два сюжета, связанные друг с другом одной темой: математика углов и тригонометрия. Каким образом обосновываются угловые меры? Какие из них для чего более пригодны? Почему значения тригонометрических функций от рациональных долей окружности почти все иррациональны и, наоборот, почему в рациональной тригонометрии только восемь рациональных углов и те, по большей части тривиальны? Материал рассчитан на школьников, но он приоткрывает двери в большую математику, поэтому здесь появятся элементы теории чисел, теории алгебраических полей и полиномы Чебышёва.

Читать далее
Всего голосов 88: ↑88 и ↓0+88
Комментарии57

GitLab выкатил версию 15.8. Рассказываем, что нового

Время на прочтение3 мин
Количество просмотров11K

Привет! Я Максим Рязанцев, DevOps-специалист в AGIMA. На днях GitLab выкатил новую версию — версию 15.8. Мы с коллегами внимательно ее изучили, разобрались, что нового. И теперь решили поделиться списком улучшений. Тем более, что список внушительный. Правда, самые заметные изменения в касаются только облачной Ultimate-версии. Но мы-то знает, что со временем фичи с облака мигрируют в Self-Managed-версию. Так что коротко расскажем обо всех новинках.

Читать далее
Всего голосов 35: ↑34 и ↓1+37
Комментарии5

ChatGPT как инструмент для поиска: решаем основную проблему

Время на прочтение40 мин
Количество просмотров115K

Вышедшая чуть больше месяца назад ChatGPT уже успела нашуметь: школьникам в Нью-Йорке запрещают использовать нейросеть в качестве помощника, её же ответы теперь не принимаются на StackOverflow, а Microsoft планирует интеграцию в поисковик Bing - чем, кстати, безумно обеспокоен СЕО Alphabet (Google) Сундар Пичаи. Настолько обеспокоен, что в своём письме-обращении к сотрудникам объявляет "Code Red" ситуацию. В то же время Сэм Альтман, CEO OpenAI - компании, разработавшей эту модель - заявляет, что полагаться на ответы ChatGPT пока не стоит.

Насколько мы действительно близки к внедрению продвинутых чат-ботов в поисковые системы, как может выглядеть новый интерфейс взаимодействия, и какие основные проблемы есть на пути интеграции? Могут ли модели сёрфить интернет бок о бок с традиционными поисковиками? На эти и многие другие вопросы постараемся ответить под катом.

Погрузиться с головой →
Всего голосов 96: ↑96 и ↓0+96
Комментарии51

О теореме Абеля-Руффини без групп и теории Галуа

Время на прочтение10 мин
Количество просмотров12K

Поиск решения алгебраических уравнений оказал колоссальное влияние на развитие математики. Формула решения общего кубического уравнения впервые была получена итальянскими математиками 16-го века. Это событие ставшее первопричиной рассмотрения комплексных чисел, считается одним из поворотных моментов в истории математики. Судьбы Джероламо Кардано, Никколо Тартальи, Сципиона дель Ферро и их поисков решения кубического уравнения заслуживают отдельного романа со своими интригами, скандалами и расследованиями. Столь яркие истории достаточно редки в математике. 

Начиная с 19-го века поиск формул для решения уравнений произвольных степеней положил начало теории групп и абстрактной алгебре, которые преобразили практически все разделы современной математики. Думаю, многие, кто интересовался историей и развитием алгебры, знают, что формулы для решения общего алгебраического уравнения степени выше четвертой не существует. Как сообщается, первое доказательство этого факта было дано итальянским математиком Паоло Руффини в самом конце восемнадцатого века, оно составляло около 500 страниц и все же содержало некоторые пробелы. Хотя отдельные математики, как Огюстен Коши, и признавали данное доказательство, но ввиду столь большого объема и сложности изложения, оно так и не было принято математическим сообществом. Считается, что первое полное доказательство дано норвежским математиком Нильсом Абелем и содержалось в двух работах, изданных в 1824 и 1826 годах. С тех пор оно носит название теоремы Абеля или теоремы Абеля-Руффини. 

Читать далее
Всего голосов 32: ↑32 и ↓0+32
Комментарии24
1

Информация

В рейтинге
Не участвует
Откуда
Киев, Киевская обл., Украина
Зарегистрирован
Активность