Статьи / Закладки / Профиль dr

Вадим Шарко @dr_vadim

Пользователь

Профиль Публикации 1Комментарии 4Закладки 23

makarstasia 19 июл в 22:46

Анализ негативных комментариев TRUE CRIME

Средний

10 мин

Машинное обучение*Научно-популярноеИскусственный интеллект

Из песочницы

Привет! Я тут активно пытаюсь охватить разные области в сфере Data Science и решила, что было бы классно покопаться c обработкой естественного языка (NLP) на примере комментариев YouTube. Так как после работы я часто смотрю видео Саши Сулим, я задалась вопросом: "Интересно, а есть ли различия в оценке зрителями видео про маньяков в зависимости от пола!? Или нам не важно, кто был убийцей - мужчина/женщина?"

Так я пришла к тому, что могу взять задачку классификации комментариев по оценке их негативности в качестве pet-проекта. То, насколько это получилось, предлагаю оценить вам.

+13

MrsWallbreaker 19 июл в 23:11

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

Простой

12 мин

2.9K

Машинное обучение*Искусственный интеллектNatural Language Processing*

Из песочницы

Техника тренировки модели на основе обратной связи от людей (RLHF) была предложена как один из способов повысить согласованность модели. Люди, при том что являются основным источником предвзятостей в данных, одновременно являются своего рода высшим авторитетом в оценке текстов на соответствие каким либо ценностям.

В серии статей мы разберем каждую часть и внутренние детали пайплайна RLHF отдельно и поймем, как сообщество пришло к этой идее. Сделаем мы через через исторический обзор подвыборки статей по теме, каждая из которых опиралась на результаты предыдущих и приносила что то важное и новое в формирование общего пайплайна.

Это первая статья цикла о LLM, Предобучении и KL‑контроле.

+11

DeadSailor 3 июл в 12:28

Как справиться с нехваткой открытых данных для обучения и тестирования ML-моделей

7 мин

4.2K

Open source*Программирование*Блог компании SelectelМашинное обучение*Научно-популярное

Кейс

Привет! Меня зовут Илларион, я аспирант ИТМО и член команды, которая занимается предсказанием временных рядов, порожденных графовыми структурами, и другими исследованиями. Однако в разработке новых методов для прогнозирования есть существенное препятствие — нехватка открытых данных для обучения и тестирования моделей.

Для решения проблемы мы создали открытый инструмент Time Series Generator. Я рассказал о нем на митапе, посвященном open source-разработке для научных задач. Под катом делюсь особенностями разработанного решения и рассматриваю реализуемые им задачи.

Читать дальше →

+39

dionisdimetor 2 мар в 13:17

Квантовая информация и законы сохранения. Энтропия фон Неймана как мера квантовой запутанности

Средний

25 мин

12K

Математика*Научно-популярноеФизикаКвантовые технологии

Когда речь заходит о законах сохранения, первым на ум приходит закон сохранения энергии. Менее известны законы сохранения заряда, импульса, момента импульса и чётности. Но что такое закон сохранения информации, зачастую не могут понятно объяснить даже сами физики. О нём мало пишут в научно-популярной литературе, потому что тема запутанная и нагружена математикой. А потом популяризаторов заводят в тупик, когда спрашивают, почему информация должна сохранятся в чёрных дырах или при квантовом измерении. Рассказать об этом не на математическом, а на естественном языке практически невозможно, но я всё же попробую, используя понятийный аппарат квантовой механики и аналогии с классической информацией. Мы выясним, что такое квантовая информация, сохраняется ли она при любых операциях с частицами, или есть исключения, которые приводят к потере информации, и как это связано с фундаментальной симметрией физических процессов.

+15

dionisdimetor 3 фев в 12:15

Информация об информации. Энтропия Шеннона, демон Максвелла и предел Ландауэра

Средний

24 мин

23K

Математика*История ITНаучно-популярноеФизика

Информация – одно из самых неоднозначных и неопределённых понятий в науке и философии. Для гуманитария это любые сведения, которые можно запомнить и передать в устной или письменной форме. Для математика это абстрактная сущность, сохраняющаяся при вычислительном изоморфизме. Для физика-теоретика это набор квантовых чисел, характеризующих состояние элементарной частицы. Для программиста это цифровые данные, которые можно представить в двоичном коде и измерить в битах. Для философа-материалиста это отражение многообразия окружающего мира с помощью знаков и сигналов. Для философа-идеалиста это нематериальная, неизмеримая и нелокальная сущность, что-то связанное с духом или сознанием. Для эзотериков это некая метафизическая субстанция или информационное поле. Что же такое информация на самом деле? В данной лекции я покажу, что информация – физическая, объективная, измеряемая величина, в которой нет ничего субъективного и мистического. Заодно мы разберёмся, что такое энтропия по Шеннону, насколько избыточен естественный язык, в чём заключается принцип Ландауэра и обладает ли информация массой.

+43

166

andreybrylb 11 сен 2023 в 16:01

Чудовищное уравнение 45-ой степени, которое Франсуа Виет решил в 16 веке

Простой

4 мин

81K

Блог компании Timeweb CloudМатематика*Читальный залНаучно-популярное

Обзор

О Франсуа Виете не слышал только ленивый: в школе все любили, обладающий особым шармом, его метод решения квадратных уравнений, а чуть позже, интересуясь историей математики, понимали, что он — отец современной системы буквенных обозначений в математике.

Одна из страниц его биографии известна чуть менее широко. Связана она с решением поистине чудовищно сложного для тех времен алгебраического уравнения 45-ой степени!

Читать дальше →

+103

andreybrylb 9 сен 2023 в 21:02

Одно из самых фундаментальных утверждений математики — теорема Гейне-Бореля-Лебега

Простой

3 мин

13K

Математика*Научно-популярное

Сегодня я хочу рассказать Вам про известное утверждение из математического анализа, которое носит имя сразу трех знаменитых математиков 19 и 20 веков: Эмиля Бореля, Анри Лебега и Эдуарда Гейне.

+22

dionisdimetor 10 авг 2023 в 11:30

Эффект наблюдателя. Сознание влияет на исход эксперимента?

Простой

13 мин

43K

Научно-популярноеФизика

Из песочницы

Эффект наблюдателя является краеугольным камнем квантового мистицизма – популярного нынче направления эзотерики, маскирующегося под науку и распространяющего искажённые интерпретации квантовой механики. Он покушается на святое – принцип реализма, согласно которому существует объективная, независимая от сознания наблюдателя реальность. Поэтому его очень любят философы-идеалисты, экстрасенсы, мистики и представители культуры нью-эйдж. Ведь было бы так замечательно, если бы наука экспериментальным путём доказала способность человека влиять на вещественный мир силой мысли! Это сильно воодушевляет тех, кто верит в нематериальную природу сознания, управление реальностью, «секрет притяжения», телекинез и прочую магию. Ссылки на теоретическую физику придают их словам больше убедительности. Мол, официальная наука признала, что каждый из нас своими мыслями создаёт окружающую действительность. Вот только сами физики почти единогласно открещиваются от такой трактовки и наотрез отказываются признавать первичность сознания по отношению к материи. Почему же эффект наблюдателя вызывает столько противоречий: из-за его неверного понимания некоторыми популяризаторами или по причине нежелания учёных-материалистов отказываться от старой парадигмы? Давайте разберёмся.

+51

202

valisak 10 авг 2023 в 16:00

Существует ли в мультивселенной бесконечное количество наших копий?

Средний

9 мин

8.8K

Математика*Блог компании RUVDS.comНаучно-популярноеФизика

Мнение

Вселенная, даже наблюдаемая нами её часть, непредставимо огромна. В ней существуют триллионы галактик, разбросанных в пространстве несколько десятков миллиардов световых лет в поперечнике. Дальше, за пределами наблюдаемого нами космического горизонта, Вселенная, конечно, ещё больше: ещё больше галактик, ещё больше звёзд, ещё больше планет, возможно, даже бесконечное их число. Но существует также очень большое, возможно, даже бесконечное число возможных квантовых исходов, которые могут произойти в пределах Вселенной. Может ли существовать достаточно галактик, звёзд и «копий» известных нам объектов, чтобы вместить все эти квантовые возможности?

Независимо от того, как долго вы будете считать (если только вы не Чак Норрис) или насколько большое число вы можете себе представить, оно всегда будет бесконечно далеко от «бесконечности». Ещё один из самых удивительных математических фактов заключается в том, что не все бесконечности одинаковы. Некоторые виды бесконечности действительно больше других: как будто они каким-то образом являются большей степенью «бесконечности», чем другие бесконечности. Давайте для начала разберёмся в бесконечностях, а затем перейдём к мультивселенной и понятию бесконечного числа параллельных вселенных.

Читать дальше →

+39

FaulerAffe 17 июл 2023 в 15:03

Создание анимированных графиков с помощью Matlab

Простой

6 мин

5.7K

Программирование*Matlab*

Туториал

Анимированные графики помогают представить информацию более красиво и наглядно. Matlab позволяет их создавать с помощью всего пары функций. Как это сделать, читайте в данной статье.

+25

Albert_Wesker 6 июн 2023 в 11:01

Есть проблемы гораздо сложнее, чем NP-Complete

Средний

8 мин

10K

Информационная безопасность*Криптография*Алгоритмы*Блог компании Timeweb CloudМатематика*

Обзор

Люди часто сравнивают P и NP в таком духе, что проблемы P простые, а NP — сложные. Но это чрезмерное упрощение. На самом деле проблемы могут быть намного, намного сложнее, чем NP.

В этом смысле можно вспомнить интеллектуально-фантастический триллер Travelling Salesman (Коммивояжёр, 2012) о четырёх математиках, нанятых правительством США для решения самой сложной проблемы в истории информатики — равенства классов сложности P и NP (P versus NP problem). И им это удалось. Чиновник министерства обороны США предлагает за их алгоритм вознаграждение $10 млн. Но сами математики слишком хорошо понимают, какие разрушительные последствия принесёт в мир их открытие. Один из лучших фильмов про математику в истории кинематографа…

Читать дальше →

+42

VladGoryachev 27 мая 2023 в 16:19

О вычислительной природе реальности

15 мин

23K

Читальный залНаучно-популярноеФизикаНаучная фантастикаКвантовые технологии

Мнение

Из песочницы

Я объясняю экспериментальные результаты проверки теоремы Белла супердетерминизмом. Далее я показываю, как такая Вселенная может возникнуть и быть совместимой с субъективным опытом свободы воли.

+67

307

SLY_G 23 мая 2023 в 12:57

Откуда у планет берутся кольца

Средний

8 мин

4.4K

Научно-популярноеАстрономия

Более 400 лет назад — в 1610 году — человечество впервые увидело кольца у планеты. Наблюдая за Сатурном в свой примитивный телескоп, Галилео Галилей заметил, что с обеих сторон его планетарного диска имеются выступы, которые он назвал «ушами». К середине XVII века другие астрономы, такие как Христиан Гюйгенс, пошли дальше и заметили разрыв, отделяющий эти выступы от самой планеты: оказалось, что Сатурн был окружён гигантским кольцом. С тех пор мы обнаружили в этой системе колец разрывы, спутники и минилуны. Более того, оказалось, что Сатурн — не единственный мир, обладающий кольцами.

Теперь мы знаем, что кольца есть у всех газовых гигантов нашей Солнечной системы: есть они у Юпитера, Урана и Нептуна, но они гораздо менее значительны и массивны, чем кольца Сатурна. Мы также узнали, что кольца Сатурна испаряются и, вероятно, уже через 50-200 миллионов лет станут не более заметными, чем кольца Юпитера. Кроме того, по крайней мере, два внешних объекта Солнечной системы — кентавр Хирон и объект пояса Койпера Квавар — обладают кольцами, а для нескольких известных экзопланет у нас есть свидетельства возможности наличия у них колец.

Читать дальше →

+21

andreybrylb 9 апр 2023 в 04:35

Удивительные кубы Хинтона, которые позволяют каждому увидеть четырехмерный мир

Простой

5 мин

17K

Математика*Биографии гиков

Сегодня я хочу рассказать Вам о замечательном популяризаторе математики Чарльзе Говарде Хинтоне - человеке, внесшем просто огромный вклад в дело изучения объектов четырехмерного мира.

+33

Erwinmal 25 мар 2023 в 13:00

Самые криповые случаи с ИИ: что пугает в нейросетях? Часть 1

Простой

11 мин

37K

Блог компании RUVDS.comЧитальный залНаучно-популярноеИскусственный интеллектБудущее здесь

Нейросети переживают настоящий бум, восторгающий одних и вызывающий опасения у других. Их стремительный прогресс делает будущее труднопредсказуемым — человечество в очередной раз создало технологию, которая может изменить очень многое за довольно-таки небольшой срок.

Каким окажется будущее уже через 5–10 лет благодаря повсеместному внедрению нейросетей — вряд ли сможет предсказать даже самый мудрый футуролог и прогнозист: скорее всего, влияние будет обширным, крайне разнообразным и очень комплексным. Достаточно сказать, что нейросети уже есть, а буквально напрашивающегося жанра нейропанка всё ещё почти что нет. Прогресс, ещё недавно казавшийся притормозившим, снова опережает фантазии — как уже не раз бывало в истории человечества.

Читать дальше →

+53

OlegSivchenko 2 мар 2023 в 22:05

Реликтовое излучение и кривизна Вселенной

9 мин

14K

Научно-популярноеФизикаАстрономия

В конце февраля 2023 года уважаемый @SLY_G опубликовал очень интересную статью, в которой обобщил некоторые нестыковки в современной фундаментальной модели Вселенной. В особенности меня заинтересовало, что, по приведённым в статье данным, не удаётся согласовать те значения скорости расширения Вселенной, которые получаются при измерениях с учётом космологической постоянной и с учётом объективного расстояния до стандартных свеч. Я обратил внимание на следующую аномалию: данные, полученные в 2001 году от космического телескопа WMAP (телескоп составлял подробную карту реликтового излучения) свидетельствовали, что реликтовый микроволновый фон не полностью изотропен, то есть, что Вселенная в инфляционную эпоху расширялась не вполне равномерно. Некоторые участки Вселенной явно «теплее» других на несколько милликельвинов – эту знаменитую тепловую карту я поставил под катом. Со временем факты в пользу такой аномалии продолжали накапливаться, пока не были в 2013 году убедительно подтверждены по наблюдениям космического телескопа «Планк», запущенного Европейским космическим агентством в 2009 году. В 2018 году группа учёных под руководством Джозефа Силка из Манчестерского университета закончила многолетний анализ данных «Планка», и по результатам этой работы было с 99%-й вероятностью установлено, что Вселенная не плоская, а обладает кривизной. Давайте рассмотрим, какие изменения в картине мира возникнут, если Вселенная не просто немного изогнута, а обладает седловидной, шарообразной или более экзотической формой.

+57

samsergey 24 фев 2023 в 04:07

Математическая продлёнка. Про углы и тригонометрию

Средний

17 мин

19K

Математика*Научно-популярное

Продолжаю знакомить вас с наработками к занятиям математического кружка. В этой статье собраны два сюжета, связанные друг с другом одной темой: математика углов и тригонометрия. Каким образом обосновываются угловые меры? Какие из них для чего более пригодны? Почему значения тригонометрических функций от рациональных долей окружности почти все иррациональны и, наоборот, почему в рациональной тригонометрии только восемь рациональных углов и те, по большей части тривиальны? Материал рассчитан на школьников, но он приоткрывает двери в большую математику, поэтому здесь появятся элементы теории чисел, теории алгебраических полей и полиномы Чебышёва.

+88

Ryazantseff 26 янв 2023 в 18:35

GitLab выкатил версию 15.8. Рассказываем, что нового

3 мин

11K

Git*Блог компании AGIMAGitHub*

Обзор

Привет! Я Максим Рязанцев, DevOps-специалист в AGIMA. На днях GitLab выкатил новую версию — версию 15.8. Мы с коллегами внимательно ее изучили, разобрались, что нового. И теперь решили поделиться списком улучшений. Тем более, что список внушительный. Правда, самые заметные изменения в касаются только облачной Ultimate-версии. Но мы-то знает, что со временем фичи с облака мигрируют в Self-Managed-версию. Так что коротко расскажем обо всех новинках.

+37

stalkermustang 26 янв 2023 в 11:55

ChatGPT как инструмент для поиска: решаем основную проблему

40 мин

115K

Python*Машинное обучение*Блог компании Open Data ScienceNatural Language Processing*

Обзор

Вышедшая чуть больше месяца назад ChatGPT уже успела нашуметь: школьникам в Нью-Йорке запрещают использовать нейросеть в качестве помощника, её же ответы теперь не принимаются на StackOverflow, а Microsoft планирует интеграцию в поисковик Bing - чем, кстати, безумно обеспокоен СЕО Alphabet (Google) Сундар Пичаи. Настолько обеспокоен, что в своём письме-обращении к сотрудникам объявляет "Code Red" ситуацию. В то же время Сэм Альтман, CEO OpenAI - компании, разработавшей эту модель - заявляет, что полагаться на ответы ChatGPT пока не стоит.

Насколько мы действительно близки к внедрению продвинутых чат-ботов в поисковые системы, как может выглядеть новый интерфейс взаимодействия, и какие основные проблемы есть на пути интеграции? Могут ли модели сёрфить интернет бок о бок с традиционными поисковиками? На эти и многие другие вопросы постараемся ответить под катом.

Погрузиться с головой →

+96

nick1612 20 июл 2021 в 01:21

О теореме Абеля-Руффини без групп и теории Галуа

10 мин

12K

Математика*

Из песочницы

Поиск решения алгебраических уравнений оказал колоссальное влияние на развитие математики. Формула решения общего кубического уравнения впервые была получена итальянскими математиками 16-го века. Это событие ставшее первопричиной рассмотрения комплексных чисел, считается одним из поворотных моментов в истории математики. Судьбы Джероламо Кардано, Никколо Тартальи, Сципиона дель Ферро и их поисков решения кубического уравнения заслуживают отдельного романа со своими интригами, скандалами и расследованиями. Столь яркие истории достаточно редки в математике.

Начиная с 19-го века поиск формул для решения уравнений произвольных степеней положил начало теории групп и абстрактной алгебре, которые преобразили практически все разделы современной математики. Думаю, многие, кто интересовался историей и развитием алгебры, знают, что формулы для решения общего алгебраического уравнения степени выше четвертой не существует. Как сообщается, первое доказательство этого факта было дано итальянским математиком Паоло Руффини в самом конце восемнадцатого века, оно составляло около 500 страниц и все же содержало некоторые пробелы. Хотя отдельные математики, как Огюстен Коши, и признавали данное доказательство, но ввиду столь большого объема и сложности изложения, оно так и не было принято математическим сообществом. Считается, что первое полное доказательство дано норвежским математиком Нильсом Абелем и содержалось в двух работах, изданных в 1824 и 1826 годах. С тех пор оно носит название теоремы Абеля или теоремы Абеля-Руффини.

+32