То, что описал автор - самые типовые примеры использования экселя "офисным планктоном": от бухгалтеров в школах до консалтеров и инвестбанкиров. Описанная проблема с разделителем встречается повсеместно. Похожие задачи часто можно встретить на собеседованиях на такие должности - нужны люди, которые могут быстро работать с экселем.
А если на филолога? Или химика? А если вообще плюнет на это ваше образование и станет тату-мастером? Давайте вводить всем обязательный мастер-класс по татуированию!
А если серьезно, то тот, кто хочет сменить специальность, пусть сам изучает недостающие дисциплины в свободное время.
Про философию. В российских вузах философия - это тупая зубрежка лекций, которые за 1 семестр успевают пробежать от античной философии (кому она вообще нужна?) до середины 20 века. Понятно, что ни о какой глубине тут и речи быть не может. А тем временем, студентам естественно-научных специальностей было бы весьма полезно изучить философские начала научного метода. Чтобы потом всякие Фоменки и прочие Петрики не появлялись.
Перестроиться достаточно легко: выделить набор обязательных для всех базовых курсов, составляющих core competencies, а остальные курсы сделать по выбору, снабдив при этом каждый списком зависимостей.
Не обязан проводить весь процесс сразу, можно постепенно вводить курсы по выбору на старших курсах, постепенно понимая, что оставить в базовом наборе, а что нет.
Т.е. центробанк дает распоряжение, что вот у нас растущая экономика и нужны деньги в системе — можете выдавать кредитов в нац валюте больше, чем у вас реально на депозитах лежит.
Вы что-то не так поняли. Никто не выдает кредитов больше, чем есть депозитов. Наоборот, процент обязательного резервирования заставляет банки хранить часть депозитов на специальных счетах ЦБ, что приводит к снижению объема выданых крелитов — по сути регулируя доступное банку "плечо".
Да, в социальных (и не только) науках манипулировать статистикой очень просто. Поэтому в серьезных эмпирических статьях по экономике, добрая половина работы может быть посвящена доказательству отсутствия эндогенности в используемых регрессиях, попыткам опровергнуть свои собственные выводы.
Очень просто ошибиться в выводе причинно-следственной связи из данных, даже если тщательно пытаешься этого избежать.
Вы текст до конца читали? Специально для вас копирую:
>«Команда Yandex Go никогда не отрицала, что алгоритмы сервиса могут использовать российские сервера наряду с финским дата-центром. Данные пользователей Латвии хранятся в строгом соответствии с нормами ЕС и GDPR — регламентом, который создавал и принимал ЕС, включая Латвию», — сообщили в «Яндекс.Такси».
Понятно, что решение политическое и никакого отношения к защите персональных данных не имеет.
Не поверите, но злобные "традиционные" брокеры тоже иногда платят процент на остатки, вот только:
1) Они не называют это депозитом
2) Требуют залог из ликвидных инструментов для покрытия маржинальной торговли, чтобы при реализации риска было чем возвращать деньги
Если он зарабатывает 5-10, то биржа возьмет все 30 или даже сотни процентов отдавая ликвидность маржинальным трейдерам.
Разве такой титанический спред не указывает на проблемы с ценообразованием ликвидности на крипто-рынке?) Или они таким образом решают проблему отсутствия разнообразия активов на крипто-рынке, что приводит к невозможности формирования адекватного залога?
Не бывает бесплатного сыра. Если ставка "депозита" 5-10% в "долларах", значит либо что-то не так с этими "долларами", либо с биржами, которые это предлагают. Даже высокорискованные бонды компаний с рейтингом ниже инвестиционного сейчас торгуются около 6%. Но поскольку "депозит" не является свободно торгуемым инструментом, то реальный риск "депозита" значительно выше, чем риск самого рискованного корпоративного бонда.
Конечно ниже рынка. Если государство стало единственным работодателем, то оно может ставить какие угодно зарплаты. Хороший специалист к ним все равно не пойдет, так что они ничего не теряют. Заодно всех выпускников онлайн курсов устроят на работу, хоть и не ту, о которой они мечтали.
Это чрезвычайно мизерный процент доходов бюджета по сравнению с нефтегазом и основной массой населения. Тем более, что на военку деньги всегда найдутся - как в анекдоте про "ты будешь меньше есть".
Я бы разделил data science позиции на две большие области:
1) Область, где продуктом является модель сама по себе — системы машинного зрения, распознавания речи, и т.д. и т.п. В этой области хорошо понятна решаемая задача и данные, которые нужны для ее решения, и data scientist не занимается формулировкой задачи и поиском фичей. Здесь нужны специалисты по нейросетям, которые прочитают свежую статью и смогут воплотить ее в продакшене, чтобы она работала с требуемой скоростью. Можно сказать, что это более техническая область.
2) Область, где модель используется как часть бизнес-процесса — рекомендательные системы, динамическое ценообразование, прогнозирование спроса, тестирование гипотез и т.д. и т.п. В этой области, зачастую data scientist должен вместе с бизнесом придумать, что именно будет моделироваться, как модель будет применяться, какие фичи можно использовать для модели. Также требуется лучшее знание классической статистики и эконометрики. Это более креативная область, где требуется понимание бизнеса и "реальной жизни", понимание ограничений возможностей data science моделей.
Думаю, что математику ближе будет первая область, а физику — вторая.
Я так понимаю, это какой-то набор компаний, акции которых дают (условно) гарантированный нерисковый доход
Нет, S&P500 не дает "нерисковой" доход. Он лишь является способом более-менее избавиться от риска индивидуальных компаний, но не защищает от общерыночного риска.
Публичны ли данные о том, сколько процентов в какую компанию нужно вкладывать согласно этим S&P
Да, методика расчета весов компаний публична.
И если публичны, могли ли вы просто вложиться за эти 10 лет в подобные акции по такому раскладу и получить, скажем, 5-10% в долларах или же что-то помешает?
Для самостоятельной репликации s&p500 потребуется портфель порядка 10 млн. долларов, что явно слишком много для среднего инвестора) А все потому, что акции продаются в штуках, и для более менее точной репликации весов придется покупать как минимум одну акцию каждой компании. А ещё придется каждый день делать ребалансировки из-за изменения весов, а это дополнительные потери и комиссии. Поэтому для среднего есть индексные etf фонды, которые реплицируют snp500 как можно точнее. К сожалению, в России средний инвестор может покупать лишь российские фонды, которые берут комиссию 1-2% годовых, тогда как американские работают за 0.1%.
Мне кажется у вас какое-то неправильное представление о студентах-экономистах. Например, в МГУ они сдают вступительный по математике, и матан им преподают по тем же учебникам, что на физфаке МГУ. А уж курсы теорвера, матстатистики и эконометрики дают студентам-экономистам гораздо лучшее представление о data science, чем курсы УрЧП студентам-физикам и математикам. Аналогичная ситуация в ВШЭ и на других приличных экономических факультетах.
Тем более, что эконометрику чаще всего читают на одном из трех языков: Stata, R, Python. Так что на выходе многие экономисты умеют худо-бедно прочитать csv файл с правильным разделителем, провести разведочный анализ данных, создать адекватную модельку на sklearn и проинтерпретировать ее результаты. Физики-математики такое не умеют без дополнительной подготовки.
Объясните, пожалуйста, о какой "статистической погрешности" идёт речь? Если сравнивать интеллект двух групп людей, одной с набором генов А, другой с В, то дисперсия оценки среднего интеллекта будет обратно пропорциональна корню из размера выборки, а значит, при наличии должной выборки, вполне можно получить значимую разницу в среднем интеллекте.
А что есть "нормальное здоровье" в вашем понимании? Сейчас у почти любого человека старше 20 лет есть какие-либо проблемы со здоровьем: кариес, плохое зрение, проблемы с позвоночником, лишний вес, психические расстройства. И это только то, что просто диагностируется. Я думаю, и у вас найдутся отклонения от нормы при тщательной диагностике.
Более того, статья как раз рассчитана на людей, у которых есть те или иные проблемы или предрасположенности. Сводить сложное и долгое лечение к "заморачиваться всякой ерундой", советовать людям "с нормальным здоровьем" есть все подряд - это простое невежество. Люди, страдающие от лишнего веса, тоже ели "когда этого хочется", что и привело к заболеванию.
Ну если быть до конца педантичным, то вы не учитываете, что выборка с сайта = selection bias. Тем более, что данные, насколько я понимаю, self-reported, что еще добавляет смещения. Выборка не репрезентативна, а потому оценка скорее всего смещена.
А еще нам не показывают, на скольких наблюдениях была рассчитана та или иная статистика. Могли бы сделать box plot с облаком точек, уже гораздо более информативно было бы.
То, что описал автор - самые типовые примеры использования экселя "офисным планктоном": от бухгалтеров в школах до консалтеров и инвестбанкиров. Описанная проблема с разделителем встречается повсеместно. Похожие задачи часто можно встретить на собеседованиях на такие должности - нужны люди, которые могут быстро работать с экселем.
А если на филолога? Или химика? А если вообще плюнет на это ваше образование и станет тату-мастером? Давайте вводить всем обязательный мастер-класс по татуированию!
А если серьезно, то тот, кто хочет сменить специальность, пусть сам изучает недостающие дисциплины в свободное время.
Про философию. В российских вузах философия - это тупая зубрежка лекций, которые за 1 семестр успевают пробежать от античной философии (кому она вообще нужна?) до середины 20 века. Понятно, что ни о какой глубине тут и речи быть не может. А тем временем, студентам естественно-научных специальностей было бы весьма полезно изучить философские начала научного метода. Чтобы потом всякие Фоменки и прочие Петрики не появлялись.
Перестроиться достаточно легко: выделить набор обязательных для всех базовых курсов, составляющих core competencies, а остальные курсы сделать по выбору, снабдив при этом каждый списком зависимостей.
Не обязан проводить весь процесс сразу, можно постепенно вводить курсы по выбору на старших курсах, постепенно понимая, что оставить в базовом наборе, а что нет.
Интересно, зачем тратятся усилия на модули, которые никто никогда не будет использовать, типа graphlib и statistics?
Вы что-то не так поняли. Никто не выдает кредитов больше, чем есть депозитов. Наоборот, процент обязательного резервирования заставляет банки хранить часть депозитов на специальных счетах ЦБ, что приводит к снижению объема выданых крелитов — по сути регулируя доступное банку "плечо".
Да, в социальных (и не только) науках манипулировать статистикой очень просто. Поэтому в серьезных эмпирических статьях по экономике, добрая половина работы может быть посвящена доказательству отсутствия эндогенности в используемых регрессиях, попыткам опровергнуть свои собственные выводы.
Очень просто ошибиться в выводе причинно-следственной связи из данных, даже если тщательно пытаешься этого избежать.
Вы текст до конца читали? Специально для вас копирую:
>«Команда Yandex Go никогда не отрицала, что алгоритмы сервиса могут использовать российские сервера наряду с финским дата-центром. Данные пользователей Латвии хранятся в строгом соответствии с нормами ЕС и GDPR — регламентом, который создавал и принимал ЕС, включая Латвию», — сообщили в «Яндекс.Такси».
Понятно, что решение политическое и никакого отношения к защите персональных данных не имеет.
Не поверите, но злобные "традиционные" брокеры тоже иногда платят процент на остатки, вот только:
1) Они не называют это депозитом
2) Требуют залог из ликвидных инструментов для покрытия маржинальной торговли, чтобы при реализации риска было чем возвращать деньги
Разве такой титанический спред не указывает на проблемы с ценообразованием ликвидности на крипто-рынке?) Или они таким образом решают проблему отсутствия разнообразия активов на крипто-рынке, что приводит к невозможности формирования адекватного залога?
Почему инфляция должна влиять на депозитную ставку доллара? Ставку устанавливает ФРС декларативным способом.
Не бывает бесплатного сыра. Если ставка "депозита" 5-10% в "долларах", значит либо что-то не так с этими "долларами", либо с биржами, которые это предлагают. Даже высокорискованные бонды компаний с рейтингом ниже инвестиционного сейчас торгуются около 6%. Но поскольку "депозит" не является свободно торгуемым инструментом, то реальный риск "депозита" значительно выше, чем риск самого рискованного корпоративного бонда.
Госбанки (Сбер, ВТБ) пылесосили всех подряд большими зарплатами последние годы. Только там могли дать джуну 120-140к на старте.
Конечно ниже рынка. Если государство стало единственным работодателем, то оно может ставить какие угодно зарплаты. Хороший специалист к ним все равно не пойдет, так что они ничего не теряют. Заодно всех выпускников онлайн курсов устроят на работу, хоть и не ту, о которой они мечтали.
Это чрезвычайно мизерный процент доходов бюджета по сравнению с нефтегазом и основной массой населения. Тем более, что на военку деньги всегда найдутся - как в анекдоте про "ты будешь меньше есть".
Я бы разделил data science позиции на две большие области:
1) Область, где продуктом является модель сама по себе — системы машинного зрения, распознавания речи, и т.д. и т.п. В этой области хорошо понятна решаемая задача и данные, которые нужны для ее решения, и data scientist не занимается формулировкой задачи и поиском фичей. Здесь нужны специалисты по нейросетям, которые прочитают свежую статью и смогут воплотить ее в продакшене, чтобы она работала с требуемой скоростью. Можно сказать, что это более техническая область.
2) Область, где модель используется как часть бизнес-процесса — рекомендательные системы, динамическое ценообразование, прогнозирование спроса, тестирование гипотез и т.д. и т.п. В этой области, зачастую data scientist должен вместе с бизнесом придумать, что именно будет моделироваться, как модель будет применяться, какие фичи можно использовать для модели. Также требуется лучшее знание классической статистики и эконометрики. Это более креативная область, где требуется понимание бизнеса и "реальной жизни", понимание ограничений возможностей data science моделей.
Думаю, что математику ближе будет первая область, а физику — вторая.
Нет, S&P500 не дает "нерисковой" доход. Он лишь является способом более-менее избавиться от риска индивидуальных компаний, но не защищает от общерыночного риска.
Да, методика расчета весов компаний публична.
Для самостоятельной репликации s&p500 потребуется портфель порядка 10 млн. долларов, что явно слишком много для среднего инвестора) А все потому, что акции продаются в штуках, и для более менее точной репликации весов придется покупать как минимум одну акцию каждой компании. А ещё придется каждый день делать ребалансировки из-за изменения весов, а это дополнительные потери и комиссии. Поэтому для среднего есть индексные etf фонды, которые реплицируют snp500 как можно точнее. К сожалению, в России средний инвестор может покупать лишь российские фонды, которые берут комиссию 1-2% годовых, тогда как американские работают за 0.1%.
Мне кажется у вас какое-то неправильное представление о студентах-экономистах. Например, в МГУ они сдают вступительный по математике, и матан им преподают по тем же учебникам, что на физфаке МГУ. А уж курсы теорвера, матстатистики и эконометрики дают студентам-экономистам гораздо лучшее представление о data science, чем курсы УрЧП студентам-физикам и математикам. Аналогичная ситуация в ВШЭ и на других приличных экономических факультетах.
Тем более, что эконометрику чаще всего читают на одном из трех языков: Stata, R, Python. Так что на выходе многие экономисты умеют худо-бедно прочитать csv файл с правильным разделителем, провести разведочный анализ данных, создать адекватную модельку на sklearn и проинтерпретировать ее результаты. Физики-математики такое не умеют без дополнительной подготовки.
>7% - это в рамках статистической погрешности.
Объясните, пожалуйста, о какой "статистической погрешности" идёт речь? Если сравнивать интеллект двух групп людей, одной с набором генов А, другой с В, то дисперсия оценки среднего интеллекта будет обратно пропорциональна корню из размера выборки, а значит, при наличии должной выборки, вполне можно получить значимую разницу в среднем интеллекте.
Какой у вас замечательный организм, жаль только, что у большинства людей он работает не так, как у вас.
Кстати, странно противопоставлять потребности организма и привычки - ведь это по-сути одно и то же.
А что есть "нормальное здоровье" в вашем понимании? Сейчас у почти любого человека старше 20 лет есть какие-либо проблемы со здоровьем: кариес, плохое зрение, проблемы с позвоночником, лишний вес, психические расстройства. И это только то, что просто диагностируется. Я думаю, и у вас найдутся отклонения от нормы при тщательной диагностике.
Более того, статья как раз рассчитана на людей, у которых есть те или иные проблемы или предрасположенности. Сводить сложное и долгое лечение к "заморачиваться всякой ерундой", советовать людям "с нормальным здоровьем" есть все подряд - это простое невежество. Люди, страдающие от лишнего веса, тоже ели "когда этого хочется", что и привело к заболеванию.
Ну если быть до конца педантичным, то вы не учитываете, что выборка с сайта = selection bias. Тем более, что данные, насколько я понимаю, self-reported, что еще добавляет смещения. Выборка не репрезентативна, а потому оценка скорее всего смещена.
А еще нам не показывают, на скольких наблюдениях была рассчитана та или иная статистика. Могли бы сделать box plot с облаком точек, уже гораздо более информативно было бы.