All streams
Search
Write a publication
Pull to refresh
-3
0
Send message
Т.е. центробанк дает распоряжение, что вот у нас растущая экономика и нужны деньги в системе — можете выдавать кредитов в нац валюте больше, чем у вас реально на депозитах лежит.

Вы что-то не так поняли. Никто не выдает кредитов больше, чем есть депозитов. Наоборот, процент обязательного резервирования заставляет банки хранить часть депозитов на специальных счетах ЦБ, что приводит к снижению объема выданых крелитов — по сути регулируя доступное банку "плечо".

Да, в социальных (и не только) науках манипулировать статистикой очень просто. Поэтому в серьезных эмпирических статьях по экономике, добрая половина работы может быть посвящена доказательству отсутствия эндогенности в используемых регрессиях, попыткам опровергнуть свои собственные выводы.

Очень просто ошибиться в выводе причинно-следственной связи из данных, даже если тщательно пытаешься этого избежать.

Вы текст до конца читали? Специально для вас копирую:

>«Команда Yandex Go никогда не отрицала, что алгоритмы сервиса могут использовать российские сервера наряду с финским дата-центром. Данные пользователей Латвии хранятся в строгом соответствии с нормами ЕС и GDPR — регламентом, который создавал и принимал ЕС, включая Латвию», — сообщили в «Яндекс.Такси».

Понятно, что решение политическое и никакого отношения к защите персональных данных не имеет.

Не поверите, но злобные "традиционные" брокеры тоже иногда платят процент на остатки, вот только:


1) Они не называют это депозитом


2) Требуют залог из ликвидных инструментов для покрытия маржинальной торговли, чтобы при реализации риска было чем возвращать деньги


Если он зарабатывает 5-10, то биржа возьмет все 30 или даже сотни процентов отдавая ликвидность маржинальным трейдерам.

Разве такой титанический спред не указывает на проблемы с ценообразованием ликвидности на крипто-рынке?) Или они таким образом решают проблему отсутствия разнообразия активов на крипто-рынке, что приводит к невозможности формирования адекватного залога?

Почему инфляция должна влиять на депозитную ставку доллара? Ставку устанавливает ФРС декларативным способом.

Не бывает бесплатного сыра. Если ставка "депозита" 5-10% в "долларах", значит либо что-то не так с этими "долларами", либо с биржами, которые это предлагают. Даже высокорискованные бонды компаний с рейтингом ниже инвестиционного сейчас торгуются около 6%. Но поскольку "депозит" не является свободно торгуемым инструментом, то реальный риск "депозита" значительно выше, чем риск самого рискованного корпоративного бонда.

Госбанки (Сбер, ВТБ) пылесосили всех подряд большими зарплатами последние годы. Только там могли дать джуну 120-140к на старте.

Конечно ниже рынка. Если государство стало единственным работодателем, то оно может ставить какие угодно зарплаты. Хороший специалист к ним все равно не пойдет, так что они ничего не теряют. Заодно всех выпускников онлайн курсов устроят на работу, хоть и не ту, о которой они мечтали.

Это чрезвычайно мизерный процент доходов бюджета по сравнению с нефтегазом и основной массой населения. Тем более, что на военку деньги всегда найдутся - как в анекдоте про "ты будешь меньше есть".

Я бы разделил data science позиции на две большие области:


1) Область, где продуктом является модель сама по себе — системы машинного зрения, распознавания речи, и т.д. и т.п. В этой области хорошо понятна решаемая задача и данные, которые нужны для ее решения, и data scientist не занимается формулировкой задачи и поиском фичей. Здесь нужны специалисты по нейросетям, которые прочитают свежую статью и смогут воплотить ее в продакшене, чтобы она работала с требуемой скоростью. Можно сказать, что это более техническая область.


2) Область, где модель используется как часть бизнес-процесса — рекомендательные системы, динамическое ценообразование, прогнозирование спроса, тестирование гипотез и т.д. и т.п. В этой области, зачастую data scientist должен вместе с бизнесом придумать, что именно будет моделироваться, как модель будет применяться, какие фичи можно использовать для модели. Также требуется лучшее знание классической статистики и эконометрики. Это более креативная область, где требуется понимание бизнеса и "реальной жизни", понимание ограничений возможностей data science моделей.


Думаю, что математику ближе будет первая область, а физику — вторая.

Я так понимаю, это какой-то набор компаний, акции которых дают (условно) гарантированный нерисковый доход

Нет, S&P500 не дает "нерисковой" доход. Он лишь является способом более-менее избавиться от риска индивидуальных компаний, но не защищает от общерыночного риска.


Публичны ли данные о том, сколько процентов в какую компанию нужно вкладывать согласно этим S&P

Да, методика расчета весов компаний публична.


И если публичны, могли ли вы просто вложиться за эти 10 лет в подобные акции по такому раскладу и получить, скажем, 5-10% в долларах или же что-то помешает?

Для самостоятельной репликации s&p500 потребуется портфель порядка 10 млн. долларов, что явно слишком много для среднего инвестора) А все потому, что акции продаются в штуках, и для более менее точной репликации весов придется покупать как минимум одну акцию каждой компании. А ещё придется каждый день делать ребалансировки из-за изменения весов, а это дополнительные потери и комиссии. Поэтому для среднего есть индексные etf фонды, которые реплицируют snp500 как можно точнее. К сожалению, в России средний инвестор может покупать лишь российские фонды, которые берут комиссию 1-2% годовых, тогда как американские работают за 0.1%.

Мне кажется у вас какое-то неправильное представление о студентах-экономистах. Например, в МГУ они сдают вступительный по математике, и матан им преподают по тем же учебникам, что на физфаке МГУ. А уж курсы теорвера, матстатистики и эконометрики дают студентам-экономистам гораздо лучшее представление о data science, чем курсы УрЧП студентам-физикам и математикам. Аналогичная ситуация в ВШЭ и на других приличных экономических факультетах.


Тем более, что эконометрику чаще всего читают на одном из трех языков: Stata, R, Python. Так что на выходе многие экономисты умеют худо-бедно прочитать csv файл с правильным разделителем, провести разведочный анализ данных, создать адекватную модельку на sklearn и проинтерпретировать ее результаты. Физики-математики такое не умеют без дополнительной подготовки.

>7% - это в рамках статистической погрешности.

Объясните, пожалуйста, о какой "статистической погрешности" идёт речь? Если сравнивать интеллект двух групп людей, одной с набором генов А, другой с В, то дисперсия оценки среднего интеллекта будет обратно пропорциональна корню из размера выборки, а значит, при наличии должной выборки, вполне можно получить значимую разницу в среднем интеллекте.

Какой у вас замечательный организм, жаль только, что у большинства людей он работает не так, как у вас.

Кстати, странно противопоставлять потребности организма и привычки - ведь это по-сути одно и то же.

А что есть "нормальное здоровье" в вашем понимании? Сейчас у почти любого человека старше 20 лет есть какие-либо проблемы со здоровьем: кариес, плохое зрение, проблемы с позвоночником, лишний вес, психические расстройства. И это только то, что просто диагностируется. Я думаю, и у вас найдутся отклонения от нормы при тщательной диагностике.

Более того, статья как раз рассчитана на людей, у которых есть те или иные проблемы или предрасположенности. Сводить сложное и долгое лечение к "заморачиваться всякой ерундой", советовать людям "с нормальным здоровьем" есть все подряд - это простое невежество. Люди, страдающие от лишнего веса, тоже ели "когда этого хочется", что и привело к заболеванию.

Ну если быть до конца педантичным, то вы не учитываете, что выборка с сайта = selection bias. Тем более, что данные, насколько я понимаю, self-reported, что еще добавляет смещения. Выборка не репрезентативна, а потому оценка скорее всего смещена.


А еще нам не показывают, на скольких наблюдениях была рассчитана та или иная статистика. Могли бы сделать box plot с облаком точек, уже гораздо более информативно было бы.

Далеко не все STEM факультеты обучают матстатистике — например, на типичном физфаке или мехмате ее вообще может не быть в программе, как отдельного курса. Теоретикам она не нужна, экспериментаторам обычно достаточно линейной регрессии с одной переменной. Все-таки в STEM данные как правило гораздо менее шумные, чем в бизнес-задачах.


Так что экономистам, на самом деле, бывает очень хорошо в data science — если работа связана с анализом экономических данных: продажи, время проведенное на сайте и т.д. и т.п. Экономисты привыкли видеть живого человека за данными и хорошо понимают, почему модель, дающая точность в 99%, может быть неприменима на практике.


С текущим набором готовых библиотек, где руками надо только грамотно собрать пайплайн, я бы сказал, что узким местом в работе дата саентиста является именно плохое понимание пределов возможностей моделей, вытекающее в том числе из плохого понимания классической эконометрики.

К сожалению, большая часть дата саентистов ничего не слышало про эконометрику, и имеет посредственные представления о мат статистике.


Складывается впечатление, что на курсах/в универе преподают весьма ограниченный набор заученных моделей-рецептов на типовые задачи, но почти ничего не говорят про практику применения этих моделей в принятии решений в бизнесе.

А кто им мешает объединяться и проверять подобные уязвимости сообща?

Равновесие "объединиться и проверять уязвимости сообща" неустойчиво: каждой отдельной компании выгодно выйти из такого объединения и бесплатно пожинать его плоды (ведь ПО — свободное!). Поэтому такого не будет никогда, в текущей модели свободного ПО.


Как сделать это равновесие устойчивым? Надо как-то компенсировать компаниям участие в таком объединении. Например, фонды открытого ПО могут сделать программу bug bounty, и платить любому, кто сообщит о баге (а лучше — сразу предложит решение). Сейчас, насколько я понимаю, фонды платят только постоянным мейнтейнерам.

Можно ускорить еще почти в два раза, просто поставив декоратор numba.njit:


import numpy as np
from numba import njit

def sqrt_dist(n):
    theta = np.random.rand(n) * 2 * np.pi
    r = np.sqrt(np.random.rand(n))
    return r * np.cos(theta), r * np.sin(theta)

@njit
def sqrt_dist_nb(n):
    theta = np.random.rand(n) * 2 * np.pi
    r = np.sqrt(np.random.rand(n))
    return r * np.cos(theta), r * np.sin(theta)

 %timeit x, y = sqrt_dist(3141592)
170 ms ± 1.21 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit x, y = sqrt_dist_nb(3141592)
91.4 ms ± 715 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

Information

Rating
Does not participate
Registered
Activity