есть такой сайт - print-forum где сидели полиграфисты, так вот там есть один старожил - KalPak с историей 1-в-1 - приехал с женой в Москву в 18-19 лет, год отработали в РА (рекламное агентство), потом открыли своё РА, потом типографию (только у него не наружка, а календари + упаковка)
кажется что в определённый период (20 лет назад) это была типовая история +-
тут смысл помимо прямой покупки (которую почти все отрицают т.к. реклама мешает-раздражает) есть фактор скажем так "подсознания"
когда потребуется купить (условно) пылесос - листая страницу с пылесосами из мозга будет всплывать мутная информация "О, фирма Копыторогие, я о них где-то слышал, наверное им можно доверять раз я о них знаю"
1) Доктор экономических наук И. В. Липсиц сказал - ИТ это ветвь пост-индустриальной экономики (услуги), а если в РФ идёт возврат к индустриальной экономике (или даже ДОиндустриальной из-за санкций и проблем с доступом к высокотехнологичному оборудованию) то и ИТ будет стагнировать\входить в рецессию, что мы и видим на графиках ТС
2) МВидео проигрывает конкуренцию маркетплейсам, показывает убытки, сама компания в целом начинает по-тихоньку избавляться от магазинов\сотрудников, а не конкретно от ИТ-специалистов
3) Когда работал в консалтинге мне в компании-заказчике сказали что они платят консалтингу х3 от моей зарплаты, поэтому разогнать свой штат и набрать аут-стафферов выглядит очень сомнительной экономией (максимум на краткосрочном периоде)
тут вероятно вопрос в том, как подсчитывают эту самую аудиторию, грубо говоря если изменить подсчет с
SELECT COUNT (*) на SELECT COUNT DISTINCT (user_id) HAVING SUM(spent_time) > 100 -- минут например
то можно получить кратное падение аудитории. Условно на каком-нибудь сайте встроено видео с рутуба с автопроизведением (пикабу?) - вот и лишний просмотр от аноним_ххххх =)
А на КПК (wm2003-2005) такого нет? Боюсь уже не найду старый винт, а там были и PocketMiniGolf, PocketHeroes, TheQuest, аналог демиургов (забыл название), эх, вот где мобильные игры делали))
ну т.е. просто через API данные забираются в облако, там некое "Yandex Query" (в статье не описано или я не увидел?) собирает DataMart который визуализируется в одном из вариантов бесплатных BI:
source -> Airflow -> DWH -> DataMart -> BI
кажется что это стандартный процесс..
ps. у Вас все DAG'и красные, обработки ошибок загрузки нет что-ли? а если один из DAG'ов сломается то визуально через Airflow UI это не понятно..
1) происходит глушение частоты на которой работает радио-брелок машины 2) параллельно идёт чтение радио-сигнала с брелка 3) владелец нажимает кнопку открытия ещё раз 4) злоумышленник отправляет считанный сигнал, а повторный сигнал сохраняет (+глушит) 5) когда владелец ушёл машину можно открыть последим сохранённым сигналом
в брелках применяется технология Rolling Code, там что-то наподобие (id_брелка + super_unique_car_password++) * Pi % 9973, т.е. каждый раз код для открытия разный, одним и тем же кодом открыть машину подряд нельзя (брелок сразу заблокируется) + сам код зашифрован неким секретным ключом, т.е. вполне себе секьюрно, тут получается проблема mitm?
особенно хорошо когда в вакансии указано Data Engineer (условно перекладыватель json'ов через Airflow из системы в систему), а технарь задает вопросы на Backend Massive Parallel Processing Developer'а (кого судя по всему и ищут), о чём догадаться по описанию вакансии невозможно
Согласен, а так же сейф, стол, стул, оргтехника, сигнализация и тд.
Просто от этого абзаца ("вложил последние деньги.. на счету осталось всего..") за километр пахнет инфоцыганщиной, непонятен переход от "еле-еле накопил 600к за 4 года" до "зарабатываю в год 27 млн" (это 340*0.08, интересно сумма уже после налогов, аренды и тд)?
Там ещё есть маркеры инфоцыганства (после учебы сразу без опыта в бизнес, акцент какие мы хорошие и качественные, не то что другие, сомнительный тезис о развития бизнеса в сегменте ремонта китайских машин (хотя абзацем ранее пишут что они без документации, сложности с ремонтом и вообще сегмент проблемный)), но они не так ярко выражены.
>> К 2016 году возможностей ИП перестало хватать... Вложил последние деньги в открытие ООО и все разрешения. На расчетном счету новой компании оставалось всего 50 тысяч рублей...
Вторая ссылка в яндексе по запросу "лицензия фсб на тахографы цена":
Стоимость лицензии на установку и активацию тахографов: 365 000 рублей. Стоимость лицензии на продажу тахографов и карт тахографов: 205 000 рублей.
Открыть ООО стоит (тоже по первым ссылкам из поиска) ну допустим 10 000 рублей.
Получается за 4 года накопить ~600 000 рублей в таком бизнесе очень тяжело, это точно прибыльное занятие?
смотрел вчера (2025-01-20) на Хабр-Карьере зарплату Junior Data Engineer - там была вилка 91-150к
это я к тому что стоит делить джунов по специальностям) а не "среднюю по больнице" (хотя в статье как раз про неё и речь, видимо сделали SELECT min(salary), max(salary) ... where grade = 'junior')))
у меня были адреса аптек по всей РФ, даже в сельской местности они почти всегда были, процент ненахода (где адрес только населённый пункт - условно "посёлок Заброшенный") сейчас уже оценить не смогу, но он был крайне мал, на 20к+ адресов адресов без улицы\дома (только населённый пункт) было меньше 100, т.е. приблизительно 0.5%
PS/ были адреса только населённый пункт + улица, количество не помню, пусть будет штук 200, довольно много было без точного корпуса (не "д. 14к2", а просто "д. 14"), ориентировочно штук 500 - итого примерно 0.5% + 1% + 2.5% = 4% без точного адреса
решал подобную задачу через гео-апи Яндекса (раньше в день было 10к бесплатных запросов, как сейчас - не знаю), в ответе приходит скорректированный адрес + точность распознавания (точный, до улицы, населенный пункт, не распознан)
так же были какие-то бесплатные geo-api, но там наполненность данных по РФ сильно ниже
PS. у вас данные на вход нормальные, для Яндекса кварталы и ул. чистить не надо, а я чистил откровенный мусор наподобие "пом.1-4, 24, 25, 26, 29" (помещение), "кв. 1э" (квартира) и тд. который принимался за номер дома/строение
есть такой сайт - print-forum где сидели полиграфисты, так вот там есть один старожил - KalPak с историей 1-в-1 - приехал с женой в Москву в 18-19 лет, год отработали в РА (рекламное агентство), потом открыли своё РА, потом типографию (только у него не наружка, а календари + упаковка)
кажется что в определённый период (20 лет назад) это была типовая история +-
тут смысл помимо прямой покупки (которую почти все отрицают т.к. реклама мешает-раздражает) есть фактор скажем так "подсознания"
когда потребуется купить (условно) пылесос - листая страницу с пылесосами из мозга будет всплывать мутная информация "О, фирма Копыторогие, я о них где-то слышал, наверное им можно доверять раз я о них знаю"
Много странных тезисов.
1) Доктор экономических наук И. В. Липсиц сказал - ИТ это ветвь пост-индустриальной экономики (услуги), а если в РФ идёт возврат к индустриальной экономике (или даже ДОиндустриальной из-за санкций и проблем с доступом к высокотехнологичному оборудованию) то и ИТ будет стагнировать\входить в рецессию, что мы и видим на графиках ТС
2) МВидео проигрывает конкуренцию маркетплейсам, показывает убытки, сама компания в целом начинает по-тихоньку избавляться от магазинов\сотрудников, а не конкретно от ИТ-специалистов
3) Когда работал в консалтинге мне в компании-заказчике сказали что они платят консалтингу х3 от моей зарплаты, поэтому разогнать свой штат и набрать аут-стафферов выглядит очень сомнительной экономией (максимум на краткосрочном периоде)
тут вероятно вопрос в том, как подсчитывают эту самую аудиторию, грубо говоря если изменить подсчет с
SELECT COUNT (*)
на
SELECT COUNT DISTINCT (user_id)
HAVING SUM(spent_time) > 100 -- минут например
то можно получить кратное падение аудитории. Условно на каком-нибудь сайте встроено видео с рутуба с автопроизведением (пикабу?) - вот и лишний просмотр от аноним_ххххх =)
можно сделать вот так - sys.setrecursionlimit(1500)
вообще насколько я помню такое в питоне делается через кэширование:
@lru_cache(maxsize=None)
def fac():
...
и тогда последующие вызовы функции с теми же аргументами не вычисляются заного
Стали известны фотки и контакты bizibizi! Воены в отаке!
Ps. Сам не участвовал, только читал, вот это топ контент был, однако
А воены браблея в итоге победили упчк? :shocked::shocked::shocked::arrow: 36484
А на КПК (wm2003-2005) такого нет? Боюсь уже не найду старый винт, а там были и PocketMiniGolf, PocketHeroes, TheQuest, аналог демиургов (забыл название), эх, вот где мобильные игры делали))
ну т.е. просто через API данные забираются в облако, там некое "Yandex Query" (в статье не описано или я не увидел?) собирает DataMart который визуализируется в одном из вариантов бесплатных BI:
source -> Airflow -> DWH -> DataMart -> BI
кажется что это стандартный процесс..
ps. у Вас все DAG'и красные, обработки ошибок загрузки нет что-ли? а если один из DAG'ов сломается то визуально через Airflow UI это не понятно..
там насколько я понимаю схема такая:
1) происходит глушение частоты на которой работает радио-брелок машины
2) параллельно идёт чтение радио-сигнала с брелка
3) владелец нажимает кнопку открытия ещё раз
4) злоумышленник отправляет считанный сигнал, а повторный сигнал сохраняет (+глушит)
5) когда владелец ушёл машину можно открыть последим сохранённым сигналом
в брелках применяется технология Rolling Code, там что-то наподобие (id_брелка + super_unique_car_password++) * Pi % 9973, т.е. каждый раз код для открытия разный, одним и тем же кодом открыть машину подряд нельзя (брелок сразу заблокируется) + сам код зашифрован неким секретным ключом, т.е. вполне себе секьюрно, тут получается проблема mitm?
однажды не смог сходу сказать "redestribute motion", а сказал "движение данных" что послужило причиной завала экзамена в компании Т
виноватым себя за ТАКИЕ пробелы в теории не считаю)
особенно хорошо когда в вакансии указано Data Engineer (условно перекладыватель json'ов через Airflow из системы в систему), а технарь задает вопросы на Backend Massive Parallel Processing Developer'а (кого судя по всему и ищут), о чём догадаться по описанию вакансии невозможно
Согласен, а так же сейф, стол, стул, оргтехника, сигнализация и тд.
Просто от этого абзаца ("вложил последние деньги.. на счету осталось всего..") за километр пахнет инфоцыганщиной, непонятен переход от "еле-еле накопил 600к за 4 года" до "зарабатываю в год 27 млн" (это 340*0.08, интересно сумма уже после налогов, аренды и тд)?
Там ещё есть маркеры инфоцыганства (после учебы сразу без опыта в бизнес, акцент какие мы хорошие и качественные, не то что другие, сомнительный тезис о развития бизнеса в сегменте ремонта китайских машин (хотя абзацем ранее пишут что они без документации, сложности с ремонтом и вообще сегмент проблемный)), но они не так ярко выражены.
>> В том же 2012 году я открыл ИП
>> К 2016 году возможностей ИП перестало хватать... Вложил последние деньги в открытие ООО и все разрешения. На расчетном счету новой компании оставалось всего 50 тысяч рублей...
Вторая ссылка в яндексе по запросу "лицензия фсб на тахографы цена":
Стоимость лицензии на установку и активацию тахографов: 365 000 рублей.
Стоимость лицензии на продажу тахографов и карт тахографов: 205 000 рублей.
Открыть ООО стоит (тоже по первым ссылкам из поиска) ну допустим 10 000 рублей.
Получается за 4 года накопить ~600 000 рублей в таком бизнесе очень тяжело, это точно прибыльное занятие?
У вас много где форматирование поехало, есть дубль кода в секции "# удаляем строки, где есть хотя бы одно пропущенное значение"
+ работать с датой как со строкой это не самый лучший вариант (кстати в return ошибка), вместо:
используйте
Если очень хочется строку то в конец можно дописать .isoformat()
смотрел вчера (2025-01-20) на Хабр-Карьере зарплату Junior Data Engineer - там была вилка 91-150к
это я к тому что стоит делить джунов по специальностям) а не "среднюю по больнице" (хотя в статье как раз про неё и речь, видимо сделали SELECT min(salary), max(salary) ... where grade = 'junior')))
у меня были адреса аптек по всей РФ, даже в сельской местности они почти всегда были, процент ненахода (где адрес только населённый пункт - условно "посёлок Заброшенный") сейчас уже оценить не смогу, но он был крайне мал, на 20к+ адресов адресов без улицы\дома (только населённый пункт) было меньше 100, т.е. приблизительно 0.5%
PS/ были адреса только населённый пункт + улица, количество не помню, пусть будет штук 200, довольно много было без точного корпуса (не "д. 14к2", а просто "д. 14"), ориентировочно штук 500 - итого примерно 0.5% + 1% + 2.5% = 4% без точного адреса
решал подобную задачу через гео-апи Яндекса (раньше в день было 10к бесплатных запросов, как сейчас - не знаю), в ответе приходит скорректированный адрес + точность распознавания (точный, до улицы, населенный пункт, не распознан)
так же были какие-то бесплатные geo-api, но там наполненность данных по РФ сильно ниже
PS. у вас данные на вход нормальные, для Яндекса кварталы и ул. чистить не надо, а я чистил откровенный мусор наподобие "пом.1-4, 24, 25, 26, 29" (помещение), "кв. 1э" (квартира) и тд. который принимался за номер дома/строение
Hive это не бд, это движок позволяющий работать со структурированными файлами как с таблицами - писать к ним sql-запросы
Т.е. сама суть статьи это как взять файл и записать его в CH (а не как подключить файл внутри CH в качестве источника)
а где сам движок, описание классов, хотя бы ссылка на гитхаб?
сделать import hive, clickhouse_connect, pd.read_sql(), insert_dataframe() можно без всего вышеперечисленного, нужен только py-файл и cron