Как стать автором
Поиск
Написать публикацию
Обновить
2
0

Пользователь

Отправить сообщение

есть такой сайт - print-forum где сидели полиграфисты, так вот там есть один старожил - KalPak с историей 1-в-1 - приехал с женой в Москву в 18-19 лет, год отработали в РА (рекламное агентство), потом открыли своё РА, потом типографию (только у него не наружка, а календари + упаковка)

кажется что в определённый период (20 лет назад) это была типовая история +-

тут смысл помимо прямой покупки (которую почти все отрицают т.к. реклама мешает-раздражает) есть фактор скажем так "подсознания"

когда потребуется купить (условно) пылесос - листая страницу с пылесосами из мозга будет всплывать мутная информация "О, фирма Копыторогие, я о них где-то слышал, наверное им можно доверять раз я о них знаю"

Много странных тезисов.

1) Доктор экономических наук И. В. Липсиц сказал - ИТ это ветвь пост-индустриальной экономики (услуги), а если в РФ идёт возврат к индустриальной экономике (или даже ДОиндустриальной из-за санкций и проблем с доступом к высокотехнологичному оборудованию) то и ИТ будет стагнировать\входить в рецессию, что мы и видим на графиках ТС

2) МВидео проигрывает конкуренцию маркетплейсам, показывает убытки, сама компания в целом начинает по-тихоньку избавляться от магазинов\сотрудников, а не конкретно от ИТ-специалистов

3) Когда работал в консалтинге мне в компании-заказчике сказали что они платят консалтингу х3 от моей зарплаты, поэтому разогнать свой штат и набрать аут-стафферов выглядит очень сомнительной экономией (максимум на краткосрочном периоде)

тут вероятно вопрос в том, как подсчитывают эту самую аудиторию, грубо говоря если изменить подсчет с

SELECT COUNT (*)
на
SELECT COUNT DISTINCT (user_id)
HAVING SUM(spent_time) > 100 -- минут например

то можно получить кратное падение аудитории. Условно на каком-нибудь сайте встроено видео с рутуба с автопроизведением (пикабу?) - вот и лишний просмотр от аноним_ххххх =)

можно сделать вот так - sys.setrecursionlimit(1500)

вообще насколько я помню такое в питоне делается через кэширование:

@lru_cache(maxsize=None)
def fac():
...

и тогда последующие вызовы функции с теми же аргументами не вычисляются заного

Стали известны фотки и контакты bizibizi! Воены в отаке!

Ps. Сам не участвовал, только читал, вот это топ контент был, однако

А воены браблея в итоге победили упчк? :shocked::shocked::shocked::arrow: 36484

А на КПК (wm2003-2005) такого нет? Боюсь уже не найду старый винт, а там были и PocketMiniGolf, PocketHeroes, TheQuest, аналог демиургов (забыл название), эх, вот где мобильные игры делали))

ну т.е. просто через API данные забираются в облако, там некое "Yandex Query" (в статье не описано или я не увидел?) собирает DataMart который визуализируется в одном из вариантов бесплатных BI:

source -> Airflow -> DWH -> DataMart -> BI

кажется что это стандартный процесс..

ps. у Вас все DAG'и красные, обработки ошибок загрузки нет что-ли? а если один из DAG'ов сломается то визуально через Airflow UI это не понятно..

там насколько я понимаю схема такая:

1) происходит глушение частоты на которой работает радио-брелок машины
2) параллельно идёт чтение радио-сигнала с брелка
3) владелец нажимает кнопку открытия ещё раз
4) злоумышленник отправляет считанный сигнал, а повторный сигнал сохраняет (+глушит)
5) когда владелец ушёл машину можно открыть последим сохранённым сигналом

в брелках применяется технология Rolling Code, там что-то наподобие (id_брелка + super_unique_car_password++) * Pi % 9973, т.е. каждый раз код для открытия разный, одним и тем же кодом открыть машину подряд нельзя (брелок сразу заблокируется) + сам код зашифрован неким секретным ключом, т.е. вполне себе секьюрно, тут получается проблема mitm?

однажды не смог сходу сказать "redestribute motion", а сказал "движение данных" что послужило причиной завала экзамена в компании Т

виноватым себя за ТАКИЕ пробелы в теории не считаю)

особенно хорошо когда в вакансии указано Data Engineer (условно перекладыватель json'ов через Airflow из системы в систему), а технарь задает вопросы на Backend Massive Parallel Processing Developer'а (кого судя по всему и ищут), о чём догадаться по описанию вакансии невозможно

Согласен, а так же сейф, стол, стул, оргтехника, сигнализация и тд.

Просто от этого абзаца ("вложил последние деньги.. на счету осталось всего..") за километр пахнет инфоцыганщиной, непонятен переход от "еле-еле накопил 600к за 4 года" до "зарабатываю в год 27 млн" (это 340*0.08, интересно сумма уже после налогов, аренды и тд)?

Там ещё есть маркеры инфоцыганства (после учебы сразу без опыта в бизнес, акцент какие мы хорошие и качественные, не то что другие, сомнительный тезис о развития бизнеса в сегменте ремонта китайских машин (хотя абзацем ранее пишут что они без документации, сложности с ремонтом и вообще сегмент проблемный)), но они не так ярко выражены.

>> В том же 2012 году я открыл ИП

>> К 2016 году возможностей ИП перестало хватать... Вложил последние деньги в открытие ООО и все разрешения. На расчетном счету новой компании оставалось всего 50 тысяч рублей...

Вторая ссылка в яндексе по запросу "лицензия фсб на тахографы цена":

Стоимость лицензии на установку и активацию тахографов: 365 000 рублей.
Стоимость лицензии на продажу тахографов и карт тахографов: 205 000 рублей.

Открыть ООО стоит (тоже по первым ссылкам из поиска) ну допустим 10 000 рублей.

Получается за 4 года накопить ~600 000 рублей в таком бизнесе очень тяжело, это точно прибыльное занятие?



У вас много где форматирование поехало, есть дубль кода в секции "# удаляем строки, где есть хотя бы одно пропущенное значение"

+ работать с датой как со строкой это не самый лучший вариант (кстати в return ошибка), вместо:

def edit_date(date):
    old_date = date.split()
    new_date = old_date[0]
    return new_dates

используйте

df['date'] = pd.to_datetime(df['dttm']).dt.date

Если очень хочется строку то в конец можно дописать .isoformat()

смотрел вчера (2025-01-20) на Хабр-Карьере зарплату Junior Data Engineer - там была вилка 91-150к

это я к тому что стоит делить джунов по специальностям) а не "среднюю по больнице" (хотя в статье как раз про неё и речь, видимо сделали SELECT min(salary), max(salary) ... where grade = 'junior')))

у меня были адреса аптек по всей РФ, даже в сельской местности они почти всегда были, процент ненахода (где адрес только населённый пункт - условно "посёлок Заброшенный") сейчас уже оценить не смогу, но он был крайне мал, на 20к+ адресов адресов без улицы\дома (только населённый пункт) было меньше 100, т.е. приблизительно 0.5%

PS/ были адреса только населённый пункт + улица, количество не помню, пусть будет штук 200, довольно много было без точного корпуса (не "д. 14к2", а просто "д. 14"), ориентировочно штук 500 - итого примерно 0.5% + 1% + 2.5% = 4% без точного адреса

решал подобную задачу через гео-апи Яндекса (раньше в день было 10к бесплатных запросов, как сейчас - не знаю), в ответе приходит скорректированный адрес + точность распознавания (точный, до улицы, населенный пункт, не распознан)

так же были какие-то бесплатные geo-api, но там наполненность данных по РФ сильно ниже

PS. у вас данные на вход нормальные, для Яндекса кварталы и ул. чистить не надо, а я чистил откровенный мусор наподобие "пом.1-4, 24, 25, 26, 29" (помещение), "кв. 1э" (квартира) и тд. который принимался за номер дома/строение

Hive это не бд, это движок позволяющий работать со структурированными файлами как с таблицами - писать к ним sql-запросы

Т.е. сама суть статьи это как взять файл и записать его в CH (а не как подключить файл внутри CH в качестве источника)

а где сам движок, описание классов, хотя бы ссылка на гитхаб?

сделать import hive, clickhouse_connect, pd.read_sql(), insert_dataframe() можно без всего вышеперечисленного, нужен только py-файл и cron

1
23 ...

Информация

В рейтинге
10 506-й
Зарегистрирован
Активность