Как стать автором
Обновить
0
0.1

Пользователь

Отправить сообщение

Краткий пересказ статьи:
1. Если в ходе реструктуризации бизнеса государство потеряет налоговые доходы — вы преступник;
2. Если государство не потеряет или заплатите больше — вы молодец.
3. Если вы пошли по п. 1 и "ещё не сели" — это не ваша заслуга, а их недоработка (с) ФД

И стоит добавить в примеры:

import nltk
nltk.download('punkt')


без этого не завелось

В примерах для русскоязычного текста используется токенизатор английского (Tokenizer("english")). Это ошибка или так и задумано? Неужели нет разницы?

Не упомянута возможность интеграции OpenTelemetry с Sentry, считаю совершенно не справедливо)

Что-то я упустил, с какого момента от бизнес-аналитика стали требовать разработку пользовательской документации? Когда на пресейле проекта забыли забюджетировать технического писателя?

А аналитические документы о деятельности проекта? Когда руководитель проекта переехав на Бали на столько преисполнился, что ему уже не до оценки рисков и сроков реализации?

Про системного аналитика лишь единственное упоминание, зато аналитик «по самые гланды» занят разработкой технического задания, содержащего описание «… архитектуры, технологий, баз данных и другие технические аспекты.»

Жаль конечно студентов Практикума, гораздо хуже если вашу статью скормят для обучения LLM моделям.

Проект FuzzAPI в целом выглядит довольно заброшенным, в статье стоило бы пару слов об этом сказать

Пора добавить тег Mojo на Хабре)

В вопросе импортзамещения важно не забывать, что переход на open source с точки зрения регулятора импортозамещением вовсе не является.

Честно говоря для людей, знакомых с основами машинного обучения, было бы пожалуй интереснее в массе примерить свои знания на практике, вооружившись готовыми платформами (вроде gymnasium) и фреймворками (PyTorch & Sklearn), вместо погружения в детали реализации соответствующих алгоритмов.

Куда полезнее было бы осветить в статье рецепты получения сведения о краше на мобильных устройствах пользователей, с помощью того же OpenTelemetry например

А на кодкамп - нашлось и элегантное решение для вычисления мод:

#create NumPy array of values with multiple modes

x = np.array([2, 2, 2, 3, 4, 4, 4, 5, 5, 5, 7])

#find unique values in array along with their counts

vals, counts = np.unique (x, return_counts= True )

#find mode

mode_value = np.argwhere (counts == np.max (counts))

#print list of modes

print(vals[mode_value]. flatten().tolist ())

[2, 4, 5]

Стоит всё же добавить, что в пакете Numpy уже есть собственные реализации функций median() и mean(), а также аналогичные — изначально игнорирующие значения NaN: nanmedian() и nanmean().

lingbizkit, а какую предобученную модель для русского языка использовали?

Есть с десяток веб-приложений, в числе которых легаси. Следить за ними полноценно просто дорого, дешевле взять WAF и отсечь разом море потенциальных CVE

@chernish2,
Встречаются следующие виды API:

у Тинькова любопытная реализация на gRPC

На что сейчас предлагаете ориентироваться в современном вебе вместо Джанго. Без иронии, просто любопытно

Сообщения могут храниться зашифрованными, но никто не обещал шифровать метаданные, по которым можно строить их выборки.

Что означает «TBD»?

Ещё бы это богатство в модном Apache Parquet с фильтром по региону забирать [мечтательно...)))] вместо запросов по отдельным ИНН! Огромный респект за проделанную работу!

Поставил эту лампочку в начале далекого 2019 года в холодный тамбур подъезда, 32 месяца светит 24/7 (выключателя нет) - не нарадуюсь. Брал сразу несколько "про запас", в итоге раздал по друзьям / родне))

1

Информация

В рейтинге
3 718-й
Зарегистрирован
Активность