Все потоки

R *

Язык для статистической обработки данных

4,25

Рейтинг

СтатьиПостыНовостиАвторыКомпании

ph_piter 30 июн в 08:27

Эксплуатация моделей (ModelOps)

19 мин

5.5K

Блог компании Издательский дом «Питер»R * Машинное обучение * DevOps *

Привет, Хаброжители! Сегодня мы поделимся с вами отрывком из книги: «Современная бизнес‑аналитика. Увеличьте ценность данных с помощью Python и R».

Статья посвящена ModelOps — набору практик для эффективного развертывания и эксплуатации моделей машинного обучения. Вы узнаете, как организовать полный жизненный цикл модели: от оценки и мониторинга до переобучения. В материале приведены практические примеры создания приложений для пакетной и онлайн‑оценки с помощью R Shiny и Python Streamlit, а также дашборда для мониторинга производительности в реальном времени.

Читать далее

+8

zubankov 9 июн в 09:12

Что делать ученому с Эльбрусом?

Простой

5 мин

8.7K

Linux * LaTeX * R * Визуализация данных *

Обзор

Что делать ученому с Эльбрусом? Краткий обзор ПО, которое мне удалось собрать и протестировать на Эльбрусе - средства для симуляции в ядерной физике, обработки и визуализации данных, верстки научных статей.

О портировании CERN ROOT читайте далее

+9

selesnow 18 мар в 15:18

Бесплатный видео курс «Язык R для разработки AI инструментов»

3 мин

7.7K

R * Искусственный интеллектData Engineering * Data Mining * Big Data *

Привет, Хабр!

За последние годы большие языковые модели (LLM) глубоко проникли в нашу работу и повседневную жизнь. Многие из нас регулярно используют их как обычные пользователи в веб-интерфейсе. Но что, если вы хотите выйти за рамки «чата с моделью» и создавать собственные интеллектуальные инструменты под конкретные задачи и бизнес-сценарии?

Если ваш основной язык программирования — R, то у меня для вас отличная новость! Экосистема R за прошлый год совершила огромный скачок в интеграции с ИИ.

Читать далее

+6

propulsive 18 фев в 18:38

Визуализируем данные о погоде в регионах России c помощью R и Datawrapper

Простой

5 мин

8.5K

R * Визуализация данных *

Туториал

Создаем интерактивную и обновляемую карту погоды по регионам России: данные собираются через API OpenWeatherMap с помощью R, обрабатываются и автоматически передаются в Datawrapper для визуализации в виде плиточной карты с температурой и погодными условиями.

Читать далее

+8

welcome2hype 27 дек 2025 в 06:41

TSP трансформеры

Сложный

12 мин

8.6K

R * Алгоритмы * Математика * Data Mining * Искусственный интеллект

Сезон ИИ в разработке

Возможно кто-то догадался, что заголовок выше — это перевод первых строк темы из ламповых сюжетов мульсериала 80-х: "The Transformers More than meets the eye"

Любопытное совпадение: эти строки весьма точно характеризуют мои мысли об архитектуре трансформеров в контексте современных технологий ИИ. Сейчас уже широко известно, что эта архитектура стала настоящим прорывом и подарила человечеству нечто особенное — очень сильно напоминающее искусственный интеллект из фантастических фильмов детства и юности. Сегодня мы наблюдаем экспансию чат-ботов во все сферы жизни, чуть позднее увидим, как эти боты начнут за нас совершать действия в цифровом мире и ещё позже — в мире реальном.

Читать далее

+2

selesnow 2 дек 2025 в 11:58

Как написать свой MCP сервер на языке R

Средний

9 мин

6.3K

R * Искусственный интеллектПрограммирование *

Туториал

Ранее я уже рассказывал про разработку AI чатов на языке R. А в этой статье мы более подробно разберёмся как из AI чата сделать полноценного AI ассистента, который умеет не только отвечать на вопросы, но и выполнять какие то действия, например взаимодействовать с файловой системой, API различных сервисов и так далее.

Читать далее

-1

mipt_digital 17 сен 2025 в 09:00

Что случается с медицинскими данными без стандартов отчетности: кейс менингита и survival-анализа в R

8 мин

4.8K

Блог компании Центр «Пуск» МФТИМашинное обучение * R * Data Engineering *

Кейс

Без стандартов — ни к журналу, ни к себе не подступишься: в этой статье — история анализа выживаемости пациентов с менингитом и то, как внедрение STROBE и TRIPOD полностью изменило подход к работе с медицинскими данными. На примере кейса и кода на R автор показывает, как стандарты отчетности помогают структурировать исследование, избежать потерь данных, честно построить модель и — главное — самому понять, что ты сделал.

Читать далее

+9

Zotovaa 31 авг 2025 в 15:55

ML — курсы vs реальность: Где же обещанные цветочки и единороги?

Простой

6 мин

15K

TensorFlow * R * IT-инфраструктура * Data Engineering * Big Data *

Мнение

Привет, хабр! 👋

Позвольте представиться: я - Настя, Data Scientist и TeamLead в одной вполне себе серьезной компании (когда чистишь данные в 3 ночи, чувствуешь себя совсем не серьезно, но это детали). Веду свой скромный телеграм-канальчик, где делюсь болью, радостью и абсурдом нашей необъятной профессии. И вот сегодня хочу вынести на ваш суд тему, которая не дает спать спокойно не только мне, но и многим моим коллегам.

Помните тот трепетный момент, когда вы только начинали свой путь в Data Science? Я — очень хорошо. Картинка была радужной: ты — повелитель нейросетей, твои модели творят магию, а бизнес-задачи падают к ногам, поверженные точностью в 99.9% (ну или хотя бы 97%).

Курсы, будь то знаменитые онлайн-платформы или университетские программы, учат нас прекрасному: бустинги, метрики, градиентный спуск, SVM, k-means, сверточные слои... Это наш фундамент, наш джентельменский набор. И да, именно за этим набором охотятся 90% рекрутеров на собеседованиях. Создается стойкое ощущение, что я и интервьюер одновременно загуглили «Топ-50 вопросов на DS собеседовании» и теперь ритуально их отрабатываем. Ну, must have, что уж тут.

Но потом ты выходишь из уютного мира clean data и идеальных датасетов в дикие джунгли реального проекта. И здесь начинается магия настоящей работы. Та самая, про которую не снимают вдохновляющие ролики. А порой многие именно тут и бросают этот, казалось бы увлекательный и перспективный карьерный путь в мир ML...

Читать и обсудить...

+4

Asimandia 13 июл 2025 в 22:05

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Средний

4 мин

2.5K

Python * R * TensorFlow * Машинное обучение * Искусственный интеллект

Дайджест

BirdCLEF+ 2025 — очередная часть ежегодного соревнования от Cornell Lab of Ornithology по распознаванию звуков дикой природы. В этом году участникам предстало предсказывать целевое животное на коротких фрагментах записи, балансируя между качеством моделей и жёсткими ограничениями железа.

Разобраться в псевдолейблинге...

+2

GOrwell1984 13 июл 2025 в 07:16

Конфаундинг, или как аналитику попасть в ловушку

Средний

17 мин

11K

Статистика в ITМашинное обучение * R * Управление персоналом *

Из песочницы

✏️ Победитель Технотекста 8

Вы построили свою модель: p-value в порядке, R² впечатляет, вот только эффект — мнимый. Причина? Иногда вы упустили какую-то переменную. Иногда добавили лишнюю. Иногда включили ту, которая полностью поменяла ваш вывод. Настало время познакомиться с самым изощрённым убийцей аналитических выводов — конфаундингом.

Читать далее

+16

m03r 2 июл 2025 в 07:00

Что в чёрной коробочке? Выясняем самостоятельно, не привлекая внимания коллег

Средний

30 мин

18K

Блог компании ЯндексАнализ и проектирование систем * Проектирование и рефакторинг * R *

Кейс

Всем привет, меня зовут Миша, и я разрабатываю платформу Яндекс Еды. Первые компоненты были написаны почти 10 лет назад (когда Еда ещё была стартапом Foodfox), и у нас накопилось много кода, который просто хорошо работает, а иногда даже «работает — не трогай». Но в процессе развития и устоявшиеся части системы нужно трогать, про что мои коллеги уже писали — как мы повышали версию PHP, пилили монолит и снимали нагрузку с БД.

Наконец настал черёд рассказать про процессинг заказов доставки еды из кафе и ресторанов (а также продуктов из магазинов и многого другого). За годы эволюционного развития он значительно разросся, что стало заметно затруднять дальнейшее развитие — например, изменения, связанные с выходом на новые рынки, — а также влиять на надёжность.

Поэтому мы решили вынести процессинг заказа в отдельный специализированный сервис. Чтобы определить, что выносить, а что оставлять, нужно было составить исчерпывающий и актуальный список процессов, которые происходят с заказом. И здесь мы столкнулись с вызовом: это знание распределено по многим людям и документам, поскольку на протяжении долгого времени в процессинг заказов вносили изменения многие команды. И перед нами встал вопрос — как собрать нужную информацию о системе с заметной долей легаси быстро, да так, чтобы информация была актуальна?

Читать далее

+38

welcome2hype 3 мая 2025 в 16:11

Глубокое Q-обучение (DQN)

Сложный

9 мин

8.2K

Data Mining * Математика * Алгоритмы * R * Искусственный интеллект

Подходит к завершению серия моих публикаций про использование идей искусственного интеллекта для решения задачи коммивояжера (TSP).

В этой заметке помогаю разобраться в авторской реализации Deep Q-learning для TSP.

Читать далее

+7

selesnow 28 апр 2025 в 09:30

Как мы внедрили LLM в рабочие процессы аналитиков на R — и сделали это бесплатно

Средний

10 мин

7.6K

R * Искусственный интеллектData Engineering * Машинное обучение *

Туториал

В этой статье расскажу, как мы в команде аналитиков начали использовать большие языковые модели (LLM) в повседневных рабочих инструментах. Всё построено на R, и покажу на практике, как можно внедрить такие фичи у себя — без платных подписок, без OpenAI и без строчки кода на Python.

Читать далее

+3

Semin_Pavel 21 апр 2025 в 08:17

Как я за год написал шесть больших научных статей и несколько маленьких

Средний

14 мин

8.7K

Занимательные задачкиR * Открытые данные * Геоинформационные сервисы * Лайфхаки для гиков

Кейс

Без «литературных негров» и чатГПТ — личный рассказ об инструментах, технологиях и приёмах, которые помогли мне не вылететь из аспирантуры и догнать коллег. Открытые данные, Python, R, RMarkdown, Quarto, git и немного ИИ в помощь исследователю.

Читать далее

+11

welcome2hype 19 мар 2025 в 06:00

А не пора ли нам подкрепиться?

Средний

10 мин

3.2K

Data Mining * R * Математика * Алгоритмы *

Обучение с подкреплением – это одна из ключевых концепций ИИ. Пришло время подкрепить коммивояжера и его задачу поиска кратчайшего пути Q-обучением. Табличный вариант Q-обучения является сравнительно простой и эффективной реализацией обучения с подкреплением.

Читать далее

+4

ph_piter 6 мар 2025 в 13:26

Книга: «Excel с Python и R: раскройте потенциал расширенной обработки и визуализации данных»

7 мин

21K

Блог компании Издательский дом «Питер»Office 365 * Профессиональная литература * R * Python *

Привет, Хаброжители!

Если вы работаете с данными, то наверняка сталкивались с ситуацией, когда Excel становится вашим лучшим другом и злейшим врагом одновременно. С одной стороны, это удобный и привычный инструмент для работы с таблицами, с другой — его ограничения могут превратить даже простую задачу в настоящий кошмар. Но что, если бы вы могли объединить мощь Excel с гибкостью и возможностями Python и R?

Именно об этом рассказывает новая книга «Excel с Python и R: раскройте потенциал расширенной обработки и визуализации данных».

Читать дальше →

+10

mrsmirnovgd 2 фев 2025 в 06:16

Многофакторное аппроксимирование на платформе .Net. Часть первая. Теория

6 мин

2.3K

.NET * C# * Open source * R *

Из песочницы

Двухфакторная аппроксимация и ее реализация на платформе .net при помощи open source приложения RefressionFromExel.

Читать далее

+1

welcome2hype 28 янв 2025 в 07:00

Внимание правильный ответ

Средний

8 мин

2.9K

Математика * Искусственный интеллектАлгоритмы * R * Data Mining *

Если читатель был достаточно внимателен, то, наверное, заметил, что в предыдущей заметке я обошел стороной непосредственно блок механизма внимания, точнее сказать, описание было дано методом черного ящика: вот тут такие-то входы, там такие-то выходы. Теперь, внимание, вопрос знатокам: Что лежит в черном ящике? В действительности, крайне важно понимать, что там внутри и логично посвятить данной теме отдельный текст. Понимание механизма внимания определяет ход дальнейших размышлений вплоть до самых передовых архитектур ИИ и поэтому сложно переоценить важность этой темы.

Читать далее

0

kristina_ponomareva 27 янв 2025 в 03:34

Моделирование Результатов в Гольфе с Помощью Цепей Маркова

Простой

7 мин

2.2K

Статистика в ITR * Математика *

С тех пор, как мне исполнилось девять лет, в моей жизни было лишь два занятия, которые меня по-настоящему интересовали. К ним относились мой любимый спорт и учёба. Я совмещала игру в гольф за сборную команду России с учёбой на отличные оценки в инженерном классе Московской школы. По окончанию школы, моим следующим шагом было поступление в университет США, где программа student-athlete очень сильно развита. Тебе дают возможность получать высшее образование, а также быть частью спортивной команды, которая соревнуется с командами других университетов в течении всего учебного года. И вот, прошло уже три с половиной года с тех пор, как я стала частью этой команды, а значит, остался один семестр до того, как я надену мантию. И по случаю завершения моей карьеры, в моей голове возник вопрос, а есть ли что-то, что связывает студенческий гольф и знания, которые я приобрела.

Читать далее

-2

whynot335 18 янв 2025 в 08:15

Транскриптомный анализ: как посчитать гены?

Простой

20 мин

8.2K

БиологияR * Визуализация данных * Здоровье

Из песочницы

Вся информация о нас закодирована в ДНК. Но как она реализуется? Как при помощи анализа данных секвенирования ученые находят количественные соотношения между группами генов? Что такое транскриптомика? Давайте разберемся, как находят закономерности в экспрессии генов и построим красочные визуализации.

Читать далее

+9

1

2 3 ...