Росатом, Москва - Работа на стыке науки и ИТ / Статьи / Хабр

ПрофильСтатьи30Подписчики301Сотрудники8

Enfriz 19 апр 2023 в 07:01

Как выигрывать соревнования по программированию

Простой

12 мин

20K

Блог компании РосатомХакатоныУправление разработкой * Управление проектами * Конференции

Ретроспектива

Я регулярно участвую в различных хакатонах и конкурсах по программированию, и довольно часто удаётся выигрывать.Рассказываю о внутренней кухне, вспоминаю поучительные истории с хакатонов и делюсь секретами успеха.

Rosatom 26 янв 2023 в 13:00

Зачем мы моделируем импульсные нейронные сети и с помощью чего это делаем

17 мин

6.7K

Блог компании РосатомBig Data * Машинное обучение *

Обзор

Привет, Хабр! На связи Михаил Киселев, руководитель направления в отделе ИИ компании «Цифрум» (Росатом) и руководитель лаборатории нейроморфных вычислений в Чувашском государственном университете. Сегодня подниму тему импульсных нейронных сетей. Общее представление о том, что такое искусственные нейронные сети, есть, наверное, у всех. Многие представляют, зачем они нужны, как устроены, как работают. Речь пойдет об одной их разновидности – импульсных нейронных сетях (ИНС). Нейросети вообще мыслились их создателями как компьютерные модели ансамблей нервных клеток мозга – это и из их названия следует. У разных типов нейросетей степень этого сходства разная. Так вот, ИНС – это самый похожий на биологический мозг тип нейронных сетей.

За счет этой похожести достигаются немалые преимущества. Прежде всего – энергоэкономичность нейропроцессоров. Почему же тогда мы не видим вокруг себя эти импульсные сети – в смартфонах, камерах, умных часах, умных утюгах?

Читать далее и узнать, почему же

+14

21 ноя 2022 в 09:16

Python в атомной энергетике: сообразительные нейроморфы, предсказание поломок и анализ нормативки

14 мин

20K

Блог компании РосатомPython * Машинное обучение * Искусственный интеллект

Атомная энергетика — отрасль наукоёмкая. Python со своими инструментами для анализа данных и построения ИИ как раз подходит АЭС, здесь с ним можно решать амбициозные задачи на острие науки о данных. Поэтому Хабр решил разузнать побольше про Python в Росатоме. И попросил меня помочь.

Меня зовут Тимур Тукаев, я IT-редактор. Начал писать о технологиях в 2007, когда поставил свой первый Linux. Увлечён идеями свободного ПО и open source, программирую на Kotlin, делаю о нём топики в JetBrains Academy.

Я пообщался с тремя инженерами Росатома и выяснил, для чего в корпорации используют Python. Рассказываю под катом.

Для чего же?

+18

Rosatom 9 ноя 2022 в 10:07

Программная роботизация атомной отрасли – от простых роботов к сложным

6 мин

2.4K

Блог компании РосатомПрограммирование * Робототехника

Recovery Mode

Выгрузить данные, свести отчет, сделать рассылку… Эти рутинные задачи «съедают» часы рабочего времени, которые с гораздо большей пользой можно было бы потратить на анализ показателей, планирование и развитие. Все эти задачи можно быстро и малозатратно перекинуть на виртуальных ассистентов — программных роботов.

Программный робот, или RPA (Robotic process automation) — технология для быстрого создания и запуска приложений-«роботов», способных имитировать действия человека при работе с системами, программами, почтой, базами данных и другим софтом.

Главная цель разработки роботов — избавиться от повторяющихся задач, не требующих сложной аналитики и «творчества», избавиться от рутинных действий, на которые ежедневно или еженедельно уходит по несколько часов рабочего времени. Речь о внесении новой информации в базы данных, составлении рассылок, сведении и форматировании данных из разных систем. Конечно, есть системы, в которых часть этих задач автоматизирована, но, когда дело касается всего процесса или сразу нескольких процессов, в игру вступают системы с разным интерфейсом и возможностями. В итоге сводить все воедино все равно приходится человеку.

Проблемы можно было бы решить созданием единой системы, но проект ее разработки и внедрения будет долгим, дорогостоящим и вряд ли эффективным. Более того, в такой системе никогда не будут реализованы надстройки и доработки, упрощающие работу небольшой команде людей или даже одному человеку. Решение — программные роботы. Они могут быть индивидуальными, «мостиком» между огромными системами и задачами конкретного сотрудника.

Katser 8 сен 2022 в 21:04

Обзор метрик обнаружения аномалий (плюс много дополнительной информации)

10 мин

12K

Блог компании РосатомPython * Анализ и проектирование систем * Машинное обучение * Искусственный интеллект

Привет, Хабр! На связи снова Юрий Кацер, эксперт по ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”.

До сих пор рамках рабочих обязанностей решаю задачи поиска аномалий, прогнозирования, определения остаточного ресурса и другие задачи машинного обучения в промышленности. В рамках рабочих задач мне приходится часто сталкиваться с проблемой правильной оценки качества решения задачи, и, в частности, выбора правильной data science метрики в задачах обнаружения аномалий.

Katser 8 сен 2022 в 11:10

Проблемы качества промышленных данных (временных рядов)

3 мин

3.5K

Блог компании РосатомData Engineering * Визуализация данных * Машинное обучение * Искусственный интеллект

Привет, Хабр! На связи Юрий Кацер, эксперт по ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”. В рамках рабочих обязанностей я решаю задачи в промышленности с помощью машинного обучения.

Большую часть работы по созданию моделей составляет работа с промышленными данными. В условиях стремительного роста объема информации, собираемой на производственных предприятиях в связи с развитием интернета вещей (сбор и хранение данных), важным аспектом становится качество таких данных. В то же время проблемы и ошибки в них становятся препятствием для применения методов машинного обучения и построения моделей на основе законов физики или предметной области. Такие проблемы, как выбросы, пропуски, изменение частоты дискретизации, шум, искажают результаты или делают невозможным практическое использование данных для машинного обучения.

В этой статье мы посмотрим на часто встречающиеся проблемы в промышленных данных типа временных рядов. О том, что такое временной ряд, и о других особенностях задач в промышленности я рассказываю в других статьях на хабре, рекомендую познакомиться, а мы пока перейдем к сути! На схеме ниже приведен большой список проблем в данных, о которых мы поговорим в статье.

Katser 7 сен 2022 в 08:22

Опыт проектов с ИИ в промышленности на примере проекта по обеспечению контроля технического состояния электролизеров

10 мин

3.5K

Блог компании РосатомИскусственный интеллектМашинное обучение * Визуализация данных * Анализ и проектирование систем *

Из песочницы

Привет, Хабр! На связи Юрий Кацер, эксперт ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”.

Недавно я выступил с докладом о том, как в рамках проекта по предиктивной аналитике на производстве мы разрабатывали систему и алгоритмы контроля технического состояния электролизера. По сути, мы разработали систему предиктивной аналитики, возились с поиском работающих подходов, долго мучались с данными о состоянии оборудования и извлекали из умов технологического персонала информацию о работе установок.

Сегодня хочу поговорить на примере этого проекта о реализации data science проектов в промышленности. С подобным докладом я также выступал ранее, видео выступления доступно по ссылке. Обычно нашей основной задачей является разработка моделей на основе данных, но работает ли такой подход всегда? Давайте поговорим об основных этапах и проблемах таких проектов и посмотрим, как мы двигались к финальному результату на примере проекта по диагностике электролизеров.

Rosatom 24 июн 2022 в 08:33

Чемпионаты стандартов WorldSkills: как решать кейсы, справляться с волнением и зачем вообще участвовать

14 мин

2.3K

Блог компании РосатомPython * Программирование * Анализ и проектирование систем * Машинное обучение *

Recovery Mode

Всем привет!

Сегодня хотим поговорить с вами об участии в чемпионатах, хакатонах, соревнованиях. Меня зовут Максим Межов, я аналитик отдела предиктивного анализа компании «Цифрум» (Госкорпорация «Росатом») и уже дважды участвовал в чемпионатах, построенных на концепции WorldSkills. Эти соревнования задают стандарты технической подготовки и квалификации специалистов. Кроме оригинального чемпионата, в ряде организаций проводятся ещё внутренние. Например, в Росатоме – это AtomSkills.

Зачем участвовать в чемпионатах?

В первую очередь, для самого себя. Не все чемпионаты подразумевают награду, могут грамоту выдать. Самое главное – это возможность перезагрузиться, заново взглянуть на привычные процессы, попробовать себя в новом и оценить свои силы. Стрессануть и получить заряд адреналина.

А ещё в соревнованиях такого типа участникам дают решать реальные задачи, настоящие проблемы, с которыми сталкиваются компании на производстве. Бывают также хакатоны, где участники работают с искусственными данными, проверяют подходы, смотрят, кто лучше сделает модель, такой опыт тоже полезен, но его сложнее потом применить в жизни.

Как проходят чемпионаты

Марафоны с окончанием «skills» построены по модели известного чемпионата Worldskills. Так, DigitalSkills-2021 длился 3 дня. Каждый день мы, участники, садились спиной к спине за компьютеры и в течение определенного времени решали модуль за модулем. По сути, это как сдать 6 экзаменов за 3 дня. К каждому дню надо готовиться, работать 2 модуля, по 3 часа. В середине модуля нам давали перерыв около 15 минут и один перерыв на обед между модулями. Мобильные телефоны, прочая собственная вычислительная техника запрещены. Только выданные компьютеры, у всех одинаковые.

Modestovich 1 июн 2022 в 10:47

Как я дообучал Tesseract и что из этого получилось

7 мин

60K

Блог компании РосатомPython *

Туториал

Из песочницы

Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а так же ввиду наличия большого количества документов сомнительного качества, поулучшав пайплайн разными методами, было принято решение попробовать улучшить и сам тессеракт.

Инструкция от разработчиков https://tesseract-ocr.github.io/tessdoc/Home.html не всегда сразу понятна и очевидна, поэтому и появилась мысль записать свой опыт в эту статью.

У меня на компьютере стоит Linux Mint 20.2 Cinnamon, поэтому все действия происходят в этой системе и я не могу гарантировать, что все получится точно так же в Windows или Mac.

Для начала необходимо установить бибилиотеку tesseract на компьютер. Делается это достаточно просто. Сначала проверю версию, которая уже установлена (как правило в комплекте с Linux уже есть пакет tesseract). В терминале набираем

+11

Ni_Bar 12 мая 2022 в 12:49

Моделируем релейные защиты и противоаварийную автоматику для полномасштабных и аналитических тренажеров АЭС и ТЭС

4 мин

3.2K

Блог компании РосатомТестирование IT-систем * Энергия и элементы питания

Из песочницы

Уважаемые читатели, добрый день!

Многие представляют АЭС и ТЭС как некие сложные установки и системы малопонятных процессов, но пользу от работы атомных и тепловых электростанций понимают практически все. Чтобы повышать безопасность и эффективность работы на станции, оперативный персонал должен постоянно совершенствовать свою профессиональную подготовку. И если реальная станция здесь не помощник, то полномасштабные и аналитические тренажеры – как раз то, что надо. Настолько то, что все приборы, ключи управления точно воспроизводят аппаратуру по составу, цвету, размерам, форме. Информацию, которая отображается на мониторах и индикаторах, не отличить по величине и внешнему виду от той, которая дается на энергоблоке. Ловкость рук, и никакого мошенничества!