Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

@rahmanny 20 фев 2024 в 10:31

Пароли в открытом доступе: ищем с помощью машинного обучения

Средний

18 мин

13K

Блог компании Lamoda TechИнформационная безопасность * .NET * C# * Машинное обучение *

Туториал

✏️ Технотекст 2023

Я больше 10 лет работаю в IT и знаю, что сложнее всего предотвратить риски, связанные с человеческим фактором.

Мы разрабатываем самые надежные способы защиты. Но всего один оставленный в открытом доступе пароль сведет все усилия к нулю. А чего только не отыщешь в тикетах Jira, правда?

Привет, меня зовут Александр Рахманный, я разработчик в команде информационной безопасности в Lamoda Tech. В этой статье поделюсь опытом, как мы ищем в корпоративных ресурсах чувствительные данные — пароли, токены и строки подключения — используя самописный ML-плагин. Рассказывать о реализации буду по шагам и с подробностями, чтобы вы могли создать такой инструмент у себя, даже если ML для вас — незнакомая технология.

+30

@badcasedaily1 20 фев 2024 в 08:28

Обзор библиотеки drake в R

Простой

6 мин

864

Блог компании OTUSR * Машинное обучение *

Обзор

Drake предлагает систематический подход к построению и управлению зависимостями в проектах, автоматизируя процесс обработки данных и анализа. С помощью drake можно отслеживать изменения в коде и данных, автоматически перезапуская только те части анализа, которые были изменены.

Создатель drake, Уилл Ландау, искал способ улучшить репродуктивность исследований в R, и так родилась библиотека drake. С тех пор она претерпела множество изменений и улучшений.

@Rai220 20 фев 2024 в 08:03

Какой плащ был у Понтия Пилата? Отвечает GigaChat

Средний

10 мин

17K

Блог компании SberDevicesМашинное обучение * Искусственный интеллектNatural Language Processing *

Обзор

Всем привет! На связи лид разработки SDK GigaChat’a — Константин Крестников. В этой статье я расскажу о том, что такое GigaChain и как в целом SDK позволяет упростить жизнь разработчика LLM, например, научить LLM давать ответы на вопросы по вашим документам или работать в режиме автономного агента. Также поговорим про решения, которые практически невозможно сделать без использования SDK.

GigaСhain — это ответвление (fork) открытой библиотеки LangСhain на Python. Её главная цель — облегчить жизнь разработчику. Библиотека состоит из большого количества различных компонентов, которые позволяют работать с промптами, объединять вызовы к большим языковым моделям в цепочки, загружать данные из разных источников и сохранять обработанные ответы языковой модели.

+27

@crazyfrogspb1 20 фев 2024 в 06:47

Будущее ИИ в радиологии — обзор конференции RSNA 2023

5 мин

1.2K

Искусственный интеллектЗдоровьеТелемедицинаМашинное обучение *

По итогам RSNA - крупнейшей выставки в сфере радиологии, прошедшей в конце 2023 года, Стефан Брауневелл, управляющий партнер SynWisery, подготовил обзор, в котором поделился размышлениями о самых популярных темах и трендах в области искусственного интеллекта в рентгенологии. Я подготовил очень-очень вольный перевод его статьи со своими комментариями.

Если вы хотите узнать ещё больше об организации процессов ML-разработки, подписывайтесь на мой Телеграм-канал Варим ML

@camunar 20 фев 2024 в 05:35

Учебный центр Rasa: NLP для разработчиков

Средний

5 мин

1.6K

Машинное обучение *

Туториал

Перевод

Перевод статьи от 01.02.2023 г., из блога Rasa

Курс «NLP (Natural Language Processing) для разработчиков» в учебном центре Rasa — это простое и быстрое знакомство с современными инструментами и методами NLP, такими как токенизация, векторное представление слов и трансферное обучение. Если вы разработчик программного обеспечения, менеджер или любой другой человек, который хотел, но еще не ознакомился со всеми концепциями машинного обучения Rasa NLU — это лучший способ получить об этом общие понятия.

@ternaus 20 фев 2024 в 04:06

Albumentations: XYMasking

Простой

7 мин

2.7K

Python * Обработка изображений * Машинное обучение *

Туториал

Короткая версия

После длинного вступления, будет туториал по применению аугментации XYMasking к спектрограммам от ЭЭГ. Кто экономит время - код с примерами можно найти по ссылке в документации библиотеки.

Длинная версия

Albumentations - это Open Source библиотека для аугментации изображений.

Аугментация - это умное слово, которое в переводе с русского на русский означает "преобразование".

Q: Зачем это надо?

A: Основное применение - тренировка нейронных сетей на картиночных данных, например ImageNet.

Чем больше разнообразных данных сеть видит при тренировке, тем выше шансы, что она выучит закономерности, а не просто запомнит их.

На практике, пока прошлый батч картинок обрабатывается сетью на GPU, CPU занимается подготовкой нового батча, причем к каждому изображению применяются различные аугментации. Это позволяет достигнуть большего разнообразия данных, которые видит сеть.

Благодаря такому подходу нейронная сеть никогда не видит один и тот же набор пикселей, что способствует более высокой точности и обобщающей способности.

@SkynetPI 19 фев 2024 в 21:03

Разработка алгоритма адаптивной системы стыковки НПА с БЭК с использованием методов машинного обучения

Средний

11 мин

1.6K

Машинное обучение * РобототехникаИскусственный интеллект

Кейс

Исследования, проводимые в работе, направлены на разработку удаленно управляемых робототехнических комплексов. В работе в качестве прототипа, на котором отрабатываются представленные в статье экспериментальные решения, выступают необитаемый подводный аппарат и автономный безэкипажный катер. В числе основных задач, решаемых в работе данными аппаратами, являются: мониторинг и оценка среды; обнаружение объектов и препятствий; маневрирование; сближение с объектом. В статье рассматривается задача стыковки в виртуальной 3D среде, в процессе которой осуществляется построение изображений рабочего пространства подводного робототехнического комплекса. Предложены алгоритмы построения 3D изображений рабочего пространства робототехнического комплекса в решении задачи стыковки, основанные на применении методов машинного обучения, включающей поиск, планирование движений, маневрирование и управление робототехническими комплексами для синхронизации подводного необитаемого аппарата с автономным безэкипажным катером в условиях неформализованных выполняющих сред. Результаты работы показывают, что применение методов машинного обучения в решении данных задач позволяют повысить уровень автономности аппаратов.

@DandyDan 19 фев 2024 в 14:04

Алгоритм Monte Carlo Tree Search простыми словами

11 мин

20K

Блог компании SelectelМашинное обучение * Научно-популярное

Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже сейчас, в эпоху развития нейронных сетей.

У многих людей, в том числе и у меня, поначалу были сложности с пониманием алгоритма, как и с верой в то, что он может хорошо играть. В этой статье хочу рассказать об MCTS максимально просто и помочь разобраться в нем новичкам. В первой главе расскажу об основах, с которыми многие могут быть уже знакомы. Однако считаю, что они действительно важны для понимания. Подробности под катом!

Читать дальше →

+40

@badcasedaily1 19 фев 2024 в 11:33

Обзор библиотеки Stan в R

Средний

11 мин

Блог компании OTUSПрограммирование * Алгоритмы * R * Машинное обучение *

Обзор

Приветствую!

Stan - это библиотека на C++, предназначенная для байесовского моделирования и вывода. Она использует сэмплер NUTS, чтобы создавать апостериорные симуляции модели, основываясь на заданных пользователем моделях и данных. Так же Stan может использовать алгоритм оптимизации LBFGS для максимизации целевой функции, к примеру как логарифмическое правдоподобие.

Для облегчения работы с Stan из языка программирования R доступен пакет rstan, который предоставляет интерфейс R для Stan.

Сегодня мы и рассмотрим этот пакет.

@mr-pickles 19 фев 2024 в 09:10

Лосось и машина

Средний

19 мин

3.5K

Блог компании Wunder FundЭкологияИскусственный интеллектМашинное обучение * Программирование *

Перевод

Одно из самых увлекательных дел, которое счастливая случайность может подкинуть учёному‑информатику — это сложная социотехническая задача из области, переживающей процесс цифровой трансформации. В моём случае это была задача подсчёта рыб. Недавно я работал в роли консультанта в сфере экологии, уделяя основное внимание подсчёту рыб, проплывающих через крупные плотины гидроэлектростанций. Занимаясь этим большим проектом, я узнал о том, как управляют системами создания наборов данных, в работе которых участвует человек, как координируют функционирование таких систем. Кроме этого я узнал о тех сложностях и неожиданностях, которые сопутствуют тому, кто пытается осмыслить результаты исследований и поделиться ими с теми, кому они интересны.

+16

@smirnovevgeny 19 фев 2024 в 07:00

Побеждаем рутину в Data Science: как перестать быть недопрограммистами и недоисследователями

Средний

22 мин

21K

Блог компании Альфа-БанкИскусственный интеллектКарьера в IT-индустрииМашинное обучение * Big Data *

Кейс

✏️ Технотекст 2023

Профессия Data Scientist сейчас стала особенно привлекательна, вовлекая еще больше энтузиастов и даже евангелистов, благодаря последним достижениям в области генерации текстов и изображений. Внешний фон наводит на мысли, что будни дата сайентиста заполнены исключительно творческой самореализацией, и рутина в процессы его работы никогда не сможет просочиться. Увы, но большую часть DS команд рутина уже поглотила.

+23

@Kit_Cat 19 фев 2024 в 06:35

Под капотом графовых сетей

Простой

11 мин

10K

Искусственный интеллектМашинное обучение * Математика *

Обзор

Графовые сети - мощный инструмент анализа данных, базирующийся на взаимосвязях объектов в виде графа. В статье рассматриваются различные типы графовых сетей (включая графовые сверточные, рекуррентные и с механизмом внимания) и их применение для решения задач анализа данных. Этот обзор предоставляет всестороннее представление о ключевых аспектах графовых сетей в мире анализа данных.

Клац-клац

@Odin_Himself 17 фев 2024 в 13:50

Как мы пытались разместить статью о новом виде спорта на Википедии, а ее украли роботы…

Средний

10 мин

5.2K

Открытые данные * Машинное обучение * Управление продуктом * Хранение данных *

Кейс

Recovery Mode

Здравствуйте, уважаемые читатели!

В этой статье будет проведен разбор одного практического случая - попытки разместить статью на ресурсе Википедия.
Будет дано подробное описание случая и представлены очень важные комментарии от специалиста в данной области.

Присутствует интрига, кульминация и простая развязка =)

@tadzh_nahal 16 фев 2024 в 09:30

Boximator: ИИ-модуль от ByteDance Research как новая веха в области генерации видео

Средний

8 мин

1.8K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Обзор

Одной из главных целей в генерации видео с помощью искусственного интеллекта является создание полностью управляемого, а также достоверного движения объектов. С помощью изменения сцен и улучшения качества по заданным критериям на основе предпочтений пользователя генерация контента выходит на совершенно новый уровень. К нему сделала шаг команда ByteDance Research, представив Boximator (box + animator) – новый инструмент для работы с видео на основе ИИ. ByteDance – родитель небезызвестного Tik-Tok, а из этого следует, что в скором времени там следует ожидать больше искусственно генерируемого контента. По-настоящему танцующих девушек или реального липсинка, судя по всему, станет значительно меньше :)

В этой статье вы познакомитесь с новой разработкой, узнаете о её новаторстве, архитектуре и функциях, а также о её преимуществах перед конкурентами.

Приятного прочтения!

@Mark_K 15 фев 2024 в 14:57

GPT или GigaChat — ответит RAGAS

8 мин

7.8K

Машинное обучение *

В предыдущей статье мы разбирались с тем, как RAGAS помогает оценить работу ретриверов в RAG-системах. Продолжая наше исследование, теперь мы переключаемся на другой важный аспект - качество языковых моделей, или LLM. Эти модели играют центральную роль в создании тех ответов, которые мы видим при общении с чат-ботами. Понять, насколько эффективны они в своей задаче, крайне важно, так как именно от их работы зависит успешное взаимодействие пользователей с системой.

@ph_piter 15 фев 2024 в 14:45

Книга «Python для сложных задач: наука о данных. 2-е межд. изд.»

11 мин

11K

Блог компании Издательский дом «Питер»Профессиональная литература * Машинное обучение * Python *

Привет, Хаброжители!

Python — первоклассный инструмент, и в первую очередь благодаря наличию множества библиотек для хранения, анализа и обработки данных. Отдельные части стека Python описываются во многих источниках, но только в новом издании «Python для сложных задач» вы найдете подробное описание IPython, NumPy, pandas, Matplotlib, Scikit-Learn и др.

Специалисты по обработке данных, знакомые с языком Python, найдут во втором издании решения таких повседневных задач, как обработка, преобразование и подготовка данных, визуализация различных типов данных, использование данных для построения статистических моделей и моделей машинного обучения. Проще говоря, эта книга является идеальным справочником по научным вычислениям в Python.

Читать дальше →

@SmartEngines 15 фев 2024 в 07:58

Как правильно генерировать обучающие данные для OCR?

Простой

7 мин

3.4K

Блог компании Smart EnginesОбработка изображений * Искусственный интеллектМатематика * Машинное обучение *

Мы в Smart Engines много пишем про распознавание документов. И, конечно, для распознавания документов нам требуется обучать нейросети, в частности, сети, распознающие текст на картинке. А им, как известно, нужно больше ~~золота~~ данных. И сегодня мы бы хотели поговорить о влиянии обучающих данных на итоговую сеть и о том, как такие данные синтезировать.

@veseluha 14 фев 2024 в 15:22

Total.js и интеграция с ИИ

10 мин

7.1K

Блог компании BotHubJavaScript * Node.JS * Машинное обучение * Искусственный интеллект

Обзор

Динамика приложений с искусственным интеллектом продолжает сеять вопросы по выбору “удачного” фреймворка, который мы могли бы использовать при создании. Поскольку именно от нашего выбора в принципе и зависит продолжительность жизни нашего детища.

В этой статье я бы хотела обратиться к одному старенькому фрейморку, рассмотреть его особенности и фичи, которые способные выделить его на фоне другого софта. Так ли он хорош? А если хорош, то почему?

Не буду затягивать с буквами во вступлении и предлагаю перейти сразу к делу!

Приятного прочтения(:

@FlexiTech 14 фев 2024 в 14:16

AI чат боты — хайп или реальная польза. Примеры интеграции умных помощников в CRM и ERP системы

Средний

6 мин

13K

Блог компании FlexiTech.aiИскусственный интеллектИнтернет-маркетинг * Машинное обучение * Клиентская оптимизация *

Обзор

Всем уже известно, что чат-боты дают возможность быстро и эффективно выстраивать коммуникацию с клиентами, но их истинный сила раскрывается при интеграции с корпоративными системами управления, а именно CRM (Customer Relationship Management) и ERP (Enterprise Resource Planning), HRM (Human Resource Management), интернет магазином и любой другой открытой системой.