TensorFlow *

открытая библиотека для машинного обучения

СтатьиПостыНовостиАвторыКомпании

LEbEdEV_AU 4 авг в 09:04

Fingers3: дорога к последовательностям (padding)

Средний

6 мин

200

Python * TensorFlow *

Туториал

С момента последней публикации о проекте Fingers прошло много времени... И я во многом продвинулся.

Вводная часть:

Ранее я анонсировал проект Fingers2 по распознаванию алфавита глухонемых (РЖЯ). При этом первая версия конструировалась по принципу обнаруженя объекта (yolo), обработка обнаруженного объекта сверточными слоями (conv2D), однако, данная гепориза показала свою не эффективность и сложность. Поэтому Fingers2 был построен на спайке mediapipe и полносвязных (dense) слоев, что показало скорость и высокую обучаемость (>99% на 34 класса). Однако, в fingers2 были использваны не все буквы. Такие буквы как Е – Ё, И – Й и Ш-Щ отличаются только движением руки, но не формой и с учетом конструкции модели, которая обрабатывает слепок кисти руки невозможно было их различить. Перфекционист во мне не мог с этим смириться и вот что получилось…

-1

balezz 18 июл в 12:39

RKNN Toolkit2: конвертация моделей и симуляция NPU Rockchip

Средний

8 мин

1.2K

Блог компании Open Data ScienceTensorFlow * Raspberry Pi * Python * Интернет вещей

Туториал

Rockchip — довольно крупная китайская компания, которая разрабатывает микросхемы для ТВ-приставок, смартфонов и планшетов. Мне довелось поработать с одноплатным компьютером Orange Pi 5, оснащенным ARM чипом RK3588 и NPU (neural processing unit) с заявленной производительностью до 6 TOPS.

В этой статье я хочу поделиться своим опытом по конвертации нейросети в формат rknn с помощью библиотеки rknn-toolkit2. Анализ процесса преобразования поможет лучше разобраться с тем, как работает эта платформа. Это полезно как для учебных целей, так и для будущих исследований.

+12

Asimandia 13 июл в 22:05

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Средний

4 мин

1.1K

Искусственный интеллектМашинное обучение * TensorFlow * R * Python *

Дайджест

BirdCLEF+ 2025 — очередная часть ежегодного соревнования от Cornell Lab of Ornithology по распознаванию звуков дикой природы. В этом году участникам предстало предсказывать целевое животное на коротких фрагментах записи, балансируя между качеством моделей и жёсткими ограничениями железа.

Разобраться в псевдолейблинге...

Aliaksei_Rudak 11 июн в 15:41

Вычисление функции потерь и градиентов в AI переводчике

Средний

10 мин

816

Машинное обучение * Искусственный интеллектPython * TensorFlow *

Туториал

Привет, Хабр!

Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.

Статья предоставляет всесторонний обзор вычисления функции потерь в машинном обучении, особенно в контексте моделей последовательностей. Она начинается с подробного описания того, как матрица логитов, генерируемая после преобразований в декодере, обрабатывается через функцию cross_entropy_sequence_loss. Эта функция играет ключевую роль в измерении расхождения между предсказанными выводами и фактическими метками. В статье описаны шаги, включая преобразование логитов в подходящий формат, применение сглаживания меток для создания сглаженных меток и вычисление кросс-энтропийных потерь с использованием softmax. Каждый этап подробно объясняется, чтобы было понятно, как каждый компонент вносит вклад в общую оценку потерь.

Кроме вычисления потерь, статья рассматривает механизм выравнивания, используемый для улучшения работы модели. Описано, как значение потерь корректируется на основе направляемого выравнивания, что позволяет модели лучше учитывать взаимосвязи между исходными и целевыми последовательностями. Также подробно рассматривается процесс вычисления и применения градиентов, иллюстрируя, как оптимизатор обновляет веса модели для минимизации потерь.

Aliaksei_Rudak 9 июн в 11:18

Оптимизация нейронных сетей для AI — переводчика

Средний

6 мин

1.2K

Машинное обучение * Искусственный интеллектTensorFlow * Python *

Туториал

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи.

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Мы поговорим о методах, которые способствуют постепенной настройке параметров модели, что может привести к более стабильным процессам обучения. Эти техники позволяют тонко настроить процесс обновления весов модели, что улучшает сходимость и в конечном итоге дает лучшие результаты.

Кроме того, в статье обсуждаются стратегии управления темпами обучения, которые играют ключевую роль в том, насколько быстро модель обучается. Понимание того, как правильно корректировать темп обучения с течением времени, может существенно повлиять на динамику обучения и сделать модели более быстрыми и точными.

Наконец, мы затронем важность управления контрольными точками, что позволяет эффективнее использовать обученные модели, усредняя веса из нескольких сессий обучения. Это помогает снизить риск переобучения и обеспечивает сохранение лучших характеристик модели, приобретенных в процессе обучения.

Nandisw 13 мая в 13:16

Основы TensorFlow (keras) на примере Heart Disease Dataset

Простой

3 мин

1.3K

Python * TensorFlow *

Из песочницы

Основы Tensorflow(keras) на примере Heart Disease Dataset. Основные возможности Tensorflow(keras). Краткий гайд.

WMT 7 мая в 15:18

Использование Daterange для поиска разрывов истории записей SCD2

Простой

9 мин

730

TensorFlow * PostgreSQL * Анализ и проектирование систем * SQL *

Мнение

Привет, Хабр!

Меня зовут Сергей Аладышев, работаю системным аналитиком на протяжении 10 лет, и в работе часто сталкиваюсь с задачами, в том числе типовыми, решения для которых выглядят понятными, но не всегда оптимальными, а главное затратными по времени.

Появляется непреодолимое желание их оптимизировать. Сегодня хочу обсудить похожую задачу: «поиск разрывов истории записей», она же: «поиск разрывов истории SCD2 в SQL». С задачей сталкивался несколько раз, но статей с её разбором не нашел, поэтому решил, что тема актуальна.

Началось все, как и всегда, с получения исчерпывающих требований от заказчика:

Dorial 29 апр в 21:54

Сделано с любовью и TensorFlow: моя первая нейронка с нуля (без GPU и с бюджетом $0)

Простой

9 мин

15K

Python * TensorFlow * Flask * Google Cloud Platform *

Когда я впервые села за компьютер с мыслью: «А не обучить ли мне нейросеть?» у меня не было понимания как это сделать и с чего начать. Зато была любовь к собакам, интерес к машинному обучению и желание разобраться, как всё работает. Так родился проект HappyPuppy - моя первая нейронка, которая распознаёт сибирского хаски и французского бульдога на фотографии. Просто загрузите фото (jpg, jpeg, png до 1MB) с вашим питомцем и модель предскажет породу.

Далее я расскажу, как на домашнем Маке появилась и выросла моя первая сверточная нейронная сеть (CNN): от идеи до работающей модели — её создание, обучение и тестирование.

Эта история будет особенно полезна новичкам в мире ИИ без опыта в программировании.

Ссылка на код на GitHub, архитектура модели и маленький ликбез по сверточным нейронным сетям будут в конце статьи.

А сейчас — история создания по шагам.

+21

dan_sw 6 апр в 21:05

Конвейер машинного обучения для классификации рукописных цифр MNIST с использованием TensorFlow Extended (TFX)

Средний

27 мин

1.7K

Python * TensorFlow * Машинное обучение *

Туториал

✏️ Технотекст 7

В рамках данной статьи будет рассмотрено построение конвейера машинного обучения для классификации рукописных цифр из базы данных MNIST с использованием фреймворка TensorFlow и TFX, а также мониторинг процесса обучения с помощью TensorBoard и выпуск модели с автоматической генерацией к ней API с помощью TensorFlow Model Server.

Основная цель данной статьи заключается в восполнении информационного пробела по теме использования TFX в контексте решения задачи классификации рукописных цифр MNIST, которая уже была представлена TensorFlow в виде одноименного репозитория tfx/tfx/examples/mnist.

BJ10 21 мар в 12:16

Нейросети для семантической сегментации: U-Net, LinkNet, PSPNet

Средний

14 мин

Программирование * Машинное обучение * Искусственный интеллектTensorFlow * Python *

Из песочницы

Всем привет! Недавно я закончил один из этапов собственного проекта, в котором я провел сравнительный анализ 3 одних из самых известных нейросетей для семантической сегментации: U-Net, LinkNet, PSPNet. Теперь я хочу поделиться со всеми, чтобы в случае, если кто-то захочет сделать что-то подобное или ему просто понадобится, то он не искал весь интернет, как я, а легко и просто все нашел. В конце главы каждый нейросети я оставил ссылки на оригинальные статьи для желающих самостоятельно все изучить (на английском). Ссылка на мой GitHub с полноценной версией всех нейросетей и main файла в конце статьи.

Я расскажу кратко о подготовке входных данных перед тем, как подавать их в нейросеть, объясню самые важные детали каждой модели по отдельности, а также покажу результаты сравнения. Использовал я библиотеку Tensorflow, а обучение проводил в среде Google Colab.

Nikarashi 25 янв в 05:07

Сегментация изображений с дефектами для промышленности на основе Unet и TensorFlow

Средний

6 мин

3.4K

Big Data * TensorFlow * Машинное обучение *

Из песочницы

В процессе работы над проектом я решил продолжить решение задачи, которую мы начали на хакатоне от компании «Норникель». Несмотря на то, что в команде не удалось отправить решение из-за технических проблем с фреймворком, я вернулся к задаче и решил её самостоятельно. Это было для меня полезным опытом, так как редко удается поработать с реальными данными с производственного процесса, и я хотел приобрести дополнительные навыки в решении подобных задач.

Artemy_Dev 6 ноя 2024 в 09:15

Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

Средний

18 мин

9.7K

Искусственный интеллектData Engineering * TensorFlow * Python *

Из песочницы

В современном мире искусственный интеллект и машинное обучение стремительно развиваются, меняя нашу повседневную жизнь и открывая новые горизонты в различных областях. Одной из ключевых технологий, лежащих в основе этих достижений, являются сверточные нейронные сети (Convolutional Neural Networks, CNN). Эти мощные алгоритмы позволяют эффективно обрабатывать и анализировать изображения, что находит применение в самых разных сферах: от медицинской диагностики до систем безопасности.

CNN подходит для классификации изображений, что делает её отличным выбором для задачи распознавания рукописных цифр.

+12

The-Founder-1 1 ноя 2024 в 14:37

Краткий свод концепций Tensor Flow

Средний

21 мин

12K

Python * TensorFlow * Искусственный интеллектМашинное обучение *

Туториал

TensorFlow — один из самых мощных и популярных фреймворков для машинного обучения, разработанный компанией Google Brain в 2015 году.

Пока старички-студенты активно практикуются в самых сложных задачах машинного обучения, новички еще практикуются с освоением практики обучения на TF.

Поэтому мы подготовили гайд с основными концептами этого незаменимого для ML-инженера фреймворка.

ANDROMAQUEHERE 22 окт 2024 в 13:15

Интеграция TFLite во Flutter: внедряем модели машинного обучения в мобильное приложение

Средний

6 мин

3.5K

Блог компании AGIMAFlutter * Python * TensorFlow *

Туториал

Привет! Меня зовут Никита Грибков, я Flutter-разработчик в AGIMA. В этой статье расскажу про фреймворк TensorFlow Lite, который позволяет интегрировать в мобильное приложение модели машинного обучения. Это полезная штука, если нужно реализовать фичи, связанные с распознаванием речи или с классификацией изображений. Покажу, как обучать модели и как затем с ними работать.

+10

The-Founder-1 18 окт 2024 в 02:29

Wolfram Natural Language Understanding или спасение для студентов

Средний

12 мин

5.9K

Искусственный интеллектTensorFlow * Python * Машинное обучение *

Обзор

Wolfram — крутая штука. Сколько школьников получило из-за него пятерку, а сколько студентов зачет, не сосчитать...

Устроено все просто: плохой ученик загружает задачку и получает приятный результат с хорошей оценкой. Все задачи считаются алгоритмически.

Хоть скопируй лабораторную по физике...

Поэтому главной загадкой этого сервиса становится перевод неподготовленной информации студента в удобоваримый для алгоритмов вариант данных.

Языковая модель (NLU) — разгадка.

alex_petrakov 15 окт 2024 в 14:15

Введение в AI Selfie Background Remover с использованием TensorFlow.js для React-приложений

Средний

4 мин

2.2K

ReactJS * TensorFlow * TypeScript * Node.JS * GitHub *

Из песочницы

Я создал "React Selfie AI Background Remover" — компонент React, который использует TensorFlow.js для удаления фона с изображений людей прямо в браузере.

✨ Основные особенности:

• 🤖 Использует MediaPipe Selfie Segmentation для точной сегментации объектов.

• ⚙️ Легко интегрируется в любое React-приложение.

• 🖼️ Доступно live demo для тестирования.

Вы можете найти компонент здесь:

• 📦 NPM

• 💻 GitHub

The-Founder-1 4 окт 2024 в 15:57

Краткий гайд по квантованию нейросетей

Средний

9 мин

6.3K

Python * TensorFlow * Искусственный интеллектМашинное обучение *

Туториал

Мы достаточно написали статей про оптимизацию ваших нейросетей, сегодня пора перейти к дроблению, уменьшению и прямому урезанию, иначе квантованию данных.

Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.

Рассказываем о видах квантования и приводим примеры в этой статье

+11

breakmirrors 1 окт 2024 в 09:37

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Средний

12 мин

5.5K

Блог компании Magnus TechПрограммирование * Машинное обучение * Искусственный интеллектTensorFlow *

Обзор

Мы продолжаем изучать, как ускоряют обучение нейросетей. В прошлой статье мы погрузились в теоретические аспекты этой проблемы. Сегодня перейдем к практике.

Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.

+30

breakmirrors 5 сен 2024 в 10:15

«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей

Средний

21 мин

Блог компании Magnus TechTensorFlow * Искусственный интеллектМашинное обучение * Программирование *

Обзор

Современные нейросетевые архитектуры достигают впечатляющих результатов в сложных задачах ИИ благодаря росту объемов данных и вычислительных мощностей. Однако обратной стороной медали стала высокая ресурсоемкость обучения.

Например, последняя версия GPT-4 от OpenAI обучалась на большом GPU-кластере. По некоторым данным, она содержит около 1,8 триллиона параметров, а ее обучение обошлось более чем в 100 млн долларов. А модель Llama 3.1 405B, вроде бы оптимизированная под ограниченные ресурсы, все равно требовала более 15 триллионов токенов и свыше 16 тысяч GPU NVIDIA H100.

И хотя нынешнее качество работы LLM уже можно действительно назвать выдающимся, на практике они подкидывают разработчикам широкий ряд проблем производительности: от запредельных объемов данных до оптимизации гиперпараметров. Все это приводит к потребности в ускорении обучения.

Мы подготовили серию материалов, которые помогут разобраться в ускорении обучения нейросетей. В этой статье рассмотрим различные теоретические аспекты от аппаратного ускорения до правильной организации самого обучения, в следующей — поговорим о практике. В общем, нас ждет глубокое погружение в тему. Приятного прочтения!

+28

Dima_RziO 30 авг 2024 в 13:24

Хайп вокруг аппаратного ускорения ИИ и реальная ситуация. Обучение модели на телефоне и результаты в миллисекундах

Простой

8 мин

3.6K

Java * Android * Машинное обучение * TensorFlow *

Кейс

Сегодня в ленте было про GPU для дата-центров. Смешно было про "мейнфреймы в офисе для AI" - в статье, на которую ссылается автор, нет ничего про то, что искуственный интеллект может или будет работать на мейнфреймах. И опять про "аппаратное ускорение AI" на пользовательских устройствах. Автор, вы сами попробуйте добраться до этого аппаратного ускорения, и если найдете как - напишите статью. А то элементарная попытка использования GPU для работы TensorFlow Lite приводит только к потерянному времени, а ускорители NPU больше не поддерживаются именно там, где должны были бы. То есть за хайпом вокруг "аппаратного ускорения ИИ" производители создали новую категорию устройств, и теперь стандартно ноутбук будет стоить в 2 раза больше, чем было раньше. А по факту пользоваться этим ускорением будут только компании-производители, чтобы еще больше заработать денег на пользователях через рекламу, "правильные" модели и торговлю персональными данными.

А мы сегодня запустим TensorFlow Lite на устройствах разного класса и года выпуска и посмотрим, что там с производительностью и ускорением.

+11

2 3 ...

10 11

TensorFlow *

Fingers3: дорога к последовательностям (padding)

Новости

RKNN Toolkit2: конвертация моделей и симуляция NPU Rockchip

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Вычисление функции потерь и градиентов в AI переводчике

Оптимизация нейронных сетей для AI — переводчика

Основы TensorFlow (keras) на примере Heart Disease Dataset

Использование Daterange для поиска разрывов истории записей SCD2

Сделано с любовью и TensorFlow: моя первая нейронка с нуля (без GPU и с бюджетом $0)

Конвейер машинного обучения для классификации рукописных цифр MNIST с использованием TensorFlow Extended (TFX)

Нейросети для семантической сегментации: U-Net, LinkNet, PSPNet

Сегментация изображений с дефектами для промышленности на основе Unet и TensorFlow

Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

Краткий свод концепций Tensor Flow

Ближайшие события

Интеграция TFLite во Flutter: внедряем модели машинного обучения в мобильное приложение

Wolfram Natural Language Understanding или спасение для студентов

Введение в AI Selfie Background Remover с использованием TensorFlow.js для React-приложений

Краткий гайд по квантованию нейросетей

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

«А можно быстрее?»: разбираем методы ускорения обучения нейронных сетей

Хайп вокруг аппаратного ускорения ИИ и реальная ситуация. Обучение модели на телефоне и результаты в миллисекундах

Вклад авторов