Как стать автором
Обновить

Делаем обучающие датасеты для больших языковых моделей

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров6.2K

Дообучение больших языковых моделей на кастомных датасетах делает модели гораздо сообразительнее. Есть история успеха датасета alpaca. Он творит чудеса с моделями, которые сначала если и умели что-то делать, то делали это очень плохо. Мы решили понять, как это делается, а главное - какие проблемы есть на этом пути и могут ли новички вроде нас разобраться в этом. История взлетов и падений - под катом.

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии0

Как deep learning помогает в разработке персонализированной терапии рака?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.7K

Специалистам в области технологий и медицинских инноваций посвящается новое слово в борьбе с раком – применение глубокого обучения, использованное исследовательской командой университета Джона Хопкинса для индивидуального анализа генетических данных пациентов. В мире, где онкология является неотъемлемой частью нашего здравоохранения, эта инновационная технология предлагает персонализированный подход к лечению, основанный на алгоритмах машинного обучения.

Он не просто борется с болезнью, а анализирует многочисленные факторы, связанные с онкологической патологией конкретного пациента. Это не просто лечение, это индивидуально настроенная стратегия, созданная благодаря силе глубокого обучения.

Моя статья направлена на то, чтобы донести до специалистов в области медицины и машинного обучения важность этого направления. Приглашаю вас изучить эту захватывающую технологию и присоединиться к обсуждению. 

Давайте вместе взглянем на возможность изменения стратегии борьбы с раком и наступления новой эры в медицинских исследованиях!

Читать далее
Всего голосов 6: ↑6 и ↓0+6
Комментарии0

Как машинлернеры мерили экспрессию генов от воздействия лекарств

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.6K

Привет! Меня зовут Дима и я веду канал про соревновательный МЛ. Недавно мы выиграли приз в довольно престижном соревновании и я сделал обзор всех лучших решений

Хочу вам рассказать о Open Problems, где не удалось взять золото, но все равно все очень довольны, ведь мы взяли 13 место и специальные приз жюри, который позволил нам выступить на NeuralIPS.

Начнем с краткого описания соревнования:

Компания-организатор занимается тем, что пытается оптимизировать проведение дорогостоящих экспериментов с препаратами на живых, но отделенных от самих созданий клетках 🧪 (in vitro) 🧪. У клеток много разных типов и препарат лечащий одну клетку мог спокойно убить все клетки другого типа в том же организме. Взяли много таких экспериментов, в том числе контрольные. Можно увидеть на картинке подробности того, как проводился тест

Читать далее
Всего голосов 9: ↑7 и ↓2+5
Комментарии3

Baidu опубликовала демо инструмента глубинного обучения PaddlePaddle

Время на прочтение2 мин
Количество просмотров7.5K


Китайский поисковый гигант Baidu опубликовал демо-версию исходного кода своего инструмента глубинного обучения PaddlePaddle (PArallel Distributed Deep LEarning) на GitHub. Анонс всего кода PaddlePaddle состоится 30 сентября.

Согласно информации на GitHub, сейчас сборка PaddlePaddle сырая и к массовому «употреблению» заинтересованными лицами готова не до конца. Разработчики заранее предупреждают, что еще не все файлы и пакеты готовы к установке, поэтому у желающих опробовать публичную демо-версию могут возникнуть серьезные проблемы при попытке работы с PaddlePaddle.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии2

Microsoft представила обновление своего набора инструментов Cognitive Toolkit

Время на прочтение1 мин
Количество просмотров6.9K


Вчера компания Microsoft в своем официальном блоге представила публике обновление своего набора инструментов Microsoft Cognitive Toolkit — системы для проектирования и обучения глубинных, сверточных и рекуррентных сетей.

Кроме того, Cognitive Toolkit дает возможность использовать обучение с подкреплением. Cognitive Toolkit предлагается использовать в таких сферах как распознавание объектов, речи и поиска релевантных результатов.
Читать дальше →
Всего голосов 12: ↑12 и ↓0+12
Комментарии1

Новости машинного обучения. Самое интересное из пяти рассылок

Время на прочтение3 мин
Количество просмотров4.2K

Наиболее интересные новости из пяти почтовых рассылок. Новые технологии, идеи по применению и гипотезы.


Machine Learning everywhere

Читать дальше →
Всего голосов 6: ↑4 и ↓2+2
Комментарии0

Новости машинного обучения. Выпуск 6

Время на прочтение4 мин
Количество просмотров3.7K

Предыдущий выпуск


Новости ML, новые технологии, идеи по применению и гипотезы.


Lattice Light-Sheet Microscopy

Читать дальше →
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Новости машинного обучения. Выпуск 7

Время на прочтение2 мин
Количество просмотров3.9K

Предыдущий выпуск


Новости ML, новые технологии, идеи по применению и гипотезы.


Nvidia GauGan


Изображение сделано в Nvidia GauGan. Видео, статья и исходный код.

Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии1

Новости машинного обучения. Выпуск 8

Время на прочтение2 мин
Количество просмотров2.8K

Предыдущий выпуск


Экзоскелеты; бионические протезы; промышленные роботы; исследование автоматических рекоммендаций Ютуба; создание моделей машинного обучения в браузере с помощью MediaPipe; виртуальная клавиатура для смартфонов; 5G; еще раз о сильном и слабом ИИ.

Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Microsoft представила DeepSpeed для тренировки нейросетей на моделях с >100 млрд параметров

Время на прочтение2 мин
Количество просмотров6.9K
image

Microsoft выпускает библиотеку с открытым исходным кодом под названием DeepSpeed, которая значительно расширяет возможности обучения для больших моделей естественного языка. Она дает возможность обучения нейросетей на моделях со 100 млрд параметров и более. DeepSpeed ​​совместима с PyTorch.
Читать дальше →
Всего голосов 13: ↑13 и ↓0+13
Комментарии1

Приглашаем на Samsung AI Forum 2020 

Время на прочтение3 мин
Количество просмотров1K
Samsung AI Forum пройдет уже в четвертый раз, но онлайн — впервые. Трансляции будут вестись на официальном YouTube-канале Samsung 2 и 3 ноября, для участия необходима регистрация на сайте форума. Несмотря на то, что в Москве в это время будет глубокая ночь, мы очень советуем постараться присоединиться к стриму. Ведь выступать в этом году будут самые крутые в мире исследователи в области искусственного интеллекта: Йошуа Бенджио, Ян ЛеКун, Кристофер Мэннинг и другие. Для тех, кто не сможет, будет доступна запись.


На форуме выступят крутейшие ученые мира в области ИИ, такие как Ян ЛеКун и Йошуа Бенджио (на фото), получившие премию Тьюринга за открытие глубоких нейронных сетей

Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии0

Глубокое обучение на Kotlin: вышла альфа-версия KotlinDL

Время на прочтение3 мин
Количество просмотров5.5K

Всем привет!


На днях мы выпустили первую альфа-версию KotlinDL, фреймворка для глубокого обучения нейросетей, API которого мы старались сделать максимально похожим на Keras (фреймворк на Python поверх TensorFlow).


В KotlinDL вы найдете простые API как для описания, так и для тренировки нейронных сетей. За счет высокоуровневого API и аккуратно подобранных значений по умолчанию для множества параметров мы надеемся снизить порог входа в глубокое обучение на JVM. Вот так, например, выглядит тренировка и сохранение простой нейросети, написанной при помощи KotlinDL:

Читать дальше →
Всего голосов 17: ↑17 и ↓0+17
Комментарии4

Phygital podcast — разговариваем о 3D ML и phygital технологиях

Время на прочтение3 мин
Количество просмотров1.1K

Всем привет хабровчане и любители 3D ML!

Мы уже ведем на хабре серию заметок про 3D ML, а теперь еще и выпускаем на нашем youtube канале визуальный подкаст "PHYGITAL PODCAST", где освещаем новости из мира ML, 3D и phygital технологий, а также вкратце излагаем суть выпущенных здесь заметок.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

OpenCV ищет студентов для Google Summer of Code-2021

Время на прочтение1 мин
Количество просмотров2K

Крупнейшая библиотека компьютерного зрения OpenCV присоединилась к программе Google Summer of Code-2021 и объявляет набор студентов, которые хотели бы попробовать свои силы и заодно помочь улучшить работу библиотеки. Детальную информацию об OpenCV и ее участии в GSoC можно найти здесь

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Круглый стол «Искусственный Интеллект – Machine Learning – Deep Learning: наше будущее или временный тренд»

Время на прочтение2 мин
Количество просмотров2.4K

В чем разница между искусственным интеллектом (AI), машинным обучением (ML) и глубоким обучением (DL)? Где заканчивается ML и начинается AI? Как это работает, почему без человека не обойтись и какую цену придется заплатить за ошибку? Вместе с ABBYY, «Цифровая Индустриальная Платформа», «ТОЧКА», «Лига Цифровой Экономики» обсуждаем эти и другие вопросы по ИИ в рамках круглого стола на конференции «Технореволюция ‌2.0»‌‌ от IT-компании SimbirSoft

20 марта приглашаем CEO, CTO, CIO, IT-директоров, руководителей всех уровней, владельцев продуктов, маркетологов, HR-специалистов и разработчиков на «Технореволюцию 2.0»‌‌ от SimbirSoft. 

В интерактивном формате поговорим о трендах на примерах реальных кейсов, обсудим особенности менеджмента в IT-индустрии, а также поспорим на тему искусственного интеллекта. 

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии0

Первая публикация с участием ВТБ на главной конференции по Data Science — NeurIPS 2021

Время на прочтение1 мин
Количество просмотров545

NeurlPS — самая большая в мире и авторитетная среди data scientists конференция по машинному обучению и развитию искусственного интеллекта.

Алексей Пустынников (DS VTB Bank) и Дмитрий Еремеев (DS РОСГОССТРАХ) заняли 2 место в конкурсе Shifts Challenge в рамках NeurIPS 2021 и представили результаты своего исследования в рамках Bayesian Deep Learning workshop.

Конкурс, организованный коллаборацией Oxford Applied and Theoretical Machine Learning Group, Yandex Research и University of Cambridge, был посвящен применению и анализу техник байесовского глубокого обучения в промышленных задачах в условиях изменения распределения данных (distributional shift). Команда приняла участие в треке «Предсказание траекторий движения». Разработанное решение предсказывает наиболее вероятные будущие траектории участников дорожного движения, а также может оценить степень неуверенности модели в своих предсказаниях, что является ключевым элементом для безопасности беcпилотных автомобилей.

Команда заняла 2 место, опираясь на последние достижения в областях Bayesian Deep Learning и Vehicle Motion Prediction, при этом достигла наилучшей точности непосредственно в предсказании траекторий среди конкурентов. Для построения модели организаторы предоставили самый большой на текущий момент набор данных для задачи Motion Prediction, включающий в себя более 1600 часов движения, записанных во время поездок по городам России, Израиля и США в различных погодных условиях.

С результатами исследования можно ознакомиться в статье «Estimating Uncertainty For Vehicle Motion Prediction on Yandex Shifts Dataset» по ссылке arxiv.org/abs/2112.08355.

Читать далее
Всего голосов 11: ↑6 и ↓5+1
Комментарии0

NVIDIA представила технологию создания 3D-моделей на основе фотографий

Время на прочтение2 мин
Количество просмотров6.2K
image

Компания NVIDIA показала приложение GANverse3D, которое с помощью машинного обучения создаёт 3D-модель из одной фотографии. Разработчики компании продемонстрировали подробности, создав модель машины «КИТТ» из телесериала 80-х «Рыцарь дорог».
Всего голосов 15: ↑15 и ↓0+15
Комментарии2

Автоматический перевод текста, HTML, файлов без ограничений на 100 языков для ваших проектов. Офлайн. API, сервер, SDK

Время на прочтение5 мин
Количество просмотров8.2K

Я занимаюсь переводчиками с 2012 года, и эта тема выбрана не случайно. Еще тогда было замечено, насколько сильно переводы могут влиять на показатели бизнеса. В нашем случае поддержка всего 15 языков вместо одного позволила увеличить количество скачиваний мобильных приложений до 35 миллионов без затрат на рекламу. Никакие другие действия не давали такой пользы с учетом потраченного времени и денег. И это стало основной причиной того, почему я выбрал это направление.

Несмотря на глобализацию, проблема языкового барьера до сих пор актуальна. В мире насчитывается более 7 тысяч языков, на которых общаются более 7 миллиардов жителей. По статистике, каждый год более 1 миллиарда человек ищут в интернете решения, связанные с переводами.

Каждый день увеличивается количество данных на разных языках. Доля английского языка в интернете сократилась до 25% в последние годы.

· Согласно недавнему опросу в восьми странах, более 72% потребителей заявили, что у них больше шансов совершить покупку на веб-сайте, если он будет на их родном языке.

· 42% потребителей Европейского Союза не покупают товары или услуги, представленные на иностранном языке, даже если они свободно говорят на этом языке.

· Компании, которые локализовали свой контент, в 2,5 раза чаще испытывают рост прибыли в годовом исчислении и в 1,8 раза чаще испытывают рост доходов.

· Для предприятий, локализовавших информацию, предназначенную для коммуникации с клиентами и партнерами, увеличение выручки было в 2,67 раза более вероятным, а рост прибыли — в 2,6 раза более вероятным.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии9

Анонс октябрьских обучающих вебинаров для инженеров

Время на прочтение2 мин
Количество просмотров591

Всем привет. В октябре мы запланировали 3 бесплатных вебинара для инженеров. Приглашаем вас принять в них участие.

Темы вебинаров:

Глубокое обучение в инженерных системах

Быстрое прототипирование и полунатурное моделирование с машинами реального времени РИТМ

Разработка на ПЛИС с применением IP-ядер российского производства

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Открытый семинар «Предсказание границ объектов в задаче семантической сегментации»

Время на прочтение1 мин
Количество просмотров345

7 апреля в 16:30 (мск) пройдёт открытый семинар «Предсказание границ объектов в задаче семантической сегментации».

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Комментарии0