Articles / Bookmarks / Profile of Bienne / Habr

Аня @Bienne

Пользователь

Profile Publications 2Comments 21Bookmarks 72

NewTechAudit Nov 14 2022 at 12:36

Gluon Time Series – библиотека от Amazon для работы с временными рядами

8 min

2.7K

Machine learning*

Tutorial

Привет, Хабр!

Меня зовут Владимир Паймеров, я Data Scientist и являюсь участником профессионального сообщества NTA. Сегодня познакомлю вас с библиотекой Gluon Time Series, которую используют для работы с временными рядами.

kopytovsv Aug 30 2022 at 13:13

Как и почему перешли с Python на Go в основном сервисе рекомендаций Авито

10 min

23K

High performance*Python*Go*Machine learning*AvitoTech corporate blog

Technotext 2022

Привет! Меня зовут Василий Копытов, я руковожу группой разработки рекомендаций в Авито. Мы занимается системами, которые предоставляют пользователю персонализированные объявления на сайте и в приложениях. На примере нашего основного сервиса покажу, когда стоит переходить с Python на Go, а когда нужно оставить всё как есть. В конце дам несколько советов по оптимизации сервисов на Python.

+42

Lenny_nn Nov 3 2021 at 13:23

Как на самом деле работает распознавание лиц

15 min

25K

NtechLab corporate blog

Мы, команда NtechLab, постараемся понятным языком рассказать, из чего на самом деле состоят самые современные алгоритмы распознавания лиц, с которыми каждый из нас сталкивается в повседневной жизни, порассуждаем, на что они способны и на что — пока нет, и попробуем ответить на вопросы о том, когда технология работает хорошо, а когда плохо, и от чего это зависит.

+22

Lenny_nn Dec 15 2021 at 11:03

Алгоритм распознавания лиц [Название_Компании] признан лучшим в мире

14 min

10K

Algorithms*Image processing*NtechLab corporate blog

Мы хотим познакомить вас с самым авторитетным на сегодняшний день «чемпионатом мира» по распознаванию лиц, NIST Face Recognition Vendor Test (FRVT) — что он из себя представляет, для чего создан, как проходит соревнование и главное, насколько он действительно важен для разработчиков и бизнеса.

stranger777 Feb 7 2022 at 21:41

Stacks Project — учебник по алгебраической геометрии с открытым исходным кодом

5 min

7.4K

Open source*Mathematics*Skillfactory corporate blogData visualization*Popular science

Translation

Последние 15 лет профессор Колумбийского университета Йохан де Йонг посвятил тому, что собирал основополагающие теоремы алгебраической геометрии в одном месте. Его творение, Stacks Project, предлагает новую модель организации и визуализации математических сведений.

К старту флагманского курса по Data Science рассказываем о проекте профессора.

+11

Aleron75 Jan 11 2022 at 09:19

5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе

5 min

24K

Python*Data Mining*Big Data*

Поговорим про способы жульничества в Data Science.

+56

XHuviX Mar 24 2022 at 12:16

Что лучше: Spark Structured Streaming или полное прекращение работы прода?

9 min

8.8K

Python*Big Data*Machine learning*Ozon Tech corporate blogData Engineering*

Tutorial

Правильное построение ETL-процессов (преобразования данных) — сложная задача, а при большом объёме обрабатываемых данных неизбежно возникают проблемы с ресурсами. Поэтому нам требуется выискивать новые архитектурные решения, способные обеспечить стабильность расчётов и доступность данных, а при необходимости и масштабируемость — с минимальными усилиями.

Когда я пришел в Ozon, мне пришлось столкнуться с огромным количеством ETL-джоб. Прежде чем применить модель машинного обучения, сырые данные проходят множество этапов обработки. А само применение модели (то, ради чего существует команда) занимает всего 5% времени.

+14

worksolutions Jan 18 2022 at 16:24

Нейродайджест: главное из области машинного обучения за декабрь 2021

4 min

4.6K

Python*Machine learning*Artificial IntelligenceTensorFlow*

Генерация 3D-моделей из текстового описания и видеозаписей, сделанных на обыкновенный смартфон, конкурент DALL-E, ускоренная GAN-инверсия и многое другое в подборке материалов за декабрь, а также небольшие новости о будущем дайджеста.

Перейти к обзору

+12

infinityeight Jan 29 2022 at 16:48

Digital art и искусственный интеллект — симбиоз цифр и искусства

5 min

3.4K

Image processing*Machine learning*Artificial IntelligenceCryptocurrenciesTensorFlow*

From sandbox

В качестве предисловия оговорюсь, что на Хабре я впервые, решил представить свою дебют на этой платформе, так сказать. Речь здесь не пойдёт о рисовании картин с использованием AI и графических паттернов. Скорее наоборот, превращение классического изобразительного исксства в многочисленную последовательность нейронных сетей в итоговым кодом в заключительном виде. Расскажу предысторию. В начале этого года, случайным образом, попало в моё поле зрения одно заманчивое словосочетание - digital art. И так как я в теме crypto уже давненько, я не смел не поинтересоваться, каким образом искусство (будь то живопись или музыка) коррелирует с криптой, и как это происходит (и для чего))) на просторах блокчейна. В итоге ознакомления с этой идеей, и не только идеей, но и инфраструктурой NFT (Non-Fungible-Token, невзаимозаменяемый цифровой актив), я с радостью обнаружил что уже хочу создать что-то подобное, но в своём, авторском исполнении. Парой слов опишу, что зверёк по имени НФТ это хэшированное изображение в любом формате, записанное в сети блокчейн в формате, являющегося аналогом ERC-721 в сети Ethereum (для тех кто ещё не в курсе темы). Задуманному быть конечно, но сказать легко, а вот сделать - труднее. Особенно, когда делаешь что-то впервые. Начал я с изучения подобных платформ на просторах всемирной паутины, начиная с крупнейших маркетплейсов opensea.io, makersplace.com, и не очень крупных, pixeos.art, ghostmarket.io и много много других.

Кроме маркетплейсов, я обнаружил чисто minting-платформы, как правило тематические, т.е. они занимаются только созданием NFT карточек и как-правило одного направления. Криптокотики всякие (с них всё и началось!), Криптопанки и прочая фауна. Нашлось кроме всего пару аутсайдеров, которые вовсе создавали неформатные NFT, с прицелом на автоматическое масштабирование за счёт пользователей, к примеру на одной из платформ за NFT контент принимаются уникальные ссылки в интернете, на другой - регистрируются домены, а заодно и снимок с NFT. Не буду сильно углубляться в обозревание ежедневно растущего формата цифровых активов NFT, а лучше наконец-то перейду к своей задумке.

Читать далее: критерии распознавания арта

kucev Sep 7 2021 at 14:11

Лучшие инструменты аннотирования для компьютерного зрения в 2021 году

9 min

6.1K

Data Mining*Image processing*Big Data*Machine learning*Personnel Management*

Translation

Мы уже долгое время занимались регулярной публикацией обзоров лучших инструментов аннотирования на рынке. Радостно видеть, что экосистема всегда динамична, а у платформ аннотирования появляются всё более мощные функции.

Все наши обзоры совершенно честны и основаны на личном опыте аннотирования тысяч изображений и видео для различных проектов и областей применения.

В этом году мы хотим поделиться списком лучших инструментов для разметки и аннотирования в 2021 году (вне какого-либо порядка).

Как и в предыдущих списках, мы оценивали инструменты по следующим параметрам:

Функции
Автоматизация
Управление проектами

Читать дальше →

KD637 Oct 7 2021 at 22:33

Как написать генератор изображений, который вас понимает

13 min

35K

Website development*Python*Programming*Skillfactory corporate blogMachine learning*

Tutorial

Translation

Автор статьи рассказывает, как за неделю создал Text2Art.com — генератор изображений на основе VQGAN+CLIP, способный рисовать пиксель-арт и живопись, а также изображать то, что вы напишете в текстовом поле.

Для интерфейса используется Gradio, модель работает на сервере FastAPI, а системой очереди сообщений служит Firebase. Подробностями делимся к старту курса по ML и DL.

+12

Saygin Oct 22 2021 at 12:43

Подборка бесплатных курсов для тех, кто делает первые шаги в Data Science

Easy

3 min

66K

Data Mining*Big Data*Machine learning*Studying in IT

Tutorial

Курсы упорядочены по степени необходимости, начиная с базовых знаний, без которых будет тяжело даваться дальнейшее изучение (линейная алгебра, статистика, базовое знание python и т.д.), переходя к более сложным. Старался избавиться от избыточности, оставляя только самые ценные, на мой взгляд, курсы. Эти бесплатные курсы легко заменят вам платные.

+13

varanio Apr 17 2019 at 21:48

Понимание джойнов сломано. Это точно не пересечение кругов, честно

4 min

310K

Website development*PostgreSQL*Programming*SQL*

Так получилось, что я провожу довольно много собеседований на должность веб-программиста. Один из обязательных вопросов, который я задаю — это чем отличается INNER JOIN от LEFT JOIN.

Чаще всего ответ примерно такой: "inner join — это как бы пересечение множеств, т.е. остается только то, что есть в обеих таблицах, а left join — это когда левая таблица остается без изменений, а от правой добавляется пересечение множеств. Для всех остальных строк добавляется null". Еще, бывает, рисуют пересекающиеся круги.

Я так устал от этих ответов с пересечениями множеств и кругов, что даже перестал поправлять людей.

Дело в том, что этот ответ в общем случае неверен. Ну или, как минимум, не точен.

Читать дальше →

+97

225

EnglishDom Jan 29 2021 at 19:04

Не можете запомнить порядок слов в английском предложении? Вжарьте по нему «опсашком»

6 min

44K

Reading roomEnglishDom corporate blogLearning languages

В русском языке порядок слов в предложении практически не важен.

«Я тебя люблю», «Я люблю тебя», «Тебя я люблю», «Люблю я тебя». Нюансы есть, но при этом каждый из этих вариантов грамматически правильный.

В английском все не совсем так. Есть фраза «I love you», а «You love I» — уже нет, так говорить неправильно. Вот только в английском есть свои способы, как сделать язык богаче и не привязываться к жесткой структуре «подлежащее-глагол-сказуемое».

Об этом сегодня и поговорим. Как правильно организовать порядок слов в английском предложении и не показаться скучным. Спойлер: «опсашком» в заголовке — это не описка, а реальный мнемонический инструмент. Обо всем расскажем в статье.

+31

121

mongohtotech Aug 5 2021 at 20:25

Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

10 min

11K

Cloud computing*Big Data*Machine learning*Google Cloud Platform*Data Engineering*

Tutorial

Рассказываем как перестать переживать о том, что вы не знаете Hadoop и вывести работу с данными в компании на новый уровень, как быстро и без больших затрат создать в аналитическое хранилище, наладить процессы загрузки туда данных, дать возможность аналитикам строить отчеты в современных BI инструментах и применять машинное обучение.

doroshenkoam Mar 6 2022 at 14:35

Собеседование Golang разработчика (теоретические вопросы), Часть I

14 min

117K

Programming*Go*IT career

From sandbox

Technotext 2021

Как сейчас проходят собеседования на golang разработчика? Что спрашивают?

+45

AlexeyMerzlyakov Aug 4 2021 at 20:19

ROS: стань контрибьютором самого большого Open Source проекта в робототехнике

9 min

8.5K

Open source*Samsung corporate blogRobotics development*Robotics

ROS - самая популярная открытая робототехническая платформа в настоящий момент. Я и мои коллеги в Samsung Research - основные контрибьюторы Navigation2 Stack, важнейшего компонента ROS, который отвечает за движение роботов.

В этой статье я расскажу в целом о ROS, о разрабатываемом нами стеке и о том, как организована коллективная работа над проектом. В заключение - о нашем треке в школе разработчика COMMoN, которую мы со Стивом Масенски из Samsung Research America, лидером проекта ROS2 Navigation Stack, проведем в августе-сентябре этого года в рамках конференции Samsung Open Source Conference Russia. Участники школы получат шанс внести вклад в репозиторий стека и сделать свой коммит в известный проект.

DellTechTeam Dec 26 2017 at 12:13

Рабочие станции Dell: для творческих задач и экстремальной производительности

9 min

9.8K

Dell Technologies corporate blogAR and VRMonitors and TVDesktop PC's

В этом году компания Dell отмечает 20-летие продуктовой линейки рабочих станций Precision. Недавно она пополнилась новыми настольными моделями: Precision 5820 Tower, Precision 7820 Tower и Precision 7920 Tower в башенном корпусе; Precision 7920 Rack в стоечном исполнении, а также мобильной рабочей станцией Precision 5520, выпуск которой как раз и приурочен к юбилею. Начинка и дизайн систем полностью обновились, чтобы сделать рабочие процессы еще более творческими. Кроме того, Dell объявила о начале поставок «умного» цифрового рабочего стола Dell Canvas.

Читать дальше →

snaky Oct 24 2008 at 23:18

Логика английских времен

6 min

71K

Learning languages

Изучавшие или изучающие английский язык знают, каким страшным может казаться множество английских временных форм глаголов.
Всего в английском 12 временных форм. А в русском-то, на первый взгляд, всего 3, и как их связать с английскими, для новичка может быть совершенно не понятно.

Читать дальше →

+150

202

trehleb Oct 31 2018 at 18:52

Машинное обучение в MatLab/Octave: примеры алгоритмов, подкрепленные формулами

2 min

13K

Programming*Machine learning*Artificial Intelligence

Недавно я начал изучать machine learning. Начал с прекрасного, на мой взгляд, курса от Andrew Ng. И чтобы не забыть, а так же повторить выученное решил создать репозиторий Machine Learning in Octave. В нем я собрал математические формулы для гипотез, градиентных спусков, "cost function"-ов, сигмоидов и прочих фундаментальных для машинного обучения "штук". Так же добавил туда упрощенные и доработанные примеры реализации некоторых популярных алгоритмов (нейронная сеть, линейная/логистическая регрессия и пр.) для MatLab/Octave. Надеюсь эта информация будет полезна для тех из вас, кто планирует начать изучение machine learning-а.

Читать дальше →

+15

2 3 4