Статьи / Закладки / Профиль Tarzan3668 / Хабр

Пузицкий Михаил @Tarzan3668

Data Science, предприниматель

Профиль Статьи 3Посты Новости Комментарии 8

Splicerok 10 ноя 2024 в 22:07

Расширения VSCode для комфортной работы с проектами

Простой

4 мин

38K

ReactJS*React Native*JavaScript*Текстовые редакторы и IDE*VueJS*

Для работы с проектами существует куча редакторов кода и IDE (VSCode, NeoVim, SublimeText, WebStorm и т.д.). В данный момент наиболее популярны VSCode и Webstorm и у каждого есть свои плюсы и минусы. Webstorm является примером прекрасного IDE от компании JetBrains, где многие вспомогательные модули идут “из коробки”. К сожалению, сейчас нет возможности легально получить доступ к этому продукту гражданам России, поэтому многим приходится искать альтернативу. Такой альтернативой вполне может стать Visual Studio Code от компании Microsoft, который имеет открытую кодовую базу, полностью бесплатный и гибко настраиваемый под ваши нужды. В данной статье мы рассмотрим пример настройки рабочего пространства VSCode для комфортной работы с нашими проектами. Я покажу вам, какими расширениями я пользуюсь для лучшего удобства и продуктивности. Эти расширения я использую давно и они хорошо зарекомендовали себя, но возможно некоторые из них могут не подойти под ваш стиль работы и написания кода. Итак, начнем!

+52

evaldor 3 сен 2024 в 17:32

DuckDB. Колоночная OLAP СУБД в кармане

Средний

5 мин

4.5K

Блог компании ЮMoneyIT-инфраструктура*IT-компанииData Engineering*

Привет, меня зовут Антон, я старший инженер в департаменте аналитических решений ЮMoney. В компании мы используем технологию MSSQL OLAP-кубов SSAS, которая хорошо себя зарекомендовала — она сравнительно легко развёртывается и достаточно производительная. Но есть ряд минусов: Microsoft прекратил развивать её примерно в прошлом десятилетии, технология требует производительных серверов, ну и, конечно, вопрос зависимости от иностранного вендора тоже стоит остро. Поэтому, посматривая по сторонам в поисках альтернативы, я решил попробовать недавно появившуюся технологию DuckDB. Особых надежд не было, но хотелось понять, на каком она уровне по сравнению с привычными для меня инструментами.

+13

Aleron75 5 сен 2024 в 11:15

5 способов оптимизации функций в Python

Простой

3 мин

2.7K

Python*Data Engineering*Big Data*

Обзор

Всегда полезно уметь ускорить выполнение кода на python, особенно если мы имеем дело с большими объемами данных или часто вызываемыми функциями.

В этой статье мы рассмотрим 5 простых, но эффективных способов оптимизации функций в Python, которые помогут вам сделать ваш код быстрее и эффективнее.

Ускорить свой код!

MicroCephalis 28 дек 2020 в 09:02

Кватернионы, матрицы поворота и перепроецирование векторов между системами координат

5 мин

16K

Математика*

Пришлось это мне в последнее время поработать с задачами, где нужно было оперировать кватернионами и заниматься перепроецированием векторов в разные системы координат (это еще называется заменой базиса). Сначала по чужим формулам — причем с опечатками и даже, как выяснилось, с фактическими ошибками — а потом делать свои, по аналогии. И всё даже работало! Но сохранялся какой-то туман в понимании происходящего. А всё, как оказалось, из-за этих ошибок: их комбинация давала систему, в целом сохраняющую корректность, неверным путем таки достигался верный результат. Зато такая удача сильно мешала осознанию проблемы и прояснению природы феномена «верный итог при подозрительных формулах». При этом разбираться досконально времени все не было — работает же, числа выдает правильные, чего тебе еще надо, собака? Вперед, нужно больше ~~золота~~ кода! А вот сейчас пришел момент, когда я, похоже, окончательно всё понял, и хочу поделиться получившейся картинкой с окружающими. Вдруг кому пригодится, и себе памятка.

Заранее оговорюсь, что материал не претендует на академичность изложения, а скорее просто описывает удобный для запоминания способ интерпретации того, что происходит при перепроецировании векторов.

Стало быть, речь у нас пойдет в особенности о проекциях и поворотах.

Читать дальше →

artmaro 9 сен 2024 в 11:21

Replit Agent создает программы за вас или кодинг без IDE

4 мин

5.7K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftReactJS*Машинное обучение*Искусственный интеллект

Обзор

Многие слышали про AutoGPT и GPT Engineer — агентные системы, которые позволяют генерировать код по промпту от пользователя. Меня зовут Евгений Кокуйкин. Я руководитель AI продуктов компании Raft. Сегодня расскажу про Replit Agent — AI Copilot для написания кода без знаний в программировании. Без шуток! Раньше у меня на такие прототипы уходили часы кодинга и отладки. А сейчас я сгенерировал код приложения через агент — быстрее, чем писал эту статью. Так что теперь можно участвовать в хакатоне, не зная Python.

Replit — это онлайн-IDE, где с помощью AI можно быстро создать прототип приложения и задеплоить его прямо в облаке. Недавно вышла экспериментальная фича Replit Agent, которая стоит 25 баксов. Правда, для оплаты потребуется зарубежная карта, но это уже каждый сам решает, стоит заморачиваться или нет. Эта фича позволяет начать генерацию проекта одним промптом. Я так вдохновился постом Степана Гершуни, что тестировал кодинг-агента в Replit, а потом не спал всю ночь, записывая впечатления. Так появился этот обзор.

+11

IvanZaycev0717 2 авг 2024 в 17:48

Давайте сделаем крупное приложение на Flask (язык Python)

18 мин

23K

Веб-разработка*Python*JavaScript*SQL*Flask*

На Хабре я часто вижу статьи о реализации тех или иных фич на Python-фреймворках. Я объединил все эти фичи в реальный проект с открытым исходным кодом, чтобы у вас сложилась целостная картина. Мы с вами создадим UX/UI на Figma, напишем фронтенд на HTML, CSS, SASS, Bootstrap и JavaScript, создадим ER-диаграмму в MySQL Workbench, напишем бекэнд на Flask, создадим регистрацию через социальные сети OAuth 2.0 в один клик, используем брокер сообщений и асинхронную очередь Celery для отправки писем на электронную почту, сделаем WYSIWYG-редактор, реализуем полнотекстовый поиск Elasticsearch, закешируем Redis, покроем тестами pytest и запустим в Docker-контейнерах, поговорим о многопроцессности для WSGI-шлюза Gunicorn.

+25

werwooolf 21 янв 2014 в 08:59

Калман, Матлаб, и State Space Models

15 мин

27K

Программирование*Data Mining*Алгоритмы*

Недавно kuznetsovin опубликовал пост об использовании Питона для анализа временных рядов в экономике. В качестве модели была выбрана «рабочая лошадка» эконометрики — ARIMA, пожалуй, одна из наиболее распространенных моделей для временных данных. В то же время, главный недостаток АRIMA-подобных моделей в том, что они не приспособлены для работы с нестационарными рядами. Например, если в данных присутствует тренд или сезонность, то математическое ожидание будет иметь разное значение в разных участках серии —

, что не есть хорошо. Для избежания этого, АRIMA предполагает работать не с исходными данными, а с их разностью (так называемое дифференцирование — от «taking a difference»). Все бы хорошо, но тут возникают две проблемы — (а) мы возможно теряем значимую информацию беря разницу ряда, и (б) упускается возможность разложить ряд данных на составляющие компоненты — тренд, цикл, и т.п. Поэтому, в данной статье я хотел бы привести альтернативный метод анализа — State Space Modeling (SSM), в русском переводе — Модель Пространства Состояний.

Читать дальше →

+21

honest_niceman 30 авг 2024 в 12:00

Что нового в IntelliJ IDEA 2024.2

Простой

4 мин

16K

Блог компании HaulmontJava*Kotlin*Текстовые редакторы и IDE*

Обзор

Недавно вышла новая версия IntelliJ IDEA 2024.2, в которой появилось довольно много новых фич. Команда Amplicode подготовила обзор основных возможностей IDE, которые на данный момент доступны российским разработчикам без каких-либо ограничений.

+26

spring_aio 28 авг 2024 в 14:00

Workspaces в IntelliJ IDEA

Простой

9 мин

7.9K

Блог компании Spring АйОПрограммирование*Java*Kotlin*

Обзор

Перевод

Команда Spring АйО продолжает следить за последними новинками в мире инструментов для разработчиков. В нашем новом переводе вы узнаете о недавно появившемся плагине для IntelliJ IDEA, который предоставляет долгожданную многими функциональность.

+14

kirillkosolapov 3 июл 2018 в 18:17

Нейронные сети, фундаментальные принципы работы, многообразие и топология

9 мин

46K

Читальный залМашинное обучение*Математика*Искусственный интеллектАлгоритмы*

Нейронные сети совершили революцию в области распознавания образов, но из-за неочевидной интерпретируемости принципа работы, их не используют в таких областях, как медицина и оценка рисков. Требуется наглядное представление работы сети, которое сделает её не чёрным ящиком, а хотя бы «полупрозрачным». Cristopher Olah, в работе «Neural Networks, Manifolds, and Topology» наглядно показал принципы работы нейронной сети и связал их с математической теорией топологии и многообразия, которая послужила основой для данной статьи. Для демонстрации работы нейронной сети используются низкоразмерные глубокие нейронные сети.

Понять поведение глубоких нейронных сетей в целом нетривиальная задача. Проще исследовать низкоразмерные глубокие нейронные сети — сети, в которых есть только несколько нейронов в каждом слое. Для низкоразмерных сетей можно создавать визуализацию, чтобы понять поведение и обучение таких сетей. Эта перспектива позволит получить более глубокое понимание о поведении нейронных сетей и наблюдать связь, объединяющую нейронные сети с областью математики, называемой топологией.

Из этого вытекает ряд интересных вещей, в том числе фундаментальные нижние границы сложности нейронной сети, способной классифицировать определенные наборы данных.

Рассмотрим принцип работы сети на примере

Читать дальше →

+35

nkha 3 авг 2024 в 17:35

Чиним замедление YouTube на уровне роутера

Средний

6 мин

662K

Настройка Linux*ГаджетыКомпьютерное железоИнтернет вещейЛайфхаки для гиков

Туториал

Всех категорический приветствую. Буквально первого августа, прямо в ночь, стал у меня жутко лагать YouTube. Естественно, мне это сильно не понравилось. Ну, что же, давайте разбираться, почему и как это исправить в условиях моей личной сети.

Что случилось?

Хорошо описано произошедшее здесь, на Хабре. Если совсем кратко, своими словами - во время установки SSL соединения в открытом виде домен передается к которому мы подключаемся(так называемое SNI). И если это googlevideo.com то начинают твориться "интересные вещи". Можно проверить это локально коммандами из статьи.

$ curl https://speedtest.selectel.ru/100MB -o/dev/null

+412

1054

itglobalcom 1 ноя 2023 в 15:00

Джон фон Нейман: выдающийся венгерский ученый, участник Манхэттенского проекта и автор статей по квантовой механике

6 мин

10K

Блог компании ГК ITGLOBAL.COMБиографии гиков

Ретроспектива

Фон Нейман — один из величайших умов в истории человечества. Несмотря на то, что ученый ушел из жизни в возрасте 53 лет, он успел поучаствовать в создании атомной бомбы, разработке ядерной энергетики и формированию основ цифровых вычислений. В этом материале рассказали про его жизнь и научную деятельность.

Danyache 30 мар 2024 в 20:10

Attention is Not All You Need: как менялась архитектура трансформера

Сложный

4 мин

6.6K

Искусственный интеллектNatural Language Processing*

С момента выхода оригинальной статьи про трансформер прошло уже больше 7 лет, и эта архитектура перевернула весь DL: начав с NLP архитектура теперь применяется везде, включая генерацию картинок. Но та ли это архитектура или уже нет? В этой статье я хотел сделать краткий обзор основных изменений, которые используются в текущих версиях моделей Mistral, Llama и им подобным.

+23

sahsAGU 2 ноя 2018 в 10:00

Руководство по Power Bi: начало работы

4 мин

242K

Блог компании MicrosoftФинансы в ITУправление продажами*Управление e-commerce*Визуализация данных*

Туториал

Microsoft Power BI — это коллекция программных служб, приложений и соединителей, которые взаимодействуют друг с другом, чтобы превратить разрозненные источники данных в согласованные, визуально иммерсивные и интерактивные аналитические сведения. Сегодня мы делимся с вами начальным руководством по этому бесплатному инструменту. Из руководства вы узнаете следующее:

Как службы и приложения Power BI работают вместе.
Как с помощью PowerApps повысить эффективность бизнеса.
Как создавать впечатляющие визуальные элементы и отчеты.

Читать дальше →

Schvepsss 13 мар 2017 в 13:41

Как в Канаде ищут пропавших детей

11 мин

15K

Блог компании MicrosoftMicrosoft Azure*Разработка мобильных приложений*

Перевод

В прошлом году в одной лишь Канаде пропали 45 000 детей. Пугающая статистика. Для того, чтобы максимально увеличить процент найденных было разработано решение с использованием Xamarin и Azure, о котором мы расскажем под катом.

Читать дальше →

+16

Schvepsss 6 мар 2017 в 10:38

Power BI Embedded, IoT и машинное обучение для обработки термограмм мозга

7 мин

6.9K

Блог компании MicrosoftBig Data*Машинное обучение*Разработка для интернета вещей*

Перевод

Каждую неделю в Microsoft появляются кейсы, посвящённые разработке решений для компаний, университетов и даже государств. Мы решили поделиться с вами самыми интересными из них и начать серию статей «Microsoft Technical Case Studies». В первом материале вы узнаете про IoT-решение для обработки изображений «теплового тоннеля мозга» (Brain Temperature Tunnel) согласно методике, основанной на исследованиях доктора Марка Абреу (Marc Abreu) из Йельского университета.

Читать дальше →

+13

patnashev 28 июл 2024 в 15:23

Большие простые числа: вес последовательностей

6 мин

9.1K

Математика*Научно-популярное

Посмотрите на эту картинку. Она называется «скатерть Улама». Пиксели нумеруются из центра по спирали, и если номер пикселя — простое число, то он закрашивается чёрным. В глаза сразу бросаются диагональные линии. Если присмотреться, можно заметить горизонтальные и вертикальные линии. Что это? Простые числа вдруг подчиняются какому-то закону? Или же Вселенная пытается нам что-то сказать? Конечно же нет. Это наглядная иллюстрация того, что числовые последовательности могут иметь разный вес.

+62

Howuhh 29 июл 2024 в 13:01

XLand-100B: первый в мире большой датасет для контекстного обучения с подкреплением

Сложный

11 мин

2.4K

Блог компании AIRIИскусственный интеллектМашинное обучение*Big Data*Алгоритмы*

Кейс

Хабр, привет! Меня зовут Александр Никулин, я аспирант МФТИ и один из исследователей научной группы «Адаптивные агенты» в Институте AIRI.

Как можно понять из названия, наша группа заинтересована в создании адаптивных агентов, способных обобщаться на новые задачи после обучения. Направление это относительно новое и в литературе именуется как контекстное обучение с подкреплением (далее in‑context RL). И мы активно двигаем его вперед! Совсем недавно выпустили две статьи, обе приняты на ICML 2024, а ещё среду на JAX со множеством задач для мета‑обучения. Мы обязательно расскажем о них чуть позже (подписывайтесь!), а в этой статье хочется затронуть наш недавний препринт. В нем мы представили и выложили в open‑source огромный (по меркам RL) и пока единственный датасет для in‑context RL. На сбор траекторий для 40к задач и 130B транзиций потребовалось 50 000 GPU‑часов. Эту работу мы проделали совместно с коллегами из лаборатории T-Bank AI Research.

Датасетом уже можно пользоваться, так что рассказываем и надеемся на будущий акцепт статьи! Ну а начнем чуть издалека, расскажу что такое in‑context learning, как он появился в RL и почему нам понадобился собственный датасет.

+12

samsung_russia 26 июн 2020 в 11:13

Интерактивная сегментация: выделяем кошек, собак и людей

7 мин

7.2K

Блог компании SamsungМашинное обучение*Обработка изображений*

Мы уже рассказывали про некоторые работы исследователей из московского Центра искусственного интеллекта Samsung. Недавно вышла статья «f-BRS: Rethinking Backpropagating Refinement for Interactive Segmentation» Константина Софиюка, Ильи Петрова, Ольги Бариновой и Антона Конушина, которая была принята на всемирную конференцию по компьютерному зрению CVPR 2020. И в этом посте мы расскажем, о чем пишут наши коллеги в этой работе и об интерактивной сегментации как прикладной задаче компьютерного зрения в целом.

Читать дальше →

NastyaMittseva 8 июн 2023 в 12:09

SBER-MoVQGAN или новый эффективный Image Encoder для генеративных моделей

Сложный

10 мин

5.3K

Блог компании СберАлгоритмы*Обработка изображений*Машинное обучение*

Кейс

Вариационные автоэнкодеры в квантованном векторном пространстве стали довольно популярными в последние несколько лет и успешно применяются в широком спектре генеративных задач (Stable Diffusion, VQ Diffusion, VideoGPT и др.). VQVAE позволяет сжимать картинку в латентное пространство меньшей размерности, а затем восстанавливать это латентное представление изображения в RGB-состояние. Операции в латентном пространстве выполняются быстро, поэтому VQVAE получил широкое применение как в авторегрессионных мультимодальных архитектурах (DALLE, ruDALL-E, RUDOLPH), так и в диффузионных моделях (DALL-E 2, Kandinsky 2.1, Latent Diffusion). В первом случае вариационный автоэнкодер позволяет закодировать картинку в последовательность визуальных токенов, которые вместе с текстовыми токенами используются в обучении трансформера. Во втором случае VQVAE кодирует картинку в квантованное пространство малой размерности, позволяя выполнять диффузионный процесс в латентном пространстве (ввиду того, что диффузионный процесс является итеративным и скорость генерации напрямую зависит от числа шагов диффузии, вычислительная сложность каждого шага очень важна), который в сравнении с пиксельной диффузией выполняется быстрее и потребляет меньше памяти.

Во всех перечисленных задачах качество генерации напрямую зависит от качества восстановления исходных картинок с помощью VQVAE. Пару лет назад мы уже проводили эксперименты и обучали SBER-VQGAN, который на тот момент давал лучшие результаты в сравнении c dVAE и ванильным VQGAN. Подробнее об этих экспериментах можно прочитать в статье на Хабре. Однако по-прежнему нам не хватало качества восстановления в сложных доменах, таких как текст и лица, поэтому мы попытались модифицировать и улучшить SBER-VQGAN, в результате получив SoTA среди моделей по кодированию изображений.

+15

2 3 ...

21 22

В рейтинге: Не участвует

Откуда: Москва, Москва и Московская обл., Россия

Дата рождения: 3 июня 1968

Зарегистрирован: 2 июля 2017

Активность: вчера в 12:00

Data Scientist, Computer Vision Engineer

Middle

От 350 000 ₽

Research work

Computer vision

Machine learning

Natural language processing

Pytorch

Deep Learning

Neural networks

Computer Science

Reinforcement learning

TENSORFLOW

Расширения VSCode для комфортной работы с проектами

DuckDB. Колоночная OLAP СУБД в кармане

5 способов оптимизации функций в Python

Кватернионы, матрицы поворота и перепроецирование векторов между системами координат

Replit Agent создает программы за вас или кодинг без IDE

Давайте сделаем крупное приложение на Flask (язык Python)

Калман, Матлаб, и State Space Models

Что нового в IntelliJ IDEA 2024.2

Workspaces в IntelliJ IDEA

Нейронные сети, фундаментальные принципы работы, многообразие и топология

Чиним замедление YouTube на уровне роутера

Джон фон Нейман: выдающийся венгерский ученый, участник Манхэттенского проекта и автор статей по квантовой механике

Attention is Not All You Need: как менялась архитектура трансформера

Руководство по Power Bi: начало работы

Как в Канаде ищут пропавших детей

Power BI Embedded, IoT и машинное обучение для обработки термограмм мозга

Большие простые числа: вес последовательностей

XLand-100B: первый в мире большой датасет для контекстного обучения с подкреплением

Интерактивная сегментация: выделяем кошек, собак и людей

SBER-MoVQGAN или новый эффективный Image Encoder для генеративных моделей

Информация

Специализация