Обновить
256K+

Визуализация данных *

Облекаем данные в красивую оболочку

30,64
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Запоминаем иностранные слова по видео-словарю, упорядоченного по грамматическим категориям и переводам

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели2.9K

Введение

Какую бы мы ни использовали методику изучения иностранного языка, рано или поздно, вопрос упирается в расширение своего словарного запас.

Самый примитивный метод для достижения данного результата – это, просто тупо, учить иностранно-русский словарь. При этом, речь не идет об изучении языка путем запоминания только его слов и их переводов. Здесь присутствует именно желание увеличить свой словарный запас, что совершенно не отменяет грамматику, а, всего лишь, способствует ей.

Многие из нас пробовали этот метод и, весьма вероятно, отказывались от него, как не оптимального.

Если задаться вопросом, в чем именно этот метод неэффективен, то, скорее всего, ответ будет заключаться в бессмысленной перегрузке своего мозга. Он ведь у нас не «железный» и ему подобные «пытки» явно не нравятся.

Хорошо, а если читать слова и переводы, но не стараться запоминать их – это улучшит процесс их усвоения или нет? Большинство, наверняка, ответят – нет.

Однако, не все так очевидно. Эксперименты показывают, что если создать озвученный, желательно «живым» голосом, видео-словарь, упорядоченный по грамматическим категориям иностранных слов и по их русским переводам, а, затем, просто внимательно его смотреть и слушать (буквально, «с открытым ртом»!), без желания что-либо специально запоминать, то тогда, слова усваиваются как бы, сами собой, без явных усилий (рис. 1). Что, конечно, удивляет!

Читать далее

Новости

Объясняю на пальцах — зачем твоему бизнесу каталог данных

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели6.6K

Статья носит исключительно образовательный/ознакомительный характер. Она не служит цели, рекламировать какой-либо инструмент или ПО. Все наименования программного обеспечения, упомянутые в статье приведены из личного опыта.

Ну-ка что там

Как рисовать для 1С бизнес-процессы, не забывая их главного участника

Время на прочтение6 мин
Охват и читатели7.5K

Просматривая содержание курсов для аналитиков 1С, я заметил любопытную закономерность. Везде учат рисовать схемы бизнес-процессов. Но нигде не учат помещать в них ключевого участника — Систему. Ту самую учетную программу, ради демонстрации которой, вообще-то, вся эта красота и рисуется.

Вместо этого ее функции размазывают между участниками процесса, как масло по бутерброду. В результате Система есть везде и нигде. И по схемам невозможно понять, что она реально делает и за что бизнес платит деньги.

Вторая проблема - универсальность. Курсы учат рисовать одну схему для всех сотрудников заказчика разом. Как будто топ-менеджер, руководитель среднего звена и исполнитель — это один и тот же человек. На практике у них три разных видения мира. В итоге схемы работают усредненно — а значит, посредственно.

И наконец, схемы рисуют, не сообщая, а зачем они? Для презентации руководству, для инструкции рядовому исполнителю или для чего-то еще?

В этой статье я покажу, как встроить Систему в схемы бизнес-процессов, адаптировать схемы под разные уровни аудитории и применять на практике — под конкретные задачи.

Читать далее

Топ-10 нейросетей для анализа данных: BotHub, Microsoft Power BI, H20.ai, Alteryx

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели10K

Помните те времена, когда мы сидели в три часа ночи, пытаясь свести VLOOKUP‑ами три кривых CSV‑файла, выгруженных из разных CRM, а питоновский скрипт падал из‑за одной запятой не в той кодировке? Кажется, это было в прошлой жизни...

На дворе апрель 2026 года. Нейросетевой анализ данных — это уже не игрушка для гиков и не R&D‑эксперимент с непредсказуемым бюджетом. Это суровая, ежедневная необходимость. Если вы сегодня не используете ИИ для очистки, обогащения и анализа датасетов, вы всё равно что копаете котлован чайной ложкой, пока соседи работают экскаватором.

По данным исследований Стокгольмского института окружающей среды, современные LLM достигают 85–90% точности по сравнению с ручной разметкой и анализом даже в таких субъективных вещах, как оценка политических и климатических документов. А в жесткой математике и структурированных таблицах этот процент стремится к абсолютным 100%.

В этой статье я собрал ультимативный топ-10 платформ, сервисов и подходов, которые перевернут ваш воркфлоу. От уютных табличек в Google Sheets до суровых кластеров для машинного обучения. Мы разберем, какие инструменты реально работают на проде, и поймем, как стать настоящим архитектором смыслов.

Пристегните скафандры, мы погружаемся. И начинаем с абсолютного геймчейнджера.

Читать далее

Печальный гений смеха. Выявляю элементы комического в текстах Зощенко с помощью Python

Время на прочтение6 мин
Охват и читатели5.6K

Зощенко умел писать точно, коротко и смешно. Попробовал с помощью Python математически установить лексические средства, которые делают язык писателя столь особенным и смешным.

Читать далее

Как я в одиночку сделал систему аналитики для Clubs в EA FC, потому что нормальной статистики там просто нет

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели8.6K

Начну с контекста. Я играю в EA FC (ранее FIFA) в режиме Clubs (11×11), где каждым виртуальным игроком управляет человек. Сам по себе режим интересный, но мне, как человеку, который любит цифры и аналитику, довольно быстро стало не хватать доступной статистики.

Я пришёл в лигу, у которой уже был свой сайт (я в этой статье опущу тему о том, что я администрировал проект порядка 3 лет). Там статистику собирали вручную: люди пересматривали записи матчей и заносили базовые показатели — голы, ассисты, перехваты, отборы и так далее. На основе этих данных считались различные рейтинги: лучшие игроки, бомбардиры, разрушители и прочее.

Выглядело это примерно так: набор таблиц, где действия сгруппированы по категориям и амплуа.

Читать далее

Интерактивные визуализаторы: внутри программных механизмов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.9K

В software engineering есть системный разрыв между «знать название технологии» и «понимать, как она работает внутри». Разработчики запоминают термины, воспроизводят определения на собеседованиях, но механику представляют приблизительно. Что именно происходит при Index Scan? Как HTTP-запрос проходит через слои Clean Architecture? Почему Observer и Mediator — это разные паттерны, если UML-диаграммы похожи?

Статичные диаграммы из книг показывают конечное состояние, но не процесс. B-Tree на картинке — это аккуратные прямоугольники со стрелками. Но как дерево строится, как перестраивается при вставке, какие страницы читаются при поиске — этого статика не передаёт.

Интерактивная визуализация закрывает этот разрыв. Не слайды и не статьи с картинками, а инструменты, где можно нажать Play и наблюдать, как система работает шаг за шагом. Ниже — обзор шести таких инструментов, покрывающих базы данных, брокеры сообщений, архитектуры, паттерны проектирования, Git-стратегии и алгоритмы.

Читать далее

Рейтинг языков программирования на GitHub: анализ 2024–2025 в JupyterLab и Anaconda

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели14K

Мы не стали спорить с TIOBE и RedMonk и собрали свой рейтинг языков программирования на основе GitHub. Данные за 2024–2025 показывают неожиданные вещи: JavaScript впереди, TypeScript резко растёт, а Rust и Go выигрывают по качеству проектов. Разбираем, что стоит за цифрами и где могут быть искажения.

Читать далее

Манипуляции в аналитике: «правильная» визуализация

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.5K

Привет, меня зовут Евгений Кириёк, я занимаюсь HR-аналитикой, преподаю и рассказываю про специфику анализа данных в области управления персоналом. 

Ниже — несколько типичных приёмов такого рода манипуляций через визуализацию данных...

Читать далее

От Google таблиц к DataLens + PostgreSQL: как мы делали BI-систему для WB и Ozon

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели7.5K

Всем привет! Меня зовут Александр. Я работаю в компании которая ведет управление личными кабинетами на маркетплейсах. И вопрос аналитики стал для нас проблемным. Испробовав много сервисов аналитики мы так и не смогли найти подходящий. Тут одно хорошо, там другое. А в кучу все собрать сложно. Мы начали тратить на это слишком много времени.

Оценив собственные силы и скилы, мы поняли: хочешь сделать хорошо, сделай это сам. И получилось. Даже лучше и больше чем планировалось изначально.

В этой статье я хочу рассказать как мы от потребности в нормальной аналитике WB и OZON прошли путь до создания своего SaaS - продукта на Datalens + PostgreSQL с оптимизацией JOIN’ов, историей себестоимости, автоматизацией процессов и классными решениями.

Читать далее

Где была Алиса Селезнева. Искал ее адреса с помощью Python

Время на прочтение4 мин
Охват и читатели8.1K

С помощью Python провел исследование космических адресов Алисы Селезневой. Вокруг нее было так много планет, неплохо исследованных, а посетила она только малую часть из них.

Читать далее

Apache Superset — боремся с фильтрами по дате. Часть 2

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.6K

В этой статье продолжаем борьбу с фильтрами по дате в Apache Superset. Сегодня разберем, как реализовать подобие логики remove_filter в старых версиях (до 5), чтобы виртуальный датасет не оборачивался фильтрами.

Читать далее

Sankey‑диаграмма движения денег: от двух дней в Illustrator до интерактива за час

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.8K

Как понять, куда на самом деле уходят деньги, если смотреть на них как на поток, а не как на набор категорий.

На реальном примере показываю, как из банковской выписки собрать Sankey-диаграмму, где помогает AI, где ошибается и какие решения приходится принимать.

В итоге получается не статичная картинка, а интерактивная модель, с которой можно работать: разбирать структуру расходов, видеть взаимосвязи и находить узкие места.
Подход применим не только к личным финансам, но и к бизнесу — для анализа движения денег, затрат и сложных процессов.

Будет полезно дизайнерам, аналитикам и всем, кто работает со сложными системами.

Читать далее

Ближайшие события

Предсказываю неочевидные факты о вас и вашем отделе по коммитам

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.8K


Статья о том, какие неочевидные вещи можно узнать о вас из логов гита. Методы ниже не бьют на 100%, но «щито поделать, десу».

Читать далее

5000 симулированных циклов: что математика говорит о децентрализованных IT-сообществах

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели4.4K

Предыдущие две статьи сформулировали гипотезу: распределённое сообщество IT-специалистов может координироваться без иерархии, зарплат и венчурного капитала — если протокол взаимодействия спроектирован правильно. Гипотеза красивая. Но красота — не аргумент. Нужна верификация. Здесь — первая попытка её провести: агентная симуляция на 500 независимых прогонов, математические метрики и один неудобный результат, который требует решения.

Читать далее

Как построить прогноз, которому верит бизнес: от Excel до нейросетей за полгода

Уровень сложностиСредний
Время на прочтение39 мин
Охват и читатели5.4K

Красивый средний MAPE не спасает, если однажды модель крупно промахнулась именно в тот момент, когда по прогнозу принимают решения. После этого бизнес перестаёт верить цифрам и начинает либо “на всякий случай” жечь миллиарды на промо, либо, наоборот, игнорирует сигнал и до последнего верит, что план выполнится сам.

В этой статье – сразу два пути: от простой Excel-сезонки, которая неожиданно обыграла Prophet и классику на длинном горизонте, к ансамблю на базе TSMixer и от наивной веры в средний MAPE – к нормальной системе оценки качества с rolling backtest, bias, EOM и деградацией по горизонту.

Это не лонгрид про ML ради ML, а история о том, как сделать прогноз рабочим инструментом бизнеса.

Читать далее

Бот для отправки графиков из Redash в Mattermost

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.2K

Расскажу, как я автоматизировала регулярную отправку графиков из BI в мессенджер.

Задача была довольно типичная: есть дашборд в redash, на который смотрят каждый день. Данные иногда приходят с задержками и нельзя быть уверенным, что в 9 утра все "доедет", плюс зайти руками и прокликать несколько разрезов это долго и неудобно, хочется сразу все видеть в мессенджере как только данные обновились.

Я опишу базовые шаги, чтобы в целом дать понимание и рассказать про такую возможность, конечно, код должен дорабатываться и персонализироваться исходя из ваших задач

Читать далее

Автоматический поиск торговых сигналов с отправкой в Telegram: полный разбор Python-системы

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели7.5K

Алготрейдинг давно вышел за пределы простых индикаторов и пересечений скользящих средних. Современные подходы опираются на анализ ликвидности, зон спроса и предложения, поведения цены внутри этих зон и реакции на них.

В этой статье разбирается полностью автоматизированная система, которая:

Читать далее

Зачем Паустовскому облака? Узнал точно с помощью Python

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.1K

Константина Паустовского называют мастером пейзажной лирики. В его произведениях природа действительно выступает не как фон событий, а как будто один из полноценных действующий персонажей. Мне стало интересно попробовать разобраться, за счет каких лексических средств писатель так здорово оперирует впечатлениями читателя.  

Читать далее

Apache Superset — боремся с фильтрами по дате. Часть 1

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.4K

В этой статье хотелось бы начать раскрытие больной для многих пользователей Apache Superset темы — фильтры по дате. Начнем с малого: как суперсет выбирает колонку даты; как выбрать желаемую колонку вместо той, которую он выбирает; каким образом это реализовано; какие баги породили этим решением; почему КОП не доведет до добра.

Читать далее
1
23 ...