Обновить
83.23

Big Data *

Большие данные и всё о них

Сначала показывать
Порог рейтинга

10 бесплатных онлайн-курсов и занятий, которые стоит пройти в апреле

Время на прочтение5 мин
Количество просмотров15K

Здесь мог быть вдохновляющий текст о том, что весной всё обновляется, пора обновиться и вам, вот это всё. В жизни всё проще: хотите расти и развиваться — учитесь. Вдохновляем на перемены подборкой наших популярных и бесплатных программ по программированию и аналитике.

Читать далее

Роботизация и BI: как перейти от данных к решениям

Время на прочтение1 мин
Количество просмотров388

Согласно отчёту Asana «Индекс-анатомии работы», около 60% времени сотрудники тратят на рутинные процессы. В общей сложности повторяющиеся задачи обходятся компаниям в 19 рабочих дней в год на одного сотрудника.

А по данным исследования агентства Bloomberg, 27% ошибок в бухгалтерском учёте возникают из-за ввода данных вручную. Рутина снижает креативность, мотивацию и внимание, что приводит к большему количеству ошибок.

20 марта на вебинаре расскажем о том, как уменьшить объём однообразной работы, снизить количество ошибок, связанных с человеческим фактором, и освободить время сотрудников для выполнения стратегических задач за счёт синергии Цифрового сотрудника (RPA) и BI-систем. Подробности и регистрация — по ссылке

Что обсудим

Функция генерации UUIDv7 включена в стандартную библиотеку Python

Время на прочтение1 мин
Количество просмотров2.4K

Ссылка на документацию

За образец взята функция Uuid::new_v7 (см. описание реализации) из очень популярной библиотеки uuid языка Rust.

Функция uuid.uuid7( ) генерирует основанный на времени UUID версии 7 в соответствии с RFC 9562. Требует импорта модуля uuid.

Для работы на платформах, не поддерживающих точность менее миллисекунды, UUID, создаваемые этой функцией, содержат 48-битную временную метку (timestamp) и используют 42-битный счетчик, чтобы гарантировать монотонность в пределах миллисекунды.

Добавлена в версии 3.14.0a5 (не выпущенная версия).

Читать далее

PIX Robotics запускает «PIX Триатлон 2.0» — новый расширенный курс по работе с данными и бизнес-процессами

Время на прочтение2 мин
Количество просмотров503

Перезапускаем бесплатный онлайн-курс по работе с данными и процессами «PIX Триатлон»!

Осенью 2024 года мы запустили масштабный проект по обучению сразу по трем направлениям: управление бизнес-процессами, бизнес-аналитика и программная роботизация. Обучение прошли свыше 3 800 участников: профильных экспертов и студентов, собственников бизнеса и руководителей компаний из разных отраслей.

Так что в новом году мы решили его прокачать еще сильнее и выпустить «PIX Триатлон 2.0» – расширенную версию курса, который дополнили шестью продвинутыми уроками по использованию передовых инструментов цифровизации бизнеса. А кроме того, участники получат возможность первыми протестировать новые продукты компании PIX Robotics. 

Читать далее

RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии

Время на прочтение2 мин
Количество просмотров365

27 февраля в 18:00 онлайн и офлайн в Москве состоится митап от РСХБ.цифра для дата-аналитиков и инженеров данных RSHB DA Meetup: Качество данных и Data Vault 2.0 в действии. Приглашаем на новый митап всех, кто занимается большими данными и следит за их качеством. Вас ждут три доклада от руководителей дата-направлений в разных компаниях — про песочницу данных, методологию Data Vault 2.0 и качество данных в Self-Service.

Зарегистрироваться на митап

Подтверждена совместимость Luxms BI и Platform V Pangolin DB

Время на прочтение2 мин
Количество просмотров317

Система управления базами данных (СУБД) Platform V Pangolin DB от СберТеха получила сертификат совместимости с системой бизнес-аналитики Luxms BI.

СберТех и ГК Luxms помогут компаниям обеспечить надежный технологический стек для управления бизнес-процессами.

В результате двухстороннего тестирования продуктов компаний была подтверждена корректность работы решений. Их совместное применение позволит российским компаниям обеспечить надежный технологический стек для управления бизнес-процессами.

Читать далее

ЦРУ разработало чат-бота для общения с виртуальными версиями президентов и премьер-министров

Время на прочтение2 мин
Количество просмотров1.4K

Американское разведывательное агентство внедряет в работу искусственный интеллект. Разработанный ЦРУ чат-бот позволяет сотрудникам общаться с виртуальными копиями иностранных президентов и премьер-министров, чтобы пытаться предсказать их поведение.

Читать далее

Новый релиз Luxms BI 10.3

Время на прочтение1 мин
Количество просмотров1.1K

Новый год начинается с нового релиза Luxms BI 10.3, который включает ряд улучшений и новых возможностей.

Luxms BI - это платформа для визуализации и анализа данных, которая помогает компаниям контролировать процессы, анализировать показатели эффективности и готовить интерактивные отчёты.

Основные функциональные особенности раскрыты в статье «Плюсы и минусы Luxms BI: честный взгляд на платформу от вендора». Мы постоянно работаем над развитием платформы, и в этом посте рассказываем об изменениях в последнем релизе.

Читать далее

Функция генерации идентификаторов формата UUIDv7 уже закоммичена в PostgreSQL

Время на прочтение1 мин
Количество просмотров2.9K

Функция uuidv7() генерации идентификаторов формата UUIDv7 (метод 3) в соответствии с RFC 9562 уже закоммичена и теперь гарантированно попадет в 18 версию PostgreSQL, выход которой ожидается в сентябре 2025 года. До этого можно пользоваться каким-нибудь из имеющихся расширений PostgreSQL.

Реализация имеет три особенности:

Читать далее

Сертификат совместимости Luxms BI v10 и Astra Linux 1.8

Время на прочтение2 мин
Количество просмотров327

Эксперты «Группы Астра» подтвердили совместимость операционной системы нового, восьмого поколения Astra Linux 1.8 с платформой для бизнес-аналитики Luxms BI v10. Это очередной шаг в развитии технологической кооперации отечественных решений, направленный на повышение безопасности и отказоустойчивости ИТ-инфраструктуры.

Luxms BI прошла испытания на совместимость с Astra Linux 1.8, подтвердив свою стабильную и корректную работу под управлением данной отечественной операционной системы. Программный стек поддерживает работу с критически важными данными в защищенной среде, что позволяет заказчикам принимать взвешенные решения, сохраняя конфиденциальность и обеспечивая устойчивость бизнес-процессов.

Обновленная версия Astra Linux стала современнее, безопаснее и удобнее, среди важных ее особенностей: улучшенная кодовая база, встроенный PostgreSQL и увеличенный срок поддержки, что делает ОС более выгодным выбором для корпоративных пользователей.

Использование двух импортонезависимых ИТ-продуктов позволяет заказчикам не только минимизировать риски, но и максимально эффективно использовать современные инструменты для достижения стратегических целей.

Читать далее

5 проектов c Luxms BI на конкурсе «Проект Года 2024» от GlobalCIO

Время на прочтение2 мин
Количество просмотров375

Сразу 5 проектов c Luxms BI участвуют в конкурсе «Проект Года 2024» от GlobalCIO. Голосование идет до 8 января.

Больше о проектах

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным

Время на прочтение2 мин
Количество просмотров895

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным (Institutional Data Initiative, IDI), запущенной Библиотекой Гарвардского университета. В рамках исследовательской инициативы американский университет будет работать с библиотеками и музеями, правительственными учреждениями и другими организациями для публикации их коллекций в виде данных.

Читать далее

Гарвард при поддержке Microsoft собрал открытый дата-сет из ~500 000 книг, но Google не дает его опубликовать

Время на прочтение3 мин
Количество просмотров8.1K


В прошлый четверг Гарвардский университет объявил о скорой публикации массивного дата-сета для обучения языковых моделей, в котором было собрано почти полмиллиона оцифрованных книг на различных языках.

Все материалы, используемые в дата-сете, уже перешли в публичный доступ и не защищены авторским правом, то есть упомянутый массив может использоваться для обучения языковых моделей всеми желающими. Данная инициатива была профинансирована Microsoft и OpenAI с целью повысить скорость развития языковых моделей и других ИИ-инструментов за счет создания равных возможностей для всех участников рынка. Хотя бы с точки зрения наличия пригодного для обучения массива данных.

Но все усложняется тем, что для публикации всего массива целиком нужно разрешение Google, как владельца одного из источников — Google Books.
Читать дальше →

Ближайшие события

МТС приглашает на AI-митап True Tech Hub в Нижнем Новгороде

Время на прочтение2 мин
Количество просмотров376

Привет, Хабр! Экосистема МТС 10 декабря проводит AI-митап True Tech Hub в Нижнем Новгороде. Мы приглашаем инженеров, работающих с нейронными сетями и машинным обучением, ученых, занимающихся исследованиями в области ИИ и смежных дисциплин. Также ждем основателей и CEO стартапов, использующих генеративный ИИ в своих продуктах или услугах. И конечно, доклады будут интересны студентам и аспирантам, изучающим генеративный ИИ.

Читать далее

У банков РФ появилась возможность внедрить систему мониторинга в реальном времени мошенничества против их клиентов

Время на прочтение1 мин
Количество просмотров2K

У российских банков появилась возможность внедрить систему мониторинга в реальном времени мошеннических действий в отношении их клиентов, пишет ТАСС со ссылкой на специалистов МТС, разработавших решение.

Читать далее

Запустили новый сезон подкаста «Деньги любят техно» — «Лица Data Fusion»

Время на прочтение1 мин
Количество просмотров585

Начинаем активную подготовку к конференции о данных Data Fusion. Новый сезон подкаста «Деньги любят техно» поможет лучше и ближе узнать лидеров развития Data Science в России: мы раскрываем их бэкграунд, принципы работы с командами и ожидания от технологичного будущего.

Узнать больше

«Целимся в то, чтобы клиент приходил покупать продукты, а мы ему ещё и доплачивали»

Время на прочтение1 мин
Количество просмотров2.9K

В этом сезоне подкаста Data Therapy мы обсуждаем практические кейсы применения ИИ и больших данных в конкретных сферах бизнеса и говорим о рисках их применения. В заключительном эпизоде сезона речь идёт о сервисе лояльности «Апельсин», который объединяет лидеров рынка — X5 Group, Альфа-банк, Альфа Страхование и билайн, его особенности и перспективы. Гость выпуска — Данила Наумов, CDO сервиса «Апельсин».

Читать далее

Microsoft объявила о первом повышении цен на Power BI за 10 лет

Время на прочтение1 мин
Количество просмотров3.5K

Microsoft объявила о первом повышении цен на инструмент анализа данных Power BI с момента его запуска почти 10 лет назад. В настоящее время его используют более 350 тысяч организаций и более 6,5 млн разработчиков.

Читать далее

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

Время на прочтение2 мин
Количество просмотров7.2K

Недавно вышедшая Hunyuan-Large от Tencent, кажется, немного прошла мимо внимания широкой аудитории, а ведь это по-настоящему значимое событие в мире ИИ. На первый взгляд — очередная модель, но на деле — это крупнейшая открытая MoE (Mixture of Experts) модель на основе Transformer с впечатляющими 389 миллиардами параметров и 52 миллиардами активных параметров! Давайте разберёмся, почему это настолько важно и чем Hunyuan-Large может удивить даже искушённых специалистов.

Основные достоинства модели:

Читать далее

«Характер и амбиции сотрудников создают атмосферу для новых идей»

Время на прочтение1 мин
Количество просмотров523

В свежем эпизоде подкаста Data Therapy мы говорим о культуре предпринимательства внутри крупных корпораций, о том, как правильно внедрять инновации, можно ли быть хорошим заказчиком для аналитиков данных, если ты в этом ничего не понимаешь, и почему не всегда нужно создавать дашборды и пытаться всё оцифровать. Гость выпуска — Екатерина Борисоглебская, сооснователь и руководитель сервиса Sell&Buy в Yango (международный бренд Яндекса).

Читать далее

Вклад авторов