Как стать автором
Обновить
147.32

Big Data *

Большие данные и всё о них

Сначала показывать
Порог рейтинга

Функция генерации идентификаторов формата UUIDv7 уже закоммичена в PostgreSQL

Время на прочтение1 мин
Количество просмотров2.6K

Функция uuidv7() генерации идентификаторов формата UUIDv7 (метод 3) в соответствии с RFC 9562 уже закоммичена и теперь гарантированно попадет в 18 версию PostgreSQL, выход которой ожидается в сентябре 2025 года. До этого можно пользоваться каким-нибудь из имеющихся расширений PostgreSQL.

Реализация имеет три особенности:

Читать далее

Новости

Сертификат совместимости Luxms BI v10 и Astra Linux 1.8

Время на прочтение2 мин
Количество просмотров273

Эксперты «Группы Астра» подтвердили совместимость операционной системы нового, восьмого поколения Astra Linux 1.8 с платформой для бизнес-аналитики Luxms BI v10. Это очередной шаг в развитии технологической кооперации отечественных решений, направленный на повышение безопасности и отказоустойчивости ИТ-инфраструктуры.

Luxms BI прошла испытания на совместимость с Astra Linux 1.8, подтвердив свою стабильную и корректную работу под управлением данной отечественной операционной системы. Программный стек поддерживает работу с критически важными данными в защищенной среде, что позволяет заказчикам принимать взвешенные решения, сохраняя конфиденциальность и обеспечивая устойчивость бизнес-процессов.

Обновленная версия Astra Linux стала современнее, безопаснее и удобнее, среди важных ее особенностей: улучшенная кодовая база, встроенный PostgreSQL и увеличенный срок поддержки, что делает ОС более выгодным выбором для корпоративных пользователей.

Использование двух импортонезависимых ИТ-продуктов позволяет заказчикам не только минимизировать риски, но и максимально эффективно использовать современные инструменты для достижения стратегических целей.

Читать далее

5 проектов c Luxms BI на конкурсе «Проект Года 2024» от GlobalCIO

Время на прочтение2 мин
Количество просмотров282

Сразу 5 проектов c Luxms BI участвуют в конкурсе «Проект Года 2024» от GlobalCIO. Голосование идет до 8 января.

Больше о проектах

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным

Время на прочтение2 мин
Количество просмотров845

Microsoft и OpenAI объявили о поддержке Инициативы по институциональным данным (Institutional Data Initiative, IDI), запущенной Библиотекой Гарвардского университета. В рамках исследовательской инициативы американский университет будет работать с библиотеками и музеями, правительственными учреждениями и другими организациями для публикации их коллекций в виде данных.

Читать далее

Истории

Гарвард при поддержке Microsoft собрал открытый дата-сет из ~500 000 книг, но Google не дает его опубликовать

Время на прочтение3 мин
Количество просмотров8K


В прошлый четверг Гарвардский университет объявил о скорой публикации массивного дата-сета для обучения языковых моделей, в котором было собрано почти полмиллиона оцифрованных книг на различных языках.

Все материалы, используемые в дата-сете, уже перешли в публичный доступ и не защищены авторским правом, то есть упомянутый массив может использоваться для обучения языковых моделей всеми желающими. Данная инициатива была профинансирована Microsoft и OpenAI с целью повысить скорость развития языковых моделей и других ИИ-инструментов за счет создания равных возможностей для всех участников рынка. Хотя бы с точки зрения наличия пригодного для обучения массива данных.

Но все усложняется тем, что для публикации всего массива целиком нужно разрешение Google, как владельца одного из источников — Google Books.
Читать дальше →

МТС приглашает на AI-митап True Tech Hub в Нижнем Новгороде

Время на прочтение2 мин
Количество просмотров282

Привет, Хабр! Экосистема МТС 10 декабря проводит AI-митап True Tech Hub в Нижнем Новгороде. Мы приглашаем инженеров, работающих с нейронными сетями и машинным обучением, ученых, занимающихся исследованиями в области ИИ и смежных дисциплин. Также ждем основателей и CEO стартапов, использующих генеративный ИИ в своих продуктах или услугах. И конечно, доклады будут интересны студентам и аспирантам, изучающим генеративный ИИ.

Читать далее

У банков РФ появилась возможность внедрить систему мониторинга в реальном времени мошенничества против их клиентов

Время на прочтение1 мин
Количество просмотров1.9K

У российских банков появилась возможность внедрить систему мониторинга в реальном времени мошеннических действий в отношении их клиентов, пишет ТАСС со ссылкой на специалистов МТС, разработавших решение.

Читать далее

Запустили новый сезон подкаста «Деньги любят техно» — «Лица Data Fusion»

Время на прочтение1 мин
Количество просмотров447

Начинаем активную подготовку к конференции о данных Data Fusion. Новый сезон подкаста «Деньги любят техно» поможет лучше и ближе узнать лидеров развития Data Science в России: мы раскрываем их бэкграунд, принципы работы с командами и ожидания от технологичного будущего.

Узнать больше

«Целимся в то, чтобы клиент приходил покупать продукты, а мы ему ещё и доплачивали»

Время на прочтение1 мин
Количество просмотров2.8K

В этом сезоне подкаста Data Therapy мы обсуждаем практические кейсы применения ИИ и больших данных в конкретных сферах бизнеса и говорим о рисках их применения. В заключительном эпизоде сезона речь идёт о сервисе лояльности «Апельсин», который объединяет лидеров рынка — X5 Group, Альфа-банк, Альфа Страхование и билайн, его особенности и перспективы. Гость выпуска — Данила Наумов, CDO сервиса «Апельсин».

Читать далее

Microsoft объявила о первом повышении цен на Power BI за 10 лет

Время на прочтение1 мин
Количество просмотров2.9K

Microsoft объявила о первом повышении цен на инструмент анализа данных Power BI с момента его запуска почти 10 лет назад. В настоящее время его используют более 350 тысяч организаций и более 6,5 млн разработчиков.

Читать далее

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

Время на прочтение2 мин
Количество просмотров6.5K

Недавно вышедшая Hunyuan-Large от Tencent, кажется, немного прошла мимо внимания широкой аудитории, а ведь это по-настоящему значимое событие в мире ИИ. На первый взгляд — очередная модель, но на деле — это крупнейшая открытая MoE (Mixture of Experts) модель на основе Transformer с впечатляющими 389 миллиардами параметров и 52 миллиардами активных параметров! Давайте разберёмся, почему это настолько важно и чем Hunyuan-Large может удивить даже искушённых специалистов.

Основные достоинства модели:

Читать далее

«Характер и амбиции сотрудников создают атмосферу для новых идей»

Время на прочтение1 мин
Количество просмотров470

В свежем эпизоде подкаста Data Therapy мы говорим о культуре предпринимательства внутри крупных корпораций, о том, как правильно внедрять инновации, можно ли быть хорошим заказчиком для аналитиков данных, если ты в этом ничего не понимаешь, и почему не всегда нужно создавать дашборды и пытаться всё оцифровать. Гость выпуска — Екатерина Борисоглебская, сооснователь и руководитель сервиса Sell&Buy в Yango (международный бренд Яндекса).

Читать далее

Платформа Kaggle запустила конкурс, где нужно тестировать увеличенное в 1,5 раза контекстное окно Gemini 1.5

Время на прочтение1 мин
Количество просмотров802

В начале этого года Google представила модель искусственного интеллекта Gemini 1.5, которая отличается улучшенным пониманием, производительностью и увеличенным контекстным окном, способным обрабатывать больше информации за один раз. Чтобы протестировать расширенные возможности этой модели, платформа для соревнований по анализу данных Kaggle запустила конкурс, в котором участники могут предложить креативные способы применения увеличенного контекстного окна Gemini. За лучшие идеи — призовой фонд в 25 000 долларов.

Читать далее

Ближайшие события

Подтверждена совместимость Luxms BI и РЕД ОС 8

Время на прочтение2 мин
Количество просмотров998

Система бизнес-аналитики Luxms BI официально получила сертификат совместимости с российской операционной системой РЕД ОС 8. В результате совместного тестирования команды Luxms и специалистов компании РЕД СОФТ была подтверждена корректность работы продуктов.

Современные компании все чаще сталкиваются с необходимостью принимать взвешенные решения на основе данных, сохраняя при этом высокий уровень информационной безопасности. Совместимость Luxms BI и РЕД ОС 8 открывает новые возможности для тех компаний, которые стремятся усилить контроль над данными и минимизировать риски.

Читать далее

«Сбер» полностью перешёл на собственное решение хранилищ данных SberData Platform

Время на прочтение2 мин
Количество просмотров5.6K

17 октября 2024 года «Сбер» сообщил, что финансовая организация полностью перешла на собственное решение хранилищ данных SberData Platform. В рамках миграции специалисты «Сбера» осуществили поэтапный вывод из эксплуатации программно-аппаратных комплексов Teradata.

Читать далее

Гиперперсонализация: как сделать предложение пользователю релевантным

Время на прочтение36 мин
Количество просмотров484

В новом выпуске подкаста Data Therapy говорим об особенностях работы в российских технологических компаниях, о культурных различиях компаний из Европы, США и России, обсуждаем гиперперсонализацию и зачем нужно читать книги. Гость выпуска — директор по машинному обучению и анализу данных Ozon FinTech Александр Толмачёв.

Читать далее

В билайне и Сеченовском университете создали ИИ-модель для оценки отторжения пересаженной почки

Время на прочтение3 мин
Количество просмотров348

Ученые, ИТ-специалисты из ООО “МедТех ИИ” (совместное предприятие ПАО “Вымпелком” и Сеченовского университета) и врачи из НКЦ №1 РНЦХ им. Б.В. Петровского разработали модель ИИ для автоматической оценки фиброза и интерстициальной инфильтрации в гистологических исследованиях трансплантата почки. Нейросеть позволяет выявлять и оценивать признаки отторжения трансплантированного органа и может стать сервисом “второго мнения” для помощи в принятии врачебных решений.

Трансплантация органов – порой единственный способ спасти жизнь пациента и значительно улучшить ее качество. Но сам процесс трансплантации сложный и часто связан с различными осложнениями. В том числе с фиброзом тканей (увеличением количества соединительной ткани) и воспалением, которые сигнализируют об отторжении органа. Регулярное мониторирование состояния трансплантированного органа необходимо для своевременной коррекции терапевтической стратегии.

За 2023 год в России провели 1789 операций по трансплантации почки, это около двух третьих всех операций по трансплантации. После операции пациент вынужден на протяжении всей жизни принимать терапию и регулярно проходить обследования. В рамках одного анализа врач-патолог изучает гистологический материал почки на предмет наличия признаков, сигнализирующих об отторжении органа, и классифицирует их по системе Банф. Существующая классификация полезна для диагностики отторжения трансплантата почки, однако она сталкивается с ограничениями из-за различной согласованности оценок врачей и частых изменений в критериях оценки.

Читать далее

Новый сезон подкаста «Деньги любят техно»: говорим о data science в разных отраслях бизнеса

Время на прочтение1 мин
Количество просмотров379

Мы запустили уже пятый, юбилейный сезон нашего подкаста «Деньги любят техно». Он целиком посвящен науке о данных. В этом сезоне концентрируемся на специфике DS в разных отраслях бизнеса и приглашаем в гости ключевых экспертов российских Data Driven-компаний. А еще подкаст теперь выходит не только в аудио-, но и в видеоформате. Будет интересно и красиво!

Подробнее

Записи докладов с M2 Data Meetup

Время на прочтение2 мин
Количество просмотров1.1K

Привет! В четверг мы провели первый митап по данным в офисе M2. Поговорили о насущном — как строить аналитические платформы данных и как они помогают решать проблемы бизнеса.

В программе было пять технических докладов о разных аспектах работы с данными: от решения конкретных прикладных технических задач до вопросов построения новой платформы данных с нуля и миграции туда пользователей со старой платформы.

Приносим записи докладов, чтобы можно было глянуть на досуге!

Смотреть доклады

Microsoft представила платформу Data Change Processing с открытым исходным кодом

Время на прочтение2 мин
Количество просмотров2.3K

Microsoft анонсировала Drasi, новую платформу обработки изменений данных с открытым исходным кодом. Она позволит разработчикам автоматизировать интеллектуальные реакции в динамических системах. Вместо копирования данных в центральное озеро данных или периодического запроса источников Drasi отслеживает изменения, наблюдая за событиями в журналах и лентах изменений.

Читать далее
1
23 ...

Вклад авторов

Работа

Data Scientist
41 вакансия