Результаты поиска по запросу «[большие данные]» / Хабр

Публикации Хабы Компании Пользователи Комментарии

Перфокарты против перфокарт: война систем до появления iOS и Android

10 мин

Big Data*История ITСтарое железоБиографии гиков

Первая система для обработки больших объемов данных появилась в конце 19 века. Американский инженер Герман Холлерит создал ее для того, чтобы обрабатывать результаты переписи населения США. Компания Холлерита — первый ИТ-стартап — нашла частных инвесторов и государственные заказы, создала новую отрасль, и привлекла сотни клиентов. Однако ее монопольное положение на этом рынке было недолгим — вскоре появился конкурент, который смог предложить пользователям более низкие цены и новые технологии.

+22

bapxat 14 мар в 14:07

«Иногда твоя работа выглядит магией»: что делают дата-сайентисты в промышленности и почему так востребованы

10 мин

11K

Блог компании НетологияBig Data*Учебный процесс в ITКарьера в IT-индустрииData Engineering*

Привет, Хабр! Меня зовут Светлана Потапова, я руковожу «Северсталь Диджитал» — подразделением ИТ-функции Северстали, которое занимается разработкой и внедрением решений на основе машинного обучения.

Data Science уже давно вышла за пределы ИТ-компаний, шагнула дальше банков и телекома и пришла в промышленность, в том числе тяжёлую. Все обратили внимание на работу с данными, ведь они справедливо считаются новой нефтью, а их правильное использование даёт компаниям существенные преимущества. Обилие разнообразных задач со своей спецификой привело к появлению отдельного направления — Data Science (DS) в промышленности.

В этой статье расскажу, зачем становиться дата-сайентистом в промышленности, кто это такой и чем занимается и почему повышать цифровизацию производства непросто, но того стоит.

Читать дальше →

+14

antipov_dmitry 12 апр в 09:17

Заменят ли LLM людей в разметке данных для AI?

Средний

7 мин

1.6K

Программирование*Data Mining*Big Data*Машинное обучение*Искусственный интеллект

Аналитика

Привет! Использование ИИ в разметке данных для него же — уже скорее необходимая потребность, нежели что-то удивительно новое. Разного рода экспериментами с авторазметкой данных нейронками мы занимаемся последние полгода и результаты — нравятся.

В данной статье я детально расскажу о нашем самом первом эксперименте с LLM в разметке данных для ИИ и proof-of-concept их годноты использования в реальных задачах, а в процессе попробую ответить на большой вопрос — так заменят ли LLM людей в разметке данных?

Давайте вооружимся GigaChat, chatGPT, Gemini и начнем!

timonin 7 апр в 23:24

Жажда «цифровой крови»: как Google, OpenAI и Meta переступают черту ради развития ИИ

Простой

13 мин

18K

Искусственный интеллектБудущее здесь

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

+20

k_karina 31 авг 2019 в 21:07

В России разработали кодекс этики использования больших данных

2 мин

7.5K

Big Data*Законодательство в ITIT-компании

Институт развития интернета (ИРИ) и Ассоциация больших данных (входят «Яндекс», Mail.ru Group, Сбербанк, Газпромбанк, «МегаФон», «Ростелеком» и другие) разработали проект кодекса этики использования больших данных. Предполагается, что документ станет основой саморегулирования этого направления на рынке.

Читать дальше →

+13

ragequit 30 ноя 2016 в 13:31

Глава InfoWatch Наталья Касперская: большие данные россиян должны принадлежать государству

2 мин

24K

Информационная безопасность*

Глава компании InfoWatch Наталья Касперская в своей беседе с ТАСС заявила, что по ее мнению большие данные россиян должны быть признаны собственностью государства.

«Мое мнение, что эти данные должны являться собственностью государства, потому что пользователи этими данными не обладают. Пользователь отпустил их в информационное пространство, и утекло все, что он там написал. Значит, это не их принадлежность», — приводит слова Касперской информационное агентство.

Читать дальше →

+27

140

MF_admin 14 фев 2020 в 14:27

Data Integration Customer Summit

1 мин

1.3K

Блог компании МегаФонOracle*Big Data*

Впервые в России МегаФон проводит Международный саммит по лучшим практикам использования интеграционных технологий и управления данными Data Integration Customer Summit.
Программа и регистрация под катом.

Читать дальше →

-1

SnezhSh 13 мар в 12:33

Приглашаем на онлайн-конференцию Fine Day

1 мин

314

Блог компании GlowByteBig Data*Бизнес-модели*Конференции

Business Intelligence GlowByte приглашает на онлайн-конференцию “Fine Day online: Истории цифровизаторов”. Это уникальное мероприятие для цифровых инноваторов! Присоединяйтесь к нам, чтобы узнать истории успеха от ведущих цифровизаторов, включая представителей АвтоВАЗа, министра здравоохранения Калининградской области, эксперта в области построения BI и компании ПИК.

ITSumma 29 янв в 14:58

Greenplum: как грамотно вакуумировать распределенную СУБД и избежать серьезных проблем

1 мин

1.8K

Блог компании ITSummaBig Data*Data Engineering*

8 февраля в 11:00 по МСК пройдет практический вебинар «Управление базами данных в Greenplum: мониторинг и удаление мусора», на котором эксперты ITSumma поделятся опытом работы с этой популярной СУБД для хранения больших объемов данных.

В программе:

+11

SnezhSh 4 апр в 15:45

«Все делают это...» — Data People by GlowByte приглашает на весенний митап

1 мин

518

Блог компании GlowByteBig Data*Конференции

Привет! 16 апреля в 18:00 Data People by GlowByte приглашает тебя на пикантный митап про данные!

Наши друзья, занимающие руководящие позиции в Data-подразделениях крупнейших российских ФинТех-компаний, поделятся опытом реализации проектов по миграции платформ данных.

Узнать больше и зарегистрироваться

Data_center_MIRAN 12 апр в 15:11

Transcend представила промышленные SSD PCI-e 4.0 объемом до 2 Тбайт

2 мин

1.3K

Блог компании Дата-центр «Миран»Хранение данных*Производство и разработка электроники*Компьютерное железоНакопители

Transcend Information, известный производитель накопителей, представила новые серии твердотельных накопителей (SSD) MTE760T, MTE480T и MTE380T. Эти устройства, соответствующие форматам M.2 2280, M.2 2242 и M.2 2230, оснащены 112-слойными чипами 3D NAND флеш-памяти и подключаются через интерфейс PCIe 4.0 x4, соответствующий спецификации NVMe 1.4.

Эти SSD предназначены для использования в различных сферах, включая встроенные системы, умные устройства в рамках концепции Интернета вещей (AIoT), а также в рамках граничных вычислений (edge-компьютинге).

Читать дальше →

X5Tech 5 сен 2023 в 18:37

Приглашаем на X5 Data Quality Meetup

1 мин

637

Блог компании X5 TechBig Data*КонференцииПрезентацииIT-компании

27 сентября проводим онлайн X5 Data Quality Meetup. Расскажем про правила и стратегии для обеспечения точных и надёжных данных.

Editor_Cloud_ru 1 ноя 2023 в 14:59

Большие данные в облаке — как их лучше хранить и структурировать обсудим 8 ноября на вебинаре Cloud.ru

1 мин

284

Блог компании Cloud.ruИнформационная безопасность*IT-инфраструктура*Облачные сервисы*

В формате онлайн-дискуссии с экспертами Arenadata и Cloud.ru обсудим, как правильно хранить и структурировать большие данные из разных источников, чтобы не потерять их.

Подробнее

IgnatChuker 20 июл 2023 в 17:34

Госдума и Минцифры РФ подготовили связанные с большими данными поправки в закон об их обезличивании

1 мин

851

Big Data*Законодательство в ITIT-компании

Министр цифрового развития доложил Президенту РФ о проделанной совместной работе с комитетом Госдумы по информполитике над законопроектом о регулировании больших данных. Подготовлены изменения в закон об обезличивании данных, например, вопросы обеспечения защиты прав граждан при обработке больших данных и применении технологий ИИ.

IgnatChuker 30 авг 2023 в 20:01

В МГУ готовится к запуску новый суперкомпьютер производительностью 400 петафлопс

2 мин

7.8K

Информационная безопасность*Учебный процесс в ITИскусственный интеллектСуперкомпьютеры

В Московском Государственном Университете (МГУ) им. М. В. Ломоносова 1 сентября 2023 года должны запустить суперкомпьютер производительностью 400 петафлопс. Новый суперкомпьютер будет использоваться в исследованиях, связанных с физикой, химией, биологией, психологией, социологией, геологией, медициной, в разработке новых инструментов на основе искусственного интеллекта (ИИ), например алгоритмов анализа больших данных, и других направлениях науки, а также поиском новых методов защиты систем на основе технологий ИИ.

+12

SnezhSh 2 июн 2023 в 13:58

Летний митап Data People by GlowByte: «Управляя данными. MDM и бизнес-глоссарий»

1 мин

505

Блог компании GlowByteBig Data*Конференции

Привет! 20 июня в 18:00 Data People by GlowByte приглашает тебя на летний митап!

Мы расскажем, что такое управление метаданными и почему эта область является одним из ключевых в Data Management. На практических примерах разберем варианты автоматизации и ценность, которую управление метаданными приносит компании. А также расскажем про синергетический эффект от правильного управления метаданными при решении задачи MDM и таинственный Data Ocean Governance.

Узнать больше и зарегистрироваться

+10

maybe_elf 10 ноя 2023 в 10:17

OpenAI запустила программу для сбора уникальных данных от сторонних организаций для обучения ИИ

1 мин

921

Big Data*Машинное обучение*Искусственный интеллектIT-компании

OpenAI запустила партнёрскую программу Data Partnerships по сбору наборов данных от клиентов. Эти датасеты будут использоваться для обучения моделей ИИ компании.

X5Tech 16 авг 2023 в 14:14

Онлайн-конференция «Эволюция ритейла. XData»

2 мин

445

Блог компании X5 TechТестирование IT-систем*Big Data*Конференции

31 августа в 11:00 приглашаем вас на онлайн-конференцию по работе с большими данными X5. Мы давно не говорили о действующих продуктах X5 на основе Big Data, однако в самый последний день лета хотим посвятить несколько часов обсуждению актуальных проблем DS, аналитике и моделям на данных. В программе только спикеры и темы X5 Tech. Будем готовы к открытой дискуссии и ответам на ваши вопросы.

Beeline_tech 13 июл 2023 в 14:46

18 июля — Beeline Data Engineering Meetup: Решение бизнес-задач с помощью данных

1 мин

708

Блог компании билайнBig Data*Учебный процесс в ITКонференцииIT-компании

Привет! Во вторник, 18 июля, мы проведем онлайн-митап для дата-инженеров и всех, кто интересуется тематикой больших данных и решений, принимаемых на их основе.

Регистрация уже открыта.

Вас ждут три технических доклада:

Максим Петров — «ETL Pipelines как микросервисы»

Внедрение микросервисов на ETL-потоках для создания системы со встроенными аналитическими возможностями.

X5Tech 23 дек 2022 в 10:33

Метавселенные: шестой выпуск подкаста Data Therapy

9 мин

441

Блог компании X5 TechBig Data*AR и VR

«Метавселенная — объединение двух миров: материального и цифрового, они оба сейчас важны для жизни». В новом выпуске подкаста обсуждаем метавселенные. Как они появились, зачем они нужны, это просто хайп или люди действительно к ним готовы – ищем ответы на эти и другие вопросы.

2 3 ...

18 19