Как стать автором
Обновить

Перфокарты против перфокарт: война систем до появления iOS и Android

Время на прочтение10 мин
Количество просмотров3K

Первая система для обработки больших объемов данных появилась в конце 19 века. Американский инженер Герман Холлерит создал ее для того, чтобы обрабатывать результаты переписи населения США. Компания Холлерита — первый ИТ-стартап — нашла частных инвесторов и государственные заказы, создала новую отрасль, и привлекла сотни клиентов. Однако ее монопольное положение на этом рынке было недолгим — вскоре появился конкурент, который смог предложить пользователям более низкие цены и новые технологии.

Читать далее
Всего голосов 23: ↑22.5 и ↓0.5+22
Комментарии7

«Иногда твоя работа выглядит магией»: что делают дата-сайентисты в промышленности и почему так востребованы

Время на прочтение10 мин
Количество просмотров11K

Привет, Хабр! Меня зовут Светлана Потапова, я руковожу «Северсталь Диджитал» — подразделением ИТ-функции Северстали, которое занимается разработкой и внедрением решений на основе машинного обучения.

Data Science уже давно вышла за пределы ИТ-компаний, шагнула дальше банков и телекома и пришла в промышленность, в том числе тяжёлую. Все обратили внимание на работу с данными, ведь они справедливо считаются новой нефтью, а их правильное использование даёт компаниям существенные преимущества. Обилие разнообразных задач со своей спецификой привело к появлению отдельного направления — Data Science (DS) в промышленности. 

В этой статье расскажу, зачем становиться дата-сайентистом в промышленности, кто это такой и чем занимается и почему повышать цифровизацию производства непросто, но того стоит. 

Читать дальше →
Всего голосов 18: ↑16 и ↓2+14
Комментарии9

Заменят ли LLM людей в разметке данных для AI?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.6K

Привет! Использование ИИ в разметке данных для него же — уже скорее необходимая потребность, нежели что-то удивительно новое. Разного рода экспериментами с авторазметкой данных нейронками мы занимаемся последние полгода и результаты — нравятся.

В данной статье я детально расскажу о нашем самом первом эксперименте с LLM в разметке данных для ИИ и proof-of-concept их годноты использования в реальных задачах, а в процессе попробую ответить на большой вопрос — так заменят ли LLM людей в разметке данных?

Давайте вооружимся GigaChat, chatGPT, Gemini и начнем!

Читать далее
Всего голосов 10: ↑9 и ↓1+8
Комментарии5

Жажда «цифровой крови»: как Google, OpenAI и Meta переступают черту ради развития ИИ

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров18K

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

Читать далее
Всего голосов 30: ↑25 и ↓5+20
Комментарии91

В России разработали кодекс этики использования больших данных

Время на прочтение2 мин
Количество просмотров7.5K
Институт развития интернета (ИРИ) и Ассоциация больших данных (входят «Яндекс», Mail.ru Group, Сбербанк, Газпромбанк, «МегаФон», «Ростелеком» и другие) разработали проект кодекса этики использования больших данных. Предполагается, что документ станет основой саморегулирования этого направления на рынке.

image

Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии21

Глава InfoWatch Наталья Касперская: большие данные россиян должны принадлежать государству

Время на прочтение2 мин
Количество просмотров24K


Глава компании InfoWatch Наталья Касперская в своей беседе с ТАСС заявила, что по ее мнению большие данные россиян должны быть признаны собственностью государства.

«Мое мнение, что эти данные должны являться собственностью государства, потому что пользователи этими данными не обладают. Пользователь отпустил их в информационное пространство, и утекло все, что он там написал. Значит, это не их принадлежность», — приводит слова Касперской информационное агентство.
Читать дальше →
Всего голосов 35: ↑31 и ↓4+27
Комментарии140

Data Integration Customer Summit

Время на прочтение1 мин
Количество просмотров1.3K


Впервые в России МегаФон проводит Международный саммит по лучшим практикам использования интеграционных технологий и управления данными Data Integration Customer Summit.
Программа и регистрация под катом.
Читать дальше →
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Приглашаем на онлайн-конференцию Fine Day

Время на прочтение1 мин
Количество просмотров314

Business Intelligence GlowByte приглашает на онлайн-конференцию “Fine Day online: Истории цифровизаторов”. Это уникальное мероприятие для цифровых инноваторов! Присоединяйтесь к нам, чтобы узнать истории успеха от ведущих цифровизаторов, включая представителей АвтоВАЗа, министра здравоохранения Калининградской области, эксперта в области построения BI и компании ПИК. 

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии3

Greenplum: как грамотно вакуумировать распределенную СУБД и избежать серьезных проблем

Время на прочтение1 мин
Количество просмотров1.8K

8 февраля в 11:00 по МСК пройдет практический вебинар «Управление базами данных в Greenplum: мониторинг и удаление мусора», на котором эксперты ITSumma поделятся опытом работы с этой популярной СУБД для хранения больших объемов данных.

В программе:

Читать далее
Всего голосов 15: ↑13 и ↓2+11
Комментарии9

«Все делают это...» — Data People by GlowByte приглашает на весенний митап

Время на прочтение1 мин
Количество просмотров518

Привет! 16 апреля в 18:00 Data People by GlowByte приглашает тебя на пикантный митап про данные!

Наши друзья, занимающие руководящие позиции в Data-подразделениях крупнейших российских ФинТех-компаний, поделятся опытом реализации проектов по миграции платформ данных.

Узнать больше и зарегистрироваться
Всего голосов 1: ↑2 и ↓-1+3
Комментарии0

Transcend представила промышленные SSD PCI-e 4.0 объемом до 2 Тбайт

Время на прочтение2 мин
Количество просмотров1.3K


Transcend Information, известный производитель накопителей, представила новые серии твердотельных накопителей (SSD) MTE760T, MTE480T и MTE380T. Эти устройства, соответствующие форматам M.2 2280, M.2 2242 и M.2 2230, оснащены 112-слойными чипами 3D NAND флеш-памяти и подключаются через интерфейс PCIe 4.0 x4, соответствующий спецификации NVMe 1.4.

Эти SSD предназначены для использования в различных сферах, включая встроенные системы, умные устройства в рамках концепции Интернета вещей (AIoT), а также в рамках граничных вычислений (edge-компьютинге).
Читать дальше →
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Приглашаем на X5 Data Quality Meetup

Время на прочтение1 мин
Количество просмотров637

27 сентября проводим онлайн X5 Data Quality Meetup. Расскажем про правила и стратегии для обеспечения точных и надёжных данных.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Большие данные в облаке — как их лучше хранить и структурировать обсудим 8 ноября на вебинаре Cloud.ru

Время на прочтение1 мин
Количество просмотров284

В формате онлайн-дискуссии с экспертами Arenadata и Cloud.ru обсудим, как правильно хранить и структурировать большие данные из разных источников, чтобы не потерять их.

Подробнее
Рейтинг0
Комментарии0

Госдума и Минцифры РФ подготовили связанные с большими данными поправки в закон об их обезличивании

Время на прочтение1 мин
Количество просмотров851

Министр цифрового развития доложил Президенту РФ о проделанной совместной работе с комитетом Госдумы по информполитике над законопроектом о регулировании больших данных. Подготовлены изменения в закон об обезличивании данных, например, вопросы обеспечения защиты прав граждан при обработке больших данных и применении технологий ИИ.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

В МГУ готовится к запуску новый суперкомпьютер производительностью 400 петафлопс

Время на прочтение2 мин
Количество просмотров7.8K

В Московском Государственном Университете (МГУ) им. М. В. Ломоносова 1 сентября 2023 года должны запустить суперкомпьютер производительностью 400 петафлопс. Новый суперкомпьютер будет использоваться в исследованиях, связанных с физикой, химией, биологией, психологией, социологией, геологией, медициной, в разработке новых инструментов на основе искусственного интеллекта (ИИ), например алгоритмов анализа больших данных, и других направлениях науки, а также поиском новых методов защиты систем на основе технологий ИИ.

Читать далее
Всего голосов 16: ↑14 и ↓2+12
Комментарии37

Летний митап Data People by GlowByte: «Управляя данными. MDM и бизнес-глоссарий»

Время на прочтение1 мин
Количество просмотров505

Привет! 20 июня в 18:00 Data People by GlowByte приглашает тебя на летний митап!

Мы расскажем, что такое управление метаданными и почему эта область является одним из ключевых в Data Management. На практических примерах разберем варианты автоматизации и ценность, которую управление метаданными приносит компании. А также расскажем про синергетический эффект от правильного управления метаданными при решении задачи MDM и таинственный Data Ocean Governance.

Узнать больше и зарегистрироваться
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

OpenAI запустила программу для сбора уникальных данных от сторонних организаций для обучения ИИ

Время на прочтение1 мин
Количество просмотров921

OpenAI запустила партнёрскую программу Data Partnerships по сбору наборов данных от клиентов. Эти датасеты будут использоваться для обучения моделей ИИ компании. 

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Онлайн-конференция «Эволюция ритейла. XData»

Время на прочтение2 мин
Количество просмотров445

31 августа в 11:00 приглашаем вас на онлайн-конференцию по работе с большими данными X5. Мы давно не говорили о действующих продуктах X5 на основе Big Data, однако в самый последний день лета хотим посвятить несколько часов обсуждению актуальных проблем DS, аналитике и моделям на данных. В программе только спикеры и темы X5 Tech. Будем готовы к открытой дискуссии и ответам на ваши вопросы.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

18 июля — Beeline Data Engineering Meetup: Решение бизнес-задач с помощью данных

Время на прочтение1 мин
Количество просмотров708

Привет! Во вторник, 18 июля, мы проведем онлайн-митап для дата-инженеров и всех, кто интересуется тематикой больших данных и решений, принимаемых на их основе.

Регистрация уже открыта.

Вас ждут три технических доклада:

Максим Петров — «ETL Pipelines как микросервисы»

Внедрение микросервисов на ETL-потоках для создания системы со встроенными аналитическими возможностями.

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии0

Метавселенные: шестой выпуск подкаста Data Therapy

Время на прочтение9 мин
Количество просмотров441

«Метавселенная — объединение двух миров: материального и цифрового, они оба сейчас важны для жизни». В новом выпуске подкаста обсуждаем метавселенные. Как они появились, зачем они нужны, это просто хайп или люди действительно к ним готовы – ищем ответы на эти и другие вопросы.

Читать далее
Рейтинг0
Комментарии0
1
23 ...