Все потоки

Data Mining *

Глубинный анализ данных

19,48

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Irealy 29 апр в 10:27

ASE нарастит мощности advanced packaging из-за спроса на AI-чипы

2 мин

6.2K

Big Data * Data Mining * IT-инфраструктура * Искусственный интеллектИсследования и прогнозы в IT *

Тайваньская ASE Technology Holding, крупнейший в мире поставщик услуг по упаковке и тестированию чипов, ожидает дальнейшего роста спроса на advanced packaging из-за рынка AI-чипов. Компания прогнозирует, что выручка её передового направления упаковки в 2026 году превысит $3,5 млрд.

Advanced packaging стал одним из важных узких мест в цепочке поставок ИИ-инфраструктуры. Для современных ускорителей уже недостаточно просто произвести кристалл: нужно объединять вычислительные блоки, память и межсоединения в сложные многокомпонентные системы. Именно такие технологии позволяют выпускать высокопроизводительные AI-чипы для дата-центров.

ASE уже повышала ожидания по этому направлению. В феврале компания прогнозировала, что бизнес advanced packaging вырастет до $3,2 млрд к 2026 году, а теперь говорит уже о более чем $3,5 млрд. Рост связывают с высоким спросом со стороны клиентов, работающих с AI-чипами.

Читать далее

0

story_book 28 апр в 10:42

Расходы на ИИ становятся отдельной проблемой для бизнеса: токены и вычисления могут стоить дороже сотрудников

2 мин

6.1K

Data Mining * Developer Relations * IT-инфраструктура * Open source * Исследования и прогнозы в IT *

Компании всё чаще сталкиваются с неожиданной стороной внедрения ИИ: экономия на людях не всегда означает снижение расходов. В ряде команд затраты на вычисления, API и токены уже становятся сопоставимы с зарплатным фондом или даже превышают его.

На это обратил внимание Axios со ссылкой на оценки участников рынка. Один из ключевых факторов — рост расходов на вычислительные мощности. Вице-президент Nvidia по прикладному глубокому обучению Брайан Катандзаро отметил, что в некоторых командах стоимость вычислений уже значительно выше расходов на персонал.

Отдельная проблема — инструменты для программирования на базе больших языковых моделей. По данным Axios, технический директор Uber исчерпал годовой бюджет на ИИ уже в начале 2026 года. Значительная часть расходов пришлась не на найм и не на покупку оборудования, а на оплату токенов при работе с Claude Code от Anthropic.

Читать далее

+5

Cristal 8 апр в 09:34

Вот так ИИ распространяет фэйковые статьи на Хабре

5 мин

5.8K

Блог компании СпецлабData Mining * HabrIT-инфраструктура * Искусственный интеллект

Вы даже не замечаете, как смысл статей меняется на противоположный.

От ИИ до тюрьмы один шаг. Дабы не зарекаться, поставьте в закладочку - авось пригодится!

И вот почему...

-2

NeuralDigest 27 мар в 19:43

Huawei продвигает новый AI-чип 950PR, а ByteDance и Alibaba готовятся к заказам

2 мин

5.8K

Блог компании NeyroHubData Engineering * Data Mining * Developer Relations * Open source *

Huawei, похоже, смогла сделать то, что раньше давалось ей тяжело: заинтересовать крупные китайские IT-компании своим новым AI-чипом. По данным Reuters, ByteDance и Alibaba планируют размещать заказы на новый 950PR, который должен стать более серьезным конкурентом Nvidia на китайском рынке.

Для Huawei это важный сдвиг. Предыдущий флагманский чип Ascend 910C не получил по-настоящему массового спроса у крупных частных техкомпаний, несмотря на курс Китая на импортозамещение в полупроводниках. С новым поколением ситуация, судя по всему, меняется.

Главная причина — не столько рост «сырой» вычислительной мощности, сколько более практичная доработка. Новый 950PR оказался лучше совместим с экосистемой Nvidia CUDA, на которой уже завязано множество китайских разработчиков. То есть переход на чип Huawei становится менее болезненным, а для рынка это, возможно, даже важнее, чем формальное сравнение по производительности.

Читать далее

+4

NeuralDigest 24 мар в 08:58

На Урале и в Сибири откроются первые студенческие лаборатории для обучения вайб-кодингу

1 мин

4.4K

Блог компании NeyroHubData Engineering * Data Mining * IT-инфраструктура * WebAssembly *

В российских вузах начинают открывать первые студенческие лаборатории по вайб-кодингу. Первая площадка заработает летом в Омском государственном техническом университете, а до конца 2026 года еще одну лабораторию планируют открыть в Уральском государственном университете путей сообщения.

Проект запускается вместе с компанией «АрхиТех ИИ», которая развивает отечественную ИИ-среду для вайб-кодинга Kodik. Студентов технических направлений собираются учить безопасной работе с ИИ при разработке ПО, а также тому, как внедрять ИИ-инструменты в реальные бизнес-процессы.

Читать далее

0

Erlag 8 янв в 11:13

Почему компании подают в суд против незаконного скрапинга SerpApi

2 мин

7.1K

Data Mining * Google API * Google Web Toolkit * Базы данных * Законодательство в IT

В последнее время много предпринимателей и частных лиц подают судебные иски против компании по скрапингу - SerpApi за обход мер безопасности, защищающих чужой контент под авторским правом, который появляется в результатах поиска Google. Целью обращения в суд является попытка остановить ботов SerpApi и их вредоносный скрапинг, который нарушает выбор веб-сайтов и правообладателей относительно того, кто должен иметь доступ к их контенту. Эти иски следуют за судебными действиями, которые другие веб-сайты уже предпринимали против SerpApi и подобных компаний по скрапингу, и является частью давней практики активных судебных разбирательств по борьбе с мошенниками в Интернете.

Google следует отраслевым стандартным протоколам краулинга и уважает политики веб-сайтов относительно сканирования их контента. Скрытные скраперы вроде SerpApi игнорируют эти политики и вообще не оставляют сайтам никакого выбора. SerpApi использует сомнительные лазейки - такие как маскировка, спам сайтов огромными сетями ботов и присвоение своим краулерам фальшивых и постоянно меняющихся имён, чтобы обходить меры безопасности и воровать контент сайтов.

Эта незаконная деятельность резко возросла за последний год. SerpApi обманным путем берет контент, который Google лицензирует у других (например, изображения, появляющиеся в панелях, данные в реальном времени в функциях поиска и многое другое), а затем перепродает его. При этом компания сознательно игнорирует права и политики веб-сайтов и поставщиков, чей контент появляется в поиске.

Читать далее

+30

Sber 22 авг 2024 в 11:23

Второе место на Data Fusion Contest 2024

3 мин

1.5K

Блог компании СберМашинное обучение * Data Mining *

В начале апреля завершилось ежегодное соревнование по машинному обучению с призовым фондом в 2 миллиона рублей — Data Fusion Contest 2024. Основных задач было две, и команда наших аналитиков-исследователей из Лаборатории ИИ заняли второе место в решении задачи по моделям оттока!

Читать далее

+2

Aleron75 23 июл 2024 в 15:12

Вышла новая — Llama 3.1 405B

2 мин

36K

Python * Data Mining * Data Engineering *

В доступе появилась новейшая Llama 3.1 405B.

🦙 Llama 3.1 8B выглядит очень достойно, а 70B даже достигает уровня производительности GPT-4o.

Модель 405B обеспечивает лучшую производительность, но не выглядит новаторской. Пробуем! Веса модели уже на HuggingFace 🚀

Глянуть бенчмарки и скачать веса

+14

Aleron75 20 июл 2024 в 14:47

Т-Банк открыл доступ к собственной русскоязычной языковой модели T-lite

1 мин

36K

Python * Data Mining * Data Engineering *

Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе аналоги.

Модель T-lite была представлена в рамках первой конференции Т-Банка по машинному обучению Turbo ML Conf. T-lite — это инструмент разработки, с помощью которого компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. В частности, это могут быть ассистенты поддержки для обработки запросов, ответов на вопросы и т.д. Пример работы LLM для голосового заказа. Веса T-lite модели уже на HuggingFace.

Изучить модельку

+7

SIGMA_team 23 апр 2024 в 15:15

СИГМА и ИнфоТеКС завершили внедрение новой российской системы учета электроэнергии в 11 регионах РФ

3 мин

2.1K

Блог компании СИГМАBig Data * Data Engineering * Data Mining * IT-инфраструктура *

Компании «СИГМА» и «ИнфоТеКС» завершили первое в РФ внедрение интеллектуальной системы учета электроэнергии (ИСУЭ), полностью соответствующей актуальным требованиям к импортозамещению и информационной безопасности. Система рассчитана на взаимодействие в режиме реального времени с более чем 16 млн точек учета. К работе в ней уже перешли дочерние общества ПАО «Интер РАО» в 11 регионах России.

Читать далее

+6

denis-19 18 апр 2024 в 12:52

Релиз профайлера данных Desbordante 2.0.0

2 мин

1.2K

Статистика в ITPython * Open source * Data Mining * Управление разработкой *

16 апреля 2024 года состоялся второй мажорный релиз профайлера данных Desbordante (исп., безграничный), который позволяет проводить поиск различных примитивов в таблицах. Исходный код проекта опубликован на GitHub под лицензией GNU Affero General Public License v3.0. Первая стабильная версия Desbordante вышла в декабре 2023 года.

Читать далее

+2

K2Tech 16 фев 2024 в 11:38

«ГалоПолимер» переводит производственные процессы на отечественную цифровую платформу

4 мин

1.6K

Блог компании К2ТехIT-компанииBig Data * Data Mining * Машинное обучение *

Крупное химпредприятие «ГалоПолимер» завершило реализацию проекта по оптимизации технологических процессов. Включение российской платформы для предиктивной аналитики и управления техническим состоянием оборудования CyberStudio в производственный цикл химпредприятия позволит увеличить объем выработки метиленхлорида без привлечения дополнительных ресурсов или перенастройки оборудования. В ходе проектных работ производство «ГалоПолимер Кирово-Чепецк» было переведено на импортонезависимое решение при сохранении непрерывности всех критических бизнес-процессов. Все работы были выполнены специалистами К2Тех и CyberPhysics в короткие сроки – всего за три месяца.

Читать далее

+3

hukenovs 14 ноя 2023 в 09:08

Русский жестовый язык: первое место в американском бенчмарке

2 мин

3.7K

Блог компании SberDevicesData Mining * Обработка изображений * Машинное обучение * Искусственный интеллект

Нейросети для распознавания жестового языка, созданные командой компьютерного зрения RnD CV в SberDevices научились лучше всех в мире распознавать американский жестовый язык и подружились с GigaChat!

Такой результат был достигнут благодаря нашему датасету русского жестового языка (РЖЯ) Slovo, который недавно мы выложили в открытый доступ. Публичная версия датасета содержит тысячу классов жестов суммарным объемом в 20 тысяч HD+ видео, записанных большой группой экспертов. Датасет и обученные на нем модели нейронных сетей бесплатны и выложены в открытый доступ. Это самый большой открытый и разнородный датасет РЖЯ в мире. Оказалось, что предварительное обучение нейронных сетей на датасете Slovo позволило модели хорошо обобщиться и стать основой для распознавания не только РЖЯ, но и других жестовых языков, в частности американского.

Подробности...

+13

atomlib 20 окт 2023 в 04:17

Автор курсов по Python и Pandas жалуется на вечный бан за рекламу торговли экзотическими животными

3 мин

13K

Data Mining * IT-компанииPython * Контекстная реклама * Социальные сети

DALL-E 3

Преподаватель языка Python Ревер Лернер рассказал в личном блоге, как получил бан в рекламной сети Facebook². Лернер попытался разместить рекламу курсов Python и Pandas, но система сочла подобное рекламой продажи экзотических животных и заблокировала его аккаунт рекламодателя. Из-за того, как организована работа с данными в Meta¹, не помогло вернуть аккаунт даже вмешательство человека.

Читать дальше →

+13

vasilevafb 14 июн 2023 в 09:18

Новая библиотека для анализа данных Pandas AI: стоит ли пробовать?

3 мин

6.7K

Python * Data Mining * Big Data *

Появилась новая библиотека Pandas AI - надстройка над популярной библиотекой для анализа данных Pandas.

Как уверяют разработчики, Pandas AI в свою очередь расширяет возможности Pandas за счет искусственного интеллекта.

Ниже краткий обзор.

Принцип работы Pandas AI

В редакторе кода задаете любой вопрос про данные на естественном языке и без написания кода получаете готовый ответ по вашим данным.

Какие вопросы можно задать? Любые вопросы, связанные с подготовкой, очисткой данных, визуализацией, исследовательским анализом данных, машинным обучением и т.д.

Простой пример, если спросить про данные о зарплате: "Кто в компании зарабатывает больше?". Pandas AI ответит: "Оливия зарабатывает больше".

Читать далее

+2

valentinak 8 ноя 2022 в 12:21

Данные накрылись ФСТЭКом

2 мин

3K

Блог компании DatanomicaData Mining * Проектирование API * Открытые данные *

Становятся недоступны наборы ранее открытых данных о юридических лицах. Так, на сегодняшний день закрыли доступ по API к банку данных об исполнительном производстве Федеральной службы судебных приставов (ФССП), также недоступны данные об участниках проекта «Сколково» и реестр аккредитованных ИТ-организаций Минцифры. При этом можно получить информацию о конкретной аккредитованной ИТ-компании на Госуслугах, а об участнике проекта «Сколково» — на сайте фонда, но не списком.

Упоминания о недоступности некоторых данных появились еще в конце февраля 2022 года. Мы в DataNewton столкнулись с ограничением доступа к некоторым, ранее открытым, реестрам и базам и есть риск, что в ближайшем будущем данные и доступ к ним по API могут закрыть и другие организации.

Читать далее

+5

F5Habr 4 окт 2022 в 14:23

Factory5 представила бесплатный сервис по анализу данных для решения задач бизнеса с помощью ИИ

2 мин

1.1K

Блог компании Factory5Data Mining * Big Data * Машинное обучение *

Российский разработчик программного обеспечения для промышленности Factory5 выпустил F5 Future — облачный сервис no-code приложений с использованием машинного обучения. Сервис призван решать бизнес-задачи, связанные с выявлением закономерностей, прогнозированием целевых показателей, а также проверять гипотезы.

Читать далее

+3

ladynoname 14 сен 2022 в 05:23

18 сентября в Санкт-Петербурге, в оффлайне состоится слет IT-сообществ HackConf 2022

4 мин

2.5K

Информационная безопасность * Data Mining * *nix * Big Data * DevOps *

18 сентября с 10 до 18 в Санкт-Петербурге состоится большая оффлайн встреча IT-сообществ, участвуют все желающие, вход бесплатный, нужно зарегистрироваться. До всемирной пандемии мы так же собирались большим составом в 2017, 2018, 2019 и несколькими годами ранее в рамках фестиваля ChaosConstructions, но работ на демопати все меньше, было бы здорово, если бы демосценеры смогли загрузить свои работы на Cafe Party 2022 в Казани, чтоб было за что голосовать. HackConf продолжая традиции будет в оффлайн формате, не будет онлайн трансляции, так мы сможем более свободно поговорить о наболевшем.

Читать далее

+12

le_webr 29 июл 2022 в 09:31

Контест на определение сбоев

2 мин

366

Блог компании Brand AnalyticsBig Data * Data Mining * Искусственный интеллектПрограммирование *

Cтартовал первый контест для разработчиков от Brand Analytics!

Задача контеста: написать приложение, которое будет определять сбои и сможет выделять сервисы и аспекты в публичных сообщениях соцмедиа о сбоях.

Призовой фонд - 500 тысяч рублей.

Срок подачи решений до 17 августа 2022 г. 20:00 MSK.

Читать далее

+1

Alex_alhimik 6 мая 2022 в 10:17

Открытый семинар «Обзор алгоритма CLIP от OpenAI»

1 мин

858

Data Mining * Искусственный интеллектМашинное обучение *

12 мая в 16:30 (мск) пройдёт открытый семинар «Обзор алгоритма CLIP от OpenAI».

Рассмотрим подход, который превосходит по качеству большинство алгоритмов для классификации изображений на многих датасетах.

Спикер: Максим Земляникин, инженер в компании Xperience.AI.

Зарегистрироваться на семинар можно по ссылке. Участие бесплатное.

Больше видео с прошедших семинаров на нашем YouTube-канале.

Читать далее

-1

1