Обновить
8K+
8
koch@koch

Blanc Mahatma de Harlem at Glummy Glooma

5
Рейтинг
1
Подписчики
Отправить сообщение

Kaggle Benchmarks. «Kaggle уже не тот...»

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

В ML/DS сообществе есть шаблонная фраза “Kaggle уже не тот”. Ностальгия по временам ушедшим понятна, но в общем-то очевидно, что драматически меняется вся индустрия и ландшафт соревнований вместе с ним. На смену заголовку, встречавшему кагглеров раньше, “Your Home for Data Science” пришел новый: “The World's AI Proving Ground”. 

Бенчмарки на Kaggle

В 2026 Kaggle окончательно перешел под крыло AI фронтьера от Google DeepMind. Сменился и фокус. Один из больших апдейтов - появление раздела "Benchmarks" и инструментария Kaggle Benchmarks SDK. Вкратце, это фреймворк + инфраструктура, которые позволяют создавать наборы тестов на любой вкус, объединять их в комплексные бенчмарки и быстро прогонять на них большие модели в равных условиях. Можно придумать и реализвать почти любой тест, метрику и механику его прогона. Тесты можно объеденить в группу и уже эта сущность и будет называться бенчмарком. На выходе будут логи, json, метрики, сравнения, лидерборд. И данные, и код бенчмарков можно оставить в приватном датасете, не доступном публично, а можно раскрыть.

Читать далее

Инструменты AutoML в 2024

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

Определимся с терминологией. Можно найти c десяток формулировок «AutoML- это…» с разной степенью детализации. Но все они сведутся к словам «AutoML — автоматизирует и упрощает работу с данными». И вот здесь как раз и начинаются сложности. Границы определения AutoML размыты. Есть фреймворки работающие на «3 строчках» кода, есть с платформы с GUI, есть библиотеки для профессионалов и новичков. Попробуем разобраться..

Читать далее

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели2.6K

В день, когда Сэм Альтман в темной одежде на темном фоне рассказывал миру о запуске GPT-4-Turbo, в те же самые минуты на Kaggle завершалось небольшое, но любопытное соревнование “Predict the LLM”. Цель – узнать автора по тексту. Авторами текстов выступили 7 анонимных больших языковых моделей…  

Читать далее

Первые 73 дня Kaggle. Опыт новичков в 20 извлеченных уроках

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели2.7K

Привет, Хабр! Небольшая заметка про скромный первый опыт на Kaggle и извлеченные уроки. Без технических подробностей. Скорее про мотивацию и организацию процесса. Матерым DS будет скучно. Но если только планируете заглянуть на соревнование, то в самый раз. Спасибо ?

Читать далее

Информация

В рейтинге
1 078-й
Откуда
Budapest, Budapest, Венгрия
Зарегистрирован
Активность