Статьи / Профиль koch / Хабр

koch@koch

Blanc Mahatma de Harlem at Glummy Glooma

Подписчики

ПрофильСтатьи4ПостыНовостиКомментарии12

koch 19 апр в 19:57

Kaggle Benchmarks. «Kaggle уже не тот...»

Простой

3 мин

12K

Искусственный интеллектМашинное обучение * Хакатоны

Обзор

В ML/DS сообществе есть шаблонная фраза “Kaggle уже не тот”. Ностальгия по временам ушедшим понятна, но в общем-то очевидно, что драматически меняется вся индустрия и ландшафт соревнований вместе с ним. На смену заголовку, встречавшему кагглеров раньше, “Your Home for Data Science” пришел новый: “The World's AI Proving Ground”.

Бенчмарки на Kaggle

В 2026 Kaggle окончательно перешел под крыло AI фронтьера от Google DeepMind. Сменился и фокус. Один из больших апдейтов - появление раздела "Benchmarks" и инструментария Kaggle Benchmarks SDK. Вкратце, это фреймворк + инфраструктура, которые позволяют создавать наборы тестов на любой вкус, объединять их в комплексные бенчмарки и быстро прогонять на них большие модели в равных условиях. Можно придумать и реализвать почти любой тест, метрику и механику его прогона. Тесты можно объеденить в группу и уже эта сущность и будет называться бенчмарком. На выходе будут логи, json, метрики, сравнения, лидерборд. И данные, и код бенчмарков можно оставить в приватном датасете, не доступном публично, а можно раскрыть.

koch 30 апр 2024 в 09:47

Инструменты AutoML в 2024

Простой

3 мин

13K

Машинное обучение * Искусственный интеллект

Обзор

Определимся с терминологией. Можно найти c десяток формулировок «AutoML- это…» с разной степенью детализации. Но все они сведутся к словам «AutoML — автоматизирует и упрощает работу с данными». И вот здесь как раз и начинаются сложности. Границы определения AutoML размыты. Есть фреймворки работающие на «3 строчках» кода, есть с платформы с GUI, есть библиотеки для профессионалов и новичков. Попробуем разобраться..

koch 7 ноя 2023 в 13:01

Классификация авторства текстов. Обзор Kaggle соревнования «H2O Predict the LLM»

Простой

4 мин

2.6K

ХакатоныМашинное обучение * Natural Language Processing *

Репортаж

✏️ Технотекст 2023

В день, когда Сэм Альтман в темной одежде на темном фоне рассказывал миру о запуске GPT-4-Turbo, в те же самые минуты на Kaggle завершалось небольшое, но любопытное соревнование “Predict the LLM”. Цель – узнать автора по тексту. Авторами текстов выступили 7 анонимных больших языковых моделей…

koch 23 мая 2023 в 05:25

Первые 73 дня Kaggle. Опыт новичков в 20 извлеченных уроках

Простой

3 мин

2.7K

Машинное обучение *

Кейс

Привет, Хабр! Небольшая заметка про скромный первый опыт на Kaggle и извлеченные уроки. Без технических подробностей. Скорее про мотивацию и организацию процесса. Матерым DS будет скучно. Но если только планируете заглянуть на соревнование, то в самый раз. Спасибо ?