Pull to refresh

Революция в онлайн-образовании: «Академия Хана» стремится запатентовать обучение с использованием сплит-тестирования

Patenting *Business Models


Из документации ведомства по патентам и товарным знакам США следует, что «Академия Хана» (Khan Academy) патентует системы и методы для обучающих видео с использованием AB-тестирования.
Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Views 5.8K
Comments 0

Генерация текста с помощью GPT2 и PyTorch

OTUS corporate blog Python *Machine learning *Artificial Intelligence
Translation

Генерация текста — одна из самых захватывающих прикладных задач обработки естественного языка (Natural Language Processing - NLP) за последние годы. Большинство из нас, вероятно, слышали о GPT-3, мощной языковой модели, которая может генерировать тексты, близкие к написанным человеком. Однако такие модели чрезвычайно трудно обучать из-за их большого размера, поэтому предварительно обученные модели обычно предпочтительнее там, где это приемлемо.

В этой статье мы научим вас генерировать текст с помощью предварительно обученного GPT-2 — более легкого предшественника GPT-3. Мы будем использовать именитую библиотеку Transformers, разработанную Huggingface. Если вы хотите узнать, как настроить GPT-2 на своем собственном наборе данных для генерации текста в конкретной предметной области, вы можете прочитать мою предыдущую статью: Настройка GPT2 для генерации текста с помощью Pytorch

Если предварительно обученной GPT-2 для ваших целей будет достаточно, то вы попали как раз туда, куда нужно! Без лишних отлагательств, приступим туториалу.

Читать далее
Total votes 9: ↑8 and ↓1 +7
Views 6.9K
Comments 1

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 1

Авито corporate blog Web services testing *Mobile App Analytics *Product Management *

Всем привет! Я Дмитрий Лунин, работаю аналитиком в команде ценообразования Авито. Наш юнит отвечает за все платные услуги площадки. Наша основная задача — сделать цены на них оптимальными. 

Мы не только пытаемся максимизировать выручку Авито, но и думаем про счастье пользователей. Если установить слишком большие цены, то пользователи возмутятся и начнут уходить с площадки, а если сделать цены слишком маленькими, то мы недополучим часть оптимальной выручки. Низкие цены также увеличивают количество «спамовых» объявлений, которые портят поисковую выдачу пользователям. Поэтому нам очень важно уметь принимать математически обоснованные решения — любая наша ошибка напрямую отразится на выручке и имидже компании. 

Одним из инструментов для решения наших задач является A/B-тестирование.

Читать далее
Total votes 11: ↑9 and ↓2 +7
Views 18K
Comments 15

Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 2

Авито corporate blog Mobile App Analytics *Product Management *

Это вторая часть статьи о том, как улучшить A/B-тесты. Здесь я подробно остановлюсь на методах увеличения мощности: поговорим про CUPED, бутстрап-критерии, стратификацию и парную стратификацию.

Читать далее
Total votes 8: ↑8 and ↓0 +8
Views 11K
Comments 2

Как метод подмены задачи борется с несовершенством данных (и мира)

МТС corporate blog Data Mining *Mathematics *Machine learning *Artificial Intelligence

Привет, Хабр! Меня зовут Максим Шевченко, я ведущий ML разработчик в Big Data МТС. В этом посте я расскажу о том, что такое метод подмены задачи. Также разберем несколько примеров того, как такой подход позволил найти эффективные решения для рабочих проектов. Проверим валидность таргетинга в наружной рекламе; рассмотрим, как еще можно проверить однородность групп до проведения А/В тестирования; расскажу про необычный подход к оценке качества данных. Добро пожаловать под кат!

Читать далее
Total votes 17: ↑16 and ↓1 +15
Views 2.9K
Comments 2