Комментарии / Профиль Assistant_Branch

Лично мне адаптированные видео/тексты не так нравились (лучше я буду не понимать, страдать и пересматривать по несколько раз, зато как бы "настоящий" источник). Но это вопрос предпочтений. Знаю людей которым адаптированная версия лучше зайдет.

Посмотреть

Как взрослому выучить английский: 7 шагов от азов до свободного владения

Assistant_Branch_Manager 18 дек 2022 в 01:45

Пожалуйста )

Посмотреть

Беспилотник 2.0

Assistant_Branch_Manager 24 июл 2022 в 01:48

А можете привести какое нибудь доказательство? Пример гонки где робот побил человека?

Посмотреть

Беспилотник 2.0

Assistant_Branch_Manager 23 июл 2022 в 23:47

Построить беспилотник который проезжает гоночную трассу не проблема. А вот побить профессионального гонщика пока невозможно. Хотя бы потому что у беспилотника примерное время реакции полсекунды-секунда, а у гонщика на порядок меньше.

Пока цель для индустрии - превзойти пьяных/переписывающихся за рулём/засыпающих водителей. Если это получится будет огромный прогресс, смертность на дорогах сейчас больше миллиона людей в год на планете.

-1

Посмотреть

Беспилотник 2.0

Assistant_Branch_Manager 23 июл 2022 в 20:57

С точки зрения упора на камеры да. Но у Теслы (как я помню) не end-to-end подход, а наоборот, очень много детекторов для каждой ситуации.

Посмотреть

Беспилотник 2.0

Assistant_Branch_Manager 23 июл 2022 в 20:54

Наверное когда нибудь может, но сейчас беспилотники водят хуже средних водителей, до профессиональных гонщиков ещё очень далеко.

Посмотреть

Как я готовился к собеседованию на позицию Senior ML Engineer

Assistant_Branch_Manager 26 мая 2022 в 21:35

Привет!

Нет, видео не смотрел. Записывать такое видео не вижу особого смысла. Все что нужно для подготовки уже есть в доступе (например, те ссылки, что я привожу в статье).

Про то что сеньоры не могу сами пройти все собесы: наверное это нормально, так как:

К собесам нужно долго готовится. Вряд-ли все сеньора постоянно находятся в процессе максимальной готовности

Никто не ожидает, что кандидат ответить идеально на все вопросы. Задача быть лучше других притендентов на конкретную позицию :)
Часть объяснения может быть в том, что в РФ сильная нехватка разработчиков, особенно сеньоров, которые сваливают в другие страны. Поэтому планка не высоко. Это чисто мои измышления, проверить их не могу.

Посмотреть

Как я готовился к собеседованию на позицию Senior ML Engineer

Assistant_Branch_Manager 26 мая 2022 в 21:33

Посмотреть

Байесовский вывод и метод максимизации правдоподобия в задаче о бросках монетки

Assistant_Branch_Manager 1 апр 2022 в 22:23

Спасибо, поправил, что я имел в виду. В левой части просто определения матожидания и дисперсии.
m здесь - это количество событий x=1 в серии бросков длины N, поэтому меняется от 0 до N

Посмотреть

Прогнозирование посещаемости объявлений по содержанию

Assistant_Branch_Manager 1 апр 2016 в 23:07

Возможно я ошибаюсь, но мне кажется, что целевая переменная выбрана не лучшим образом. Количество просмотров в сутки быстро затухает, поэтому вы переоцениваете новые объявления. Лучше предсказывать кол-во просмотров за первые n дней (объявления созданные менее чем n дней назад не рассматривать). Если этих данных нет, то можно на основании общего графика затухания вычислять величину "ожидаемое число просмотров за все время". Чуть усложненная версия опираться на срезы в течении нескольких дней наблюдений.
Когда я недавно занимался похожей задачей (тоже объявления) bag of words на полем "title" давал даже лучше результат (возможно текст в описании более сложный и хуже поддаться разбору).
Вы пишите "рассматривать задачу классификации (отсюда и tf-idf)", подскажите почему?
Возможно вы знаете: tf-idf фиттится на тестовой, а не на всей выборке, а что делать с кросс-валидацией? Там же "тестовая" попадает в tf-idf.fit как это влияет? Видимо улучшает качество на кросс-валидации, но влияет ли это на подбор параметров и приминать ли это в расчёт?

Посмотреть

О расширении словаря эмоционально окрашенных слов на базе сообщений Твиттера

Assistant_Branch_Manager 19 июн 2015 в 16:50

Если это действительно ошибка (совершается случайно), то вероятность употребления такого слова в правильном и искаженном написании рядом с положительными/отрицательными уже оцененными словами одинакова, следовательно при достаточно большом объеме твитов у слова и его искаженной версии будут одинаковые «числа».
Если же слово намеренно коверкается, скорее всего у него другое значение, следовательно вероятность встретиться с положительно/отрицательно оцененными словами разная для вариантов написания, таким образом и их оценка будет разная.

Посмотреть

О расширении словаря эмоционально окрашенных слов на базе сообщений Твиттера

Assistant_Branch_Manager 18 июн 2015 в 23:00

Данный метод как раз позволяет добавлять слова с ошибками и сленг в словарь (главное, чтобы такие слова встречались вместе с другими корректными, уже оцененными словами в одном твите).
ex: bro=-0.29

Посмотреть

О расширении словаря эмоционально окрашенных слов на базе сообщений Твиттера

Assistant_Branch_Manager 17 июн 2015 в 14:56

Выражения типа «Awesome bastards!» такой метод оценки может оценивать некорректно (скорее всего около нуля, так как присутствует одно сильно негативное и одно сильно положительное слово), хотя стоит заметить, что и человек испытывает сложности в оценки подобных выражений вырванных из контекста.
В любом случае данный метод предназначен для оценки в среднем большого количества информации, а не единичных твитов. Например, если в данном месяце вместе со словом «Obama» стали чаще встречаться позитивные/негативные слова, (в сравнении с предыдущем месяцем), то можно сделать вывод об положительном/отрицательном изменении рейтинга. Главное, что бы реальное изменение настроений было больше чем погрешность измерений.
Конечно дополнение данного метода возможностью распознавать словосочетания, а также отрицательные и вопросительные предложения, позволит повысить его точность и осмысленность.

Посмотреть