Comments / Profile of Celsius / Habr

@Celsius

Data Scientist

ProfileArticles2PostsNewsComments106

Изготовление мини ПК на APU Ryzen или компьютер дальнобойщика

Celsius Apr 23 2020 at 15:43

Все хорошо, но за жесткий диск боязно, от вибраций он может внезапно помереть.

Look

Видеозвонки с виртуальным фоном и опенсорсные инструменты

Celsius Apr 23 2020 at 15:16

Какой кошмар! Хорошо, что гуру обработки изображений хабр не читают, а то бы сразу утопили за забивание гвоздей микроскопом.

-3

Look

Машинный перевод. От Холодной войны до наших дней

Celsius Apr 16 2020 at 04:47

Вряд-ли можно доказать это математически, язык это такая аморфная структура, которую человек не может объяснить. У лингвистов есть несколько теорий, некоторые вполне себе рабочие, но все держится на каких-то костылях, есть пробелы в логике.
Взять, например, идеи Ноама Хомского. Можно для многих ситуаций сделать универсальные парсеры и генераторы, вроде-бы даже перевод неплохой получится. Но проблема в том, что большая часть языковых конструкций определяется временем и культурой. Если что-то в языке строго описать и захардкодить, то через десяток лет оно развалится из-за того, что язык, контекст, культура и носители постоянно меняются.

Тут только два пути — либо ждать, когда все языки сольются в один, либо создать сильный ИИ (второе как-то реалистичней).

Look

Почему успехи ИИ DeepMind в Atari вызывают у меня разочарование

Celsius Apr 4 2020 at 06:20

Вообще-то достижения ботов это не главное. Главное это опыт. Люди учатся создавать ИИ и чем разносторонней будут решаться задачи, тем больше будет понимания.

До нормального ИИ еще далеко. То, что сейчас исследуется и используется это примитивные числодробилки, нечто вроде дизайнерских арифмометров — подкидываем шестеренки, они собираются в нечто рабочее, запихиваем туда данные, дергаем за ручку и получаем результат.

В наших руках довольно универсальные инструменты, поэтому мы можем их даже в прод пихать. И результаты кстати, вполне себе ничего. Нейронки это вообще довольно универсальная вещь.

Взять к примеру машинный перевод. Человеческий мозг создает языки такими, что у них есть общая глубинная структура, собственно именно поэтому мы можем учить языки и делать перевод. А машина может делать довольно сносный перевод, вообще без какого-либо понимания глубинных структур и с довольно поверхностным «пониманием» связей между словами. Тупо извлекаем статистические фичи слов/букв, берем LSTM, прикручиваем механизм внимания, сверху приправляем языковой моделью (которая опять же чисто статистическая фича), добавляем немного правил и получаем переводчик.

Всякие распознавания образов, детекции и автокодировщики изнутри выглядят как те же арифмометры, хотя у них и нет физических шестеренок, но абстрактно подход похож.

А если посмотреть на решающие древа, особенно которые люди пишут руками, это вроде-бы примитивные конечные автоматы, на примитивных правилах. Но если их собрать в кучу, получается нечто более мощное, потому-что можно эффективно запрограммировать операции, для которых нейронки вообще не годятся.

Так вот, когда мы разберемся в создании интеллекта настолько, что даже в школах будут преподавать базовую архитектуру сильного ИИ, тогда и наступит ожидаемое будущее. Изучать Вселенную через думающую машину, вот настоящая цель всех этих фокусов и экспериментов.

Look

Самодельная подводная лодка с надводной wi-fi антенной

Celsius Mar 2 2020 at 05:03

С шприцем, конечно идея ужасная. Модуль управления плавучестью, надеюсь, вынесен в отдельный корпус?
Уже предложили здравую идею с перистальтическими насосами, но я подозреваю, что под давлением у них будут проблемы. Встречал еще такой вариант — на вал наматывается гибкий шланг из резины или латекса, для погружения он разматывается и вбирает в себя воду, для всплытия сматывается и вода вытесняется. Только камера с шлангом должна быть с клапаном, который надо предварительно откалибровать, иначе подлодка всплывет не до конца.

Вот орковский способ сделать магнитную муфту www.youtube.com/watch?v=wvfPQZEO6LA годится он только для сервоприводов.

Look

Когда я слышу слова «нейросеть восстановила», я лезу проверять бэкапы

Celsius Mar 2 2020 at 04:01

Да, ЧБ это совсем не простой эффект, в цифре куча способов его получить. PAL, HDTV и усреднение RGB «в лоб» дадут совершенно разные оттенки серого, а нейросеть «восстановит» совершенно разные цвета.
В аналоге нюансов бесконечно больше, там и свойства пленки, и используемые реактивы, и даже условия хранения дают свой эффект. Я много занимался восстановлением старых фотографий и колоризацией, на большинстве снимков даже один тон неконтролируемо «плавает».

К тому-же нейросети не для дилетантов, это вполне обычные программы, которые созданы решать некоторую определенную задачу. Если задача не определена, то и результат получаем соответствующий. Сотворить и обучить нейросеть может любая обезьяна, тут знаний надо меньше чем для веб-программирования. Большинство начинаний идут от студентов, которым нужен не продукт, а хотя-бы какой-то результат, чтобы запостить публикацию и получить зачет. И делается это все на паре десятков «позвоночников», предобученных на условном ImageNet.

Если нам надо раскрашивать машины, то мы берем фотографии машин до «состаривания» фотографии и после, обучаем раскрашивающий фильтр. Если нам надо раскрашивать обезьян, фотографии машин нам уже не годятся, так же как не годится троллейбус из хлеба для полетов в космос.

Look

Учёные создали алгоритм, позволяющий робомобилям избегать аварий и пробок

Celsius Feb 26 2020 at 13:00

Молодцы ребята, но почти каждый студент писал боидо-подобный алгоритм, для самых разнообразных сред. За пару вечеров можно портировать и отладить код для космоса или атмосферы, хоть для океана и подземных червей, был бы только прототип.
А ползающая тележка на трех колесах в двухмерной плоскости это задача школьного уровня.

-1

Look

Комитет JPEG решил использовать ИИ-алгоритмы для сжатия изображений

Celsius Feb 21 2020 at 16:53

И все тело их, и спина их, и руки их, и крылья их, и колеса кругом были полны очей, все четыре колеса их.

Иез. 10:12

DeepDream

Человеческий мозг тоже много чего додумывает и дорисовывает в воспоминаниях, да и в реальном времени.

Look

Microsoft показала новые иконки Windows и рассказала о процессе их создания

Celsius Feb 21 2020 at 09:29

В этих ваших линупсах и сейчас можно настроить все, начиная от установки любого оконного менеджера, до изменения цвета пикселя, в нужных координатах.

Как у людей подгорает после каждой обновы винды это просто шоу. Я всяко изощрялся, пытаясь заставить ее работать как мне надо. Но в понимании майков, вин-админ это бактерия, которая должна со смирением принимать свою участь.
В итоге имеем то, что имеем.

Взять, например те же обновления. Вырубаем всех лишних демонов, глушим связь с серверами через hosts, за одно и телеметрию обрезаем. Устанавливаем галку «лимитное подключение» на все коннектах, запрещаем проверять обновы. Отрубаем защитник время от времени, чтобы впустую не жрал ресурсы. Вроде-бы все замечательно? А вот и нет.
Проходит эдак с год, выходит вроде-бы стабильная обнова. Скрепя сердце, отключаем все запреты, накатываем обновление, включаем запреты обратно.
И тут случается чудо, очередная обнова ставится самостоятельно, без нашего ведома, как обычно целые разделы настроек пропадают бесследно, кнопочки оказываются в случайных местах. Защитник был выключен на момент обновы и попыток самостоятельно включиться не проявлял, зато теперь на месте выключателя красуется надпись «Параметрами защиты от вирусов управляет ваша организация». WTF? Какая организация? У меня домашняя версия.
Это еще хорошо, что всякие паразиты, вроде sedlauncher, которые постоянно потребляют 100% IO диска, отключаются парой кликов.

Людям говоришь «ставьте линукс», а в ответ «чур меня! там одноглазники не работають».

Look

Мечтают ли нейросети об электроденьгах?

Celsius Feb 17 2020 at 06:17

Самый простой и дорогой способ — манипулировать рынком, вбрасывать новости, останавливать/запускать майнинг-фермы. Какому-нибудь правительству условного Китая это вполне доступно, если там найдутся достаточно сообразительные люди.

Look

Мечтают ли нейросети об электроденьгах?

Celsius Feb 17 2020 at 06:05

Даже совсем глупый разработчик не будет предсказывать хаотическую систему на основе предыдущих состояний. Ковырять один единственный график в попытках выжать из него здравый смысл это ущербно, там ведь даже на спектрограмме шум.

Сейчас развилась куча мощных инструментов, взять например анализ текстов.
Качаем с бирж историю, объединяем, усредняем. Качаем твиты с хештегами, связанными с криптой. Сводим время твита и истории. Создаем модель, которая пережевывает предыдущие цены с твитами и выдает предсказание.

Конечно, на волнах хайпа далеко не уедем, цены на каждую секунду не получить. Но представить, что ждет рынок на следующей неделе — вполне возможно. Ни человеку, ни классическим торговым ботам такое не под силу (хотя, да можно посадить тысячу аналитиков, но им надо платить зарплату), а ML модели вполне себе вывозят.

Look

Почему заблокировали ProtonMail и как это поможет в борьбе с «террористами»

Celsius Jan 29 2020 at 13:47

То-ли дело Казахстан: ничего никогда не блокировали, но как сайт появляется в списке РКН, так в Казахстане доступ к нему пропадает.
Давно пора переименовать в Казахский Федеральный Округ.

Look

Скандал на конкурсе Kaggle: победитель сжульничал, алгоритм плохо оценивает шанс бездомных животных найти хозяев

Celsius Jan 17 2020 at 15:33

В новостях должны быть ссылки на массовые баны и полеты с первых мест на двухсотые, надо поискать.

Тестовый сет всегда щупают, загнать синтетические предсказания и погадать по лидерборду, большого ума не требует.
Некоторые, правда, слишком усердствуют и тогда в обсуждениях закипают бурления. В основном со стороны «гадалок» и оверфитеров.

Про «загонку в модель» очевидно — модель не может сказать на каких данных ее обучали. Поэтому организаторам в условиях надо обязывать участников давать параметры и алгоритм обучения.

А взломы это те же лики, только в совершенно дикой манере. Когда в интернет торчит SQL база с приватными данными и их нельзя опубликовать, потом прикрыли, а кто успел тот и съел. Тут становится жалко потраченного времени.

Соревнования на табличках — самые нервные, организаторы как и везде, мешают данные с бурдой и обещают полцарства, а потом не обещают, просто сворачиваются из-за утечки.
С картинками интересней, но мощностей надо на пару порядков больше.

Look

Celsius Jan 17 2020 at 07:27

Обычное дело на Кеггле, во всех конкурсах в топе сидят скраперы и оверфитеры. Участники обманывают и организаторов и себя. Каждый конкурс начинается с того, что кто-нибудь прощупывает закрытый тестовый датасет, потом делится с командой.

Если организатор не озаботился очисткой и не анонимизировал данные, то доходит до взлома БД сайтов.
Полученные данные можно загнать в модель и никто фарш не сможет повернуть назад. Хотя, во многих конкурсах, добытые данные можно сделать публичными.

Кстати, недавно закончились конкурсы где организаторам пришлось выкинуть из оценки >50% и 89% данных.

Look

Основы deep learning на примере дебага автоэнкодера, часть №1

Celsius Jan 15 2020 at 08:55

Тоже пришлось повоевать в свое время с автоэнкодерами, MNIST слишком примитивный и при расширении сети на большие разрешения все усложняется. Рабочих примеров кода мало, т. к. автокодировщик для картинок никому не нужен, а с другими данными все очень легко.

На большой глубине (с черно-белыми изображениями) из сигмоидальных функций лучше всего работает гиперболический тангенс, в некоторых случаях даже линейная от -1 до 1. Еще лучше — специализированные лямбда-активации, энкодер можно задать обычными свертками и пулингами, а на декодер приходится писать специализированные шейдеры, для быстрой сходимости и компенсации артефактов.

И да, для больших изображений все-таки автокодировщики не годятся, ту же задачу можно решить намного эффективней и изящней при помощи GAN.

Look

Обзор Keras для TensorFlow

Celsius Dec 27 2019 at 15:30

Конечно, там приходится с нуля все руками прописывать, описывать каждую мелочь.
В Керасе под капот приходится заглядывать, только когда что-то отваливается в новой версии. А в Торче из под капота никто никогда и не вылезал.

Look

Использование кастомных функций потери и метрики качества обучения в Keras

Celsius Nov 24 2019 at 12:15

Вообще-то достаточно инициализировать функцию и подать название в load_model, в виде custom_objects = {'имя_функции': функция_потерь}

Look

Как нейронная сеть SincNet выделяет значимые частоты в звуке через Back Propagation

Celsius Nov 14 2019 at 08:08

Странно, что не оптимизировали подход до конца. Можно ведь генерировать мел-окно, пихать в вектор и подавать нейросети. Затем, после обучения, удалить самые бесполезные параметры. В результате, на нейросеть будет меньше нагрузка и она сама будет меньше, а значит быстрее.

Взять, например MelNet, там очень здорово придумали с повышением размерности, но из-за невозможности применить сжатие гармоник, по скорости она не превосходит tacotron2

Look

Попытки начать обучение ребенка программированию с Minecraft pocket edition

Celsius Oct 23 2019 at 07:59

Есть прекрасный мод OpenComputers. Там правда, только Lua, но интересней программировать не ради программирования, а для решения игровых задач. Роботами и дронами можно копать/садить картошку, разводить животных, добывать и сортировать ресурсы. Есть даже возможность управлять миром и игроками через специальное админское устройство.
И да, можно даже подключиться к IRC и помигать лампочкой в квартире.

Look

Настольный. Металлический. Бесшумный. Твой?

Celsius Oct 18 2019 at 05:00

Дорого все-таки. Надо бы проектировать с заделом на большую автоматизацию.
Под процессор испаритель площадью по-более бы. В идеале, здоровое ведро с переходниками под процессор и видеокарту, тогда и корпус не нужен.

Для видеокарты сделать отдельный модуль, чтобы он пристыковывался к основному корпусу в единое целое. И продавать по-отдельности.
Крышку с отверстиями под разъемы можно фрезеровать на заказ, схемы под все материнки есть.

-1

Look

1 2 3 4