Комментарии / Профиль eiennohito / Хабр

Пользователь

Пробуем делать web-frontend на Rust (WebAssembly)

eiennohito 28 мар 2017 в 13:00

Игнорирование нативных интерфейсов — это вообще не выход. Сразу же все языки, где есть хитрый ввод (китайский, японский, корейский например) перестают поддерживаться. Или нужен будет кросс-платформенный API для доступа к состоянию IME и прочих средств ввода, чего никогда не будет, я думаю.

Что приняли в C++17, фотография Бьярне Страуструпа и опрос для C++20

eiennohito 22 мар 2017 в 10:41

Есть такая штука, что например uint8_t* нельзя алиасить к другим указателям.

https://gcc.gnu.org/bugzilla/show_bug.cgi?id=66110

Что приняли в C++17, фотография Бьярне Страуструпа и опрос для C++20

eiennohito 22 мар 2017 в 08:33

А std::byte* можно будет алиасить с другими типами указателей?

Интернет по всему миру: Япония и Сингапур

eiennohito 22 мар 2017 в 02:05

Это конечно внутри японии, но спидтест показывает 500/500 мбит.
Загрузки со стима обычно в районе 30 МБайт/с (50гб игра за 10 минут где-то).

Интернет по всему миру: Япония и Сингапур

eiennohito 22 мар 2017 в 01:01

Нормальный 4G только у нормальных операторов потому что за нормальные (или неприличные) деньги.
Сейчас померял свой 4G на докомо: 32.15 in/4.57 out (до сервера в 100 км отсюда).
По вайфаю скачивание поднимается до 50, если что.
Туристические симки от MVNO довольно таки тормозные.

Интернет по всему миру: Япония и Сингапур

eiennohito 21 мар 2017 в 11:03

Живу в Киото, плачу где-то 5000 за гигабит по оптике от docomo, кто провайдер уже не помню. Подключение было бесплатным. Что дороже, чем в России не спорю, пожалуй. Сотовая связь вообще сильно дороже.

Советы начинающему скалисту

eiennohito 12 мар 2017 в 02:10

По поводу кортежей в скале. Если эта штука будет использоваться в более чем одном месте, то лучше имхо сделать case class. Иногда и для одного места лучше сделать case class. Я почти кортежами не пользуюсь.

Почему переводчикам не нужно бояться нейросетей Гугла

eiennohito 9 мар 2017 в 04:06

Вот на что нейросетевые переводы не похожи, так это на дословный перевод.
Это больше к статистическим системам машинного перевода.

у нейросетей больше проблем с тем, что они «забывают» перевести некоторые слова или делают достаточно бредовые замены одних слов на похожие другие.
Нейросетевой перевод по сути дела — сэмпл из очень очень мощной языковой модели целевого языка, подкрашеный исходным предложением как «темой».

Я написал самую быструю хеш-таблицу

eiennohito 9 мар 2017 в 02:08

Для реализаций хэш-таблиц — самое то, пожалуй!

Я написал самую быструю хеш-таблицу

eiennohito 7 мар 2017 в 07:25

Есть даже такое чудо как https://github.com/ridiculousfish/libdivide

Это библиотека, которая реализует… целочисленное деление на константу… как умножение со сдвигом.

Трансляция TensorFlow Developer Summit

eiennohito 17 фев 2017 в 21:33

Tensorflow нынче единственный (насколько я знаю, поправьте меня если это не так) фреймворк, в котором интерфейс кернелов асинхронный. Из других я смотрел правда только на Chainer, Theano, DyNet.

XLA тоже очень интересный и правильный шаг здесь. Оптимизация с объединением операций пока что только тут. Но это инженерная база гугла помогает.

Google выпустила TensorFlow 1.0

eiennohito 16 фев 2017 в 12:29

Создавать и обучать сетки в Tensorflow сейчас все равно можно практически только в питоне.
Обученные же легко запускаются в виде микросервисов с помощью https://github.com/tensorflow/serving. Нужно только чтобы был grpc.

Интегрировать tensorflow в своё серверное приложение библиотекой я бы не стал. Оно весьма тяжёлое. Заморачиваться с тем, что делается для мобильных приложений для сервера имхо оверкилл, когда есть решение на микросервисах.

Google выпустила TensorFlow 1.0

eiennohito 16 фев 2017 в 12:22

Я не понял что вы имеете в виду.

Tensorflow и Theano работают в символьном режиме, когда сначала создаётся граф вычислений, а потом он «запускается» и происходит работа нейросети.

Есть и другие подходы.
Иногда процесс вычислений задаётся линейно, как например сделано в dl4j.

DyNet создаёт граф вычислений на каждый вызов и исполняет его.
Chainer производит «ход вперёд» без создания графа, однако запоминает историю для последующего вычисления градиентов и оптимизации.

Веса модели есть везде и их количество будет одинаковым для сети одинаковой конфигурации вне зависимости от фреймворка. Иначе сети не были бы одинаковой конфигурации.

tiny-dnn — анонс библиотеки

eiennohito 20 янв 2017 в 15:36

Увы, не для текста. Рекуррентных сетей вообще нет (и похоже не предвидится).

На текст специализируются похоже только https://github.com/clab/dynet да https://github.com/pfnet/chainer

Методы оптимизации нейронных сетей

eiennohito 5 янв 2017 в 10:05

Почти по теме: вот как раз вчера читал https://arxiv.org/pdf/1606.04474v2.pdf

Learning to learn by gradient descent by gradient descent (NIPS 2016)

Учат оптимизатор как нейросеть

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

eiennohito 19 дек 2016 в 17:11

Если бы можно было знать, где сети ошибаются, а где нет, то эта штука помогла бы, но всё немного сложнее. Случаи когда все сети не ошибаются менее интересны, потому что среди уже аннотированных данных достаточно информации для нахождения правильного решения. Случаи когда все сети врут гораздо хуже — они заражают исходные данные, а нейросети сильно чувствительны к плохим аннотированным данным, особенно для языка, где пространство параметров очень разрежено по сравнению с обработкой изображениями.

Подход когда промежуточные результаты, где варианты сетей не сошлись в ответе показывать человеку и использовать проверенные деревья для увеличения примеров будет лучше на мой взгляд.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

eiennohito 19 дек 2016 в 15:23

Если вы про GNMT, то далеко не для всех языков в продакшне.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

eiennohito 19 дек 2016 в 15:11

Насколько я знаю, Гугл для языков с очень большим объёмом параллельных текстов использует end-to-end нейросети, в том числе в продакшне. Для большинства обычных — просто статистический подход с самой простой языковой моделью — Stupid Backoff. Хитрые вещи с морфологией они не делают, надеясь на просто языковую модель. Нейросети правда частично решают эту проблему, так как гугловская модель использует не слова, а subword units, что будет приводить к сегментации на что-то, похожее на морфемы, но я подробностей про русский не слышал. Разве что параллельный корпус у них примерно на 0.3B предложений.

Как Яндекс научил машину самостоятельно создавать переводы для редких языков

eiennohito 19 дек 2016 в 14:53

А у вас это есть где-нибудь в опубликованное в более подробном виде. Ссылки на arXiv/ACL Anthology были бы хороши.

Анатомия KD-Деревьев

eiennohito 18 окт 2016 в 11:14

Ну здесь, как говорится мопед не мой. Этот алгоритм нам рассказывал на паре по вычислительной геометрии препод.