Комментарии / Профиль temp / Хабр

Tobias Fünke@temp

Пользователь

Как собрать биграммы для корпуса любого размера на домашнем компьютере

temp 13 окт 2016 в 16:13

Биграмма — это два слова, которые в тексте или, в нашем случае в корпусе текстов, являются соседними.

Вообще n-gram и в частности bi-gram может также применятся к буквам и фонемам. Например n-gram фонем используются в speach recognition, а n-gram букв в language identification.

По теме статьи, имеет смысл обратить внимание на Spark MLib feature Extraction, который решает проблему генерации n-gram в map-reduce и множество других.

Deep Learning — что же делать, кого бить

temp 4 авг 2016 в 10:01

Есть опыт работы с ANN в production системах. Текущий подход, где используется обучение с gradient descent, подходит для определенного типа задач. Идея в том, чтобы прогнать множество итераций с обучающим набором, чтобы получить достаточный уровень ошибки. В итоге получим распознавание паттернов, для определенного типа задач. Но проблема в добавлении новых знаний в существующую сеть. Неэффективно прогонять многие итерации обучения, чтобы добавить крупицу нового знания. Пока пытаются решить проблему one shot learning костылями типа Neural Turing Machine, но имхо это забивание гвоздей микроскопом. Более интересно совместить вероятностные подходы с ANN, например с Gaussian Processes и Deep Reinforcement Learning. Это уже применяется в робототехнике, но есть нюансы работы с широкими слоями ANN. Вообще, если следить за темой, то основные идеи меняются не быстро. С другой стороны, на хайпе нейросетей сейчас каждый ученый и его тетя пишут научные статьи, создавая илюзию стремительно меняющейся области. Особенно преуспели в том деле китайские товарищи, выдавая тонны г*вно статей на гора.

Как сохранить здоровье, работая за компьютером?

temp 16 апр 2011 в 07:58

Всегда недоумевал, глядя на советы двигаться во время получасовых перывов. Безусловно это полезно, но мало применимо к нашим реалиям. Если программист работает в кабинете/опен спэйс то частые прогулки вызывают косые взгляды менеджера и коллег, порой довольно неодобрительные. Обычно в бизнес центрах не очень много места для прогулок и они ограничиваются маршрутом кабинет-туалет/курилка-кабинет. Более того, поработав в нескольких компаниях среднего уровня, не разу не видел чтобы люди делали упражнения для глаз, например. Такое впечатление, что люди пренебрежительно к этому относятся, из разряда «зачем мне пристегиваться» в автомобиле. Сам стараюсь следовать правилам работы за ПК, но это сложно психологически, когда никто в коллективе не разделяет этих взглядов.

Возможно в компаниях вроде Google/Facebook/Yandex ситуация прямо противоположная, но все же большинство людей работают в организациях попроще. Хотелось бы топик на тему выживания и сохранения здоровья в подобных условиях :)

Поколение, которое не прочтёт ни Чехова, ни Тургенева, ни Жюля Верна…

temp 2 окт 2009 в 11:25

Весьма скромная — трилогия Лукьяненко и «мечтают ли андроиды об электроовцах» Ф.Дика.

Поколение, которое не прочтёт ни Чехова, ни Тургенева, ни Жюля Верна…

temp 2 окт 2009 в 07:38

Задумался и понял, что последние полгода не читал ничего кроме технической литературы. Уважаемые хабрапользователи, посоветуйте пожалуйста достойные произведения жанра киберпанк.

Давка в «Эльдорадо» на распродаже ноутбуков: видео

temp 8 сен 2009 в 08:11

Что примечательно — примерно 2 года назад, в похожей ситуации, немцы штурмовали магазин электроники:
www.youtube.com/watch?v=PmCDwAC62Gc

Турбо скорость Интернета с Opera 10

temp 2 сен 2009 в 10:07

Как я понимаю, новая опера не использует настройки старой. Подскажите пожалуйста, как восстановить предыдущие настройки.

-1

Кувшин-ксилофон

temp 1 сен 2009 в 10:32

Поделитесь еще рецептами, если вас не затруднит.

IOI-2009: очередной триумф Гены Короткевича

temp 17 авг 2009 в 13:56

> После этого Гена сбоев не допускал.
Ваша догадка может подтвердиться )

Windows 7 бесплатно для студентов, аспирантов и преподавателей

temp 7 авг 2009 в 05:07

Проверил, действительно мой факультет в списке. И почему нам никто ничего не сказал? Теперь нужно обратиться к администратору? Он похоже и сам ничего не знает об этом :)

Сегодня число загрузок Firefox превысит миллиард

temp 1 авг 2009 в 04:13

Интересно, кто был этим пользователем.