Pull to refresh
1
0
Артём @Frohman

User

Send message

Lingtrain Aligner. Написал приложение для создания параллельных книг, которое вас удивит

Reading time6 min
Views23K

title


Здравствуй, читатель. Хотелось бы ненадолго отвлечь твое внимание от новостей и историй данной технической статьей. Поэтому пусть такой "кликбейтный" затравочный заголовок не вводит тебя в заблуждение.


В этой статье я расскажу как сделать параллельную книгу, имея на руках два текста на разных языках. Я написал веб-приложение, которое упрощает процесс выравнивания, превращая сырые тексты в книги и параллельные корпуса. Хочу поделиться с сообществом этим проектом, а также узнать ваше мнение. Технические детали я описывал здесь и здесь, код приложения открытый. Поехали.


Установка


Приложение я оформил в виде docker контейнера, поэтому запустить его у себя на машине не должно составить труда. Также можно запустить приложение из исходников, инструкция есть в репозитории.


Итак, для запуска приложения у себя на компьютере нужно выполнить следующие команды:


docker pull lingtrain/aligner:v4
docker run -v C:\app\data:/app/data -v C:\app\img:/app/static/img -p 80:80 lingtrain/aligner:v4

C:\app\data и C:\app\img — это папки на вашем компьютере.


Контейнер скачается с репозитория Docker Hub и запустится на 80-м порту. Откроем приложение в вашем любимом браузере по адресу localhost.


Lingtrain app 1


Сделаем три шага: загрузка, выравнивание, генерация.

Смотреть демо
Total votes 60: ↑59 and ↓1+74
Comments45

Как ДОМ.РФ работает с системами хранения данных российского производства

Reading time14 min
Views6.2K

В постоянно меняющемся мире сфера IT как одна из самых молодых пытается держаться на переднем крае. И мы, системные инженеры, должны учитывать все факторы окружающей среды, чтобы оставаться на плаву в этом неспокойном море.

Читать далее
Total votes 13: ↑12 and ↓1+17
Comments4

Умные субтитры

Reading time6 min
Views5.4K

Сегодня я вам расскажу о своем методе для изучения иностранных языков.

С чего начать изучение нового языка? Чаще всего люди на раннем этапе используют стандартный лексико-грамматический метод с доминированием письменного языка, который показал себя медленным и весьма скучным — вам чаще всего нужна зашкаливающая мотивация, чтобы не бросить где-то посередине.

Я предлагаю начать сразу с видео. Во-первых, видео просто интересно смотреть (особенно если это нормальные мультики/фильмы/сериалы, созданные для носителей языка). Во-вторых, вы сразу начнете запоминать звучание слов, что очень сильно пригодится для развития навыка аудирования в будущем.

Однако, если вы просто возьмете видео на новом для себя языке, то вы ничего не поймете. Первый шаг к решению проблемы - смотреть видео с субтитрами на языке оригинала. Однако, когда вы еще не знаете лексику языка, такие субтитры вам не помогут. Вам нужны двойные субтитры - на языке оригинала + перевод на ваш родной язык. 

При просмотре видео с двойными субтитрами мозг начинает сопоставлять слова из двух предложений на разных языках. Это зачастую нетривиально (особенно если у языков сильно отличается грамматика), на это мозг тратит время и энергию. 

Моя идея состоит в том, чтобы выполнить эту задачу вместо мозга и отображать субтитры как на картинке выше: посередине находятся субтитры на языке оригинала, ниже — их перевод; плюс над иностранными словами подписаны соответствующие им слова из перевода. Таким образом, за время просмотра десятка подобных фильмов/мультиков, каждое слово из базовой лексики будет многократно отображено вместе со своим переводом в текущем контексте, что позволит его запомнить.

Читать далее
Total votes 10: ↑9 and ↓1+12
Comments15

Автоматизация вытяжки в ванной комнате

Reading time4 min
Views89K
Ванная комната является помещением, постоянно подвергающимся воздействию повышенной влажности и перепадам температуры — как результат, в нем с легкостью может поселиться плесень и грибок. Основной способ борьбы — вентиляция помещения. Вентиляция может быть как естественной, так и принудительной. Если естественная вентиляция монтируется еще на стадии строительства здания, то принудительная система вентиляции может быть реализована в любой момент времени.



Сегодня речь пойдет о том, как путем нехитрых манипуляций сделать автоматизированное включение вентиляции в ванной комнате, чтобы она не превращалась в парную баню и продолжала радовать нас чистотой и свежестью.
Читать дальше →
Total votes 16: ↑14 and ↓2+12
Comments51

GNS3 1.0 beta и Cisco IOU

Reading time4 min
Views54K


Всем привет!

Совсем недавно вышла публичная бета популярного симулятора сетевого оборудования GNS3 1.0. Интересен он в первую очередь тем, что стал поддерживать switching (раньше поддерживал лишь routing) с помощью Cisco IOU. Так как я пользуюсь им, начиная с альфа-версии, то решил написать небольшой гайд, как подружить GNS3 и IOU.

Дисклеймер. Cisco IOU могут использовать только сотрудники компании Cisco.

Ниже представлена инструкция и для Windows, и для Linux.
Читать дальше →
Total votes 25: ↑23 and ↓2+21
Comments19

Видео всех лекций с «Курсов информационных технологий» от «Яндекса»

Reading time1 min
Views30K
Для тех, кто не смог посетить Курсы информационных технологий, видеоролики всех лекций выложены в свободный доступ. Это лекции по полтора-два часа на базовые темы: операционные системы; архитектура ЭВМ; устройство GNU/Linux; системы хранения данных; файловые системы; сети и протоколы; виртуализация; безопасность.
Читать дальше →
Total votes 116: ↑101 and ↓15+86
Comments39

Zalman VE-200 — USB/eSATA бокс для портативного HDD с виртуальным CD-приводом

Reading time6 min
Views226K
Наконец-то появились в продаже в России долгожданные Zalman VE-200, один из которых я и заказал себе.



Этот бокс для 2.5" HDD, с первого взгляда, не представляет собой ничего особо выдающегося — те же USB и eSATA-интерфейсы, что и у многих других боксов. Но, в отличие от конкурентов, бокс содержит в себе виртуальный CD-привод, в который монтируются *.ISO, сложенные в специальной папочке. Впрочем, это потом, а теперь:
Читать дальше →
Total votes 118: ↑114 and ↓4+110
Comments182

GPRS изнутри. Часть 4.1

Reading time7 min
Views12K
Это заключительная часть серии статей о технологиях GPRS/EDGE, которую мы начали в предыдущих трех повествованиях: 1, 2, 3. На этот раз мы заглянем за двери маш. залов и посмотрим, что же на самом деле обеспечивает возможность передавать и принимать данные по воздуху с помощью мобильного телефона — речь пойдет о hardware под SGSN'ы и GGSN'ы.

Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments4

GPRS QoS — миф или реальность?

Reading time9 min
Views5.2K
В этой статье мы рассмотрим принципы и методы использования т.н. профилей качества предоставляемых сервисов — QoS, применительно к пакетной передаче данных в сетях мобильных операторов, основанных на технологиях GPRS/EDGE.

Читать дальше →
Total votes 10: ↑8 and ↓2+6
Comments2

Создана программа для «разгона» интеллекта

Reading time2 min
Views3.6K
Учёным впервые в мире удалось экспериментально доказать возможность развития подвижного интеллекта у человека. Они создали компьютерную программу, которая стимулирует рабочую память таким образом, что действительно улучшаются способности мозга к обучению и решению неизвестных задач. Хотя рынок подобных программ оценивается в четверть миллиарда долларов (а легальный химический допинг для мозга появится ны рынке только через несколько лет), но учёные всё равно не собираются коммерциализировать свою сенсационную разработку.

Подвижный интеллект (fluid intelligence) — это способность воспринимать и запоминать новое, решать новые проблемы, с которыми человек раньше не сталкивался. В отличие от так называемого «накопленного» интеллекта, который основан на приобретённых знаниях (математика, словарный запас и т.д.), подвижный интеллект определён от рождения человека и остаётся неизменным на протяжении жизни. Некоторые специалисты иногда сравнивают связку подвижного и накопленного интеллекта со связкой компьютерного железа и софта. Первый закладывается природой, а второй поддаётся апгрейду. С возрастом первый изнашивается, а второй практически не ухудшается и может даже развиваться, превращаясь в мудрость.

Теперь же оказывается, что и «железо» в человеческом мозге можно немного «разогнать». Для этого достаточно 25-минутных ежедневных тренировок, после которых мышление становится более подвижным.
Читать дальше →
Total votes 46: ↑44 and ↓2+42
Comments64

Миф о восьмичасовом сне

Reading time1 min
Views21K
С детства нам объясняли, что спать нужно восемь часов. Как заведённые, одно и то же повторяли врачи и родители. Альтернативных мнений просто не было: восемь часов — и точка. Однако, последние медицинские и исторические исследования дают всё больше доказательств, что восьмичасовой сон неестественен для человека.
Читать дальше →
Total votes 94: ↑61 and ↓33+28
Comments158

Бизнес — это закономерный этап в карьере специалиста

Reading time6 min
Views23K
<UPD>Спасибо огромное за отрезвляющие комменты. В общем, я понял, что моя статья — полная ерунда. Не надо было мне соваться в это дело, поучать других и позориться. Если хотите, можете прочитать мою статью, но только вместе с комментами — в них вся мякотка.</UPD>

В этой статье слово «программист» можно заменить на любую другую специальность.

Раньше я думал, что «работа на дядю» и бизнес — это совершенно разные вещи. Что для них требуются совершенно разные знания. Что опыт наёмной работы никак не поможет в бизнесе. Что в бизнесе можно заработать гораздо больше денег, чем работая по найму. Что работа по найму увеличивает капитал в арифметической прогрессии, а бизнес — в геометрической.
Если не знаете, что такое прогрессия, нажмите сюда
Арифметическая прогрессия — это значит, что в первый год у вас (условно говоря) 100 рублей, во второй — 200 рублей, в третий — 300 рублей, и так делее.
Геометрическая — это в первый год 100 рублей, во второй — 200, в третий — 400, в четвёртый — 800, то есть каждый год (например) в два раза больше, чем в предыдущий.

Я думал, что единственное, что нужно для бизнеса — это бизнес-хватка, хитрость, и, возможно, умение обманывать. Что честный бизнес в России невозможен. Что если человек хочет заработать деньги, то он должен перестать работать на дядю, просиживая штаны в офисе, и уйти в бизнес. А лучше сделать это сразу после окончания школы, чтоб зря время не терять. Я думал, что высшее образование для бизнеса не нужно.

Но при этом я для себя решил, что я бизнесом заниматься не буду, так как:
1. У меня (как я думал) нет бизнес-хватки.
2. В России (как я думал) честный бизнес невозможен, а я честный и из России уезжать не собираюсь.

Поэтому я собрался всю свою жизнь заниматься наёмным трудом (а точнее, работать программистом). Работа программиста мне нравится, но, как я думал, никогда не принесёт мне столько денег, сколько принёс бы бизнес. Я смирился с тем, что буду заниматься приятным, но не слишком прибыльным делом, т. е. богачём не стану.

Единственный вид бизнеса, который (как я решил) является для меня приемлимым — это игра на бирже, то есть трейдинг. А также инвестирование. Правда, всё это не совсем бизнес, но всё же увеличивает капитал в геометрической прогрессии. Для него не так сильно нужна бизнес-хватка и вполне можно зарабатывать деньги честно. Поэтому я решил, что буду работать программистом и параллельно заниматься трейдингом. При этом я рассуждал так: работа увеличивает деньги арифметически, а трейдинг — геометрически. Значит, в какой-то момент трейдинг начнёт приносить гораздо больше денег, чем работа. И в этот момент работу можно будет бросить.

Но однажды всё изменилось. Один мой знакомый сказал мне, что 150 000 рублей — это потолок для программиста в Москве. Другой сказал, что работать программистом в одной узкой специальности всю жизнь — это глупо, нужно всегда учиться чему-то новому, расширять кругозор и в какой-то момент стать менеджером (у других программистов), либо заняться консалтингом или бизнесом (опять-таки, IT-бизнесом).

Что ж, потолок в 150 000 меня совсем не устраивал и это заставило меня задуматься. Я подумал и понял всё. Итак, бизнес — это закономерный этап в карьере специалиста.
Читать дальше →
Total votes 73: ↑25 and ↓48-23
Comments69

Если жесткий диск сломался

Reading time9 min
Views74K

О чем статья



Очень многие уже побывали в ситуации, когда жесткий диск вдруг начинал хрустеть, отказывался записывать или читать файлы, с него магическим образом пропадала операционка или даже вся файловая система.

Обычно это означает, что на жестком диске образовались так называемые bad blocks (бэдблоки), и о возврате такого порченого винчестера наш дальнейший рассказ.
Читать дальше →
Total votes 111: ↑90 and ↓21+69
Comments198

Мой опыт восстановления зрения

Reading time9 min
Views277K
   Этим летом я был на некоторое время предоставлен сам себе – всех своих я отправил подальше от дыма, а сам, недолго думая, решил немного подтянуть здоровье. Не просто записаться в тренажерный зал и накачать «квадратиков» для пляжа, а именно обследоваться у некоторых врачей, чтобы выработать для себя вектор дальнейших действий, дабы совсем не превратиться в «овоща».

image

   Расскажу лишь про свой опыт восстановления зрения – именно оно больше всего подвержено риску у любого «компьютерного» человека.
Читать дальше →
Total votes 495: ↑398 and ↓97+301
Comments208

Типовые вопросы на собеседовании и рекомендации кандидату

Reading time3 min
Views2.9K
(продолжаю делиться опытом по поиску работы отсюда — туда)

Как известно, поиск работы – это само по себе работа, сложный и многоэтапный процесс. Чтобы успешно его пройти до самого конца и получить желанную работу, следует хорошо понимать каждый из этапов: от поиска вакансий, написания резюме и совпроводительных писем до переговоров на тему зарплаты. Понимание, в свою очередь, позволит хорошо подготовиться, а значит работать более эффективно. Как говорится, тяжело в леченье – легко в гробу.

Безусловно кульминационным и определяющим моментом процесса является собеседование, или, как его сейчас называют на западный манер, – интервью. Мне всё же термин «собеседование» кажется более подходящим, так как данный вид общения предполагает вопросы с обеих сторон: нанимателя и претендента на вакансию. О вопросах к работодателю, которые стоит подготовить кандидату на должность, я расскажу как-нибудь в другой раз, а здесь же я хотел бы привести примеры реальных вопросов, к которым мой кадровый агент рекомендовал мне подготовиться перед встречей с будущим (уже теперешним) работодателем.

Сразу хочу сказать, что эти вопросы не по предметной части, а, скажем так, общие. Понятно, что задают их кадровики, и как бы глупо эти вопросы ни звучали, на них нужно ответить, чтобы перейти на следующий уровень. В том или ином виде они попадались мне на всех моих встречах по поводу трудоустройства. Ниже даны сами вопросы, а также
Читать дальше →
Total votes 21: ↑8 and ↓13-5
Comments19

Оплата сертификационных тестов через VUE

Reading time4 min
Views4.5K

Введение


В этой заметке хотелось бы поделиться своим скромным опытом оплаты сертификационного тестирования через систему Pearson VUE.
Первым делом пару слов о Pearson VUE и его ближайшем конкуренте Prometric.
Читать дальше →
Total votes 9: ↑5 and ↓4+1
Comments3

Много книг, хороших и разных

Reading time20 min
Views96K
Мой список книг, которые мне хочется прочесть, изрядно вырос, спасибо топику “запасаемся на зиму”. Под катом вы обнаружите список книг, составленный по комментариям в том топике.
Читать дальше →
Total votes 139: ↑124 and ↓15+109
Comments89

Запасаемся на зиму

Reading time1 min
Views22K
Книги — пища для мозгов программиста. А художественные — десерт. Хорошая книга — как вкусное блюдо, которое хочется дочитать растянув удовольствие, испробовать снова и снова. Но есть куча книг, которые мы еще не нюхали и, возможно, никогда не попробуем, потому что нам их не посоветовали несколько человек.

У каждого есть одна-две любимые книги, которые могут понравится другим, поделитесь пожалуйста, заразите. Думаю многим будет интересно поставить в очередь «к прочтению» несколько новых. Давайте устроим «дегустацию» книг в формате: одна книга — один комментарий. Чтобы другие могли добавить в избранное (и оценить, и обсудить) каждую книгу по отдельности.

Читать дальше →
Total votes 158: ↑148 and ↓10+138
Comments476

Активация Windows

Reading time8 min
Views50K
Винда релизится только раз в году, а убунта два раза. 2:1 — пингвин выйграл.

image

Близится час Х, в связи с чем решил посмотреть, что предлагают нам пираты для решения проблем с операционной системой.
Читать дальше →
Total votes 170: ↑114 and ↓56+58
Comments77

Аналог ip unnumbered в Linux системах или экономим IP адреса

Reading time4 min
Views18K
Не так давно я столкнулся с проблемой аналога ip unnumbered на Linux, которая с легкостью реализовывается на оборудование Cisco.
При использование такого вида маршрутизации, не придется делить сеть глобально маршрутизируемых ip адресов на небольшие с маской /30 или /31. Достаточно присвоить, например, интерфейсу loopback сеть класса C ( /24 ), а клиентским интерфейсам указать на то, что вся обработка IP пакетов будет осуществляется с адресом присвоенным loopback interface. Тем самым вы получаете рациональное использование IP адресов.
Рассмотрим теперь выше сказанное на практике.

Читать дальше →
Total votes 13: ↑13 and ↓0+13
Comments13
1
23 ...

Information

Rating
5,439-th
Location
Москва и Московская обл., Северная Корея
Registered
Activity