Pull to refresh
0
0
Send message

Сам себе Гутенберг. Делаем параллельные книги

Reading time12 min
Views23K

Lingtrain parallel books


Upd. 04.12.2021 — Наш телеграм канал


Если вам нравится изучать языки (или вы их преподаете), то вы наверняка сталкивались с таким способом освоения языка как параллельное чтение. Он помогает погрузиться в контекст, увеличивает лексикон и позволяет получить удовольствие от обучения. Читать тексты в оригинале параллельно с русскоязычными, на мой взгляд, стоит, когда уже освоены азы грамматики и фонетики, так что учебники и преподавателей никто не отменял. Но когда дело все же доходит до чтения, то хочется подобрать что-то по своему вкусу, либо что-то уже знакомое или любимое, а это часто невозможно, потому что такого варианта параллельной книги никто не выпускал. А если вы учите не английский язык, а условный японский или венгерский, то трудно найти вообще хоть какой-то интересный материал с параллельным переводом.


Сегодня мы сделаем решительный шаг в сторону исправления этой ситуации.


Из чего делаем


На входе у нас будут два текстовых файла с оригинальным текстом и его переводом. Для примера возьмем книгу "Убить пересмешника" Харпер Ли на русском и английском языках.


Начало документов выглядит так (отрывки приведены в таком виде, в котором они были найдены в сети):

Выровнять пересмешника
Total votes 106: ↑106 and ↓0+106
Comments67

Госзакупки: баланс между итальянской забастовкой и русской уголовкой

Reading time11 min
Views42K
Прочитал я на днях статью ЕЭТП о госзакупках, и даже поучаствовал в комментариях.

Хочу рассказать о своем видении данного процесса. Меньше теории, больше практики. Практики будет больше со стороны поставщика, в роли которого мне приходилось выступать, но не только. Мнение закупщиков также будет упомянуто.

В статье будут рассмотрены основные этапы процесса госзакупки, указаны способы, которыми участники вынуждены пользоваться для их обхода. Данная статья не является пошаговой инструкцией. От читателя ожидается знание основных понятий и некоторый опыт в госзакупках по 44-ФЗ и 223-ФЗ.
Читать дальше →
Total votes 125: ↑121 and ↓4+117
Comments320

Разбираемся с артиклями: базовые правила

Reading time4 min
Views35K
Артикли в английском языке – одна из самых сложных тем. Если при изучении слов мы можем опираться на мнемотехнику, схожее звучание или даже написание слов, то в случае с артиклями нам деваться некуда: в русском языке их попросту нет. Так что придется изучать правила. Их довольно много, и лучше поделить их на категории базовых и продвинутых. В этой шпаргалке рассмотрим базовые правила.

image
Читать дальше →
Total votes 25: ↑24 and ↓1+23
Comments41

Разбираемся с артиклями: продвинутый уровень

Reading time4 min
Views41K
Если вы уже освоили базовые правила и уверенно применяете их в речи и письме, то пришло время узнать некоторые тонкости, которые обычно рассматриваются на высоких уровнях. Мы приготовили для вас еще одну шпаргалку, которая поможет выучить оставшиеся правила расстановки артиклей раз и навсегда.

image
Читать дальше →
Total votes 21: ↑19 and ↓2+17
Comments15

Как освоить иностранный язык без преподавателя. Часть 1. «Мой опыт»

Reading time6 min
Views40K

Примечание: статья в целом актуальна для любого европейского языка, в том числе для английского.


В феврале прошлого года нахлынуло на меня желание изучить испанский. Ну как-бы интерес был и раньше, нравится мне латино-музыка и сам язык. Но то времени не хватало, то чем-то другим занят был… Короче, время наконец-то нашлось и решил я, что надо воспользоваться им по максимуму, чтобы с нулевого уровня научиться хотя бы понимать песни на слух и более-менее разговаривать.


таблица-вертушка неправильных глаголов


Курсы я отмёл сразу, т.к. в принципе не верю в такую модель обучения. Она создаёт приятную иллюзию того, что тебя обучают, а тебе только надо 2 раза в неделю приходить на занятие и иногда не забывать делать домашку. Такое своеобразное перекладывание ответственности. Всё это мы и в школе проходили, даже в более интенсивном формате. Но растягивать это дело на долгие годы, чтобы получить сомнительный результат, мне совершенно не хотелось...

Читать дальше →
Total votes 22: ↑19 and ↓3+16
Comments79

Как освоить иностранный язык без преподавателя. Часть 2. «Пошаговая стратегия»

Reading time12 min
Views70K

Languages are not taught, they are learnt!


Это статья для тех, кто хочет свободно разговаривать на иностранном языке. Неважно, начинаете вы с нуля или уже учите язык годами, но до сих пор испытываете сложности с восприятием беглой речи на слух или стресс при необходимости поговорить с носителем языка, здесь вы найдёте пошаговую стратегию освоения разговорного языка.


Примечание: Материалы статьи опираются на исследования Е.Д. Авериной, Д.Б. Никуличевой, Э.В. Гуннемарка и П.Нейшна, пропущенные через призму моего восприятия и опыт изучения 3 иностранных языков.

Читать дальше →
Total votes 46: ↑44 and ↓2+42
Comments65

Наушники на работе: что говорят исследования

Reading time6 min
Views36K
Все мы прекрасно понимаем, как работают наушники. Однако их эффект на рабочий процесс разительно отличается в зависимости от условий и «контекста» использования.

Читать дальше →
Total votes 22: ↑19 and ↓3+16
Comments52

Музыка для эффективной работы: что нужно знать

Reading time5 min
Views33K
Музыка регулирует сложные когнитивные и сенсомоторные реакции и может влиять на наше мышление, познание (включая внимание и память), речь и управление болью. Доцент кафедры музыкального образования и терапии Университета Майами Тереза Лесюк считает, что прослушивание музыки «активирует центр удовольствия, стимулирует путь через лимбическую систему до орбитофронтальной коры, которая отвечает за мышление».

Большинство исследователей сходится во мнении, что музыка меняет настроение и содействует физиологическому здоровью, однако научное изучение влияния музыки на нашу продуктивность находится на этапе развития. Например, учёные до сих пор не пришли к единому мнению, все ли музыкальные жанры и типы звуков помогают сосредоточиться на работе. В сегодняшнем материале поговорим об этом, а также о том, как и какую музыку полезно слушать в рабочее время.

Читать дальше →
Total votes 19: ↑17 and ↓2+15
Comments20

Как заработать свои первые 100$ в Google Play Market — мой опыт

Reading time4 min
Views224K
В этой статье я расскажу, как мне удалось заработать первые 100$ на моих приложениях в Google Play Market. Какие стратегии более успешные и на что стоит обратить внимание новичку.
Читать дальше →
Total votes 40: ↑34 and ↓6+28
Comments52

Чего боятся программисты?

Reading time10 min
Views58K
У программистов, как и у всех людей, есть фобии. Кто-то боится маньяков, кто-то — утки, которая следит за человеком, кто-то впадает в панику при нарушении привычного распорядка дня, кого-то начинает штырить от внезапно пропавшей связи в смартфоне.

Все это, если можно так сказать, общечеловеческие фобии, присущие целым поколениям, странам и континентам. Но есть и чисто профессиональные фобии, которые вряд ли будут понятны представителям других профессий.

Фобии — это зло, как в жизни, так и в работе. Потому что предмет страха — выдуманный, а сам страх — настоящий. И последствия страхов вполне реальные.

В этой статье — истории реальных программистов и их профессиональных фобий, которые мешали им жить и работать в свое удовольствие. Люди реальные, имена вымышленные.
Читать дальше →
Total votes 99: ↑83 and ↓16+67
Comments154

Люди не хотят чего-то действительно нового — они хотят привычное, но сделанное иначе

Reading time4 min
Views16K

От переводчика: это довольно старая статья 2015 года, однако, на мой скромный вкус, она по-прежнему актуальна, как и многие другие материалы от Нира Эяля.
Если ваш новый продукт или сервис не набирает популярность, спросите себя: как найти мой ролл «Калифорния»?
Должен признать, что бенто-ланч едва ли является источником серьёзных бизнес-уроков. Однако, давайте взглянем на ролл «Калифорния» — понимание влияния этого знакового блюда японской кухни может помочь привести ваш продукт к успеху и избежать провала.
Читать дальше →
Total votes 40: ↑37 and ↓3+34
Comments40

Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке

Reading time12 min
Views86K
В 2020 году библиотека Natasha значительно обновилась, на Хабре опубликована статья про актуальную версию. Чтобы использовать инструменты, описанные в этом тексте, установите старую версию библиотеки pip install natasha<1 yargy<0.13.

Раздел про Yargy-парсер актуален и сейчас.


Есть стандартная задача извлечения именованных сущностей из текста (NER). На входе текст, на выходе структурированные, нормализованные объекты, например, с именами, адресами, датами:



Задача старая и хорошо изученная, для английского языка существует масса коммерческих и открытых решений: Spacy, Stanford NER, OpenNLP, NLTK, MITIE, Google Natural Language API, ParallelDots, Aylien, Rosette, TextRazor. Для русского тоже есть хорошие решения, но они в основном закрытые: DaData, Pullenti, Abbyy Infoextractor, Dictum, Eureka, Promt, RCO, AOT, Ahunter. Из открытого мне известен только Томита-парсер и свежий Deepmipt NER.

Я занимаюсь анализом данных, задача обработки текстов одна из самых частых. На практике оказывается, что, например, извлечь имена из русского текста совсем непросто. Есть готовое решение в Томита-парсере, но там неудобная интеграция с Python. Недавно появилось решение от ребят из iPavlov, но там имена не приводятся к нормальной форме. Для извлечения, например, адресов («ул. 8 Марта, д.4», «Ленинский проезд, 15») открытых решений мне не известно, есть pypostal, но он чтобы парсить адреса, а не искать их в тексте. C нестандартными задачами типа извлечения ссылок на нормативные акты («ст. 11 ГК РФ», «п. 1 ст. 6 Закона № 122-ФЗ») вообще непонятно, что делать.

Год назад Дима Веселов начал проект Natasha. С тех пор код был значительно доработан. Natasha была использована в нескольких крупных проектах. Сейчас мы готовы рассказать о ней пользователям Хабра.
Natasha — это аналог Томита-парсера для Python (Yargy-парсер) плюс набор готовых правил для извлечения имён, адресов, дат, сумм денег и других сущностей.
В статье показано, как использовать готовые правила из Natasha и, самое главное, как добавлять свои с помощью Yargy-парсера.
Читать дальше →
Total votes 87: ↑86 and ↓1+85
Comments33

15 когнитивных искажений

Reading time9 min
Views182K
Люди сталкиваются с большим объёмом информации, часть из которой достоверна, а часть освещает интересующую область односторонне, а иногда и сознательно искажённо.

Эта статья о том, как отличать достоверную информацию от искажённой, и о том, как правильно подавать информацию, чтобы убедить других людей.



Начнём с того, что люди не всегда мыслят рационально. Это данность, которая обусловлена принципами работы нашего интеллекта, выработанными в процессе эволюции. Условно, представим разум, разделённый на две Системы. Устройство разума не так однозначно, но описанное упрощение позволит понять причины искажений. Первая система генерирует решения и гипотезы быстро «если коснёмся горячего предмета, то отдёрнем руку». Вторая, принимает решения путём логических рассуждений. Первая Система генерирует гипотезы, а вторая принимает их или отвергает. Такой способ мышления медленный и энергозатратный. Логическое рассуждение используется людьми реже и требует больших усилий. Это причина большинства когнитивных искажений.

Так, галочка «по умолчанию согласен» позволила увеличить количество согласных на донорство до 86% в Швеции, тогда как в Дании, где при получении прав нужно самостоятельно ставить согласие, т. е. принимать осознанный выбор, количество согласных на донорство 4%.
Читать дальше →
Total votes 63: ↑62 and ↓1+61
Comments114

Как работает поиск приложений в Google Play. Конспект

Reading time8 min
Views47K
В статье рассмотрены некоторые особенности работы поиска приложений в магазине Google Play.

Компания Google редко публично обсуждает свои поисковые технологии, но в 2013 году на конференции Google I/O 2013 рассказала, что влияет на ранжирование приложений в магазине Google Play.

Наша команда сделала конспект этого выступления со своими комментариями и примерами из практики. Видео на английском по ссылке, cправочное руководство Управление данными для Google Play.
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments8

10 главных секретов продуктивности Илона Маска

Reading time13 min
Views93K


Этим летом я прочитал книгу Илона Маска Tesla, SpaceX, and the Quest for a Fantastic Future. Замечательное чтиво и подробный рассказа о взлётах и падениях одного из крупнейших визионеров нашего времени. Также книга позволила ознакомиться с рабочей этикой Маска и секретами продуктивности, которыми он пользуется для управления несколькими компаниями.
Читать дальше →
Total votes 71: ↑42 and ↓29+13
Comments27

Как уничтожить Интернет?

Reading time9 min
Views40K
Помните угрозу анонима уничтожить Интернет? Где хакер грозился «положить» 13 корневых DNS серверов сети Интернет и сделать получение информации, посредством запроса с использованием доменного имени, невозможным? В результате чего любой, кто введёт «http://www.google.com» или какой-либо другой URL-адрес, получит страницу с ошибкой, что заставило бы большинство пользователей думать, что Интернет не работает.



В представлении современного человека, слабо связанного с IT, Интернет — это Wi-Fi, и мало кто задумывается, что большая часть сети Интернет расположена под водой и вообще о том, насколько огромное количество данных передаётся по этой подводной сети магистральных каналов, которая хоть и избыточна, но довольно-таки уязвима и может быть в один прекрасный момент уничтожена физически. Для лучшего понимания проблемы рекомендую к прочтению статью: Сообщения в глубине: удивительная история подводного Интернета. В этой же статье мы рассмотрим вероятные точки отказа, несмотря на то, что Интернет-сеть децентрализована и принято считать, что отключить её полностью невозможно и предположим ситуацию, при которой сеть перестанет функционировать полностью.
Total votes 44: ↑35 and ↓9+26
Comments52

Каждую пятницу я в… Пик Балмера — есть ли за ним правда?

Reading time8 min
Views89K
Многим известна шуточная зависимость между способностью к программированию и количеством выпитого. Согласно теории, существует определённая доза, открывающая сверхчеловеческие способности к кодингу (согласно эмпирическим данным — около 2 бутылок пива). Однако задавались ли Вы вопросом, какова доля шутки в этой шутке? Немного алкотеории и алкопрактики с блекджеком и шл... цифрами и графиками на дне стакана под катом.

Испить до дна
Total votes 46: ↑39 and ↓7+32
Comments32

Великолепные придурки в разработке

Reading time14 min
Views59K


Многие из нас работали с ними — с разработчиками-придурками, которые великолепно делают свою работу, но обращаются с другими, как с мусором. Под катом парочка примечательных историй и целая поляна для обсуждений.
Читать дальше →
Total votes 89: ↑57 and ↓32+25
Comments91

Приватность: рождение и смерть. 3000 лет истории приватности в картинках

Reading time16 min
Views36K


В эпоху ИТ и быстрого развития технологий понятие «приватности» превратилось в фикцию. Глобальные информационные сети и множество сервисов незаметно собирают о пользователях терабайты данных, да и сами пользователи постоянно выкладывают свою жизнь на всеобщее обозрение в соцсетях. Но всё же многие из нас считают свои компьютеры, смартфоны и поведение в сети «приватными», или хотя бы стремятся к этому. А как вообще появилось понятие «приватности» в человеческой культуре?
Total votes 50: ↑46 and ↓4+42
Comments53

Датчанин, распространявший инструкции для пользователей Popcorn Time, пошел под суд

Reading time3 min
Views25K


Мужчина из Дании был присужден к полугоду домашнего ареста. Его вина заключается в распространении информации о Popcorn Time — программе, агрегирующей данные с сотен торрент-трекеров. Пользователи могут найти в системе практически любой фильм, выложенный на торрентах из базы, и сразу его просмотреть. Интерфейс программы максимально дружелюбный — никаких проблем не возникает даже у детей.

С момента возникновения оригинального сервиса появилось сразу несколько клонов. Проблема в том, что на авторов оригинала нашли управу правообладатели, и те предпочли прекратить разработку чего бы то ни было, связанного с Popcorn Time. Тем не менее, их работу продолжили многочисленные последователи, благодаря которым сервис и программа живут до сих пор.
Читать дальше →
Total votes 27: ↑27 and ↓0+27
Comments93

Information

Rating
Does not participate
Registered
Activity