Articles / Bookmarks / Profile of kdenisk / Habr

Денис Кулагин @kdenisk

Компьютерная лингвистика

ProfileArticles12PostsNewsComments163

Mumlum Nov 15 2019 at 12:13

Как выучить иностранный язык

10 min

115K

Learning languages

Я расскажу о том, как изучать иностранный язык и буду это делать на примере личного опыта изучения английского языка. Английский я начал учить в 36 лет, а уже сейчас у меня свободный английский язык (как письменный, так и устный), подтверждённый официальными сертификатами. Чтобы не быть голословным: у меня есть сертификат IELTS 7.5 баллов (это С1 level) и сертификат переводчика NAATI. Короче, я знаю о чем говорю.

Оглавление:

Отступление про умных людей и прочих полиглотов
Первый шаг
Какой преподаватель нужен (уровень преподавателя)
Где искать преподавателя
Развитие навыков: слушание
Развитие навыков: чтение
Развитие навыков: письмо
Развитие навыков: разговор: произношение
Развитие навыков: разговор: языковой барьер
Словарный запас
Самое главное

Итак, вопрос: “Как выучить английский язык?”.

Читать дальше →

+87

158

LuckySB Apr 15 2015 at 13:54

Systemd за пять минут

4 min

684K

Слёрм corporate blog

Наша компания занимается администрированием веб-серверов на базе CentOS. Довольно часто наши клиенты используют веб-приложения на базе python, ruby или java. Для автозапуска подобных приложений есть готовые шаблоны для написания стартап-скриптов. Но прогресс не стоит на месте, вышел уже второй релиз CentOS 7 и, следуя старой традиции «не ставить dot-zero релизы на продакшен», мы начинаем предлагать клиентам сервера на базе CentOS 7.1 (1503).

В CentOS7, так же как и в его родителе RHEL7, используется systemd — менеджер системы и служб для Linux, совместимый со скриптами инициализации SysV и LSB. systemd обеспечивает возможности агрессивной параллелизации и много всего прочего.

Огромный монстр с множеством возможностей, гибкими настройками и мегабайтами документации…

Но что делать, если стоит задача быстро-быстро, вот прямо вчера, сделать автозапуск некоего сервиса?
Давайте выжмем из документации минимально необходимый набор информации для создания простых старт-стоп скриптов.

Знакомство с systemd

+62

Erwinmal Sep 4 2021 at 10:00

Пять лучших киберпанк-аниме

7 min

95K

RUVDS.com corporate blogReading roomPopular scienceScience fictionCyberpunk

Очень скоро киберпанк как жанр отметит своё сорокалетие. Почему он появился именно в США начала 80-х, и почему при этом с первых дней стал настолько «японским» – мы уже говорили . Как он породил целую группу жанров, и сам понемногу из актуальных размышлений о будущем стал формой ретрофутуризма – тоже.

И всё же в обоих этих статьях огромный массив японского киберпанка лишь упоминался. А ведь он во многих отношениях даже больше и значимее, чем на родине жанра, в США. Киберпанк не просто так получил массу японских черт ещё у американских авторов. Сами японцы уже в 80-е буквально влюбились в новый жанр, и принялись в нём активно работать. Однако если киберпанк в США – это преимущественно фильмы и книги, то в стране Восходящего Солнца его основными воплощениями стали манга и аниме, комиксы и мультипликация с японской спецификой.

За сорок прошедших с начала 80-х лет японцы сделали десятки, если не сотни, аниме-произведений в жанре киберпанка. И некоторые из них прочно вошли в золотой фонд жанра. Списков топ-10 и так далее в сети хватает – но многие из них крайне поверхностны, кратки и написаны «для галочки» без особого вникания в предмет.

Так что почему бы не попробовать сделать свой вариант, копнув чуть глубже?

+73

126

Zelenyikot Sep 27 2021 at 09:00

Арракис, который мы заслужили

4 min

51K

RUVDS.com corporate blogPopular scienceScience fictionAstronauticsThe future is here

Во вселенной писателя-фантаста Фрэнка Герберта, Дюна, она же Арракис — это пустынная и маловодная планета с двумя лунами. По сюжету, она находится за пределами Солнечной системы, но если мы захотим поискать ближайшую схожую параллель, то больше всего подходит планета Марс. Предлагаю воспользоваться возможностями, которые даёт современная космонавтика, и совершить воображаемую прогулку на нашу Дюну.

Читать дальше →

+214

249

Arnak Jul 12 2021 at 14:29

Выгорание, поставленное на поток. Как в Китае работает система «Третий глаз», и почему программисты из-за нее умирают

7 min

178K

getmatch corporate blogIT-companiesThe future is hereHealthPersonnel Management*

Translation

В крупнейших китайских IT-компаниях действует система наблюдения под названием Ди Сан Цзи Янь, «Третий глаз». Она получает данные из камер в офисах и из ноутбуков каждого человека, чтобы определить, кто стоит повышения, а кого нужно уволить. «Третий глаз» позволяет отслеживать экраны программистов в режиме реального времени, записывать их чаты, их активность в браузере и каждое редактирование документа. Часть компаний устанавливают систему даже в туалетах.

Программа автоматически отмечает «подозрительное поведение», такое как посещение сайтов поиска работы или платформ с потоковым видео. Отчеты генерируются еженедельно, суммируя время, потраченное на «непрофильные» веб-сайты и приложения. Даже если вы посещали их в свое обеденное время или сидя в уборной.

Дальше это может убрать у вас перспективы карьерного роста и повышения зарплаты. Выводы системы также используются в качестве доказательства, когда компания хочет уволить определенных людей. Главное, за чем следит система — чтобы вы не проводили ни минуты рабочего времени за «лишними активностями». Некоторые программисты из-за неё уже совершили суицид, другие — умерли от измождения.

Читать дальше →

+135

542

kitaisky Jul 10 2021 at 09:09

BERT для классификации русскоязычных текстов

6 min

32K

Machine learning*Natural Language Processing*

From sandbox

Файнтюнинг русскоязычного BERT для задачи классификации. Туториал для быстрого старта без лишних подробностей.

+10

NikolayZolotarev Jul 24 2020 at 05:51

Проблемы научных публикаций

16 min

46K

Professional literature*Popular science

Technotext 2020

Для людей, не знакомых близко с научным процессом, может быть не очень понятна важность научных статей. Публикация — это не только распространение информации, но и верификация результатов исследований, а еще самая главная мера эффективности научной работы.

Важность публикаций для ученых описывается выражением «Publish or perish» — «Публикуйся или сдохни». Именно всевозможные библиометрические показатели являются основой для получения грантов, подъема по карьерной лестнице и, в конечном итоге, научного успеха. И поэтому проблемы научных публикаций негативно влияют на всю науку в целом.

Читать дальше →

+118

309

itsoft Oct 26 2020 at 08:28

Хороший договор — короткий договор

8 min

29K

ITSOFT corporate blogStart-up developmentLegislation in ITFinance in ITIT-companies

Статья про одностраничный устав получила хороший отклик. Поэтому решил рассказать ещё и о коротком договоре. В одну страницу договор не уместился, к сожалению, но 3 страницы тоже хороший результат и может кто-то сможет ещё уменьшить. Данной статьёй хотелось бы призвать всех уважать клиента и писать короткие и понятные договора.

Большинство договоров пишут юристы, а руководители, продажники и клиенты, похоже их не читают. Да их и невозможно прочесть. Много ли людей читают договор с банком или лицензионное соглашение?! Или договор с оператором сотовой связи или провайдером?! Скучное и бесполезное занятие. Всё равно на текст договора чаще всего никак не повлиять в крупных компаниях.

Юристы зачем-то пишут скучнейшим и малопонятным языком, копируют в договор тексты законов. Вероятно их цель, чтобы читатель заснул и не переварил написанного. Или им платят за 1000 знаков, а не за смысл. В тоже время многие российские законы написаны вполне человеческим и понятным языком и имеют хорошие нормы права по умолчанию.

Предлагать клиентам подписать договор, который бы не хотел подписывать сам — хамство.

У нас был договор написанный простым и понятным языком. Но жизнь не стоит на месте и коллеги сказали, что нужен новый договор. И что нужно обязательно обратиться к юристу, чтобы всё профессионально было. Обратились. Получили скучнейшую простыню как у всех. Читать невозможно.

+48

174

Loiqig Jul 2 2020 at 07:50

Базовые принципы полисеров и шейперов

11 min

29K

Network technologies*

Tutorial

Одними из инструментов обеспечения качества обслуживания в сетях передачи данных являются механизмы полисинга и шейпинга и, может быть, это самые часто используемые инструменты. Ваш Интернет провайдер, наверняка, ограничил вам скорость именно этим.

Тема качества обслуживания не самая простая для понимания, а если вы когда-нибудь интересовались именно полисерами и шейперами, то скорее всего встречали однотипные графики, отображающие зависимость скорости от времени, слышали термины «корзина», «токены» и «burst», может быть даже видели формулы для расчёта каких-то параметров. Хороший и типичный пример есть в СДСМ — глава про QoS и ограничение скорости.

В этой статье попробуем зайти чуть с другой стороны, опираясь на учебник Cisco, RFC 2697 и RFC 2698 — самые базовые понятия.

Читать дальше →

Shubinpavel Dec 14 2016 at 04:01

С Земли на Луну. История и математика. Часть 1

8 min

21K

AstronauticsPopular scienceAstronomy

Если уходить в историю изучения траекторий полета с Земли на Луну, то необходимо вернуться на полтора века назад, в 1865 год, когда был опубликован новый роман Жюля Верна «С Земли на Луну прямым путём за 97 часов 20 минут». Конечно, это была далеко не первая книга, в которой описывался подобный перелет, но это был первый роман, в котором автор решил подойти к описанию путешествия с научных позиций.

Читать дальше →

+32

SaniaA3 Jan 9 2021 at 21:39

Проклятье Циолковского и благодать Оберта

15 min

35K

AstronomyAstronauticsPopular sciencePhysics

Здравствуйте, уважаемые читатели Хабра.

Продолжаем изучать орбитальную механику на пальце и двух энергиях. В этой статье вы узнаете о формуле Циолковского, эффекте Оберта, чем энергия отличается от импульса, как работают ракеты и всё это на максимально простых примерах с крепкой 90 градусной геометрией.

Эффект Оберта

Начнем пожалуй с Эффекта Оберта, хотя это крайне сложный эффект, но зато разобравшись с ним — мы поймем всю орбитальную физику. Для начала давайте зададимся вопросом — В чем сила, брат? — В лошадиных силах!

Сколько лошадиных сил у ракетного двигателя?

Ответ странный — по разному, один и тот же килограмм топлива в одном и том же двигателе дает разное количество энергии. Причина в разной скорости на которой используется это топливо, чем больше скорость самой ракеты — тем больше энергии дает двигатель, причем этот же двигатель ускоряющий вбок (относительно текущей скорости) — будет давать меньше энергии, чем при ускорении вперед.

Давайте сразу рассмотрим 2 хороших и наглядных примера. Один из Ютуба от гаражного учёного Игоря Белецкого продемонстрировавшего эффект Оберта с помощью шприца, резинки и кое чего еще, а второй пример из Википедии.

Читать дальше →

+124

aphex34 Nov 12 2020 at 07:37

Обучение модели естественного языка с BERT и Tensorflow

9 min

36K

SberDevices corporate blogMachine learning*Natural Language Processing*

Рис. 1. Фразы и предложения в векторном представлении модели естественного языка

Обработка естественного языка (Natural Language Processing, NLP) – это область вычислительной лингвистики, ориентированная на разработку машин, способных понимать человеческие языки. Разработка таких машин – одна из задач, которые решают исследователи и инженеры в команде SberDevices.

В современной компьютерной лингвистике понимание смысла написанного или сказанного достигается с помощью векторных моделей естественного языка. Например, в семействе виртуальных ассистентов Салют такая модель применяется для распознавания намерений пользователя, ведения диалога, выделения именованных сущностей и многих других задач.

В этой статье мы рассмотрим метод обучения модели естественного языка (NLU) на размеченных данных и реализацию этого метода на python3 и tensorflow 1.15. Ниже вы найдете пошаговое руководство и примеры кода. Код всего эксперимента доступен для воспроизведения на Colab.

Помимо этого, мы выкладываем в публичный доступ русскую модель NLU класса BERT-large [427 млн. параметров]: tensorflow, pytorch.

Прочитав этот пост, вы узнаете:

что такое модели NLU и как они применяются в компьютерной лингвистике;
что такое векторы предложений и как их получить;
как обучить векторизатор предложений [NLU] на базе архитектуры BERT;
как можно использовать обученные модели NLU

+18

Altius2010 Nov 5 2020 at 21:23

За что получает деньги наемный работник? Не понимаете? Сейчас поймете

4 min

152K

Personnel Management*

From sandbox

«За что я плачу тебе деньги?» — обычный вопрос работодателя работнику, причем саркастический, как правило.

«За что я тут корячусь на тебя?» — столь же обычный вопрос работника к работодателю.
Разобраться, за что же действительно работодатель платит деньги наемному работнику, поможет моя собственная теория, закодированная в десять букв – «ПЗП – ПЗС – ПЗПИ»

Читать дальше →

+225

888

annakanunikova Sep 27 2018 at 10:12

Информационная архитектура в Интернете часть 1

9 min

18K

Usability*Interfaces*Professional literature*Reading room

Очень часто вижу вопросы от начинающих проектировщиков, похожих один на другой: «Посоветуйте что прочитать…».

Часто в ответ кидают А. Купера «Об интерфейсе. Основы проектирования взаимодействия», Д. Раскина «Интерфейс: новые направления в проектировании компьютерных систем», С. Круга «Не заставляйте меня думать», Д. Нормана «Дизайн привычных вещей». Это основа, все понятно.

Реже видела упоминания о такой замечательной книге, как «Информационная архитектура в Интернете» (авторы П.Морвиль и Л.Розенфельд).

Так как начинать всегда тяжело, а информации много, решила выложить конспект книги.
Книга большая, в одну статью все не поместилось. В итоге получился цикл из 4 статей, в которых постаралась оставить все самое интересное и нужное.

Конечно, опытным проектировщикам все это известно, а вот начинающим, думаю, пригодится.
Первая часть посвящена определению информационной архитектуре и тому, как люди ищут информацию. Поехали!

P.S.: Чтобы пополнять Хабр интересной информацией, в конце статьи прикрутила опрос: будет ли интересно читать весь цикл статей или на первой можно и остановиться.

Читать дальше →

AlexanderByndyu Jun 1 2016 at 12:18

Кнопочное мышление против целостного IT-продукта

10 min

54K

Agile*Product Management*Project management*Development Management*

Эта статья — выражение моей личной боли. Кнопочные решения портят мне жизнь, я трачу время на споры и обоснования.

Когда мы общаемся с коллегами, заказчиками или пользователями, я использую фразу «кнопочное мышление». Что я имею ввиду под этим термином? Текущая статья — развернутый ответ на этот вопрос.

Синонимами кнопочного мышления я считаю «экранное мышление» или преждевременную концептуализацию. Я раскрою мышление кнопками на десятке примеров из практики. А здесь для начала история, которая наверняка случалась с каждым. Представьте к вам приходят и рассказывают о падении конверсии на сайте. А вы ему сразу: «Давайте кнопку покупки сделаем побольше и поярче!». Что произошло? В бизнесе возникла проблема. Вместо погружения в детали, вместо исследования причин, вы играете с размерами кнопки. Вот в таких случаях я говорю о кнопочном мышлении.

Для тех, кто любит смотреть, а не читать, есть видео и слайды.

Читать дальше →

+23

dopler Sep 4 2020 at 06:55

Как growth hacking помогает взлетать стартапам за несколько месяцев?

10 min

18K

ProductStar corporate blogProduct Management*Growth Hacking*

Recovery Mode

Мы регулярно слышим истории о том, как, например, какой-то компании удалось получить 100 тысяч новых пользователей за месяц. Возникают мысли, что ребятам повезло или они придумали инновационный продукт. Но в большинстве случае причиной стремительного роста становится применение стратегии growth hacking, о которой подробно поговорим в этой статье.

Gradiens Sep 3 2020 at 09:23

Германия, или Туда и Обратно — 1

14 min

68K

IT careerIT-emigration

Почти два года назад, под Новый год, у меня зазвонил телефон.

После пары дежурных фраз «как сам, как дети» меня позвали работать в Германию.

Я крепко призадумался.

С одной стороны, никогда не рассматривал работу за рубежом как что-то реальное. С другой — приглашение было от старых боевых товарищей. Слова «фирма компенсирует расходы», «приезжай, будем разработку налаживать, немцев нанимать» долго вертелись в голове и не давали покоя.

Итак, под бой курантов мы с супругой приняли решение: «Ехать!»

Кто хочет прочитать про мой увлекательный, но весьма субъективный опыт переезда в Германию — добро пожаловать под кат.

Читать дальше →

+145

728

iefedorov Sep 23 2019 at 07:09

Разгоняем Google PageSpeed до 100 и больше

6 min

61K

HTML*Web analytics*Client optimization*Search engine optimization*Website development*

Простые и полезные советы, которые позволят вам максимально разогнать сайт без необходимости закапываться в метриках Google PageSpeed и Lighthouse.

Читать дальше →

+13

alconost Dec 26 2019 at 12:32

Пять привычек, которые помогут сохранить эффективность работы мозга

5 min

54K

Alconost corporate blogPopular scienceBrainLifehacks for geeksHealth

Translation

Тренируйте мозг, изменяйте нейронные связи

Наш мозг на удивление динамичен и постоянно меняется. Он умеет приспосабливаться, лечиться, обновляться и изменять нейронные связи.

Наши ежедневные действия (и бездействие) буквально меняют мозг в лучшую (или худшую) сторону. Но еще не поздно омолодить, переделать и изменить мозг так, чтобы оставаться в лучшей форме.

Эксперименты по нейропластичности (это способность мозга изменяться в ответ на получаемый опыт) показали, что мозг умеет меняться — изменяя свою структуру, биохимию, увеличиваясь и уменьшаясь в размерах.

Можно ли физически изменить мозг — в любом возрасте? Да, но в определенных пределах. И начать можно с того, о чем я сейчас расскажу.

Переведено в Alconost

Читать дальше →

+27

bak Jan 24 2018 at 16:09

Исправляем опечатки с учётом контекста

10 min

27K

Data Mining*Algorithms*Machine learning*Programming*

Недавно мне понадобилась библиотека для исправления опечаток. Большинство открытых спелл-чекеров (к примеру hunspell) не учитывают контекст, а без него сложно получить хорошую точность. Я взял за основу спеллчекер Питера Норвига, прикрутил к нему языковую модель (на базе N-грамм), ускорил его (используя подход SymSpell), поборол сильное потребление памяти (через bloom filter и perfect hash) а затем оформил всё это в виде библиотеки на C++ со swig биндингами для других языков.

Читать дальше →

+19

2 3 ...

6 7