Pull to refresh
0
0
Send message

Краткий обзор техник векторизации в NLP

Level of difficultyEasy
Reading time21 min
Views15K

Как переводчик-редактор, я интересуюсь темой NLP и автоматизации рутины бюро переводов. Изучая вопрос того, как смысл слов превращается в векторы, наткнулся на эту обзорную статью. Статья мне показалась изложенной доступно, поэтому я перевел ее для удобства других коллег. Работоспособность большей части кода проверял, вроде работает (см. Jupiter Notebook). Надеюсь, будет полезно.

===

Технологии NLP — Natural Language Processing, обработки естественного языка — позволяют компьютерам обрабатывать человеческий язык, понимать его значение и контекст, а также связанные с ним эмоциональную окраску и намерения, и далее, использовать эти данные для создания чего-то нового.

Как сделать слова понятными для компьютеров? Используется векторизация. Рассмотрим несколько техник такой векторизации.

Читать далее
Total votes 15: ↑15 and ↓0+15
Comments1

Управление вентиляцией: собираем, интегрируем, экономим

Reading time11 min
Views23K

Современный дом не может существовать без вентиляции. Только система вентиляции обеспечивает нам требуемое качество воздуха, и, как следствие, здоровье, бодрость и долгие годы жизни. А умный дом не может существовать без механической системы приточно–вытяжной вентиляции, поскольку с естественной (т. е. не регулируемой) вентиляцией требуемого комфорта и энергоэффективности не добиться.

А такой системой надо умно управлять. Об этом сегодня и поговорим.

Читать далее
Total votes 27: ↑27 and ↓0+27
Comments138

Управление вентиляцией. Электронагрев воздуха. Эссе про технику и деньги

Reading time10 min
Views14K

Продолжаем тему управления вентиляцией. В прошлой статье я рассмотрел водяной нагрев воздуха. Судя по комментариям, многие не хотят связываться с водяным нагревом: сложно, вода может замерзнуть, с антифризом возня… Ну что же, давайте сегодня обсудим альтернативный вариант — электронагрев. Определим нужную для этого мощность, рассмотрим варианты управления, подберем оборудование для автоматизации. И даже посчитаем, сколько будем платить за электричество.

Поехали
Total votes 29: ↑29 and ↓0+29
Comments49

Система увлажнения воздуха для дома или квартиры

Reading time5 min
Views39K

По многочисленным просьбам делюсь своим способом сделать недорогую стационарную высоконапорную систему увлажнения воздуха. Ниже будет описана конкретная система, работающая в моей квартире с 2016 года, с фотографиями и подробностями. Похожим образом по моей рекомендации было сделано ещё с десяток подобных систем разного масштаба.

Читать далее
Total votes 99: ↑99 and ↓0+99
Comments101

План самостоятельного обучения DDD, CQRS, EventSourcing

Reading time7 min
Views42K

Если вы собрались плотно погрузиться в тему Doman Driven Design (DDD), о том как его применять, как использовать, для чего он нужен, и как с ним связаны Command and Query Responsibility Segregation (CQRS), Event Sourcing и другие термины из мира DDD то можно воспользоваться планом обучения, который последовательно погрузит вас в эти темы и поможет сориентироваться. Часть информации на русском, часть на английском языке, так как русскоязычных аналогов я не смог найти.

Погрузиться в DDD
Total votes 32: ↑31 and ↓1+34
Comments4

Где научиться оформлению резюме под зарубежные компании?

Reading time1 min
Views5.8K

Cобрала ссылки на ресурсы Harvard, Yale, Stanford, Washington Universities по оформлению резюме под американские и международные вакансии. Подходит для удаленных вакансий, проверено на собственной шкуре.

Читать далее
Total votes 13: ↑8 and ↓5+5
Comments6

Пять книг, которые изменили мою карьеру программиста

Reading time4 min
Views86K

"Читатель проживает тысячу жизней, прежде чем умрет.. Человек, который никогда не читает, проживает только одну "

- Джордж Р.Р. Мартин.

Читать далее
Total votes 33: ↑29 and ↓4+33
Comments30

Приемы оптимизации веб-графики в 2021 году

Reading time4 min
Views11K

Привет, Хабр!

Сегодня я хотел бы рассказать о ряде практик, позволяющих оптимизировать загрузку и отрисовку изображений на сайте. Давайте рассмотрим, что мы может сделать на сегодняшний день помимо стандартных методик (компрессии и кеширования на клиенте).

Читать далее
Total votes 46: ↑45 and ↓1+51
Comments24

До свидания, Google Fonts. Последний аргумент

Reading time6 min
Views80K


Шрифты Google Fonts страшно популярны. Их загружают более 42,8 миллиона сайтов, в том числе Хабр. Библиотека Google Fonts содержит 1023 свободных шрифта и программные интерфейсы для их внедрения через CSS. Очень удобно, казалось бы.

Во многих статьях отмечалось, в какую цену обходятся многочисленные запросы через API. Совет самостоятельно хостить шрифты дают много лет. Даже сама Google давала такой совет на конференции Google I/O 2018 года в выступлении на тему веб-производительности.

Так почему же многие до сих пор загружают шрифты через Google Fonts API? Ну, был последний аргумент — кэширование. Мол, благодаря общему CDN пользователю не нужно скачивать шрифт заново с каждого сайта. Однако в октябре 2020 года этот аргумент перестал работать. Теперь шрифты Google Fonts больше не кэшируются!
Читать дальше →
Total votes 76: ↑76 and ↓0+76
Comments65

Как программировать если совсем не хочется? План спасения на случай перегорания или дедлайна

Reading time8 min
Views77K


Никакой воды в этой статье, только описание конкретного плана действий в случае если вы перегорели, у вас дедлайн, прокрастинация, депрессия, а также методики и советы, помогающие привести этот план в действие.

Читать дальше →
Total votes 39: ↑35 and ↓4+40
Comments55

Как нас начали гнобить конкуренты с более слабым набором фич

Reading time11 min
Views12K
image

Нет, занимаясь разработкой CRM, я, конечно, подозревал, что важны не только фичи, но и то как мы всё это продаём. Но совершенной неожиданностью оказалось то, что всем тем, кто обращался к нам, конкурент рассылает листок со сравнением, где поливает нас грязью. Листок сделан замечательно: там есть три легко проверяемых утверждения и много с трудом проверяемых. То есть если вы не залезете «под капот» ПО, то всё это легко может показаться правдой.

Я бы хотел восстановить немного справедливости и разобрать тезисы нашего дорогого конкурента с точки зрения манипуляций, а потом дополнить их своими манипуляциями фактами до полной картины.

«Количество действующих клиентов — это показатель доверия». Да, это показатель доверия, но только не в конкурентной среде ПО. Условно, наш основной конкурент относится ко второму поколению медицинских CRM, мы к третьему. На рынок они вышли в 2017 году с большими инвестициями и переманили часть клиентов Инфодента (аж 2000 года рождения), разных версий 1С и Dental4Windows. Кто помнит, это было время очень агрессивных холодных звонков. Как это ни странно, три перечисленные платформы первого поколения вместе имеют клиентов в шесть раз больше, чем доля нашего конкурента. Соответственно, наш конкурент имеет на текущий момент (с учётом, что мы полгода как начали продавать) тоже примерно на столько же больше нас. Но довод звучит логично. Так что если вы в него верите — видимо, надо срочно делать даунгрейд до софта нулевых.

Следующей нашей ошибкой был перфекционизм. Надо было входить на рынок с сырым продуктом и доделывать его, а мы вышли со стабильным релизом.
Читать дальше →
Total votes 34: ↑20 and ↓14+12
Comments18

Создание favicon для сайта 2020

Reading time10 min
Views140K

Что такое favicon и для чего он нужен?


Favicon – это значок (иконка), который отображается во вкладке браузера, закладках, а также в сниппетах результатов поиска.

image

Favicon играет важную роль в веб-приложениях. Он может улучшить внешний вид сайта в выдаче, повышает узнаваемость вашего сайта, помогает пользователю быстро найти необходимую страницу в закладках и вкладках.

Кроме того, пользователь может добавить страницу вашего сайта на главный экран телефона или сохранить как веб-приложение. В таком случае с помощью favicon можно быстро найти сайт среди большого количества других приложений.

Какой формат использовать для favicon?


Раньше в качестве основного формата использовали ICO. Особенность данного формата – мульти-размерность. Данный файл может хранить в себе несколько размеров иконки. На смену ICO пришел формат PNG. ICO все еще поддерживаемый, но большинство современных браузеров выбирают PNG формат иконки, который легче. Некоторые браузеры не могут выбрать правильный значок в файле ICO, что приводит к неправильному использования значка с низким разрешением.

О каких платформах пойдет речь в этой статье?


  • Десктопные браузеры
  • Chrome на Android
  • Иконка закладки в iOS (PWA)
  • macOS
  • Windows

Читать дальше →
Total votes 44: ↑42 and ↓2+46
Comments30

Использование Nginx FastCGI Cache

Reading time9 min
Views27K

FastCGI Cache — это система кэширования данных реализованая на уровне HTTP-сервера Nginx.

Преимущество FastCGI Cache заключается в том, что Nginx вернёт закешированный ответ пользователю сразу, как только получит запрос, при этом слой приложения не будет вовсе обрабатывать поступивший HTTP-запрос, если он имеется в кэше Nginx. 

Использование FastCGI Cache — отличный способ снизить нагрузку на вашу систему.

Если на вашем сайте есть страницы, которые изменяются редко или задержка обновления информации на некоторое время не критична, то FastCGI Cache именно то, что нужно.

Читать далее
Total votes 8: ↑7 and ↓1+11
Comments16

Зоопарк нашей кожи: что делать с акне (прыщами)

Reading time7 min
Views51K
image
Staphylococcus epidermidis. Обычно ведёт себя мирно, но может провоцировать акне, если слишком проголодается

Наша кожа — это зоопарк. Причём открытого типа, с разными «климатическими» зонами и биомами. В программе сафари около 1000 видов различных бактерий и грибов. У здоровых людей вся эта микробиосистема живёт в гармонии и согласии, ест друг друга, остатки того что насекретировала наша кожа, и не пускает особенно злые виды, которые были бы не против съесть нашу кожу. Если экологическое равновесие нарушается, то в первую очередь возникают воспалительные очаги, которые обычно называют прыщами.

Для того чтобы этого не происходило, нужно следить за пищевыми цепочками условно-полезных видов и уничтожать условно-вредные. В этом круто помогают производные серы и азелаиновой кислоты. Сейчас расскажу, что интересного у нас получилось собрать из этих компонентов, как оно работает и при чём тут половые гормоны и загар.

Обычно на коже выделяют три основных биома: жирный, сухой и влажный. В каждом из них живёт свой набор организмов, который оптимально адаптирован к жизни в этой зоне. Например, пупок — типичная влажная зона. Нет воздействия губительного ультрафиолета, сальные железы отсутствуют, тепло и влажно. Поэтому он часто считается эталонным участком для исследований пупкового пуха микробиома человеческой кожи.
Читать дальше →
Total votes 60: ↑54 and ↓6+68
Comments36

Отображение emoji в результатах поиска

Reading time2 min
Views4.2K


Со временем в результатах поиска попадается все больше emoji и эта тенденция продолжится до тех пор пока поисковые системы не начнут их фильтровать. Присутствие заметного emoji в сниппете способно значительно повысить его CTR. Например, на моем статейном сайте средний CTR в Google вырос на 5,5% после включения emoji в title, description и микроразметку хлебных крошек.


Но, выбирая emoji для продвигаемой станицы некоторые оптимизаторы руководствуются лишь их релевантностью контенту и напрочь забывают про такой показатель как поддерживаемость.

Читать дальше →
Total votes 8: ↑6 and ↓2+14
Comments2

Лемматизируй это быстрее (PyMorphy2, PyMystem3 и немного магии)

Reading time3 min
Views41K
Я работаю программистом, и в том числе занимаюсь машинным обучением применительно к анализу текстов. При обработке естественного языка требуется предварительная подготовка документов, и одним из способов является лемматизация – приведение всех слов текста к их нормальным формам с учетом контекста.

Недавно мы столкнулись с проблемой больших временных затрат на этот процесс. В конкретной задаче было более 100000 документов, средняя длина которых около 1000 символов, и требовалось реализовать обработку на обычном локальном компьютере, а не на нашем сервере для вычислений. Решение на просторах интернета мы найти не смогли, но нашли его сами, и я хотел бы поделиться — продемонстрировать сравнительный анализ двух наиболее популярных библиотек по лемматизации в этой статье.


Читать дальше →
Total votes 8: ↑5 and ↓3+5
Comments14

Полная домашняя автоматизация в новостройке

Reading time8 min
Views219K
Три года назад стал претворять свою давнюю мечту в реальность — максимальная домашняя автоматизация квартиры, купленной в новостройке с нуля. При этом «отделку от застройщика» пришлось принести в жертву умному дому image и полностью переделать, а вся электрика, не связанная с автоматикой приехала с известного китайского сайта. Паяльник не потребовался, но знающих мастеров, электриков и плотников пришлось искать долго.


Панель управления квартирой в феврале 2020 года (Home Assistant)

В этой статье расскажу о выборе технологий умного дома, используемых в квартире, а также приведу мои схемы разводки, фотографии всего что было сделано, получившиеся электрические щиты и конфигурации всех устройств, дам ссылку на гитхаб.


Строительство нашего дома в процессе — ноябрь 2016 года
Умный дом в самом соку...
Total votes 104: ↑101 and ↓3+132
Comments514

Геймификация личной продуктивности

Reading time5 min
Views5.5K

Предисловие


Думаю, многие встречали статьи по различным методикам увеличения своей продуктивности, но в действительности мало кто придерживается строгой дисциплины и ежедневно выполняет необходимый ToDo план. Я один из таких.


Но так или иначе вопрос личной эффективности меня интересует уже много лет и я всячески экспериментирую в поисках ответа на вопрос "Почему одни люди могут двигаться к цели ежедневно, а другие уже после недели перестают всячеcки придерживаться плана?".
Собственно, эта скромная статья — мое предположение, которое пока работает на всех моих знакомых. Они поддержали и любезно согласились поучаствовать в эксперименте, который длился ровно 30 дней.


Как все начиналось


Еще далекие 5 лет назад я пробовал самые классические подходы — ручка и блокнот, где я ежедневно в виде ToDo списка писал, что мне нужно сделать на день. Обычно планы на будущий день я записывал с вечера, чтобы за ночь мое подсознание подготовилось к продуктивному дню.


Список выглядел примерно так:


  1. Договориться о встрече с Иваном Петровичем
  2. Созвониться с заказчиком и обсудить ТЗ
  3. Дописать модуль АBC

    И все в таком роде.

Довольно просто и в то же время до жути неудобно. В один день я мог поставить 3 задачи и уже к обеду все закончить, в другой задач было так много, что я не успевал сделать и половины. Не было четкого плана, как их делить, как сортировать по приоритетам и как вообще себя оценивать. Да-да, оценка мне была очень важна, так как человек любит все структурировать.


Важно было через месяц посмотреть на свой результат и сделать определенные выводы. Кроме месячных отчетов о своем прогрессе хотелось банально понимать, какую оценку я получил за текущий день.


Как я уже сказал, из-за того, что задачи не сортировались по приоритетам и по количеству, нельзя просто высчитать процент, так как каждый новый день система отсчета будет меняться и ни о какой абсолютной оценке и речи быть не может.

Читать дальше →
Total votes 6: ↑5 and ↓1+6
Comments15

Бесплатные образовательные курсы на время карантина: бизнес, менеджмент, маркетинг

Reading time7 min
Views9.7K
image

На Хабр Карьере есть специальный раздел с обучающими программами на разных платформах. Среди них мы отобрали самые внятные и полезные бесплатные курсы — на время изоляции и вообще. Ориентировались на содержание, количество выпускников и репутацию школ. 31 курс на любой вкус: от продвижения в Инстаграме до венчурных инвестиций.
Читать дальше →
Total votes 9: ↑8 and ↓1+21
Comments0

Как вывести сайт под запад в ТОП10, не зная ничего о SEO

Reading time7 min
Views40K
В этой статье описан личный опыт двух человек: меня и моей коллеги Марии. Опыт людей, у которых совершенно не было знаний в SEO. Во второй половине 2019 года на нас легла ноша в виде продвижения 2-х сайтов проекта Ratatype. Сайтов молодых (рождены в 2019) и на иностранный рынок, языков которого мы не знаем (Франция и Испания), да еще и с очень ограниченным бюджетом.

Что вы найдете в этой статье:

  1. Реальный кейс, который работал, работает и будет работать.
  2. Пошаговую инструкцию «Что? Зачем? Как?» на простом языке.
  3. Описание провалов, куда ж без них.
  4. Что-то интересное на рынке SEO, но это не точно.

Чего вы здесь не найдете:

  1. Трендов 2020, 2021 или любого другого года.
  2. Мнений экспертов.
  3. Предложения услуг продвижения.

Если все устраивает — прошу, следуйте ниже по тексту.
Читать дальше →
Total votes 14: ↑10 and ↓4+10
Comments22
1

Information

Rating
Does not participate
Registered
Activity