В этой статье рассмотрим пять лучших библиотек Python, предназначенных специально для работы с русским языком в контексте NLP. От базовых задач, таких как токенизация и морфологический анализ, до сложных задач обработки и понимания естественного языка.
Пользователь
Памятка архитектору
Я работаю архитектором (Solution Architect если быть точным) в аутсорсинговой компании. В ходе работы я занимаюсь такими активностями как: дизайн и внедрение архитектурных решений, аудит систем заказчика и разного рода консультации вокруг архитектуры систем.
Иногда в разговоре с коллегами я говорю «спокойно, действуем ровно по учебнику». Но тут есть большая доля лукавства, т.к. одной книги где были бы собраны базовые принципы я так с ходу назвать не могу. По большей части это сборная солянка из разных книг, личного опыта и историй, рассказанных коллегами. Что-то освещено в одной из книг Фаулера, что-то есть в курсах от AWS.
В статье я решил собрать вместе список общих принципов, которых я стараюсь придерживаться, приступая к очередной задаче.
Создаем веб-приложение на Haskell с использованием Reflex. Часть 1
Введение
Всем привет! Меня зовут Никита, и мы в Typeable для разработки фронтенда для части проектов используем FRP-подход, а конкретно его реализацию на Haskell – веб-фреймоворк reflex
. На русскоязычных ресурсах отсутствуют какие-либо руководства по данному фреймворку (да и в англоязычном интернете их не так много), и мы решили это немного исправить.
В этой серии статей будет рассмотрено создание веб-приложения на Haskell с использованием платформы reflex-platform
. reflex-platform
предоставляет пакеты reflex
и reflex-dom
. Пакет reflex
является реализацией Functional reactive programming (FRP) на языке Haskell. В библиотеке reflex-dom
содержится большое число функций, классов и типов для работы с DOM
. Эти пакеты разделены, т.к. FRP-подход можно использовать не только в веб-разработке. Разрабатывать мы будем приложение Todo List
, которое позволяет выполнять различные манипуляции со списком задач.
Дефицит чипов увеличился уже до 30%, индустрии грозит кризис продолжительностью в год
В последнее время все чаще появляются новости вроде «видеочипов не хватает», «дефицит процессоров», «поставки ноутбуков под угрозой». И это не просто новости, а отражение реальной действительности, которая даже хуже, чем может показаться. По словам экспертов, проблемы на рынке полупроводниковых элементов сохранятся до конца этого года.
Основная причина — цифровизация всего и вся, переход в онлайн, увеличение объемов трафика и т.п. Промышленность оказалась не готова к пост-ковидной реальности. В итоге мы получили глобальный дефицит на рынке микросхем, который угрожает нормальному ходу работы многих отраслей, от автомобилестроения до производства ноутбуков и промышленных систем.
Менять одежду на персонажах из MakeHuman в Unity3d
Цель стати - перенести персонажа из Makehuman в Unity3d так, чтобы его внешность и одежду можно было менять прямо во время игры. Для этого будет использован бесплатный плагин для юнити UMA.
UTF-8 vs UTF-16. Несколько советов программистам
С появлением первых устройств цифровой передачи информации и электронно-вычислительных машин возникла задача кодирования текстовых символов с помощью последовательностей единиц и нулей. Минимальная единица представления информации – байт. Исходя их этого в 1963 году в США разработана, стандартизована, а впоследствии расширена кодовая таблица ASCII (American standard code for information interchange), использовавшая 8 битную кодировку. В первую очередь с помощью этой таблицы предполагалось кодирование цифр и букв английского языка. Первые 128 символов таблицы представлены на рис.1:
МЯСО. Правильное питание — мифы и реальность. Часть 2
Очередная статья про вред мяса, по-вашему? Я постараюсь дать вам не банальную информацию, исследуя взаимодействие красного мяса с нашим организмом. Вы, несомненно, найдёте тут что-то новенькое для себя. Прольём свет на мясной вопрос!
Тех, кому ближе формат видео, приглашаю на мой youtube-канал «Пролить свет». Там вы также найдёте этот материал. Эта статья является продолжением темы мифов правильного питания. Предыдущий материал здесь.
Как выбрать мобильную кросс-платформу в 2021 году
Кросс-платформенные решения - тренд в мобильной разработке. Уже есть различные технологии от PWA до Flutter и Kotlin Multiplatform. Как выбрать среди них?
Новый развивающийся бизнес зачастую в первую очередь ориентируется на мобильные технологии: социальные сети, необанкинговые решения, приложения для электронной коммерции, такси и другие. Новый бизнес ориентирован на экономическую эффективность, поэтому переход на кросс-платформенность для разработки мобильного приложения кажется правильным выбором. Посмотрим, что будет в 2021 году и как выбрать правильную технологию.
Почему язык Go стал стандартом для DevOps-инженеров
Иногда вещи находят себе применение неожиданно и не в том, для чего их задумывали.
В 1960-е годы Кен Томпсон — легенда программирования — написал компьютерную игру Space Travel для операционной системы Multics. Система была проектом компании Bell Lab, где он работал вместе с Денисом Ритчи. Позже проект закрыли, и чтобы продолжать играть в свою Space Travel, Томпсон решил портировать ее на компьютер PDP-7. Инструменты, которые он создал для порта, затем легли в основу операционной системы Unix.
Томпсон написал в одиночку первые три версии. Для Unix был нужен системный язык — так появился B. Позже Денис Ритчи, коллега и друг Томпсона, подхватил разработку и написал язык C. Вот так в основе почти всего, на чем построены современные технологии, лежало желание поиграть в компьютерную игру и пет-проекты для забавы.
Кен Томпсон построил блестящую карьеру исследователя в области computer science. В середине 2000-х он устроился в Google, где вместе с Робом Пайком и Робертом Грейсмером создал Golang — один из самых популярных языков последнего времени.
«Мы сваляли дурака»: как и почему IBM потеряла рынок персональных компьютеров
История поражений и провалов не менее интересна, чем история взлетов. Тем более, когда речь идет об IBM — легендарном “голубом гиганте”, определявшем развитие информационных технологий на протяжении всего 20 века.
12 августа 1981 г. Дон Эстридж представил публике персональный компьютер IBM PC. Презентация не вызвала ажиотажа, но уже через несколько лет компьютерами от IBM пользовались миллионы людей. А еще спустя немного времени от лидерства практически ничего не осталось: масштабный рынок ПК был вчистую проигран конкурентам, и в 2005 г. остатки этого бизнеса были проданы китайской компании Lenovo.
В недавно вышедшей монографии “IBM: Падение и возрождение великой компании“ Д. Кортада попытался ответить на вопросы, как и почему, имея колоссальные ресурсы и опыт, корпорация не смогла удержаться на рынке персональных компьютеров.
Мы выбрали из исследования главное.
Всё, о чём должен знать разработчик Телеграм-ботов
Вы вряд ли найдете в интернете что-то про разработку ботов, кроме документаций к библиотекам, историй "как я создал такого-то бота" и туториалов вроде "как создать бота, который будет говорить hello world". При этом многие неочевидные моменты просто нигде не описаны.
Как вообще устроены боты? Как они взаимодействуют с пользователями? Что с их помощью можно реализовать, а что нельзя?
Подробный гайд о том, как работать с ботами — под катом.
Ученые случайно обнаружили колонию странных существ подо льдом Антарктиды
Несколько дней назад исследователи пробурили антарктический шельф для того, чтобы взять образцы отложений на дне океана. Вместо этого они нашли колонию животных, которых там не могло быть. Об их находке рассказывает Wired.
Еще один фреймворк…
Вчера я зарелизил свой первый Python фреймворк. Нет, не еще один. Это в мире - еще один. А для меня пока что первый. И я допускаю, что он первый в своем роде. Это фреймворк для создания кастомных серверов. И создаваться они будут через конфиг. Ух, насоздаем сейчас...
«Переверни игру»: тем, кто стримит лоу-фай музыку, не нужны ни деньги, ни карьера в музыкальной индустрии
В 70-е начинающие музыканты не могли позволить себе дорогостоящую аудиотехнику и аренду студий, поэтому качество их записей оставляло желать лучшего. Так появился «lo-fi», к которому имели отношение даже ранние The Beatles. Однако термин быстро переосмыслили — в эпоху кассет за ним стояли те, кто намеренно отказывался от борьбы за чистый звук и видел в этом особый способ самовыражения. Но к моменту появления YouTube-стримов, лоу-фай стал совершенно другим, и под ним уже понимали самодостаточное музыкальное направление.
Поговорим об этом подробнее и обсудим, как обстоят дела у лоу-фай стримеров.
Рейтинг языков программирования 2021: доля Python падает, а TypeScript обошел С++, в лидерах JavaScript, Java, C#
Украинский профильный ресурс DOU.UA провел очередной ежегодный опрос о языках программирования, в рамках которого было собрано 7211 анкет (92% респондентов находятся в Украине). Из интересного - впервые с 2014 года у Python отрицательная динамика, наблюдается тенденция перехода с JavaScript на TypeScript, наиболее довольны пользователи Elixir, и наконец на графиках появился Rust.
Как мы раскрыли 24-летний баг в ядре Linux
Захватывающий детективный рассказ о поиске и исправлении трудноуловимого и при этом весьма странного бага, который неведомым образом ускользал от обнаружения на протяжении долгих лет взросления системы Linux. В начале описывается предыстория и технологическая база компании, в которой этот баг постигло разоблачение, после чего автор подробно демонстрирует все предпринятые для его раскрытия шаги.
Кто использует магнитную плёнку и почему за ней будущее
В декабре 2020 года IBM Research и Fujifilm представили прототип картриджа LTO на 580 терабайт. Небольшая кассета с магнитной лентой вмещает информации как несколько десятков обычных HDD или 120 000 DVD.
Магнитные ленты появились почти сто лет назад, а компьютерные файлы на них записывают с 1952 года. Ещё наши мамы в советских НИИ меняли катушки на мейнфреймах. И в 2021 году плёнки остаются самым дешёвым накопителем со стоимостью хранения примерно в 6 раз ниже, чем на HDD. Поскольку плёнка практически исчезла с потребительского рынка, многие даже не знают, насколько бурно развивается эта технология.
Черные дыры могут иметь «волосы». Эйнштейн не прав?
Согласно общей теории относительности Эйнштейна, черные дыры обладают только тремя наблюдаемыми свойствами: массой, спином (момент импульса) и зарядом. Дополнительных характеристик, или, как называют их физики, «волос», не существует.
Чтобы объяснить идею, представим однояйцевых близнецов. Они имеют одинаковый генотип, это генетические копии, но даже такие близнецы будут различаться множеством вещей: от темперамента до прически. Черные дыры, согласно теории гравитации Альберта Эйнштейна, могут иметь всего три характеристики: массу, спин и заряд. Если эти значения одинаковы для любых двух черных дыр, то они идентичны, будет невозможно отличить одну от другой. У черных дыр нет волос.
Bedrock Linux: лего-набор для создания идеального linux-дистрибутива
С момента появления Linux достаточно скоро возникло множество дистрибутивов: Slack, RedHat, Debian, SUSE и т. д. Тогда же возникла и проблема выбора дистрибутива, ведь каждый из них имеет свои особенности и преимущества, которые делают его особенным. RedHat и Debian наиболее стабильные и консервативные из дистрибутивов, Ubuntu заточен на удобство и имеет прекрасный пользовательский интерфейс, Gentoo — свобода выбора и гибкость.
У каждого пользователя Linux были моменты, когда ему не хватало некоторых функций, реализованных в других дистрибутивах. Многим в свое время не понравилось, что Debian перешел на systemd и они создали на его основе новый дистрибутив — Devuan. Некоторые перешли на Gentoo, где пользователь может создать среду с двумя системами инициализации: как с openrc, так и с systemd.
В разных дистрибутивах этот вопрос решается по-разному. Установка пакета, который отсутствует в штатном репозитории, решается с помощью docker-контейнеров, или использованием систем самодостаточных пакетов snap и flatpak. Можно даже ставить RPM пакеты на системах с пакетным менеджером DEB. В Gentoo имеется поддержка RPM и DEB пакетов. Все это работает, однако плохо масштабируется и не очень стабильно.
Создатели Bedrock Linux пошли дальше и создали полноценный мета-дистрибутив. В нем возможно использование не только пакетов, но и компонент различных Linux дистрибутивов, как кубиков Лего. В одном окружении можно создать систему из нескольких Linux OS, например установку дополнительных пакетов Ubuntu поверх базовых компонент Debian и Arch. Установочный скрипт доступен для следующих платформ.
- aarch64;
- armv7hl;
- armv7l;
- mips64el;
- mips64;
- mips;
- mipsel;
- ppc64;
- ppc64le;
- ppc;
- s390;
- x86_64;
- x86;
Как умные тележки покоряют супермаркеты в США
Магазины в Америке рассчитывают на то, что после пандемии люди больше не захотят касаться руками общих мест и общаться с кассирами. Последним таким ритейлером стал Kroger, с 2750 магазинов в стране. Он выпустил «умную» тележку, умеющую сканировать и взвешивать продукты. А еще — давать рекламу, от которой невероятно сложно устоять.
Информация
- В рейтинге
- Не участвует
- Зарегистрирован
- Активность