Как стать автором
Обновить
-3
0

Пользователь

Отправить сообщение

Сам себе Гутенберг. Делаем параллельные книги

Время на прочтение12 мин
Количество просмотров23K

Lingtrain parallel books


Upd. 04.12.2021 — Наш телеграм канал


Если вам нравится изучать языки (или вы их преподаете), то вы наверняка сталкивались с таким способом освоения языка как параллельное чтение. Он помогает погрузиться в контекст, увеличивает лексикон и позволяет получить удовольствие от обучения. Читать тексты в оригинале параллельно с русскоязычными, на мой взгляд, стоит, когда уже освоены азы грамматики и фонетики, так что учебники и преподавателей никто не отменял. Но когда дело все же доходит до чтения, то хочется подобрать что-то по своему вкусу, либо что-то уже знакомое или любимое, а это часто невозможно, потому что такого варианта параллельной книги никто не выпускал. А если вы учите не английский язык, а условный японский или венгерский, то трудно найти вообще хоть какой-то интересный материал с параллельным переводом.


Сегодня мы сделаем решительный шаг в сторону исправления этой ситуации.


Из чего делаем


На входе у нас будут два текстовых файла с оригинальным текстом и его переводом. Для примера возьмем книгу "Убить пересмешника" Харпер Ли на русском и английском языках.


Начало документов выглядит так (отрывки приведены в таком виде, в котором они были найдены в сети):

Выровнять пересмешника
Всего голосов 106: ↑106 и ↓0+106
Комментарии67

Первые шаги в BI-аналитике. Роль Data Engineering

Время на прочтение8 мин
Количество просмотров11K

Добрый день, уважаемые читатели! Материал носит теоретический характер и адресован исключительно начинающим аналитикам, которые впервые столкнулись с BI-аналитикой.

Что традиционно понимается под этим понятием? Если говорить простым языком, то это комплексная система (как и, например, бюджетирование) по сбору, обработке и анализу данных, представляющая конечные результаты в виде графиков, диаграмм, таблиц.

Это требует слаженной работы сразу нескольких специалистов. Дата-инженер отвечает за хранилища и ETL/ELT-процессы, аналитик данных помогает в заполнении базы данных, аналитик BI разрабатывает управленческие панели, бизнес-аналитик упрощает коммуникации с заказчиками отчетов. Но такой вариант возможен, только если фирма готова оплачивать работу команды. В большинстве случаев небольшие компании для минимизации затрат делают ставку на одного человека, который зачастую вообще не обладает широким кругозором в области BI, а имеет лишь шапочное знакомство с платформой для отчетов.

В таком случае происходит следующее: сбор, обработка и анализ данных происходит силами единственного инструмента – самой BI-платформой. При этом данные предварительно никак не очищаются, не проходят компоновки.  Забор информации идет из первичных источников без участия промежуточного хранилища. Результаты такого подхода можно легко лицезреть на тематических форумах. Если постараться обобщить все вопросы касательно BI-инструментов, то в топ-3 попадут, наверное, следующие: как загрузить в систему плохо структурированные данные, как по ним рассчитать требуемые метрики, что делать, если отчет работает очень медленно. Что удивительно, на этих форумах вы практически не найдете обсуждений ETL-инструментов, описания опыта применения хранилищ данных, лучших практик программирования и запросов SQL. Более того, я неоднократно сталкивался с тем, что опытные BI-аналитики не очень лестно отзывались о применении R/Python/Scala, мотивируя это тем, что все проблемы можно решить только силами BI-платформы. Вместе с тем всем понятно, что грамотный дата инжиниринг позволяет закрывать массу проблем при построении BI-отчетности.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии1

Упрощаем работу с Tableau через Телеграм

Время на прочтение10 мин
Количество просмотров13K
image

Всем привет. Предоставление доступа к готовым отчетам часто является отдельной проблемой. Вопрос удобства и оперативного доступа к результатам обработки данных для руководства во многом определяет судьбу их дальнейшего использования. Система Tableau (или по-простому Табло) не зря пользуется популярностью для подобных задач, позволяя быстро анализировать данные из многих источников, публиковать онлайн-отчеты на сервере, настраивать автоматические рассылки PDF-версий отчетов и многое другое.

Однако даже когда все настроено, опубликовано и рассылается, коллеги сталкиваются с проблемами:

  • регулярные отчеты на почту теряются в потоке рабочих писем и найти нужное не всегда получается сразу.
  • как правило, онлайн-доступ к отчетам защищен корпоративным VPN. В некоторых ситуациях это доставляет проблем.
  • часто требуется получить отчет, не дожидаясь его регулярной рассылки. Например, план-факт по проекту за текущий месяц может потребоваться в любой день.
  • иногда пароль от своей учетки на сервере банально забывается или нужный отчет сложно отыскать среди других 100500 папок и отчетов.

Одним из решений таких проблем является бот Телеграма, который умеет экспортировать PDF-отчеты с сервера Табло по нажатию кнопки и отправлять их пользователю. В данной статье мы посмотрим код и примеры работы самого простого варианта такого бота.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+12
Комментарии1

Псс, дизайнер, хочешь ещё один конструктор для создания сайтов?

Время на прочтение4 мин
Количество просмотров10K

Всем привет! На самом деле я сторонюсь сравнений с конструкторами сайтов и ниже расскажу, почему это так. Наш проект — это скорее редактор, позволяющий динамически верстать макеты без кода и генерирующий на выходе оптимизированный продакшн-реди код. В остальном мы ближе к графическим редакторам. Этакий No-Code Pixel Perfect инструмент, где всё нужное под рукой, и где реализовано всё то, чего не хватало в Фигме.



Читать дальше →
Всего голосов 28: ↑22 и ↓6+22
Комментарии42

Животное устало

Время на прочтение2 мин
Количество просмотров88K
Животное стареет. Ничего удивительного. Я знала, что в конце концов это произойдёт. Но не предусмотрела никаких мер, чтобы справиться с ситуацией. Реальность подкралась незаметно. И теперь с ней приходится жить…

Оно мечется по ночам, стонет от болячек, не может найти удобное положение для сна. Будит меня слишком рано, по утрам мышцы деревенеют и не хотят двигаться, и оно не может снова заснуть. А если оставить его спокойно посидеть, то оно задремлет прямо посреди дня. Стало сложно найти продукты, совместимые с его пищеварением. Оно отвергает всё больше и больше продуктов, но не соглашается на монотонную диету, которая вроде бы ему подходит. Несмотря на ограниченное питание, существо набирает вес и утолщается в середине. Одновременно теряет силу и гибкость.
Читать дальше →
Всего голосов 188: ↑166 и ↓22+202
Комментарии241

Как я обогреваю свой дом при помощи майнинга криптовалют

Время на прочтение5 мин
Количество просмотров138K
После создания собственного смарт-электросчётчика из деталей за 4 доллара я начал ежедневно проверять уровень потребления электричества в доме, благодаря чему понял, насколько дорого обходится его обогрев. Особенно потому, что всё отопление и горячая вода в моём доме с низким энергопотреблением создаётся электричеством. У меня на крыше установлены солнечные панели пиковой мощностью 4,8 кВт, но зимой они по понятным причинам покрывают не так много затрат.


В холодные дни я плачу за электричество до 6 евро в день

Что у меня есть и как это улучшить



Nilan Compact P: нагревает воздух, а также имеет бойлер на 200 литров

Мой дом обогревается (и охлаждается) центральной системой вентиляции с тепловым насосом. По сути, мой тепловой насос втягивает холодный воздух снаружи, обогревает его и выдувает его во все комнаты, а также нагревает воду. Также на случай очень холодных дней у меня в каждой комнате есть инфракрасные панели.
Читать дальше →
Всего голосов 52: ↑45 и ↓7+50
Комментарии108

Как быть более продуктивным, не заставляя себя

Время на прочтение8 мин
Количество просмотров73K

Представьте, что вы могли бы работать больше и при этом быть супер-продуктивным. И знаете, что самое приятное? В этом случае вам не пришлось бы заставлять себя работать.

Есть люди, у которых дела обстоят именно так. Они могут просто сидеть и работать, без какого-либо беспокойства и насилия над собой. Более того, они работают с удовольствием. Есть хорошие новости — вы тоже можете этому научиться.

Давайте начнем.

Большинство людей испытывает негативные чувства по отношению к своей работе. Они думают, что работа — это что-то неприятное, в отличие от развлечений. Работа воспринимается как раздражающее занятие, которое мешает людям делать то, чем им на самом деле хочется заниматься. Люди также полагают, что отдых и полное безделье — это идеальное состояние, в котором они хотели бы находиться всё время. Такое мышление приводит к тому, что человек начинает думать, что нужно заставлять себя работать через силу, и что работа — это очень тяжело, и лишь железная сила воли поможет справиться с ней.
Читать дальше →
Всего голосов 51: ↑46 и ↓5+57
Комментарии46

10 бесплатных и полезных курсов в сети, от Фейнмана до Ына

Время на прочтение6 мин
Количество просмотров15K

Я предпочитаю курсы, а не книги. Хотя лучшие книги определённо превосходят курсы, есть несколько причин, по которым прекрасный курс оставит более глубокое впечатление. Начинающим на курсах склонны преподавать основы, тогда как большинство авторов книг пытаются быть оригинальными. Но многое из того, что стоит знать, на самом деле довольно старое. В этом посте поделимся с вами лучшими бесплатными курсами Гарварда, Стэнфорда, Массачусетского технологического института и других.

Читать далее
Всего голосов 8: ↑7 и ↓1+7
Комментарии5

Понимание квантовых вычислений через случайное блуждание пьяненьких людей

Время на прочтение7 мин
Количество просмотров15K
image

Квантовые вычисления — это самая большая революция в вычислениях со времен… вычислений. Наш мир состоит из квантовой информации, но мы воспринимаем мир как классическую информацию. То есть очень много происходит в небольших масштабах, недоступных нашим нормальным чувствам. Как люди, мы эволюционировали, чтобы обрабатывать классическую информацию, а не квантовую информацию: наш мозг запрограммирован на то, чтобы думать о саблезубых кошках, а не о кошках Шредингера. Мы можем достаточно легко закодировать нашу классическую информацию с помощью нулей и единиц, но как насчет доступа к дополнительной доступной информации, из которой состоит наша Вселенная? Можем ли мы использовать квантовую природу реальности для обработки информации? Конечно, иначе нам пришлось бы закончить этот пост здесь, и это нас всех не удовлетворило бы. Давайте исследуем возможности квантовых вычислений, а затем приступим к написанию собственного квантового кода.

Отправной точкой для изучения квантовых вычислений является понимание того, что, хотя многие принципы противоречат здравому смыслу, классическая вселенная, которую мы знаем и любим, — всего лишь тень квантовой ткани реальности. Часть того, чтобы привыкнуть к кванту, — это привыкнуть к ограничениям нашего собственного восприятия. Это ограничение аналогично рисованию трехмерного объекта на двухмерном листе бумаги. Взгляните на каркас ниже. Он может представлять собой либо коробку (мы можем проиллюстрировать это стаканом сверху), угол (мы можем поместить бутылку внутрь, чтобы мы увидели угол).

image

Мы вынуждены видеть либо одно, либо другое, а не то и другое одновременно.
Читать дальше →
Всего голосов 29: ↑27 и ↓2+36
Комментарии13

Аэродинамика из STL

Время на прочтение5 мин
Количество просмотров9.2K

Для построения траекторий КА и их носителей нужны данные. В первую очередь - аэродинамические. Они нужны при определении сил и моментов, действующих на космический аппарат (или его ступень), а также для оценки теплового состояния конструкции. Характеристики зависят от внешнего вида КА и параметров полета и обычно выглядят как обширные простыни с зависимостями соответствующих коэффициентов от углов атаки, чисел Маха, высот и много еще чего.

Есть несколько способов получить эти цифры:

Читать далее
Всего голосов 16: ↑16 и ↓0+16
Комментарии17

Лучшие open source альтернативы MS Project с диаграммами Ганта

Время на прочтение7 мин
Количество просмотров78K
Если вы управляете большими и сложными проектами, попробуйте сначала решения на базе open source. Если не понравится — вернётесь к Microsoft Project.



Проектирование и конструирование спутников, создание роботов, запуск любого серьёзного продукта — всё это сложные большие проекты. Разработка ИТ-продуктов во многом относится к той же категории. Нам приходится привлекать, распределять и вкладывать большие суммы, взаимодействовать с поставщиками и подрядчиками (нередко это команды на аутсорсе). В результате формируются сложные зависимости, которые нужно отслеживать и корректировать.
Читать дальше →
Всего голосов 28: ↑28 и ↓0+28
Комментарии18

Постдок-статистик укротил старую геометрическую задачу

Время на прочтение9 мин
Количество просмотров7.2K

Специалист по статистике к удивлению экспертов решил одну из важнейших задач выпуклой геометрии в высших измерениях




В середине 1980-х Жан Бургейн, бельгийский математик, придумал простой вопрос касательно фигур из высших измерений. А потом занимался им всю оставшуюся жизнь.

Ушедший от нас в 2018 году Бургейн был одним из выдающихся математиков современности. Лауреат Филдсовской премии 1994 года, высшей награды для математиков, он был известен, как специалист по решению задач высокого класса. С ним можно было поговорить о задачке, над которой вы бились несколько месяцев, а он мог решить её, не сходя с места. И всё же Бургейн не сумел ответить на собственный вопрос о фигурах из высших измерений.

«Жан однажды сказал мне, что на эту задачу он потратил больше времени и сил, чем на какую бы то ни было другую за всю свою карьеру», — писал Виталий Милман из Тель-Авивского университета.
Читать дальше →
Всего голосов 32: ↑32 и ↓0+32
Комментарии1

Python: 18 задач на вывод символов по заданному шаблону

Время на прочтение3 мин
Количество просмотров70K
Подготовка к техническому собеседованию по Python — нелёгкая задача. На таком собеседовании вам, вполне возможно, встретятся задачи на вывод символов по заданным шаблонам. Если вы хотите научиться решать такие задачи — вам может пригодиться подборка способов их решения, приведённая в этом материале.



Здесь продемонстрировано 18 примеров кода. Начинающие программисты вполне могут проработать всё по порядку, а опытные могут разобраться именно с тем, что им нужно. Главное — понять, как устроен тот или иной пример. Отсутствие чёткого понимания того, что происходит в программах, способно сыграть злую шутку с тем, кто, например, заучив фрагмент кода и воспроизведя его на собеседовании, попытается объяснить то, как именно этот код работает. А тех, кто проводит собеседование, часто интересуют именно такие вот разъяснения.
Читать дальше →
Всего голосов 25: ↑17 и ↓8+19
Комментарии16

Через 10 лет ИИ будет решать большинство задач лучше человека: интервью с организатором конференции OpenTalks.AI

Время на прочтение10 мин
Количество просмотров8.4K

Пару лет назад выдвигались опасения, что искусственный интеллект очень быстро достигнет уровня, когда его развитие станет неподконтрольным человеку и вдобавок пойдет по экспоненте. С одной стороны, это праздные страхи сторонних наблюдателей. С другой — возникает логичный вопрос: возможно ли это вообще и в какие сроки? Что такое сильный ИИ и в чем его проблема? Почему Европа проигрывает США и Китаю в области ИИ?

Всю эту пачку вопросов мне удалось задать Игорю Пивоварову — генеральному директору и руководителю программного комитета конференции OpenTalks.AI. Это тот случай, когда человек, который глубоко в теме, может на пальцах объяснить, что сейчас происходит в индустрии, и сделать ряд прогнозов (всё как мы любим).

Читать далее
Всего голосов 15: ↑14 и ↓1+20
Комментарии23

Логика у HR проста — обучать ИИ на «прижившихся»

Время на прочтение7 мин
Количество просмотров6K
На секунду у меня в голове возникла картина: сыщик дает собаке понюхать предмет, принадлежащий разыскиваемому лицу, и та мгновенно берет след. Аналогия не точна, но и не противоречива. А речь идет о сервисе GoRecruit, который с помощью методов машинного обучения выбирает из сотен кандидатов тех, кто с большей вероятностью приживется на должности, и формирует своеобразный рейтинг, который уже изучают кадровики.


Для поиска айтишников такая схема пока не особо применима, поскольку эта область специфическая, и тут рекрутеры используют другие инструменты. А в остальном — вполне актуальная вещь, особенно когда откликнувшихся на вакансию больше сотни.

О том, как работает сервис и какова тут логика кадровиков, нам рассказал Александр Барабаш. Формально он директор GoRecruit, но при этом имеет прямое отношение к разработке.
Читать дальше →
Всего голосов 23: ↑17 и ↓6+16
Комментарии22

Как этот год работала наша внутренняя служба гражданской обороны — от первых слухов до развития кризиса

Время на прочтение10 мин
Количество просмотров13K
image

У нас есть в составе служба охраны труда, служба гражданской обороны и чрезвычайных ситуаций — такая должна быть в крупной компании в принципе. Я расскажу, как именно работала эта служба, когда чрезвычайная ситуация началась, — от начала кризиса до текущей его стадии, когда уже всё более-менее успокоилось.

У нас было 40 тысяч масок, 5 тысяч респираторов, 10 тысяч перчаток и 350 литров антисептиков, но опасение вызывала информированность. Не то чтобы это был необходимый запас для офиса, но раз уж вы начали готовиться к ковиду, то становится трудно остановиться. Началось всё ещё весной 2020, когда половина офисных сотрудников в эпидемию не верила, а другая половина бегала в панике и не знала, как защищаться. У нас работает больше 2500 человек, поэтому было важно организовать процессы, связанные с этим всем.

В первую очередь мы взялись за сбор и оценку информации и сделали отдельную поддержку чисто по COVID-19.

В административно-эксплуатационном департаменте есть бывшие военнослужащие. Мы собрались и поняли, что любую неопределённость можно преодолеть планом. Потому начали писать стратегические планы действий на случай, если вдруг нужно будет переходить на удалёнку, например. Верили в них поначалу мало, но за следующие пару недель параноики восторжествовали. От стадии «это сезонное и пройдёт через две недели» мы довольно быстро перешли к «это серьёзно», «это запредельно серьёзно» и далее к варианту плана «***», где военные в присущей им манере детально описали наихудший вариант развития событий. Именно его мы и взяли дальше за основу работы.
Всего голосов 55: ↑53 и ↓2+66
Комментарии35

Почему я перестал читать статьи «Как стать разработчиком»

Время на прочтение8 мин
Количество просмотров9.9K
Совет для начинающих разработчиков

image


Я бы хотел, чтобы во времена, когда я учился программированию, кто-то сказал мне перестать читать статьи о том, «Как стать разработчиком за X месяцев». Так что позвольте мне донести эту мысль до вас.

Перестаньте читать эти чертовы статьи.

Понимаю, некоторые люди будут сопротивляться этому заявлению (особенно авторы таких статей). Для начала отмечу, что это исключительно мое мнение. Если вы любите читать такие статьи, не давайте мне остановить вас.

Но если вы начинающий разработчик, вам лучше игнорировать такие статьи (или хотя бы относиться к ним с большим недоверием).

Позвольте объяснить почему.

«Если мне удалось сделать это быстро, то и у вас получится!»


Одна из самых сложных вещей в моей карьере – ее изменение. Сменить карьеру – непростая задача. Этого нельзя сделать ни по прихоти, ни в мгновение ока. Этому нужно уделять пристальное внимание и много учиться в течение длительного периода времени. Неудивительно, что это может нанести вам как финансовый, так и эмоциональный ущерб.
Читать дальше →
Всего голосов 16: ↑8 и ↓8+5
Комментарии8

Заключённый использовал одиночную камеру для изучения математики. Сегодня он решает самые трудные уравнения в мире

Время на прочтение19 мин
Количество просмотров72K

В 2010 году некий Кристофер Хейвенс (Christopher Havens) был приговорен к 25 годам тюремного заключения за убийство. В 2020 году его работа по теории чисел была опубликована в научном журнале. Все стены камеры, в которой Кристофер Хейвенс отбывает срок, испещрены бумажными листками с формулами.

Бумажные листы, исписанные числами и греческими символами, уже не помещаются на небольшом столике и теперь, как пёстрые обои, развешаны по всем стенам камеры размером 2.4x3.7 метров. В процессе поиска решений он мог записывать на стенах уравнения непрерывных дробей длиной до 4.5 метров. Это его история.

Приятного чтения!
Всего голосов 116: ↑96 и ↓20+112
Комментарии131

Как выйти на китайский рынок с mini-app для WeChat, чтобы не прогореть

Время на прочтение12 мин
Количество просмотров6.7K

В Китае легко затеряться. Наши первые пиццерии там работали по привычной модели: точка «на доставку» с залом на второй линии не в людном месте. Но модель работала не так как мы хотели, потому что рядом с пиццерией десятки лавок со всеми видами еды, вроде боула с мидиями или хрустальной лапши, где клиент получит еду быстрее. Можно было бы сделать своё приложение с доставкой, но на китайских экранах сотни приложений, где можно заказать еду, и наше бы просто затерялось. Поэтому мы «пошли» в WeChat и его экосистему мини-приложений.

Почти нет примеров когда некитайская продуктовая компания вышла в WeChat с собственной мини-программой, да ещё с in-house разработкой вне Китая. Поэтому мы  познавали все нюансы разработки самостоятельно, от устройства китайской цифровой экосистемы и мини-приложений в WeChat, до вывода продукта на китайский рынок. Об этом и расскажем в этом большом «разборе» китайских приложений.

Читать далее
Всего голосов 25: ↑25 и ↓0+25
Комментарии15

Как мы учились предсказывать отказы

Время на прочтение10 мин
Количество просмотров14K

Привет, Хабр! Это снова Ольга Пешина, эксперт по развитию новых технологий в АО «Северсталь-Инфоком». Прокачивая телеметрию нашего гигантского металлургического комбината, мы хотим оперировать полученными с агрегатов данными не только в режиме реального времени (“что-то сломалось, надо чинить”), но и построить модель предиктивной аналитики отказов оборудования (“скоро там-то будет проблема, надо заранее принять меры”).

Я расскажу, как мы набивали шишки на попытках внедрить предиктивные ремонты, что из запланированного нам удалось, а что – нет и почему.

идём строить модель
Всего голосов 12: ↑11 и ↓1+15
Комментарии10

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность