Как стать автором
Обновить
15
0

Пользователь

Отправить сообщение

Лингвистический Epic fail, или Как запихнуть весь словарь русского языка в Power BI

Время на прочтение7 мин
Количество просмотров9.2K
image

Как-то, решая проблему лингвистического анализа в Power BI и заодно подыскивая примеры для моей предыдущей статьи, я вспомнил о задаче, которую пытался решить в Excel ещё несколько лет назад: нужно было внедрить в аналитическую систему словарь русского языка для лингвистического анализа большого количества запросов на естественном языке. Причём желательно было использовать стандартные офисные инструменты. Подавляющее большинство людей сразу взялись бы решать эту задачу в Excel, и я когда-то пошёл по тому же пути. В качестве словаря использовал открытый корпус русского языка (http://opencorpora.org/).

Но меня ждало разочарование — словарь состоял из 300 тыс. словоформ, более 5 млн записей, а для Excel это в принципе невозможный объём. Даже если запихнуть в него «всего лишь» 1 млн строк, то выполнять с ними какие-то манипуляции или, упаси боже, вычисления, сможет только очень терпеливый человек, который вообще никогда и никуда не торопится. Но в этот раз я решил натравить на задачу более подходящий инструмент — Power BI.
Читать дальше →
Всего голосов 24: ↑23 и ↓1+22
Комментарии18

Компьютеры пишут прозу, но все еще уступают людям. Почему?

Время на прочтение8 мин
Количество просмотров6.1K


Два года назад в японском литературном конкурсе чуть не выиграла повесть, написанная искусственным интеллектом. Она называется «День, когда компьютер написал роман». Пусть это и звучит как дурацкое воплощение анекдота «лучший способ заработать миллион — написать книгу, как заработать миллион», повесть прошла в финал, обойдя примерно полторы тысячи текстов, написанных людьми. Но прорыва не случилось. Художественные тексты по-прежнему пишут люди, нехудожественные — в основном тоже.

Пару месяцев назад компания Meanotek попробовала сделать ИИ-помощника для писательства и написать рассказ с ним в соавторстве. Спойлер — успеха он не добился. Создатели проекта рассказали нам, в чем была идея и как она воплощена. А мы попытались разобраться, почему из машин поэты выходят лучше, чем прозаики.
Всего голосов 20: ↑19 и ↓1+18
Комментарии9

5 трендов в области облачных вычислений в 2021 году

Время на прочтение5 мин
Количество просмотров4.9K

События 2020 года перевернули большинство прогнозов с ног на голову. Безусловно, AI и IoT по-прежнему будут сильнейшим образом влиять на нашу жизнь в следующем году. Однако наиболее важной задачей технологий сейчас является помощь человеку в адаптации в сложные переменчивые времена. Чем тут могут быть полезны облачные технологии? Рассказываем.

Читать далее
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

Дефицит новых процессоров и видеокарт от AMD и Nvidia настолько сильный, что невмоготу даже поставщикам ПК

Время на прочтение3 мин
Количество просмотров20K

AMD и Nvidia не справляются с необходимым уровнем производства процессоров Ryzen 5000, Radeon RX 6000 и GeForce RTX 30. Рынку нужно гораздо больше. Речь не только про обычных покупателей, сильно страдает и бизнес — компании, которые занимаются сборкой готовых игровых компьютеров.

С сотрудниками нескольких десятков компаний поговорили представители издания PCWorld. И большинство игроков рынка описали ситуацию с нехваткой не просто как ужасную, а как «возможно, худшую из всех возможных". Если у кого-то из поставщиков и появляются новые видеокарты, то их разбирают как горячие пирожки в период голода. По любой цене — гораздо более высокой, чем MSRP.
Читать дальше →
Всего голосов 28: ↑28 и ↓0+28
Комментарии33

Как бы я изучал Data Science, если бы начал пару лет назад, или Руководство по эффективному изучению науки о данных

Время на прочтение5 мин
Количество просмотров30K
Когда я только начал своё путешествие к науке о данных, я потратил много времени на то, чтобы понять, с чего начать, что я должен узнать в первую очередь и какие ресурсы должен использовать. За последние два года я узнал несколько вещей, о которых хотел знать раньше, например о том, стоит ли сначала сосредоточиться на программировании или статистике, какие ресурсы я должен использовать для изучения новых навыков, как я должен подходить к изучению этих навыков и так далее. Таким образом, эта статья написана, чтобы дать направления и идеи для тех, кто изучает Data Science.

Приятного чтения!
Всего голосов 30: ↑29 и ↓1+35
Комментарии3

В раздумьях об ARMагеддоне

Время на прочтение4 мин
Количество просмотров11K
Привет, Хабр! Меня зовут Сергей Минаев, я руководитель направления администрирования веб-сервисов в компании «Спортмастер».

И пока весь мир обсуждает, насколько удачным получился процессор Apple M1, и действительно ли можно верить бенчмаркам, я и мои инженеры погрузились в раздумья о грядущем.

Мы сидели и курили, начинался новый день, а из головы все никак не уходили мысли о том, что произошло. Нет, мы не обсуждали возможное крушение Intel, мы не думали о том, что будет дальше делать AMD с x86, не думали про Вендекапец. Мы пытались и все еще пытаемся понять, насколько изменит веб-разработку новый продукт от Apple.

Давайте вернемся в “ давным-давно, в далекой галактике” и вспомним про различные архитектуры процессоров, и почему они остались на обочине истории.

В начале было слово. Потом двойное слово




Когда компьютеры были такими же большими, как и деревья, а x86 был маленьким, как трава, основную работу проводили на “больших компьютерах”, и никто особо сильно не воспринимал всерьез IBM PC. Но тут произошла революция номер раз — появился 80386. Появился защищенный режим, можно было адресовать 4Гб памяти… но все это на самом деле не имеет никакого значения. Значение имеют цена и распространённость. В какой-то момент x86 благодаря Microsoft очень малоизвестной компании начал завоевывать рынок персональных компьютеров, которые можно было покупать домой. А там, где множество, там и появляется подручный, привычный и любимый инструмент. Именно таким инструментом стал x86, под который начали писать очень много ПО, и это ПО писали на самом x86.
Читать дальше →
Всего голосов 28: ↑17 и ↓11+17
Комментарии40

Телефон шпионил за мной, поэтому я нашёл тех, кто использует данные слежения

Время на прочтение12 мин
Количество просмотров120K

СЛЕЖКА: Американская компания имеет информацию о моём местоположении.

В моём телефоне 160 приложений. Я не знаю, что они делают, но решил это выяснить.

У меня было ощущение, что эти приложения шпионят за мной. Конечно, не прослушивают меня, но постоянно следят за тем, где я нахожусь. Что каждый мой шаг кому-то передаётся: когда я хожу в продуктовый, выпиваю или общаюсь с друзьями.

Я знаю, что есть те, кто покупает и продаёт эту информацию. Как они отслеживают нас, и что хотят делать с нашими данными?

Чтобы добраться до самого дна, я начал в феврале эксперимент. На свой запасной телефон я установил кучу приложений и потом стал его носить с собой повсюду.

Или почти повсюду. Я оставил его дома, когда проходил тест на COVID-19 в апреле.
Читать дальше →
Всего голосов 104: ↑101 и ↓3+131
Комментарии253

GitHub показал темную тему вместе с потрясным видео

Время на прочтение2 мин
Количество просмотров13K

GitHub объявил, что долгожданная темная тема, наконец, готова, ознаменовав анонс характерным крутейшим (но не без ироничным) видео, которое лучше сто раз увидеть, чем сто раз услышать.

Во тьму!
Всего голосов 11: ↑9 и ↓2+11
Комментарии46

Wasm в Armory Engine

Время на прочтение2 мин
Количество просмотров2.9K

Для тех кто в танке - wasm или WebAssembly это язык программирования низкого уровня для виртуальной стековой машины раз разработанный как портативная цель компиляции для высокоуровневых языков, таких как Си, C++, C#, Rust, Go. Проще говоря вы можете писать высокопроизводительный, компактный и переносимый код используя wasm. Наш Armory тоже использует wasm. Благодаря ему движок может работать в браузере и на других платформах с использованием Krom.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии3

Скрытые алгоритмы, заманивающие в ловушку бедности

Время на прочтение10 мин
Количество просмотров18K
Привет, Хабр! Делюсь с вами постом, в котором рассказывается, как группа юристов обнаруживает и борется с автоматизированными системами, которые отказывают бедным в жилье, работе и в базовых услугах. Рассматривается американский опыт, но в России данная проблема тоже очень скоро будет актуальна, ведь алгоритмы кредитного скоринга активно внедряются и у нас. А где ещё поднимать вопросы этичности подобных систем, как не среди тех, кто их создаёт?

Приятного чтения!
Всего голосов 24: ↑18 и ↓6+13
Комментарии31

Цифровизация управления проектами

Время на прочтение7 мин
Количество просмотров3.6K
Задачей проекта цифровизации при сооружении дожимной компрессорной станции Еты-Пуровского газового месторождения стало создание 3D-модели в ПО CATIA по исходной рабочей документации, настройка программного обеспечения 3DEXPERIENCE для обновления модели в ходе управления изменениями, проверка качества поступающих обновлений со стороны генерального проектировщика и настройка цифровых протоколов и документооборота.
Читать дальше →
Всего голосов 2: ↑1 и ↓1+1
Комментарии1

Пол Грэм: Локальная революция

Время на прочтение6 мин
Количество просмотров2.6K
«Я сомневаюсь, что у какого-либо государства хватит яиц, чтобы решиться создать стартап-хаб или мозгов, чтобы сделать это правильно.»

image


Апрель 2009

Недавно я осознал, что в моей голове крутятся две идеи, которые взорвутся, если их соединить.
Первая, что стартапы — это новая экономическая эра, по типу промышленной революции. Я не уверен в этом, но, с большой долей вероятности, можно утверждать, что это так. Основатели и персонал стартапов работают намного продуктивнее (представьте, насколько меньше добились бы Ларри и Сергей[имеются в виду основатели Google], если бы они работали на большую компанию), и эта возросшая продуктивность может изменить общественные устои.

Вторая идея, что стартапы это такой вид бизнеса, что процветает в определенных местах, которые специализируются. Кремниевая долина специализируется на стартапах так же, как Лос-Анжелес на фильмах или Нью-Йорк на финансах. [1]

Что, если обе идеи правильны? Что, если стартапы одновременно и новый этап промышленной революции, и такой вид бизнеса, что процветает в определенных местах?

Если так, то эта революция будет совершенно необычна. Все предыдущие революции распространялись. Земледелие, города, индустриализация широко распространились по миру. Если стартапы закончат как кинобизнес, сосредоточенный в нескольких местах и одном доминирующем центре, то это будут новые последствия.
Читать дальше →
Всего голосов 29: ↑19 и ↓10+11
Комментарии1

Что делать, если у стартапа денег на счету меньше, чем на 1 год

Время на прочтение4 мин
Количество просмотров4.1K
Представим, что вы основатель стартапа, который успешно привлек бизнес-ангела или раунд венчурного фонда и у вас осталось денег максимум на 12 месяцев.

Самое сложное при таком раскладе — утихомирить свою собственную психику. Вам придется одновременно управляться со своей тревогой, чтобы не допустить излишнего пессимизма, и при этом стараться не быть необоснованным оптимистичным. Тонкая грань, однако.
Перво-наперво нужно четко понять, сколько у вас осталось средств и сколько времени.

Прежде, чем читать дальше, следует обязательно ознакомиться с содержаниями эссе «Последняя капля» и «По умолчанию мертв» или «по умолчанию жив» .

Если ваш стартап «по умолчанию мертв», то вашей приоритетной задачей будет как можно скорее перевести стартап в состояние «по умолчанию» жив". Механизмы здесь очень просты: либо увеличиваем прибыль, либо сокращаем расходы. Или делаем и то, и другое одновременно.
Читать дальше →
Всего голосов 31: ↑23 и ↓8+19
Комментарии12

Как создать базу знаний, чтобы она стала «интеллектуальным активом» компании

Время на прочтение6 мин
Количество просмотров48K
Создавая базу знаний, каждый преследует свои цели и решает свои проектные задачи, использует свои инструменты и программные средства. Однако для чего бы и с помощью чего бы не создавалась база знаний, она обязательно должна приносить компании максимальную пользу. Как этого добиться?

В сентябре 2020 года я выступила спикером IV-й конференции «Управление корпоративными знаниями», проходившей в рамках недели корпоративного обучения. Мой мастер-класс «Как создать корпоративную базу знаний, чтобы она стала «интеллектуальным активом» компании» заинтересовал собравшихся, и я решила сделать из материалов выступления статью. Буду рада если текст поможет вам в работе. Буду рада, если кто-то из вас захочет в комментариях обсудить этот пост.

Источник
Читать дальше →
Всего голосов 40: ↑37 и ↓3+43
Комментарии16

Тахометр + температура двигателя на Arduino для МиниМото

Время на прочтение2 мин
Количество просмотров14K
Купил я сыну в прошлом сезоне его первый мотоцикл. Радости не было предела.

Катались мы катались, всё хорошо, но т.к. на минибайках нет ни спидометра, ни тахометра, ничего, пришла идея это исправить. Есть конечно же в продаже готовые варианты, но весь интерес в том, чтобы попробовать сделать что-то самому, а купить можно всегда. Что у меня из этого вышло, читайте ниже.


Читать дальше →
Всего голосов 12: ↑10 и ↓2+13
Комментарии18

Проверь свои клеммники

Время на прочтение3 мин
Количество просмотров59K
Эта история началась много лет назад. В блаженной памяти 2012 году я прочитал на Хабре замечательный материал «Прекратите скручивать». Никогда не был фанатом скруток, а прикольные девайсы из поста только утвердили решимость использовать что-то более продвинутое. Поэтому, когда спустя пару лет у меня возникла задача разделить выходящий из электросчетчика провод на две линии (особенность дизайна проводки в квартире), я выбрал самый подходящий вариант — WAGO 222. И каждый месяц, снимая показания счетчика, радовался, глядючи на аккуратные коробочки. И, конечно же, этого поста не было бы, если бы дальше не случилось «однако». Начиная с какого-то времени в коридоре стал чувствоваться слабый запах паленой проводки. Точное место проблемы не находилось, а по времени феномен совпадал с этапом нагрева воды стиральной машинкой. Постепенно запах начал возникать на все более низкой температуре стирки и становился сильнее. А очередной осмотр проводки преподнес неприятный сюрприз: потеки пластика на обоих WAGO 222 и отчетливо обугливающаяся изоляция в них входящих проводов.


Всего голосов 86: ↑74 и ↓12+83
Комментарии369

10 научных статей о реставрации с помощью глубокого обучения, которые должен прочитать каждый

Время на прочтение12 мин
Количество просмотров6.2K
В скором времени у нас стартует новый поток продвинутого курса «Machine Learning Pro + Deep Learning», а сегодня мы делимся постом, в котором рассказывается о подходах к реставрации с помощью глубокого обучения. Реставрация изображений в разрезе глубокого обучения — это задача заполнения потерянных пикселей так, чтобы итоговое изображение выглядело реалистично и соответствовало оригинальному контексту. Некоторые приложения метода, такие как удаление нежелательных объектов и интерактивное редактирование изображений, показаны на кдпв. Приложений на самом деле так много, как вы только можете себе представить.
Приятного чтения!
Всего голосов 21: ↑20 и ↓1+25
Комментарии2

CRM: не играйте в конструкторы, это больно

Время на прочтение9 мин
Количество просмотров8.3K
У сотрудника был конструктор Lego с интересной особенностью: он достался ему без инструкции по сборке. По идее, это должна была быть вполне симпатичная машинка с рабочими дверцами и прочими интересными фишечками, но собрать её без инструкции невозможно: куча одинаковых блоков и кубиков не оставляли шансов сделать безошибочно. Одно время конструктор работал антистрессом: во время телефонных переговоров и совещаний сотрудник делал из кубиков произвольных жирафов, динозавров и домики. В итоге инструкцию скачали на сайте, машинка благополучно встала на колёса, динозаврики с совещаний пропали и об этой истории все забыли. 

А буквально пару недель назад этот конструктор вспомнили все — причём именно применительно к CRM. Угадали, почему?


В разработке абсолютно то же самое
Читать дальше →
Всего голосов 23: ↑16 и ↓7+24
Комментарии26

Как из четырёх минут речи мы воссоздали голос молодого Леонида Куравлёва

Время на прочтение7 мин
Количество просмотров20K
Всем привет! Меня зовут Олег Петров, я руковожу группой R&D в Центре речевых технологий. Мы давно работаем не только над распознаванием речи, но и умеем синтезировать голоса. Самый простой пример, для чего это нужно бизнесу: чтобы для каждого нового сценария, которому обучают голосовых роботов, не нужно было организовывать новую запись с человеком, который его когда-то озвучил. Ещё мы развиваем продукты на основе голосовой и лицевой биометрии и аналитики по голосовым данным. В общем, работаем над серьёзными и сложными задачами для разного бизнеса.



Но недавно к нам пришли коллеги из Сбера с предложением поучаствовать в развлекательной истории — «озвучить» героя Леонида Куравлёва в новом ролике. Для него лицо Куравлева было воссоздано по кадрам из фильма «Иван Васильевич меняет профессию» и наложено на лицо другого актера с помощью технологии Deepfake. Чтобы мы смогли не только увидеть, но и услышать в 2020 году Жоржа Милославского, мы решили помочь коллегам. Ведь с годами голос у всех нас меняется и даже если бы Леонид Вячеславович озвучил героя, эффект был бы не тот.

Под катом я расскажу, почему эта, уже во многом привычная задача голосового синтеза, оказалась чуть сложнее, чем мы ожидали, и поясню, почему такие голоса не смогут обмануть качественные системы биометрической авторизации.
Всего голосов 44: ↑36 и ↓8+40
Комментарии75

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность