Pull to refresh
-15
0
Send message

Материалы NLP курса от DeepPavlov

Reading time4 min
Views26K

В этой статье вы найдете материалы очных курсов «Deep Learning in NLP», которые запускались командой DeepPavlov в 2018-2019 годах и которые являлись частичной адаптацией Stanford NLP course — cs224n. Статья будет полезна любым специалистам, погружающимися в обработку текста с помощью машинного обучения. Благодарю физтехов, разрабатывающих открытую библиотеку для разговорного искусственного интеллекта в МФТИ, и Moryshka за разрешение осветить эту тему на Хабре в нашем ods-блоге.


Читать дальше →
Total votes 47: ↑45 and ↓2+59
Comments6

Как я свой хобби-проект переносил на k8s

Reading time5 min
Views8.5K
image

В этой статье я хотел бы рассказать о своем хобби-проекте поиска и классификации объявлений о сдаче квартир из социальной сети ВКонтакте и опыте его переезда на k8s.

Total votes 16: ↑15 and ↓1+20
Comments6

Электронная книжка в качестве дисплея

Reading time10 min
Views68K
Нетрадиционное применение распространённых вещей — это то, что всегда нам интересно! Ведь так хочется порой похачить очередное устройство. Понять как оно работает и внести какие-то свои коррективы в его работу, добавив новых функций.


Выводим свои картинки

Я расскажу, как можно старенькую читалку Sony PRS-505 превратить в удобный дисплейчик. И также расскажу, как можно писать свои программы для этой книжечки

Погнали
Total votes 133: ↑129 and ↓4+125
Comments61

DDoS-атака через социальную инженерию

Reading time6 min
Views17K


TL;DR Атакующий подменяет source ip на адрес вашего сервера и триггерит автоматические абузы. В результате клиента банят на хостинге за вредоносную активность, которой не было.

Комментарий от vdsina.ru:
Эта статья написана нашим клиентом, который перешёл к нам от крупного хостера после DDoS-атаки и любезно согласился поделиться этой историей.

Расскажу про удивительно коварный способ DDoS-атак, с которым я раньше не сталкивался. Коварство заключается в том, что на сам сервер жертвы не выполняется никакой атаки. Вместо этого, злоумышленник провоцирует срабатывание сторонних систем обнаружения атак, заставляя генерировать совершенно настоящие жалобы (в простонародье «абузы») на ваш сервер.

Со стороны хостера это выглядит так, будто вы занимаетесь вредоносной активностью, хотя на самом деле это неправда. Оказалось, что многие крупные хостинг-провайдеры не готовы глубоко разбираться в причинах проблемы и предпочтут вас просто забанить за нарушение правил.

В статье подробно разбирается этот вид атаки в реальном кейсе.
Читать дальше →
Total votes 27: ↑26 and ↓1+34
Comments16

История обработки естественного языка, с тринадцатого века до наших дней

Reading time20 min
Views13K

Обработка естественного языка восходит к мистикам Каббалы


Задолго до того, как обработка естественного языка стала модной темой в области искусственного интеллекта, люди придумывали правила и машины для манипулирования языком



Мистик 13 века Авраам бен Самуэль Абулафия изобрёл область обработки естественных языков, начав практику комбинирования букв

Сейчас мы находимся на пике интереса к обработке естественного языка (natural language processing, NLP) – области информатики, концентрирующейся на лингвистическом взаимодействии человека и машины. Благодаря прорывам в машинном обучении (МО) в последнее десятилетие, мы наблюдаем серьёзное улучшение в деле распознавания речи и машинного перевода. Генераторы языка уже достаточно хороши для того, чтобы писать связные новостные статьи, а виртуальные помощники типа Siri и Alexa становятся частью нашей повседневной жизни.
Читать дальше →
Total votes 12: ↑9 and ↓3+10
Comments1

Основы работы с Shader Graph в Unity

Reading time13 min
Views52K
image

Шейдер — это небольшая программа, содержащая инструкции для GPU. Она описывает способ вычисления экранного цвета для определённого материала.

Хотя у Unity есть Standard Shader, иногда требуется реализовать эффект, на который не способен стандартный шейдер.

Раньше для этого необходимо было знание особого языка шейдеров, такого как Cg или HLSL, а подходы в них немного отличаются от обычного создания скриптов геймплея. Для многих людей написание шейдеров — это непопулярная сторона разработки игр, потому что требуется освоение дополнительной кривой обучения.

В Unity появился Shader Graph, позволяющий упростить написание шейдеров почти без кода. Лучше всего то, что Shader Graph позволяет работать с визуальным интерактивным интерфейсом.

В этом туториале вы создадите свой первый шейдер для Unity!
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments0

Индексируем миллиарды текстовых векторов

Reading time9 min
Views8.3K

При извлечении информации часто возникает задача поиска подобных фрагментов текста. В контексте поиска запрос может быть сгенерирован пользователем (например, текст, который пользователь вводит в поисковом движке) или самой системой. Часто нам нужно сопоставлять входящий запрос с уже проиндексированными запросами. В этой статье мы рассмотрим, как можно построить систему, решающую эту задачу применительно к миллиардам запросов без траты целого состояния на серверную инфраструктуру.
Читать дальше →
Total votes 52: ↑52 and ↓0+52
Comments2

Машины уже опережают людей в тестах на чтение; но понимают ли они прочитанное?

Reading time13 min
Views3.9K

Инструмент под названием BERT способен обогнать людей в тестах на чтение и понимание. Однако он же демонстрирует, какой путь ещё нужно пройти ИИ




Осенью 2017 года Сэм Боумен, вычислительный лингвист из Нью-Йоркского университета, решил, что компьютеры до сих пор ещё не очень хорошо понимают текст. Конечно, они достаточно неплохо научились симулировать это понимание в определённых узких областях, вроде автоматических переводов или анализа чувств (к примеру, определять, является ли предложение «грубым или милым», как он сказал). Однако Боумен хотел получить измеримое свидетельство: настоящее понимание написанного, изложенное человеческим языком. И он придумал тест.
Читать дальше →
Total votes 10: ↑7 and ↓3+8
Comments23

Обзор PocketBook X – огромного 10,3-дюймового ридера с экраном E Ink Carta Mobius и металлическим корпусом

Reading time7 min
Views41K
Приветствую всех! На прошлой неделе начались продажи ридера PocketBook X – первой 10,3-дюймовой модели в линейке компании. Мне удалось быстренько заполучить её на тест и некоторое время погонять. О впечатлениях я расскажу ниже, сдобрив их некоторыми мыслями о столь крупных устройствах для чтения.

Первое, что следует знать про PocketBook X – он стоит 24 999 рублей. Сумма вроде бы и приличная, но! На деле оказывается, что это самый доступный ридер такого формата – 10,3 дюйма – на российском рынке. Другие модели с аналогичной диагональю дороже, причём значительно – они стоят от 40 тысяч. Почему «икс» (ну или «десятка», тут уж кому как нравится) получился дешёвым? Во-первых, продается он только в магазине на pocketbook.ru. Это позволило избежать накруток розничных сетей. Оно ведь как бывает: продается то или иное устройство и в рознице, и в фирменном магазине производителя; производитель рад бы продавать устройство гораздо дешевле, но не может поставить цену ниже, чем в федеральной рознице. Потому что после этого он из розницы просто вылетит. С PocketBook X такой проблемы нет, на модели зарабатывает только производитель (иначе бы стоил этот ридер тысяч 35, а то и дороже).


Total votes 23: ↑21 and ↓2+37
Comments97

Разбираем WTF задачки в JavaScript

Reading time2 min
Views34K


JavaScript язык особенный. Сколько его не изучай, всегда найдутся моменты, которые заставят даже матёрого профессионала начать чесать репу.


В этой статье приводятся несколько задачек на JavaScript, связанных с необычным поведением языка. Кому-то они помогут узнать что-нибудь новое, а кто-то просто сможет освежить знания.


Задачка 1 — «BANANA»


Читать дальше →
Total votes 40: ↑34 and ↓6+41
Comments108

Как научить нейросеть воспроизводить игровую физику

Reading time11 min
Views14K
Практически в любой современной компьютерной игре наличие какого-либо физического движка является обязательным условием. Развевающиеся на ветру флаги и кролики, бомбардируемые шарами, ― всё это требует надлежащего исполнения. И, конечно, пусть не все герои носят плащи… но те, кто носят, действительно нуждаются в наличии адекватной симуляции развевающейся ткани.



И всё же полное физическое моделирование таких взаимодействий часто становится невозможным, поскольку оно на порядки медленнее необходимого для игр в реальном времени. Данная статья предлагает новый метод моделирования, который может ускорить физические симуляции, сделать их в 300-5000 раз быстрее. Цель его состоит в том, чтобы попытаться научить имитации физических сил нейронную сеть.
Читать дальше →
Total votes 44: ↑40 and ↓4+47
Comments5

Information

Rating
Does not participate
Registered
Activity