Pull to refresh
2
0
Send message

Мы стоим на пороге кризиса «Фальшивой науки»

Reading time 9 min
Views 54K


Журналы все чаще отзывают научные статьи, потому что оказывается, что написаны они не теми, кем заявлено. Необходимо выработать более эффективные способы решения проблемы, в противном случае мы рискуем полностью утерять общественное доверие к науке.
Читать дальше →
Total votes 84: ↑77 and ↓7 +70
Comments 372

Гравицапа для межпланетных перелётов или гравитационный манёвр

Reading time 9 min
Views 19K

Вопрос эмиграции в последние десятилетия стоит наиболее остро. И если 40 лет назад пределом мечтаний было перебраться за океан, то в XXI веке умами овладела мечта о релокейшне на Марс, например. Однако там тоже в скором времени может стать тесно. Остаётся одна дорога — колонизация Солнечной Системы и экзопланет. Допустим, мы собрались покинуть внутреннюю область Солнечной Системы, а, если повезёт, то и совсем выбраться за её пределы. Помимо невероятных объёмов тушёнки и кислорода, необходимых для выживания в суровом Космосе, нам потребуется в разы на порядки большее количество топлива, чтобы всё это добро дотащить. И ещё столько же топлива, чтобы тащить то топливо. И ещё топливо.

И самое обидное, что скорее всего мы закончим свой век среди троянских астероидов Юпитера, померев от тоски. Потому что топлива всё равно ни на что не хватит. Однако присмотримся к нашей Солнечной системе повнимательнее. Вот те же «троянцы и греки» — не просто так столпились в точках Лагранжа L4 и L5 Юпитера. Их туда «затолкала» гравитация планеты-гиганта, не потратив ни единой капли гидразина.

Давайте же и мы применим дармовую энергию Природы для достижения благородной цели доставки полезной нагрузки в далёкий космос.
Читать дальше →
Total votes 57: ↑56 and ↓1 +55
Comments 11

Расчёты гравитационных манёвров в космосе или зачем человечеству нужны компьютеры

Reading time 10 min
Views 12K
Что вы делаете, когда вдруг выясняется, что задача, над которой вы работаете не имеет решения? Принципиально не имеет, можно даже не пытаться. Правильно, откладываете до лучших времён, а лучше, забываете о ней, чтоб не портить себе аппетит и психику.

Я недавно писал о манёврах в космосе, использующих гравитационную магию вместо устаревшего топлива для покорения просторов Солнечной Системы. Так вот мало того, что мы не знаем что такое гравитация, мы всё ещё не можем нормально всё посчитать.

К рубежу 19-20 веков прогрессивное человечество столкнулось с доказательством невозможности создания волшебных и точных математических формул, описывающих наше бытие. Например, к 1899 году французский математик Анри Пуанкаре доказал, что существует бесконечно много частных решений задачи трёх тел. Другими словами, существует бесконечно много разных формул, описывающих движение, например, космического тела в поле тяготения двух других. Для каждого объекта, момента времени, положения в пространстве надо всё считать отдельно, и пока считаешь, задача потеряет актуальность, комета улетит, а мы облажаемся с гравитационным манёвром и эта чёртова консервная банка с надписью NASA станет нашим гробом. А чтобы описать поведение системы множества тел, потребуется время, сопоставимое с возрастом Вселенной. Распаковывай чемоданы обратно, мы никуда не летим, дорогая.


Приблизительные траектории трёх одинаковых тел, находившихся в вершинах неравнобедренного треугольника и обладавших нулевыми начальными скоростями
Читать дальше →
Total votes 36: ↑36 and ↓0 +36
Comments 13

Настраиваем домашний почтовый сервер и уходим с «бесплатной» почты

Reading time 15 min
Views 306K

С каждым годом рекламы в интернете становится все больше, а подают ее с каждым разом все навязчивее. Дошло уже до почты: реклама в интерфейсе почтового ящика выглядит как первое непрочитанное письмо, которое машинально хочется открыть. Я не против рекламы, особенно когда она в тему и не сбивает с толку. Но маскировать её под непрочитанное письмо ‒ это перебор. Чувствуется, что следующим шагом рекламу начнут вставлять прямо в тело письма.

Читать далее
Total votes 108: ↑100 and ↓8 +92
Comments 338

15 лучших наборов данных для обучения чат-бота

Reading time 4 min
Views 17K
Чтобы быстро решать вопросы пользователей без вмешательства человека, эффективный чат-бот требует огромного количества обучающих данных. Однако основное узкое место в разработке чат-бота — это получение реалистичных, ориентированных на задачи диалоговых данных для обучения этих систем с помощью методов машинного обучения. Специально к старту нового потока курса «Машинное обучение» делюсь с вами списком лучших наборов данных разговоров из чатов, разбитых на вопросы и ответы, данные службы поддержки клиентов, диалоговые данные и мультиязычные данные.


Приятного чтения!
Total votes 14: ↑14 and ↓0 +14
Comments 2

Осторожный переезд в Нидерланды с женой и ипотекой. Часть 1: поиск работы

Reading time 12 min
Views 108K
На Хабре да и вообще в русскоязычном Интернете есть немало инструкций о том, как перебраться в Нидерланды. Я и сам немало полезного почерпнул из одной статьи на Хабре (ныне, видимо, скрытой в черновике уже нет, вот она). Но я все-таки расскажу о своем опыте поиска работы и переезда в эту европейскую страну. Помнится, и когда я только собирался рассылать резюме, и когда уже проходил собеседования, мне было очень интересно почитать об аналогичном опыте других коллег по цеху.

image

В общем, если вам интересен рассказ о том, как C++ программист из Подмосковья искал работу в Европе, желательно в Великобритании, а нашел-таки в Нидерландах, переехал туда сам и привез жену, все это с непогашенной ипотекой в России и с небольшими приключениями — добро пожаловать под кат.
Читать дальше →
Total votes 216: ↑202 and ↓14 +188
Comments 306

«Обратите внимание» #1: Дайджест статей об ИИ, продуктовом мышлении, поведенческой психологии

Reading time 2 min
Views 5K

Обратите внимание - дайджест 1


Это первый в серии еженедельных дайджестов о технологиях, людях и том, как они влияют друг на друга.

Читать дальше →
Total votes 17: ↑17 and ↓0 +17
Comments 8

NLP. Основы. Техники. Саморазвитие. Часть 1

Reading time 12 min
Views 72K

Привет! Меня зовут Иван Смуров, и я возглавляю группу исследований в области NLP в компании ABBYY. О том, чем занимается наша группа, можно почитать здесь. Недавно я читал лекцию про Natural Language Processing (NLP) в Школе глубокого обучения – это кружок при Физтех-школе прикладной математики и информатики МФТИ для старшеклассников, интересующихся программированием и математикой. Возможно, тезисы моей лекции кому-то пригодятся, поэтому поделюсь ими с Хабром.

Поскольку за один раз все объять не получится, разделим статью на две части. Сегодня я расскажу о том, как нейросети (или глубокое обучение) используются в NLP. Во второй части статьи мы сконцентрируемся на одной из самых распространенных задач NLP — задаче извлечения именованных сущностей (Named-entity recognition, NER) и разберем подробно архитектуры ее решений.


Читать дальше →
Total votes 53: ↑51 and ↓2 +49
Comments 11

Как найти похожие тексты и отсортировать

Reading time 2 min
Views 5.2K
Есть простой метод отсортировать набор текстов по похожести на заданный текст: по Эвклидову расстоянию между частотами слов в анализируемых текстах. В принципе, на этом алгоритм должен быть понятен, простую реализацию можно найти здесь.

Как ни удивительно, простой метод даёт хорошие результаты. Например, если ищем следующую книгу чтоб почитать, можно ввести текст прочтённой книги или нескольких прочтённых книг как образец для поиска, и тогда для этого репозитория из 10 книг получаем следующие результаты для книги «FAIRY TALES By The Brothers Grimm»:
Читать дальше →
Total votes 15: ↑5 and ↓10 -5
Comments 10

Как мы учили ИИ распознавать скопления галактик

Reading time 4 min
Views 11K
image

Недавно, вместе с командой друзей-астрофизиков, я закончила проект, целью которого был поиск далеких, скрытых тканью космоса галактик и их скоплений. Сейчас я поделюсь с вами тем, что мы сделали в результате этой непростой работы.
Читать дальше →
Total votes 52: ↑51 and ↓1 +50
Comments 20

«Туда и обратно» для нейронных сетей, или обзор применений автокодировщиков в анализе текстов

Reading time 9 min
Views 19K
Мы уже писали в самой первой статье нашего корпоративного блога о том, как работает алгоритм обнаружения переводных заимствований. Лишь пара абзацев в той статье посвящена теме сравнения текстов, хотя идея достойна гораздо более развернутого описания. Однако, как известно, обо всем сразу рассказать нельзя, хоть и очень хочется. В попытках воздать должное этой теме и архитектуре сети под названием «автокодировщик», к которой мы питаем очень теплые чувства, мы с Oleg_Bakhteev и написали этот обзор.


Источник: Deep Learning for NLP (without Magic)

Как мы упоминали в той статье, сравнение текстов у нас было “смысловое” – мы сопоставляли не сами текстовые фрагменты, а векторы, им соответствующие. Такие векторы получались в результате обучения нейронной сети, которая отображала текстовый фрагмент произвольной длины в вектор большой, но фиксированной размерности. Как получить такое отображение и как научить сеть выдавать нужные результаты – отдельный вопрос, о которой и пойдет речь ниже.
Читать дальше →
Total votes 21: ↑20 and ↓1 +19
Comments 4

Памятки по искусственному интеллекту, машинному обучению, глубокому обучению и большим данным

Reading time 4 min
Views 36K


В течение нескольких месяцев мы собирали памятки по искусственному интеллекту, которыми периодически делились с друзьями и коллегами. В последнее время сложилась целая коллекция, и мы добавили к памяткам описания и/или цитаты, чтобы было интереснее читать. А в конце вас ждёт подборка по сложности «О большое» (Big-O). Наслаждайтесь.

UPD. Многие картинки будут читабельнее, если открыть их в отдельных вкладках или сохранить на диск.
Читать дальше →
Total votes 51: ↑47 and ↓4 +43
Comments 9

Пифагорейское математическое обоснование музыкальной гаммы

Reading time 16 min
Views 33K
Глава из книги Александра Волошинова «Математика и искусство» (Москва: Просвещение, 1992)

Почтенный Пифагор отвергал оценку музыки, основанную на свидетельстве чувств. Он утверждал, что достоинства ее должны восприниматься умом, и потому судил о музыке не по слуху, а на основании математической гармонии и находил достаточным ограничить изучение музыки пределами одной октавы.

Плутарх

Строго говоря, речь здесь пойдет о пифагоровом строе. Что же такое гамма и строй в музыке?
Читать дальше →
Total votes 33: ↑30 and ↓3 +27
Comments 50

Космический язык, ч. 1: универсальна ли универсальная грамматика?

Reading time 13 min
Views 14K

Глаза осьминога демонстрируют явление конвергентной эволюции – намёк на возможность того, что структура языка инопланетян может оказаться похожей на нашу

Симпозиум METI


Симпозиум


Как бы вы составили сообщение для разумных существ с другой планеты? Им не был бы знаком ни один из языков человечества. Их «речь» может отличаться от нашей так же, как жутковатые крики китов или мерцающие огоньки светлячков. У их культурной и научной истории был бы свой собственный путь. Даже их разум может работать не так, как наш. Будет ли глубинная структура языка, так называемая "универсальная грамматика", у инопланетян такой же, как у нас? Группа лингвистов и других учёных собралась 26 мая 2018 года, чтобы обсудить сложные проблемы разработки сообщения, которое смогли бы понять внеземные существа. Появляется всё больше надежд на то, что среди миллиардов обитаемых планет, которые, как мы теперь считаем, существуют в нашей Галактике, найдутся такие существа. Этот симпозиум, названный «Язык в космосе» [Language in the Cosmos], был организован инициативой METI International. Он проходил в рамках Международной конференции по разработке космоса в Лос-Анджелесе, организованной Национальным космическим обществом. Председателем был доктор Шерри Уэллс-Дженсен, лингвист из Университета Боулинг-грин-стэйт в Огайо.
Читать дальше →
Total votes 31: ↑29 and ↓2 +27
Comments 72

Слово лингвисту: что если компьютеры заговорят лучше нас

Reading time 10 min
Views 9.7K

Фото: Александр Корольков/РГ

3 июня, в заключительный день Московского книжного фестиваля на Красной площади, лингвист Александр Пиперски выступал с рассказом о компьютерной лингвистике. Он говорил о машинных переводах, нейросетях, векторном отображении слов и поднимал вопросы границ искусственного интеллекта.

Лекцию слушали разные люди. Справа от меня, например, клевала носом китайская туристка. Александр, наверняка, тоже понимал — пара лишних цифр, формул и слов об алгоритмах, и люди убегут в соседнюю палатку слушать фантастов.

Я попросил Александра подготовить для Хабра «режиссерскую версию» лекции, где не вырезано ничего, что может усыпить случайных туристов. Ведь больше всего выступлению не хватало аудитории с толковыми вопросами и вообще хорошей дискуссии. Думаю, здесь мы ее сможем развить.
Читать дальше →
Total votes 29: ↑28 and ↓1 +27
Comments 59

На переднем крае науки: анализ статей arxiv.org

Reading time 11 min
Views 25K
image

Моя специальность — физика конденсированного состояния. Разумеется, в процессе погружения в нее требуется изучать много научных статей, однако на разбор хотя бы одной может уйти немало времени. На arxiv в разделе cond-mat публикуется более тысячи статей в месяц. Складывается ситуация, когда многие исследователи, особенно начинающие, не обладают целостным видением своей области науки. Описанный в этой статье инструмент резюмирует содержимое базы научных статей и призван ускорить работу с литературой.
Читать дальше →
Total votes 66: ↑65 and ↓1 +64
Comments 31

Чему я научился, пройдя множество собеседований в компаниях и стартапах из сферы ИИ

Reading time 14 min
Views 38K
За последние восемь месяцев я прошел собеседования в самых разных компаниях — DeepMind в Google, Wadhwani Institute of AI, Microsoft, Ola, Fractal Analytics и некоторых других — в основном на позиции Data Scientist, Software Engineer и Research Engineer. По ходу дела мне предоставлялись возможности не только пообщаться со многими талантливыми людьми, но также по-новому взглянуть на себя с пониманием того, что хотят услышать работодатели, когда беседуют с кандидатами. Думаю, если бы я располагал этой информацией раньше, то мог бы избежать многих ошибок и подготовиться к собеседованиям куда лучше. Это и стало импульсом к написанию данной статьи — возможно, она поможет кому-нибудь получить работу мечты.


В конце концов, если уж собираешься две трети своего времени (если не больше) проводить за работой, она должна быть этого достойна.
Читать дальше →
Total votes 28: ↑20 and ↓8 +12
Comments 6

Где и как изучать машинное обучение?

Reading time 2 min
Views 76K

Всем привет!


Ни для кого не секрет, что интерес к машинному обучению и искусственному интеллекту растет в лучшем случае по экспоненте. Тем временем мой Яндекс Диск превратился в огромную свалку пейперс, а закладки в Google Chrome превратились в список, длина которого стремится к бесконечности с каждым днем. Таким образом, дабы упростить жизнь себе и вам, решил структурировать информацию и дать множество ссылок на интересные ресурсы, которые изучал я и которые рекомендую изучать вам, если вы только вначале пути (буду пополнять список постоянно).

Путь для развития новичка я вижу примерно так:

Untitled_presentation
Читать дальше →
Total votes 47: ↑44 and ↓3 +41
Comments 19

LIGO: линейка точностью в 1/10000 диаметра протона

Reading time 13 min
Views 40K
Нобелевская премия по физике за 2017 год ожидаемо досталась Кипу Торну, Райнеру Вайссу и Берри Беришу за экспериментальное обнаружение гравитационных волн на лазерно-интерферометрических приборах LIGO. Этот успех (а обнаружение гравитационных волн (ГВ) от двух сливающихся черных дыр первый раз произошло 14 сентября 2015 года) стал плодом примерно 50-летнего развития техники для детектирования ГВ. В результате этого развития инструмент LIGO обладает леденящими характеристиками, впрочем, никакие человеческие эпитеты не передают уровня прецизионности этой машины.

image
Лазерно-интерферометрическая гравитационная обсерватория LIGO в Ливингстоне, Луизиана, США.

Сегодня поговорим об инженерном устройстве LIGO. Но прежде — о гравитационных волнах вообще.
Total votes 91: ↑91 and ↓0 +91
Comments 179

Топливо для ИИ: подборка открытых датасетов для машинного обучения

Reading time 6 min
Views 80K


Связанные проекты сообщества Open Data (проект Linked Open Data Cloud). Многие датасеты на этой диаграмме могут включать в себя данные, защищенные авторским правом, и они не упоминаются в данной статье


Если вы прямо сейчас не делаете свой ИИ, то другие будут делать его вместо вас для себя. Ничто более не мешает вам создать систему на основе машинного обучения. Есть открытая библиотека глубинного обучения TensorFlow, большое количество алгоритмов для обучения в библиотеке Torch, фреймворк для реализации распределенной обработки неструктурированных и слабоструктурированных данных Spark и множество других инструментов, облегчающих работу.


Добавьте к этому доступность больших вычислительных мощностей, и вы поймете, что для полного счастья не хватает лишь одного ингредиента — данных. Огромное количество данных находится в открытом доступе, однако непросто понять, на какие из открытых датасетов стоит обратить внимание, какие из них годятся для проверки идей, а какие могут быть полезны в качестве средства проверки потенциальных продуктов или их свойств до того, как вы накопите собственные проприетарные данные.


Мы разобрались в этом вопросе и собрали данные по датасетам, удовлетворяющим критериям открытости, востребованности, скорости работы и близости к реальным задачам.

Читать дальше →
Total votes 65: ↑65 and ↓0 +65
Comments 10

Information

Rating
Does not participate
Registered
Activity