Articles / Bookmarks / Profile of Galvorn / Habr

@Galvorn

User

Profile Publications Comments 3Bookmarks 197

reloaded2000 Mar 10 2016 at 12:15

«Титаник» в реалиях 21 века

7 min

28K

Popular science

From sandbox

Часто при просмотре художественных фильмов о катастрофах на море в голову приходят мысли о том, насколько реально и возможно в жизни все происходящее на экране: могла ли в действительности случиться та или иная ситуация, сработало или не сработало бы то или иное средство спасения, правильно ли повели себя герои фильма и т.д. В этой статье хотелось бы попробовать разобраться, как обстоит дело с безопасностью на море сегодня, и как должны действовать люди в современных реалиях чтобы спастись, на примере ситуаций из достаточно известного художественного фильма, основанного на реальных событиях – «Титаник». Сразу оговорюсь, рассматривать все аспекты я не буду, ввиду их огромного количества. Рассмотрю только самые яркие, глобальные и интересные (разумеется, на мой скромный взгляд).

Читать дальше →

+49

113

57uff3r Feb 25 2016 at 08:44

Улучшаем свой английский: изобретаем субтитры заново

5 min

50K

Self Promo

1. Intro

— Татьяна Леонидовна, а можно, мы посмотрим это кино с субтитрами?
— Нет, малолетние дятлы, мы тренируем ваше слуховое восприятие, поэтому кино вы будете смотреть без них! С субтитрами вы будете только читать текст и не слушать.
— Татьяна Леонидовна, но без субтитров мы больше половины не понимаем!
— А вот это уже ваши проблемы.

Начало 2000-х, диалог с учителем во французской спецшколе, Санкт-Петербург.

+56

119

marks Feb 11 2016 at 20:39

Internet Archive выложил 1500+ программ под Windows 3.1, работать можно прямо в браузере

1 min

16K

History of ITSoftware

Несколько дней назад Internet Archive выложил в Сеть десятки старых вирусов, которые работали еще под DOS, создав Malware Museum. В «музее» размещено около 80 классических вирусов, с которыми сталкивались многие пользователи того времени.

Теперь есть и еще один музей — на этот раз старых программ, которые работали еще под Windows 3.1. Разработчики разместили наиболее популярные в то время приложения, включая как чисто рабочие инструменты, так и игры. Найти все это можно в новом разделе the Windows 3.X Showcase. Всего здесь размещено 1523 программы, их количество продолжает увеличиваться. В браузере все это работает благодаря JavaScript-эмулятору Windows 3.1.

Читать дальше →

+15

Zalina Jan 25 2016 at 13:29

Что такое современная лингвистика. Лекция в Яндексе

21 min

24K

Entertaining tasksЯндекс corporate blogProfessional literature*

В лингвистике сосуществуют две традиции описания языка: одна из них, до сих пор продолжающая традицию шумеров и древних греков, описывает язык фрагментарно — отдельно фонетику и фонологию, отдельно морфологию, отдельно синтаксис и т. д. Другая, идущая с четвертого — пятого веков до н. э. от индийского монаха Панини, описывает язык как интегральное целое — описание фонетики, морфологии, синтаксиса, семантики строится в виде взаимно ориентированных правил, с помощью которых из элементарных языковых единиц строятся тексты.

Именно последний способ описания языка используется в сложнейших инженерно-лингвистических моделях, позволяющих автоматически переводить тексты одного языка на другой. О них и об их развитии и пойдёт речь на лекции.

Лектор Александр Николаевич Барулин — сотрудник Института языкознания РАН. Закончил отделение структурной и прикладной лингвистики филологического факультета МГУ им. М. В. Ломоносова. Учился в аспирантуре Института востоковедения АН СССР, защитил диссертацию на тему «Теоретические проблемы описания турецкой именной словоформы» (1984). Проработал в Институте востоковедения 12 лет. В 1991 году совместно с В. К. Финном и Д. Г. Лахути организовал факультет информатики РГГУ и возглавил созданное на этом факультете отделение теоретической и прикладной лингвистики. В 1992 по проекту Барулина был организован факультет теоретической и прикладной лингвистики — он стал деканом этого факультета, а также заведующим кафедрой теоретической и прикладной лингвистики.

Под катом — подробная расшифровка лекции.

Читать дальше →

+24

audio_man Jan 29 2016 at 08:52

Почему некоторые ноты гармонично звучат вместе

4 min

45K

Аудиомания corporate blogPopular sciencePhysicsSoundBrain

Вы никогда не задумывались, почему некоторые ноты больше подходят друг другу, чем другие? Как связаны между собой частоты их волн? Почему ноты одной тональности звучат «хорошо»? Почему «хорошо» звучат ноты в составе аккорда?

Читать дальше →

+32

ITinvest_team Jan 28 2016 at 15:04

Геймификация: Как владельцы баров применяют биржевые механики для повышения продаж коктейлей

3 min

13K

ITI Capital corporate blogFinance in ITLifehacks for geeks

В нашем блоге мы уже рассказывали о том, как трейдеры зарабатывают на бирже с помощью социальных сетей, как на котировки акций влияют новогодние праздники и почему офисные служащие выбирают онлайн-трейдинг в качестве хобби.

Фондовый рынок становится все более открытым, что выражается не только в росте числа его участников и проникновении в финансовую сферу новых технологий, но и в том, что механики биржевых торгов проникают и «во внешний мир». Сегодня мы поговорим о том, как их используют для повышения продаж владельцы питейных заведений.

Читать дальше →

+11

bocharov Oct 22 2012 at 12:19

«Он видел их семью своими глазами»

6 min

65K

Open source*

Можешь выбрать подходящую к заголовку поста картинку?

Тогда научи робота! Он тоже хочет.

Команда проекта Открытый корпус просит хабралюдей помочь разметить свободно доступный (CC-BY-SA) корпус текстов. Под катом мы расскажем о том, что такое корпус, зачем он нужен, как обстоят дела с корпусами в России и за рубежом, почему так плохо и какой у нас план.

Читать дальше →

+145

116

bocharov Dec 16 2015 at 16:01

Как, читая новости, приносить пользу науке?

3 min

12K

CrowdsourcingArtificial Intelligence

В предыдущий раз мы написали на Хабре о краудсорсинге лингвистических данных. Речь шла о морфологической разметке (part of speech tagging) современных текстов на русском языке. С тех пор было размечено около 2.2 млн. заданий, и около 3 тысяч человек приняли в этом участие. Мы с вами прошли чуть больше половины пути. Спасибо, что вы помогаете нам!

В OpenCorpora мы создаём открытые данные для обучения и тестирования математических моделей анализа текста на русском языке. Таким образом, мы помогаем российской компьютерной лингвистике догнать западную. Потом будем помогать обгонять ;)

Сегодня мы расскажем о разметке именованных сущностей. Это ещё один слой разметки текстов в Открытом корпусе. Мы будем выделять в тексте имена людей, названия компаний и географических объектов.

Под катом: зачем мы это делаем, что такое разметка именованных сущностей и что будет дальше?

+14

NightRadio Apr 20 2014 at 11:26

Печать и воспроизведение звука на бумаге

3 min

102K

Sound

Можно ли закодировать звук в виде изображения, которое считывается камерой и проигрывается в реальном времени?

На ум сразу приходит QR-код или некие его аналоги. В такой код можно записать ссылку на mp3, или даже совсем маленький звуковой файл. Но в первом случае требуется выход в сеть, а во втором — большая плотность кода и повышенные требования к качеству изображения. Кроме того, ни тот ни другой способ не обеспечит мгновенное воспроизведение.

Что, если кодировать звук не в цифровом, а в аналоговом формате? То есть, допустить возможность больших потерь информации с сохранением основных «очертаний» звукового послания. Например, такие потери возникнут при плохом освещении, плохой камере, маленькой картинке, мятой или рваной бумаге с кодом. Пусть со страшными артефактами, но картинка должна звучать.

Читать дальше →

+201

124

HabraBugger Aug 12 2015 at 10:40

Стандартная модель элементарных частиц для начинающих

5 min

75K

Popular sciencePhysics

«Мы задаёмся вопросом, почему группа талантливых и преданных своему делу людей готова посвятит жизнь погоне за такими малюсенькими объектами, которые даже невозможно увидеть? На самом деле, в занятиях физиков элементарных частиц проявляется человеческое любопытство и желание узнать, как устроен мир, в котором мы живём» Шон Кэрролл

Если вы всё ещё боитесь фразы квантовая механика и до сих пор не знаете, что такое стандартная модель — добро пожаловать под кат. В своей публикации я попытаюсь максимально просто и наглядно объяснить азы квантового мира, а так же физики элементарных частиц. Мы попробуем разобраться, в чём основные отличия фермионов и бозонов, почему кварки имеют такие странные названия, и наконец, почему все так хотели найти Бозон Хиггса.

Читать дальше →

+39

Meklon Jul 23 2015 at 15:17

Здравствуйте, я Meklon и я кофеин-зависимый

15 min

93K

Другие статьи цикла:
Хроники лаборатории: как мы молотый кофе считали софтом для анализа клеточных структур
Компот из кофейных сухофруктов. Знакомимся с каскарой — лучшим другом велосипедиста

Звонок будильника зазубренной пилой вырывает мозг из обьятий сна, свет из-за занавески жгучими импульсами внезапно заставляет сетчатку заливать мозг пакетами нервных импульсов. Спящий организм неторопливо проводит инициализацию базового оборудования, убеждается в относительной сохранности контрольной суммы нейрональных последовательностей и запускает базовую операционную систему по дороге на кухню. Запутанные скрипты инициализации заставляют руки выполнять сложные последовательности нажатий кнопок, регистрируют глухое жужжание акустическими сенсорами, звук льющейся жидкости… Мозг автоматически включает внутренний таймер на 25 секунд, одновременно отслеживая цветовые характеристики тихо журчащей пары тонких струек. Несколько движений чайной ложкой, ускоряющей растворение сахарозы, и сознание взрывается от сочетания тонкого бодрящего аромата, тягучего шоколадного вкуса с легкой кислинкой и нотами тропических фруктов. В сознании медленно проступает образ смуглых девушек, наполняющих свои корзины красными ягодами под лучами палящего горного солнца. Пробуждение...

На Хабре/Гиктаймсе уже не раз обсуждался кофе и все, что с ним связано. Я решил написать пост, посвященный этому напитку и различным эффектам кофеина с медицинской точки зрения. Если хватит времени — возможно это будет цикл статей с экспериментами над людьми, computer vision и прочим непотребством. Увидим. А пока, товарищи кофеиноманы и им сочувствующие, добро пожаловать под кат.

Получить свою порцию кофеина

+93

335

SLY_G Jul 22 2015 at 22:54

MIT предлагает всем желающим бесплатные уроки по теории покера

2 min

22K

Games and game consolesLogic games

Первое видео курса

Массачусетский технологический институт выложил в свободный доступ курс лекций по теме «Теория и аналитика игры в покер» (на английском языке). Доступны видеолекции, конспекты и специальные заметки по курсу. Это событие – часть программы OpenCourseWare, которая посвящена организации бесплатного доступа к избранным лекциям института для всех желающих – даже для тех, кто не учится в нём.

Помните, как в школе многие говорят: «Ну зачем мы это учим, нам это не пригодится!»?

Так вот, лекции по покеру – пожалуй, могут оказаться не просто интересными, но и весьма полезными с практической точки зрения.

Лекции ведёт магистрант института Кевин Дезмонд, который получил степень бакалавра по финансам. И, что логично, его лекции как раз рассказывают о технологиях анализа и планирования, предназначенных для максимизации выгоды от игры на деньги.

В курсе рассматриваются основы игры, наилучшие стратегии, и те важные детали, которые самоучки обычно упускают. Рассматривается анализ поведения игроков, манеры игры и прогнозы их будущих действий в зависимости от предыдущих раздач.

Читать дальше →

+14

RusakovMxL Jul 17 2015 at 13:12

Концепт: самогонный аппарат — полный автомат

16 min

74K

DIY

From sandbox

Под полным автоматом понимается: Вы пришли, залили брагу, закрыли бак, открыли вентиль на газовом баллоне, поставили банки в нужные места под разные продукты выгонки, нажали кнопку и ушли. Пришли через определенное время (время зависит от емкости бака), все разлили по емкостям, продукты отработки вылили в канализацию, залили по-новой, и т.д.

Под концептом подразумевается то, что система находится в стадии разработки, но имеет законченную структурную идею, и не претендует на то, что она работает на 100%. В действительности, когда реально начинаешь собирать устройство, где-нибудь что-нибудь точно да откажет: или драйвер не заработает, или температура неправильно рассчитана. Поэтому концепт — он и в Африке концепт.

Что касается алгоритма работы, то по температурам задатчиков он рабочий. Взят алгоритм из других источников и форумов. Собиралось по крупицам. Временные интервалы взяты с запасом и зависят от объема перегонного куба. Мой куб планируется литров на 20-25. Для куба объемом 5 литров (от скороварки), естественно, временные интервалы будут другими, заведомо меньшие.

Читать дальше →

+52

Durham Jul 10 2015 at 14:28

Простой метод для извлечения соотношений и фактов из текста

4 min

16K

Website development*Semantics*Machine learning*MeanoTek corporate blog

Ранее мы писали об анализе отзывов о ресторанах, с целью извлечения упоминаний разных аспектов (еды, обстановки, и подобного). Недавно в комментариях возник вопрос о извлечении из текста фактической информации, т.е. можно ли, например, из отзывов об автомобилях извлечь факты, например «быстро ломается коробка передач» => ломается(коробка передач, быстро), чтобы с этими фактами можно было потом работать. В этой статье мы опишем один из подходов к решению такой проблемы.

Метод, о котором мы расскажем, опирается на ряд упрощений, он не самый точный, но зато легок в реализации и позволяет быстро создать прототип приложения, в котором он должен использоваться. В ряде случаев его будет и вполне достаточно, а для других можно ввести усовершенствования, не отступая от основного принципа.

Читать дальше →

+11

qc-enior Jul 7 2015 at 11:25

Анализ тональности высказываний в Twitter: реализация с примером на R

10 min

19K

Data Mining*Инфопульс Украина corporate blogTwitter API*R*Data visualization*

Tutorial

Translation

Социальные сети (Twitter, Facebook, LinkedIn) — пожалуй, самая популярная бесплатная доступная широкой общественности площадка для высказывания мыслей по разным поводам. Миллионы твитов (постов) ежедневно — там кроется огромное количество информации. В частности, Twitter широко используется компаниями и обычными людьми для описания состояния дел, продвижения продуктов или услуг. Twitter также является прекрасным источником данных для проведения интеллектуального анализа текстов: начиная с логики поведения, событий, тональности высказываний и заканчивая предсказанием трендов на рынке ценных бумаг. Там кроется огромный массив информации для интеллектуального и контекстуального анализа текстов.

В этой статье я покажу, как проводить простой анализ тональности высказываний. Мы загрузим twitter-сообщения по определенной теме и сравним их с базой данных позитивных и негативных слов. Отношение найденных позитивных и негативных слов называют отношением тональности. Мы также создадим функции для нахождения наиболее часто встречающихся слов. Эти слова могут дать полезную контекстуальную информацию об общественном мнении и тональности высказываний. Массив данных для позитивных и негативных слов, выражающих мнение (тональных слов) взят из Хью и Лью, KDD-2004.

Реализация на R с применением twitteR, dplyr, stringr, ggplot2, tm, SnowballC, qdap и wordcloud. Перед применением нужно установить и загрузить эти пакеты, используя команды install.packages() и library().

Читать дальше →

+16

nikitasius Jul 3 2015 at 09:49

Facebook удалил пост замглавы Роскомнадзора

1 min

33K

Social networks and communities

Пятничное утро на то и пятничное, что ознаменует окончание рабочей недели, наступающие выходные (кому-как) и несет в себе солнечный летний позитив и, местами, «факапы» понедельника.

Сегодняшнее оказалось вдвойне приятнее и слаще чем «твикс левый» и «твикс правый» вместе взятые.

Читать дальше →

+60

191

AlexGechis Jun 18 2015 at 15:19

У семи программистов адрес без дома

4 min

97K

Website development*System Analysis and Design*Algorithms*Geoinformation services*HFLabs corporate blog

Привет, Хабр!

Мы в HumanFactorLabs парсим адреса в особо крупных размерах. Наши продукты упрощают ввод контактных данных и работу с ними.

За 10 лет работы в результате анализа многочисленных исключений в российских адресах мы выработали правила хранения адресов, при соблюдении которых вы не потеряете важную информацию.

Недавно на Хабре нас попросили привести примеры необычных адресов, в связи с чем и написана эта статья.

Читать дальше →

+98

211

babi4 Jun 16 2015 at 14:46

Генотипируем гиков: опыт полевой генетики

4 min

9.6K

Popular scienceBiotechnologiesHealth

У нас было четыре центрифуги, тысяча пипеток Пастера, наборы реактивов, морозилка на минус двадцать, термоциклер, форезная камера и трансиллюминатор, который включался, только если нажать off. Единственное, что вызывало сомнения, — как мы будем делать ПЦР в полевых условиях, но мы знали, что рано или поздно мы попробуем и это.

Мы сделали это впервые на московском ГикПикнике 13-14 июня в парке Красная пресня. Расставили столы, рассадили волонтеров, наварили агарозного геля в микроволновке из нашего офиса (получались прекрасные брикеты прозрачного, как слеза младенца, холодца для электрофореза) и начали генотипирование. Хотелось показать всем, что генетика — это весело!

Читать дальше →

+21

Durham Jun 2 2015 at 14:21

Автоматическая генерация осмысленных уникальных текстов

6 min

96K

Website development*Search engines*Semantics*Machine learning*MeanoTek corporate blog

Каждый веб-оптимизатор знает, что для того чтобы сайт любили поисковики, он должен содержать уникальные тексты. Причем не абы какие наборы слов, а осмысленные предложения, желательно по теме сайта. Особо это проблема для агрегаторов, которые берут информацию с других сайтов, и интернет-магазинов, где параметры и данные о товарах в целом одинаковые. Поэтому стандартная практика в этой ситуации — заказывать уникальные тексты копирайтерам. Стоимость такого удовольствия от 50 до 300 руб. за 1000 знаков. Если на вашем сайте 10000 страниц, то уникальные тексты быстро становятся значительной статьей расхода.

В этой статье поговорим методах алгоритмической генерации текстов и расскажем о нашем опыте работы с ними.

Читать дальше →

+21

rocknrollnerd Jun 2 2015 at 10:30

Внезапный диван леопардовой расцветки

8 min

83K

Algorithms*Image processing*Machine learning*

Если вы интересуетесь искусственным интеллектом и прочим распознаванием, то наверняка уже видели эту картинку:

А если не видели, то это результаты Хинтона и Крижевского по классификации ImageNet-2010 глубокой сверточной сетью

Давайте взглянем на ее правый угол, где алгоритм опознал леопарда с достаточной уверенностью, разместив с большим отрывом на втором и третьем месте ягуара и гепарда.

Это вообще довольно любопытный результат, если задуматься. Потому что… скажем, вы знаете, как отличить одного большого пятнистого котика от другого большого пятнистого котика? Я, например, нет. Наверняка есть какие-то зоологические, достаточно тонкие различия, типа общей стройности/массивности и пропорций тела, но мы же все-таки говорим о компьютерном алгоритме, которые до сих пор допускают какие-то вот такие достаточно глупые с человеческой точки зрения ошибки. Как он это делает, черт возьми? Может, тут что-то связанное с контекстом и фоном (леопарда вероятнее обнаружить на дереве или в кустах, а гепарда в саванне)? В общем, когда я впервые задумался над конкретно этим результатом, мне показалось, что это очень круто и мощно, разумные машины где-то за углом и поджидают нас, да здравствует deep learning и все такое.

Так вот, на самом деле все совершенно не так.

под катом пятна

+142

141

3 4 ...

9 10