Комментарии / Профиль Trept / Хабр

Александр@Trept

Пользователь

ПрофильСтатьи6ПостыНовостиКомментарии357

Что такое на самом деле Big Data и чем они прекрасны. Лекция Андрея Себранта в Яндексе

Trept 3 мар 2014 в 09:22

У меня одного впечатление, что заново открывается математическая статистика?

Сделан важный шаг на пути к лазерному термоядерному синтезу

Trept 14 фев 2014 в 08:22

Через 100 лет не только ишак, но и все остальные не увидят результатов такого прогноза.
Вряд ли стоит что-либо прогнозировать на такой срок.
Ведь на другие планеты мы сейчас не летаем, как считали 50 лет назад, того же термояда нет, подводных городов, да и летающих автомобилей тоже не предвидится, про ИИ разговор (среди специалистов, а не фантастов) идет тоже уже лет 40.
А вот закон Мура работает.

Генпрокуратура РФ провела заседание экспертной группы по вопросам Bitcoin

Trept 7 фев 2014 в 10:31

Экстраполируя Сноудена, можно предположить, что Ваш алгоритм АНБ либо уже реализовала, либо реализует в ближайшее время.

Уроки космических катастроф

Trept 28 янв 2014 в 13:25

Как говорили в популярном фильме «Жить захочешь — не так раскорячишься» :)
А если серьезно, то человек не слишком представляет, какие у него возможности могут проявиться, когда речь заходит о жизни и смерти. Есть известная байка о парашютисте, который разорвал руками прочнейшую сумку с парашютом, когда тот не выходил штатным образом. Знаю хорошую книгу В.Санина «Одержимый» о капитане, который рисковал судном и жизнью, экспериментируя с обледенением.

Уроки космических катастроф

Trept 28 янв 2014 в 08:55

Отношение было действительно простое, но чуть иное: государство США — враг. Там было симметрично: Империя Зла.
А вот отношение к рядовым американцам, тем более, к космонавтам, очень хорошее.
Думаю, и у американцев было что-то похожее. Не зря «Москва слезам не верит» получил Оскара.
Ученые наши серьезно сотрудничали и в космосе, и в медицине, и в метеорологии, несмотря на серьезнейшую конкуренцию.
Сейчас о конкуренции давно забыли. Правда, космос и ВПК еще держатся, но с научным прогрессом никак.

Тройной удар для Рунета: идентификация пользователей, контроль сайтов и электронные платежи

Trept 16 янв 2014 в 14:18

У СБ уже есть какая-то инфа об этом пользователе, раз запрашивают. Хотите рискнуть?

Тройной удар для Рунета: идентификация пользователей, контроль сайтов и электронные платежи

Trept 16 янв 2014 в 14:10

Не будьте таким пессимистом, разъяснение от Webmoney последует быстро, как примут закон, а может, и раньше.
С Росфинмониторингом играться себе дороже.

Система поиска плагиата

Trept 6 дек 2013 в 13:12

Отличная работа, коллега!
По Вашему условию пример нашего проекта в этой области.
А по поводу Вашего алгоритма одно предложение: Вы используете тф*идф для предложений, тогда, может, стоит применить его для оценки слов документа, чтобы выкинуть совсем незначащие. Таким образом можно сократить количество шинглов. Также можно оптимизировать количество запросов к поисковикам, запрашивая в первую очередь наиболее значимые шинглы.

Автомобиль на алюминиевом топливе

Trept 4 дек 2013 в 11:55

Плюс основной один: исключаются потери при транспортировке электроэнергии.
Это полный аналог «водородной энергетики».
Водород, конечно, выгоднее и чище сжигать, но опять же трудно транспортировать, да и не слишком безопасно.

Лексикон Хабра

Trept 29 ноя 2013 в 13:11

Думаю, Ализар многим интересен.

Лексикон Хабра

Trept 29 ноя 2013 в 12:24

Дальше можно и углубиться в это исследование.
Построить аналогичные словари для различных срезов Хабра.
Например, для популярных тегов, или плодовитых авторов, блогов компаний.
Здесь будет интересный вопрос, по чему взвешивать: по НКРЯ или всему Хабру. Во втором случае мы получим отличие словаря автора от словаря Хабра. Минус в этом случае — меньшая устойчивость результатов из-за меньшего объема текстов Хабра по сравнению с НКРЯ.

Лексикон Хабра

Trept 29 ноя 2013 в 11:48

Сходу контекстно-независимых не вспомнил. Примеры можете привести?

Лексикон Хабра

Trept 29 ноя 2013 в 11:46

В Хабре 1178-е по частоте или по G-мере?

Самые часто употребляемые слова на Хабре

Trept 26 ноя 2013 в 12:55

Аппетит приходит во время еды, пардон за банальность.
Может, у Вас руки дойдут и до тф*идф, ведь абсолютная частотность, как мы видим из Вашего примера (большое спасибо за работу!), практически не показывает реального лексикона, кроме тривиального.

Самые часто употребляемые слова на Хабре

Trept 26 ноя 2013 в 07:57

Для определения «контрасности» слов используется мера TF-IDF, или ее модификации, одной из лучших считается BM25.
Конечно, результат сильно зависит от покрывающего множества (корпуса) текстов, он должен быть достаточно большим и тематически взвешенным. Для последнего, к сожалению, сколь-нибудь продуктивного определения нет.
В качестве такого корпуса можно взять НКРЯ. Здесь его самые частотные словоформы.
Интересно таким же образом посчитать и биграммы Хабра.

Blippex — википедия поиска

Trept 29 окт 2013 в 07:26

И Яндекс и Гугл давно уже используют анализ поведения пользователей, в частности, заход на сайты и время, проведенное на отдельных страницах для ранжирования результатов. Инструменты для этого — браузеры Хром и Яндекс, Я.Элементы.
Чем Ваш подход лучше?

Сноуден пролил свет на ситуацию со взломом криптографии. Все плохо

Trept 6 сен 2013 в 12:39

Это не совсем то, что Вы утверждали.
Согласно Вашей цитате в группировке (а Анонимусы — группировка), одни агенты. Зачем там кого-то ловить?
А вот для выполнения заказов такая группировка вполне годится.

Сноуден пролил свет на ситуацию со взломом криптографии. Все плохо

Trept 6 сен 2013 в 07:07

Согласно этой логике Анонимусы состоят почти сплошь из шпиков, поскольку они — несомненная цель для спецслужб. Следовательно, выполняют заказы. Не противоречит ли это фактам?

-2

Пересёк границу — потерял электронные книги

Trept 19 авг 2013 в 10:09

Вы сами и ответили: для части обладателей Киндл.

Пересёк границу — потерял электронные книги

Trept 19 авг 2013 в 08:51

А еще цена определяется монополией.
Киндл — такая же монополия, как РЖД. Вроде, есть альтернативы (самолет, автомобиль), но для большого класса людей — нет.

1 2 3 4

6 7 ...

17 18