Comments / Profile of kzn / Habr

Антон Казенников @kzn

Пользователь

kzn Jan 28 2011 at 20:51

Это если есть соответствующие индексы. Иначе все равно всю базу сканить придется.
Да и не во всех NoSQL есть сортировка.

Look

Реляционные базы данных обречены?

kzn Jan 28 2011 at 20:43

Реляционной? Имхо достаточно очевидно — вопрос надежности. Если база потеряет данные — это очень плохо. Если кеш — то не очень.

Look

Реляционные базы данных обречены?

kzn Jan 28 2011 at 10:58

1. Ок. Имеем Primary Key + BLOB. BLOB — может быть каком угодно формате. Скажем, JSON. В чем сложность? Если запросы не по индексу, все равно нужно просматривать все записи.
2. Суть в том, что просто SQL не бывает. Так же как NoSQL
3. А что? в sql глазами данные посмотреть сильно проще.

Look

Реляционные базы данных обречены?

kzn Jan 28 2011 at 08:47

Имхо:
1. Чем принципиально NoSQL отличается от простых запросов по primary key?
2. SQL плох тем, что у каждого производителя СУБД свой диалект.
3. Делать аналитику на SQL сильно проще.
4. Интересным подходом кажется HandlerSocket + MySQL — обход SQL уровня и прямой доступ к таблицам по ключам.

Look

15000 день unix эпохи

kzn Jan 26 2011 at 07:44

Ждать слишком долго придется.

Look

15000 день unix эпохи

kzn Jan 26 2011 at 07:39

Логичнее ждать 16384й день :-)

Look

Как же всё-таки на самом деле хабрачеловек «обманывал» бабушек…

kzn Jan 19 2011 at 20:28

Прочитал исходный топик, ответы, этот. Официальную реакцию. Странно выглядит.

Вспоминается анекдот: «А потом пришел лесник и всех разогнал».

Look

Точка, точка, запятая: машинное обучение

kzn Jan 19 2011 at 15:10

Спасибо.

Look

Точка, точка, запятая: машинное обучение

kzn Jan 19 2011 at 12:17

Спасибо. Интересно.
А какой у вас объем обучающей/проверочной выборки? И, собственно, откуда набор данных? Сами размечали?

А какие признаки из html вы используете? Вряд ли система предназначена для работы на plain-text.

Look

Про техники оптимизации

kzn Jan 3 2011 at 09:15

Да-да. По коду видно, что это какие-то вычисления. Автору было бы неплохо написать, что этот код решает такую-то задачу. Конечно можно по функциям сидеть и разбирать и найти известные алгоритмы, но у меня не возникает желания напрягать мозг для этого.

+10

Look

Латентно-семантический анализ

kzn Dec 20 2010 at 08:34

Еще плюс — Портер от словаря не зависит

Look

Латентно-семантический анализ

kzn Dec 20 2010 at 08:32

Не совсем так. При использовании AOT потребуется еще один шаг — разрешение возможной омонимии.
В этом смысле Портер лучше :)

Look

Не инженеры и не серверы, а время

kzn Dec 8 2010 at 08:28

По вашим же словам следует считать не время, а экономический эффект.

Look

Комментарии в коде — полезные, бессмысленные, вредные?

kzn Nov 29 2010 at 14:29

Нет. Сворачивание методов/комментариев/блоков кода. Тогда на экране они не занимают лишнее место.

Look

Комментарии в коде — полезные, бессмысленные, вредные?

kzn Nov 29 2010 at 12:09

Откройте для себя фолдинг?
В нормальных редакторах он есть.

Look

NLP: проверка правописания — взгляд изнутри (часть 3)

kzn Nov 29 2010 at 11:17

Смотреть не только на отдельные словоформы, но и на контекст, кажем ± 2 слова.
Насколько я понимаю, примерно так работает hmm-подход(конечно, в этом случае есть только левый контекст).

Кроме того, скорее всего это очень сильно зависит от количества тегов — есть же деление на fine-grained POS, и coarse-grained POS.

Look

NLP: проверка правописания — взгляд изнутри (часть 3)

kzn Nov 29 2010 at 10:57

Насколько я понимаю, еще один вариант POS Tagging — это обучение без учителя. Т.е. скорее всего можно взять много текстов, поделить их по словоформам и выделить классы. Вероятно, что эти классы будут более-менее соответствовать частям речи.

Ну и возможны смешанные варианты, конечно(semisupervised learning).

Look

Задача по Java Core

kzn Nov 16 2010 at 09:10

Еще потенциальный ответ :)
Не скомпилируется, если java < 1.5 из-за vararg

Look

Задача по Java Core

kzn Nov 16 2010 at 09:08

Не отменяет :) но облегчает жизнь. В частности для вышеприведенной задачки.
Я не вижу особого смысла в задачках на лексический анализ(читай буквоедство), когда соль задачки в том, что «не скомпилируется, потому что вот тут забыли ';' поставить».

Классический i+++++i тоже не всегда полезен, потому как такого кода не должно быть, независимо от того понимает написавший тонкости работы или нет — читать это очень сложно.

Это примерно как проверка орфографии сложных слов. Оно конечно коррелирует с кругозором и умением излагать свои мысли, но это не строгая зависимость.

Look

Задача по Java Core

kzn Nov 16 2010 at 08:39

Имхо, недостаток таких задач в том, что если знать о существовании такой задачи, то все тривиально.
Ну и я не очень понимаю их смысла, IDE для того и нужен, чтобы все красиво и понятно раскрасить, а не заставлять
программиста делать лексический анализ в голове.

-2

Look

1 2 ...

6 7

9 10 11 12