Ну да, скажем пару раз в день снимает камера на автобусной полосе. Если сейчас за это 300р. то за 20 рабочих дней будет 12000. С июля будет уже 60000 afair.
Мне кажется вполне себе адекватная стоимость абонемента для спешащих.
Ужос.
Для меня двумя самыми весомыми аргументами при покупке серии ноутов серии thinkpad были нормальная клавиатура и нормальная матрица. Не глянцевая, и не 16:9.
Мне всегда забавно читать такие тексты. С одной стороны вроде как о конкретных вещах, а с другой ни о чем. С одной стороны, есть конкретные задачи, вроде выделения ключевых слов, определения тематики текста, морфологического и синтаксического анализа, определения тональности текста. С другой — пафосные словеса о понимании текста. Это при том, что _открытых_ материалов по анализу текстов, исследованию языка много.
По крайней мере в конкретных задачах есть постановка задачи и можно анализировать ошибки. А в пространных рассуждениях — ну да, можно высказать свое мнение. Но никакого критерия оценки правильности нету.
> По тексту определить идеологию автора (правая/левая).
Весьма вероятно, что это решается на уровне ключевых слов/тематики.
> Проанализировав текст, вывести ':)', если текст велелый и ':(', если текст грусный.
Это задача определения тональности текста. По-английски, это называется sentiment analysis.
Насколько я понимаю, причин было несколько.
Во-первых, это первое соревнование в рамках Диалога и поэтому у организаторов не было опыта организации подобных соревнований.
Во-вторых, это делалось для стимулирования потенциальных участников к участию — это дает свободу получить обратную связь на свою систему, не называя ее.
Но наиболее интересно было бы построить pos-tagger с расширенными характеристиками, который предсказывал не только часть речи, но и род, число, падеж и прочие.
Таки вопрос был почему скажем не взять heritrix, допилить под себя и запустить?
С календарями проблема не в том, что считает автор, а в том, как от отфильтровать 100500 страниц календарей от реального контента. Это задача уже автора поисковика.
Я не совсем понимаю целевого назначение такой платы. С одной стороны mini-itx, с другой 10 сата.
Для большого числа винтов место нужно, или активное охлаждение. А для этого проще обычный корпус уже.
Опять же, куда в домашних условиях 4! сетевых контроллера?
Ну и стоить она будет имхо от $300, даже больше скорее всего.
Я бы еще упомянул JSoup. Она быстрее htmlcleaner раза в 2, по крайней мере в JavaSE.
Ее плюсы в относительной простоте кода и удобных CSS-подобных селекторах.
Как уже говорилось, надо было измерять на HotSpot.
Во-вторых, да, тут много примеров как делать не надо.
Например — исключения для управления. На практике, это очень тормозная операция. По опыту могу сказать, что отказ от такого рода управления в пользу традиционного может дать прирост в несколько раз(если исключения кидались особенно интенсивно).
Мне кажется вполне себе адекватная стоимость абонемента для спешащих.
По крайней мере у меня получилось.
Для меня двумя самыми весомыми аргументами при покупке серии ноутов серии thinkpad были нормальная клавиатура и нормальная матрица. Не глянцевая, и не 16:9.
По крайней мере в конкретных задачах есть постановка задачи и можно анализировать ошибки. А в пространных рассуждениях — ну да, можно высказать свое мнение. Но никакого критерия оценки правильности нету.
> По тексту определить идеологию автора (правая/левая).
Весьма вероятно, что это решается на уровне ключевых слов/тематики.
> Проанализировав текст, вывести ':)', если текст велелый и ':(', если текст грусный.
Это задача определения тональности текста. По-английски, это называется sentiment analysis.
Во-первых, это первое соревнование в рамках Диалога и поэтому у организаторов не было опыта организации подобных соревнований.
Во-вторых, это делалось для стимулирования потенциальных участников к участию — это дает свободу получить обратную связь на свою систему, не называя ее.
Еще замечу, что большинство проблем возникает с [около] служебными словами например: и, как, что тот, все и т.д., а не словами типа бокрёнок и куздра.
Кроме того, state-of-the-art для русской морфологии приведен в: Ляшевская О.Н., Астафьева И., Бонч-Осмоловская А., Гарейшина А., Гришина Ю., Дьячков В., Ионов М., Королева А., Кудринский М., Литягина А., Лучина Е., Сидорова Е., Толдова С., Савчук С., Коваль С. «Оценка методов автоматического анализа текста: морфологические парсеры русского языка». Тогда на Диалоге проводось соревнование по морфологии.
Но наиболее интересно было бы построить pos-tagger с расширенными характеристиками, который предсказывал не только часть речи, но и род, число, падеж и прочие.
Будут ли семинары регулярными?
С календарями проблема не в том, что считает автор, а в том, как от отфильтровать 100500 страниц календарей от реального контента. Это задача уже автора поисковика.
Другой вопрос — как фильтруете календари — от них можно получить 100500 ссылок и больше.
Для большого числа винтов место нужно, или активное охлаждение. А для этого проще обычный корпус уже.
Опять же, куда в домашних условиях 4! сетевых контроллера?
Ну и стоить она будет имхо от $300, даже больше скорее всего.
Школьником баловался.
Ее плюсы в относительной простоте кода и удобных CSS-подобных селекторах.
Как уже говорилось, надо было измерять на HotSpot.
Во-вторых, да, тут много примеров как делать не надо.
Например — исключения для управления. На практике, это очень тормозная операция. По опыту могу сказать, что отказ от такого рода управления в пользу традиционного может дать прирост в несколько раз(если исключения кидались особенно интенсивно).
Еще полезно посмотреть доклад «Performance Anxiety» Joshua Bloch.
Опять же, кто мешает использовать blas? Или написать обертку для нативных библиотек?