Pull to refresh
18
0
Алексей Серба @Aleksey

User

Send message
У меня те же самые опасения. Насколько я понимаю если услуги оказываются на периодической основе, то договоров будет море и за каждый транш (при сотрудничестве с иностранной компанией в которой по русски ничего подписывать особо не хотят). Мне интересно идут ли какие-нибудь банки (хотя бы Мск-Питер) на встречу и помогают/разьясняют что да как.
* А что за поля в этом csv файле? Некоторые поля это похоже просто id и догадаться сложно без имен столбцов.
* Есть ли у вас словари для столбцов с id?
А вы не пробовали выложить ваши Analyzer/Tokenizer/TokenFilter в саму библиотеку Lucene? В trunk-е проекта есть специальный модуль analysis, там этому самое место imho. Можно просто зафайлить Jira issue и приаттачить исходники. Вроде бы проблем с лицензией никаких нет и внимание ваша работа бы привлекла на порядок больше и квалифицированная помощь бы не заставила себя ждать.
Заказал эту модель как раз сегодня, через пару дней еду в командировку, заберу самостоятельно. Слышал отзывы людей которые заказывали и международную доставку (можно либо напрямую либо через shipito).
Интересная идея у Redbeacon. Вообще, мне кажется у нас не хватает локальных сервисов, даже популярного аналога yelp-а нет, простор огромен.
Оптимизация обьясняет только появление нескольких слоев, но не остальные претензии, как разный фон, отсутствие градиента, буквы от разных печатных машинок и тд, тд. Хорошим ответом должен стать ролик с инструкциями (разумными — оптимизация сойдет, но не 100 различных манипуляций) как можно повторить один в один получившийся результат, чтобы каждый мог проверить и посыпать голову пеплом.
Мне понравился ответ от компании Quora — «We’d point fingers, but we wouldn’t be where we are today without EC2»
Интересующимся темой советую посмотреть видео тренинги по технологиям Hadoop и смежным от компании Cloudera — www.cloudera.com/resources/?media=Video
Ага, на сессии Q&A были в основном не специфичные вопросы, а какие то ехидные наезды на Apache Foundation, XML и ынтырпрайз, крупность компании докладчика и так далее.
Ага, на сессии Q&A были в основном не специфичные вопросы, а какие то ехидные наезды на Apache Foundation, XML и ынтырпрайз, крупность компании докладчика и так далее.
Ухты, только что узнал про переименование проекта и подумал wtf? Спасибо за выжимку в чем сыр-бор то был — я бы тоже с киная убежал на гитхаб не раздумывая.
вроде как даже и по полям

Нет, к сожалению обновлять в документе только некоторые поля без переиндексации всего документа пока нельзя. В мейлинг листе было обсуждение как это можно реализовать, но пока конца еще не видно, так что я бы не обольщался.
Посмотрите стандартный spellchecker из Apache Lucene. Он также использует технологию n-gramm-ов, но его преимущество состоит в том, что при поиске подходящего термина используется не SQL OR конструкция, а полнотекстовый boolean-овский OR поиск с вычислением релевантности на основе TF-IDF, что дает гораздо лучшие результаты и в плане релевантности подсказки и в плане производительности.
Sun Microsystems собирается выйти на рынок Cloud Computing-а
Ждем 18 марта, посмотрим как говорится
network.com/
В Netbeans кстати maven2 проекты понимаются как родные — без промежуточной генерации проектных файлов.
В Idea теперь с этим также? Maven проекты понимаются как родные с зависимостями и прочим?
Из конструктива - тоже есть предположение что какой-нибудь messaging сильно облегчит все.
А по ощущениям, мне кажется что простоты не хватает :)

Information

Rating
Does not participate
Location
Санкт-Петербург и область, Россия
Date of birth
Registered
Activity