У меня те же самые опасения. Насколько я понимаю если услуги оказываются на периодической основе, то договоров будет море и за каждый транш (при сотрудничестве с иностранной компанией в которой по русски ничего подписывать особо не хотят). Мне интересно идут ли какие-нибудь банки (хотя бы Мск-Питер) на встречу и помогают/разьясняют что да как.
* А что за поля в этом csv файле? Некоторые поля это похоже просто id и догадаться сложно без имен столбцов.
* Есть ли у вас словари для столбцов с id?
А вы не пробовали выложить ваши Analyzer/Tokenizer/TokenFilter в саму библиотеку Lucene? В trunk-е проекта есть специальный модуль analysis, там этому самое место imho. Можно просто зафайлить Jira issue и приаттачить исходники. Вроде бы проблем с лицензией никаких нет и внимание ваша работа бы привлекла на порядок больше и квалифицированная помощь бы не заставила себя ждать.
Заказал эту модель как раз сегодня, через пару дней еду в командировку, заберу самостоятельно. Слышал отзывы людей которые заказывали и международную доставку (можно либо напрямую либо через shipito).
Оптимизация обьясняет только появление нескольких слоев, но не остальные претензии, как разный фон, отсутствие градиента, буквы от разных печатных машинок и тд, тд. Хорошим ответом должен стать ролик с инструкциями (разумными — оптимизация сойдет, но не 100 различных манипуляций) как можно повторить один в один получившийся результат, чтобы каждый мог проверить и посыпать голову пеплом.
Ага, на сессии Q&A были в основном не специфичные вопросы, а какие то ехидные наезды на Apache Foundation, XML и ынтырпрайз, крупность компании докладчика и так далее.
Ага, на сессии Q&A были в основном не специфичные вопросы, а какие то ехидные наезды на Apache Foundation, XML и ынтырпрайз, крупность компании докладчика и так далее.
Ухты, только что узнал про переименование проекта и подумал wtf? Спасибо за выжимку в чем сыр-бор то был — я бы тоже с киная убежал на гитхаб не раздумывая.
Нет, к сожалению обновлять в документе только некоторые поля без переиндексации всего документа пока нельзя. В мейлинг листе было обсуждение как это можно реализовать, но пока конца еще не видно, так что я бы не обольщался.
Посмотрите стандартный spellchecker из Apache Lucene. Он также использует технологию n-gramm-ов, но его преимущество состоит в том, что при поиске подходящего термина используется не SQL OR конструкция, а полнотекстовый boolean-овский OR поиск с вычислением релевантности на основе TF-IDF, что дает гораздо лучшие результаты и в плане релевантности подсказки и в плане производительности.
В Netbeans кстати maven2 проекты понимаются как родные — без промежуточной генерации проектных файлов.
В Idea теперь с этим также? Maven проекты понимаются как родные с зависимостями и прочим?
* Есть ли у вас словари для столбцов с id?
Нет, к сожалению обновлять в документе только некоторые поля без переиндексации всего документа пока нельзя. В мейлинг листе было обсуждение как это можно реализовать, но пока конца еще не видно, так что я бы не обольщался.
Ждем 18 марта, посмотрим как говорится
network.com/
В Idea теперь с этим также? Maven проекты понимаются как родные с зависимостями и прочим?
А по ощущениям, мне кажется что простоты не хватает :)
Что Вы считаете своим наивысшим достижением за это время?
Наверно, карты.
В сервисе Google Maps стали доступны полностью русифицированные карты России. Пользователям доступны карты крупных городов (таких, как Москва, Санкт-Петербург, Казань, Екатеринбург и т.д.), включая все автодороги, станции метро и номера домов.
Действительно, мне кажется что это очень полезное начинание.