Круто кончено, но резюме на Hh и похожих площадках пишут не для девелоперов. Их пишут для ленивых эйчаров. Быстрые, простые, полные тегов и ключевых слов, чтобы висеть в поиске в первых страницах. Message broadcast если так понятнее. Без этого до второго этапа не добраться.
80 резюме с выхлопом в 1-го человека, лично для меня говорит только о том, что у Вас скорее всего огромные проблемы с основным проектом, бабла тратится на него немерянно и что если придет «вот-тот-самый-самый», то сразу все наладится и он вот прям всех спасет своей крутостью. От сюда и завышенные требования.
По опыту, если процесс разработки налажен, есть политика релизов, подготовки и проверки фич, то нанимать на флагманский проект можно даже джуниоров — они все равно ничего не сломают. Силенок и опыта не хватит спорить с архитектором.
Благодарю, теперь более-менее понятно. Получается, что нужно просто поменять лицензию на BSD. Так что, вопрос человеконенавсничества просто пропадет, ибо делал не только для себя )
Насчет заметки: лучше сделать краткую таблицу. Серьезно, эти лиценз-шиты и так огромны, и читать их ну вообще не охота.
А можно поподробнее, разу уж встала проблема с лицензией? Я просто не спец в вопросах лицензирования и ставил GNU GPL из соображений «делайте, что хотите на ваше усмотрение». А оказывается овчинка когти скрывает?
А при чем здесь парсинг? Парсинг в RE появился как полезный нарост с течением времени. Безусловно, грамматиками можно сделать все, но кому это надо? У них логика сложнее и часто вообще не практично их использовать. Ни в плане разработки, ни в плане конечного результата.
А, ну, они и сами не дураки, думаю, догадаются. Недостатки и плюсы регулярок описаны на википедии. А недостатки моей реализации исправляю, пока что, я сам.
За тем исключением, что экскаватором цветы не сажают =) На самом деле это только кажущееся общее назначение. Параллели были проведены заранее с уже существующими инструментами: чтобы не придумывать свой язык, я выбрал уже устоявшийся в обществе язык регулярных выражений, его даже лингвист без проблем выучит и просто следовал Майкрософтовскому Дзен в видении регулярок. Их используют везде и знает практически каждый. Чего я бы не сказал об ABBYY.
Я бы сказал, что некорректно сравнивать многофункциональную документо-дробилку и прикладной фреймворк для .NET на шаблонных коллекциях. Это же вообще разные задачи. Да даже если и можно их использовать (через обертку) так же удобно как в этой статье, то я не думаю, что это хорошая идея таскать за собой танкер вместо поплавка. Да и денежный вопрос как-то напрягает, не у всех есть возможность составить договор с ABBYY на круглую сумму.
Как правило все проблемы в лингвистике решаются двумя путями: эвристики в которых безбожно пишутся регулярки и словарные методы и машинное обучение. В данном случае лучше машинным обучением на разделителях. Почитайте на мейл ру, а так же в интернете. Есть много литературы на эту тему и качество у моделей часто высокое и достаточное для бизнес процессов.
Честно скажу, она не успела произвести на меня впечатления, так как я узнал о ней недавно :)
Я изначально делал упор на общедоступность и скорость. К сожалению, использовать явовские библиотеки стенфорда свободно нельзя (лицензия) и интероп — тоже не сахар. Кстати, за неимением функциональности явовский аналог медленнее. Бенчмарк я постараюсь выложить на гитхабе, как будет минутка.
Счётчик цикла ('axis') инициализируется значением 'bestAxis', однако условием выхода служит это же или меньшее значение, из-за чего не будет выполнено ни одной итерации цикла.
Это не условие выхода а условие входа. Цикл выполнится ровно один раз.
Единственное место, где я вижу для них перспективу в большинстве проектов — табличные списки разного формата и DataBaseStyle. Остальное просто убьет «сладостью» весь проект, ничего же не понятно будет.
Задачи с применением такого рода технологии есть в математических фреймворках и цель у нее там несколько иная, нежели удобство, а именно — объединение задач в одну и там не важна читабельность (математика жеж). Например, вычисление одновременно и мат ожидания, и дисперсии, чтобы два раза цикл не гнать, но это такой слабенький пример, есть и покруче.
80 резюме с выхлопом в 1-го человека, лично для меня говорит только о том, что у Вас скорее всего огромные проблемы с основным проектом, бабла тратится на него немерянно и что если придет «вот-тот-самый-самый», то сразу все наладится и он вот прям всех спасет своей крутостью. От сюда и завышенные требования.
По опыту, если процесс разработки налажен, есть политика релизов, подготовки и проверки фич, то нанимать на флагманский проект можно даже джуниоров — они все равно ничего не сломают. Силенок и опыта не хватит спорить с архитектором.
Насчет заметки: лучше сделать краткую таблицу. Серьезно, эти лиценз-шиты и так огромны, и читать их ну вообще не охота.
На выходных.
Я изначально делал упор на общедоступность и скорость. К сожалению, использовать явовские библиотеки стенфорда свободно нельзя (лицензия) и интероп — тоже не сахар. Кстати, за неимением функциональности явовский аналог медленнее. Бенчмарк я постараюсь выложить на гитхабе, как будет минутка.
Это не условие выхода а условие входа. Цикл выполнится ровно один раз.
Задачи с применением такого рода технологии есть в математических фреймворках и цель у нее там несколько иная, нежели удобство, а именно — объединение задач в одну и там не важна читабельность (математика жеж). Например, вычисление одновременно и мат ожидания, и дисперсии, чтобы два раза цикл не гнать, но это такой слабенький пример, есть и покруче.
А насчет бага интересно — там в лапше из кода могло лежать что-то по круче, ибо, «где пахнет — там и гнильца».
Почему было решено все делать через кривые безье?