Как стать автором
Обновить

Комментарии 13

Моя первая статья и, надеюсь, не самая худшая. По крайней мере, я воздержался от ссылки на телеграмм в конце (чему помогло то, что у меня его нет).

Некоторые вещи оформились странно, потому что я, кажется, не разобрался до конца с редактором.

Я не понял на счет иллюстрированный, откуда брали иллюстрации?
Просто оставлю ссылку на словарь тут: https://enes.dict.cc
Где-то там есть возможность скачать словарь целиком - для не коммерческого использования. Вдруг кому-то пригодится.

Вообще я видимо неправильно употребил это слово, имея в виду текстовые примеры (типа проиллюстрировать примером). Сейчас уберу, спасибо.

И спасибо большое за словарь, изучу альтернативу. Я в принципе не удивлён, если проблема у меня возникла из-за недостаточно тщательного поиска.

Вот такой API есть
https://dictionaryapi.com/products/api-spanish-dictionary

FREE API

The Merriam-Webster Dictionary API is free as long as it is for non-commercial use, usage does not exceed 1000 queries per day per API key, and use is limited to two reference APIs.

COMMERCIAL USE

If your app is for commercial use (either monetized via ads or a paid fee), please contact us directly so we can approve use and develop business terms on a case-by-case basis.

Спасибо. Это видел, но, боюсь, если задача дойдет хотя бы до MVP, то мне понадобится существенно больше 1000 запросов в день. Ограничение-то довольно жесткое.

При этом кэшировать запросы та же лицензия запрещает.

Глаза немного вытекают от велосипедных решений того, что уже давно есть в Langchain: промптинг, многопоточный вызов, валидация ответа с помощью pydantic, ретрай в случае провала проверки и т.д.

Спасибо, в следующий раз учту. С Langchain немного имел дело, но в несколько ином аспекте -- писал агента. Так как здесь собственно чат-функций или длинных чейнов не было, то мне просто как-то не пришло в голову к нему обратиться.

Его лицензия даже дозволяет коммерческое использование API, однако:
6.1.2 You will not cache, store, or save Content.

6.1.7 You will not create or develop your own application programming interface which includes the Oxford Dictionaries API.(source)

Вот интересно, если отбросить морально-этические соображения, насколько данные "запреты" являются серьезными? Чтобы были какие-то последствия, для начала ведь надо, чтобы ваш продукт заметили. Другой момент после этого - доказать, что используемые вами данные были получены из их системы.

Да и в конце концов, если мы говорим об использовании в MVP или на старте проекта, то тут тем более никто никогда не обратит внимания на ваше приложение (имеются ввиду владельцы авторских прав, типа Oxford Spanish Dictionary). А уж позже, если идея выстрелит и станет расти и развиваться, тогда для успокоения души ничто не мешает пересобрать базу более легальным путем.

Да кто их знает. Я вот не специалист по авторскому праву даже близко и поэтому предпочёл сразу подстелить соломку.

Не знаю, насколько у Оксфорда развит департамент, который занят тем, что ходит по стартапам на ранних стадиях и снимает с них последние короткие штанишки за нелицензированное использование. Да в конце концов им ведь даже в суд не нужно подавать -- достаточно грохнуть доступ к API в ночь перед презентацией инвесторам и привет.

Думаю вполне развит, кстати напомнило что база почтовых кодов британии всегда содержит несуществующие коды-watermark'и для как раз именно подтверждения того что сервис использующий поиск по почтовым кодам имеет нелецинзионную базу. В вашем случае это могут быть фиктивные слова термины, но вы же их отфилтровываете.

Подскажите, а почему вы не захотели примеры в reverso взять? У них неофициальное api есть. Про коммерческое использование ничего не увидел, может плохо смотрел?)

Про Reverso не подумал, у них база большая. Другое дело, что она надергана из сторонних источников -- интересно, как они копирайт оформили.

Ближайшее что я нашел в связи с коммерческим использованием это:

Reverso is the publisher, designer, author and owner of the pages, interface and functions related to Reverso software products and online services.

The interface and all its components, methods and designs are the exclusive property of Reverso. Translation engines and other components are the property of Reverso and its partners. They are protected by international copyright laws, applicable in all countries that have signed international copyright agreements.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории