Статьи / Профиль ganqqwerty / Хабр

Кул Домов @ganqqwerty

Code monkey

Профиль Публикации 25Комментарии 2.5KЗакладки 231

ganqqwerty 23 окт в 15:13

Машинный перевод нейросетками: несколько приёмов чтобы улучшить качество

Простой

2 мин

1.8K

Машинное обучение*Искусственный интеллектИзучение языков

Меня немного удивила статья уважаемых специалистов по локализации, сравнивающая разлиные движки перевода. По-моему, и гугловский, и яндексовский переводчики, и даже DeepL полгода как списаны в утиль и представляют исключительно исторический интерес.

Перевожу в последнее время только нейросетями и часто даже при наивном подходе получаю нормальные результаты. Наивный подход - это зайти в ChatGPT и написать "Please translate `大型アプデ！セルフレジの導入で大富豪となったスーパーマーケット経営ゲーム` from Japanese to English".

Лучше, конечно, будет обогатить запрос и дать нейросетке возможность уточнить область поиска слов. Контекст скармливаю следующим путем:

ganqqwerty 17 окт 2022 в 09:49

Декомпозируем регулярные выражения

7 мин

PHP*JavaScript*Программирование*Java*Регулярные выражения*

Туториал

Хороший код читается легко, как проза. Многие книги учат нас тому, как важно делить код на небольшие, повторно используемые, легко потребляемые блоки.

Но почему-то, в случае с регэкспами у программистов как будто появляется слепое пятно на чувстве стиля. Вот такая регулярка – совершенно обычное дело:

/^(0[1-9]|1[012])[- /.](0[1-9]|[12][0-9]|3[01])[- /.]((19|20)\d\d)$/

А чо не так-то?

+12

ganqqwerty 22 апр 2017 в 13:13

Тысячная избранная статья. Как устроено рецензирование в Википедии

8 мин

21K

КопирайтКраудсорсингНаучно-популярное

Туториал

21 апреля русская Википедия выбрала свою тысячную по счету Избранную статью: Двадцать восемь панфиловцев. Так выпало, что писал её, в основном, я. Интересно, что после этого я получил много вопросов о том, по каким критериям выбираются статьи. Пользуясь случаем, хотелось бы рассказать о том, как устроено общественное рецензирование в этом потрясающем краудсорсинговом проекте и как можно поднять свой уровень критического мышления, участвуя в написании энциклопедии.

А давайте ее удалим?

Сначала кто-то пишет маленькую статью, а кто-то другой сразу выставляет ее на удаление. Например, потому что она маленькая. Или потому что она по неактуальной теме.
Создается раздел обсуждения, такой как вот этот.

Обсуждение является не голосованием, а, скорее, дискуссией. Участники ругаются, апеллируя к правилам. Подводящий итоги (судья) взвешивает доводы за и против. Если принимается решение страницу оставить, об этом появляется соответствующая плашка на ее страничке обсуждения. После этого выставить на удаление статью становится значительно сложнее.