Comments 43
Это здорово конечно, но грустно было не увидеть Dart, хотя Яндекс вроде как активно его продвигает(
популярные языки
нет php
гениально
C# тоже нет
И Rust нет, к сожалению
и Haskell (
И Common Lisp :(
и даже Scheme!
Неужели и Erlang не завезли? Не любят в Яндексе функциональные языки, эх не любят
И ассемблера нет. И VHDL... И Cobol обидели :(
А если серьезно - на самом деле, базовая поддержка есть. И это за счет того, что в претрейне приличное количество кода. Список языков, которые поддерживаются - это список того, что было обкатано внутри и показало хорошую эффективность внутри и по метрикам и по пользовательскому фидбеку.
Более того, для того же самого VHDL помощник используется командами, но мы по нему не гоняли тесты на приемку -задачи такой просто не стояло. Но если будет большой запрос - конечно углубимся, раскопаем и сделаем максимально. Файнтюн под такое хорошо заходит.
Вот буквально сейчас решил написать что-то очень простое на asm (строчку вывести 0х80м прерыванием) - CA все правильно закинул в eax/ebx и сдеал вызов.
Пробуйте, тестируйте на своих задачах - возможно, будет достаточно базовой поддержки. Возможно - нет, это повод нас попинговать и попросить реализовать.
Да там даже нет 1с вы о чём вообще
Зато есть JSON :)
помогать разработчикам с написанием кода и делать их счастливыми
Судя по статистике чтобы делать разработчиков счастливыми нужно переписывать их код на расте.
Только поддержка языков программирования планируется? Или со временем SQL, PlantUML, Swagger и т.п. тоже будут доступны?
Не вижу поддержки Groovy...
Нужен rust
А что с плагином для jetbrains?
В пути. Надеюсь, что скоро сможем открыть для скачивания.
Готова версия плагина для JetBrains - https://yandex.cloud/ru/docs/code-assistant/quickstart#install-plugin
Поддерживается работа с IDE версий 2024.1 и 2024.2.
Мой emacs уже похож на теремок из сказки, сначала подселился leonardo, потом gpt-3.5-turbo, gh copilot и т.д. теперь ждем когда откроют API от YCA.
Очень нужна еще поддержка языка 1С и плагин для Eclipse, чтобы это можно было использовать в IDE 1C:EDT (которая на базе Eclipse разработана).
Реквестую C# и плагин для Visual Studio ("большой" студии, не Code)
лучше как раз для Code-а, потому что "большая" студия в РФ недоступна для корпоративного использования, только для личного. напоминаю, что с 22 года наша жизнь все сильнее меняется в сторону отказа от платных западных инструментов, их приходится пиратить банально, а долго так продолжаться не может - нужно заменять
Спасибо за статью, рад, что Яндекс сделал такого помощника. Может, дойдут руки испытать. Есть пожелание к авторам Яндекса: более уважительно относиться к русскому языку. Понимаю, профессиональный сленг и всё такое (сам пишу на C++). Но лучше всё же поступать более дальновидно и не ставить под угрозу самобытность русского языка и независимость страны.
Вот какие необоснованные, на мой взгляд, англоречия и просто слова на английском есть в этой статье. Сразу пишу и замены.
стейтмент — выражение;
прокси-метрика — упрощённая метрика;
прокси — прокладка, посредник;
асессор — оценщик;
ассистент — помощник;
балансер — распределитель;
датасет — набор данных;
инференс — вывод, выведение;
кейс — случай;
контекст — окружение;
претрейн — предобучение;
пул — набор;
продакшн — бой, боевая среда;
рандомный — случайный;
репозиторий — хранилище;
саджест — предложение;
сэмпл — выборка;
файнтюнить — тонко настраивать;
target — цель;
retention — сохранение, оставление;
split — разбиение, разделение.
Вы дома, в быту уже перестали использовать заимствованные слова? Телефон называете "устройством для разговоров на расстоянии при помощи радиоволн"?
Не стоит сводить данный вопрос к крайностям, мол, или полностью отказывайтесь от заимствований, или молчите в тряпочку даже тогда, когда англоречиями заменяют существующие русские слова. Последнее является неуважением к русскому языку и России. Пишет ли кто-то в англоязычной статье про ИИ слова вроде «vyrazheniye», «sluchay», «hranilische», «predobucheniye»? Если нет, то зачем мы втаскиваем англоречия в русский?
Зато пишут sputnik
Уважение сначала надо заслужить своими разработками и экономическим ростом. Тот, кто вещь изобретает, тот и решает, как она будет называться
Думаю, речь идет больше о стилистике. Заголовок из статьи в качестве примера:
Правильные target и датасет — залог успеха
почему target на английском а датасет по-русски?
в одном месте используется: метрику UnitTest, в другом юнит‑теста
Насколько знаю, слово sputnik они используют только для обозначение того первого спутника, запущенного Советским Союзом. А для всех остальных спутников используют слово satellite. Можно даже по частоте упоминания в поисковых запросах сравнить: https://trends.google.ru/trends/explore?date=all&q=sputnik,satellite&hl=ru . Sputnik используется намного реже. То же касается и слова «луноход»: хотя мы первые его создали и запустили, на Западе не используют это слово для обозначения всех подобных аппаратов, а используют слово rover (lunar rover, space rover, Mars rover и т.п.). Потому что англоязычные страны уважают свой язык.
«Тот, кто вещь изобретает, тот и решает, как она будет называться» — что-то в мире постоянно изобретают: что-то в США, что-то в Германии, что-то во Франции, что-то в России, что-то в Китае, что-то в Японии. Если следовать вашему подходу, тогда, получается, все языки в мире со временем должны перемешаться? Мне кажется, это нелепость.
Кроме того, ведь не США или Англия изобрели такие понятия, как «выражение», «помощник», «случай», «хранилище», «предложение» и т.д.
И потом, самолёт, пароход, холодильник и много чего ещё открыли или создали впервые не в России, но назвали русскими словами. Мне кажется, нам просто нужно последовать этому доброму примеру.
Насколько знаю, слово sputnik они используют только для обозначение того первого спутника, запущенного Советским Союзом.
Да, слишком уж давно это было.
Однако, wiktionary дает более широкое значение слова sputnik в английском с пометкой dated, и в польском с пометкой colloquial: https://en.wiktionary.org/wiki/sputnik
Если следовать вашему подходу, тогда, получается, все языки в мире со временем должны перемешаться?
А они и перемешиваются в плане специфической терминологии. В русском терминология в IT взята из английского, в музыке из итальянского, а в навигации из немецкого и голландского.
Кроме того, ведь не США или Англия изобрели такие понятия, как «выражение», «помощник», «случай», «хранилище», «предложение» и т.д.
При заимствовании слово начинает указывать на контекст; это помогает лучше понимать текст.
"Помощник" может означать много разных вещей, а assistant - это чатбот.
Кроме того, разные переводчики переводят термины по-разному, и иногда реально трудно по переводу понять, что же там было в оригинале.
При заимствовании слово начинает указывать на контекст; это помогает лучше понимать текст.
Это очень спорно. Например, ваша статья посвящена помощники на основе искусственного разума, который помогает писать код на различных ЯП. В начале статьи вы пишете:
«В статье расскажем, для чего мы сделали кодового ассистента».
Всё, теперь контекст задан совершенно точно. И если бы вы написали:
«В статье расскажем, для чего мы сделали кодового помощника», а потом написали бы:
«Что умеют современные AI-помощники»
«Сами создатели популярных кодовых помощников любят приводить эту статистику»
«Сегодня 15% от всего кода за день разработчик пишет с помощью помощника»
и т.д., ни у кого никакого недопонимания не возникло бы.
Кроме того, разные переводчики переводят термины по-разному, и иногда реально трудно по переводу понять, что же там было в оригинале.
Вот это действительно неприятное затруднение. Если сравнить, например, с учебником по какому угодно предмету, то ясно, что не далеко мы бы уехали, если бы разные их авторы называли одни и те же понятия разными словами. Здесь нужны какие-то решения на уровне государства, видимо, какие-то терминологические советы, которые бы утверждали единые слова для соответствующих предметных областей. Кстати, в Советском Союзе, насколько я знаю, такие учреждения были.
ваша статья
статья не моя
ни у кого никакого недопонимания не возникло бы
это если читать статью целиком. сегодня много информации люди получают фрагментарно, чтобы экономить время
какие-то терминологические советы
а не проще ли оставлять иностранный термин в оригинальном виде? зачем тратить деньги налогоплательщиков на всякие советы?
статья не моя
Извините, был невнимателен.
а не проще ли оставлять иностранный термин в оригинальном виде? зачем тратить деньги налогоплательщиков на всякие советы?
Обратите внимание, что не только иностранная терминология заимствуется, но и исконные русские слова заменяются на заимствованные: «стоянка» на «паркинг», «сражение, состязание, битва» на «батл», «ложь, утка, обман, вымысел» на «фейк», «скидка» на «дисконт», «прозрачный» на «транспарентный», «ремесленный» на «крафтовый», «договор» на «контракт», «продлевать» на «пролонгировать», «продавец» на «селлер» и т.д. И одна из причин этого, на мой взгляд, — как раз привычка в научных и узконаправленных областях деятельности заимствовать слова, не переводя на русский язык. Из-за этого многим людям заимствованные слова начинаются подсознательно казаться более умными, более возвышенными, и они начинают вставлять их где только возможно. А русский язык, соответственно, начинает восприниматься как бы второсортным.
Если оставлять заимствованные слова «как есть», особенно те, что приходят прямо сейчас, то через несколько десятков лет русский язык превратится в убогую кашу из русского и английского. Мне, допустим, этого совсем не хочется. У нас прекрасный язык, ни чем не хуже английского и любого другого. На нём написана куча великих художественных произведений, в которых заложены наши, русские, ценности. Соответственно, если будет происходить обангличивание, обамериканивание, озападнивание языка, — то же самое будет происходить и с нашими ценностями и мировоззрением. А мне, допустим, западные ценности и их повестка совсем не близки, как и многим другим русским людям. Мне не хочется, чтобы моя дочь и вообще следующие поколения русских людей теряли доступ к огромным богатствам русской литературы и заложенным в ней ценностям, более светлым и жизнеутверждающим, чем западные.
Так что уж лучше потратить деньги на терминологические советы.
Челлендж: попробуйте перевести следующие термины на русский без заимствований, чтобы нормально звучало на русском, и чтобы хотя бы специалисту было понятно
Diffusion network
Chain-of-thought
Few-shot prompting
Encoder-decoder transformer
Retrieval augmented generation
Челлендж: попробуйте перевести следующие термины на русский без заимствований
Чтобы это всё перевести, нужно глубоко погрузиться в данную предметную область, а времени на это у меня нет, к сожалению.
чтобы нормально звучало на русском
Не понятно, как проверить это условие беспристрастно. Скорее всего, человек будет определять с точки зрения привычно/непривычно. И, конечно, новые слова и их сочетания будут звучать непривычно.
и чтобы хотя бы специалисту было понятно
Специалисту будет понятно то, что он прочитал в учебниках и статьях по соответствующему предмету. Если там будут «стейтменты», «инференс» и «рандомный», то это ему будет понятно. Если будут «выражения», «выведение» и «случайный», значит, это ему будет понятно.
Будьте добры, пришлите адрес Ваших публичных работ во всемирной паутине знаний, я желаю ознакомиться с ними из праздного любопытства любви к русскому языку.
прокси-метрика — упрощённая метрика
подмена смысла. да, она в данном контексте и вправду упрощенная, но так будет не всегда
прокси — прокладка, посредник
посредник звучит как будто это человек. с прокладкой еще веселее по ассоциациям
асессор — оценщик
оценщик - это может быть алгоритм оценки
ассистент — помощник
помощник - это может быть какой-нибудь wizard
контекст — окружение
окружение - это почти всегда environment
пул — набор
набор - это скорее set
продакшн — бой, боевая среда
это просто забавно
репозиторий — хранилище
хранилище гораздо чаще storage
файнтюнить — тонко настраивать
тонко настраивать - это скорее подбирать гиперпараметры
target — цель
"сначала нам нужно нормализовать цель". "целевое значение" хотя бы, но это громоздко
а какие инструменты использовались для построения abstract syntax tree (AST)
Как мы учили Yandex Code Assistant помогать разработчикам с написанием кода и делать их счастливыми