Как стать автором
Обновить
15
0
Сергей Гурылёв @Sergio97

Machine Learning and Backend engineer

Отправить сообщение

Именно, почти любую систему проверки можно обмануть, главное чтобы это не было слишком просто

Понял, Спс. Немного разные подходы в реализации практических заданий, в случае моего курса - запуск производится на машине студента локально
На мой взгляд у каждого подхода есть свои плюсы и свои минусы

В этом плане да, но согласитесь декомпилировать все же сложнее чем, открыть скрипт на python, увидеть какую API ручку нужно дергать, и через какой-нибудь постман сдать сразу весь курс

Спасибо за ваш интерес к курсу и отзыв! Язык C используется, потому что хотелось сделать исполняемый файл, который сразу можно запускать без наличия интерпретаторов, docker'а и прочего. Плюс к этому исполняемый файл не так просто декомпилировать, поэтому студенту проще сдать честно, чем пытаться обмануть проверяющую систему. По поводу опционального экспорта - можно собрать task_checker без интеграции с LMS (если я вас правильно понял). Третий пункт немного спорно, когда я вел курс, некоторые слушатели сказали, что практика сложная и заставляет изрядно понервничать, когда что-то не получается. Если бы подсказок не было, то была бы вообще беда. Но можно добавить переменную окружения, которая позволит собирать версию без подсказок

По поводу чекера в докер-образе в вашей реализации, можно поподробнее? Откуда студент берет образ? Кто монтирует каталог и запускает образ, студент или преподаватель?

Спасибо, интересная статья. Кстати, я бы не сказал, что цель ваших публикаций сильно отличаются, от этого курса. Взаимодействие с ОС, подготовка текстовых документов, программирование - эти цели курсов совпадают. Отличие разве что в том, что раньше автоматизацию писали на компилируемых языках вроде Паскаль, а сейчас задачи стараются автоматизировать скриптовыми языками, вроде Bash.

Спасибо за комментарий и оценку курса! Обязательно добавлю этот важный момент в лекцию, и презентации надо будет тоже поправить

Поясните, пожалуйста, о каком ssh-клиенте идет речь? Компилируемая утилита linux_task_checker запускается на локальном компьютере студента (либо на виртуалке) и проверяет локальные действия пользователя в системе с помощью набора тестов, а ssh нужен только для последнего 9 задания

Добрый день! Да, планирую добавить поддержку Moodle, по срокам, думаю, в течении 1-2 недель

Тоже решал эти задачи, порог был преодолен. Однако со мной никто не связался, так что вы не одиноки

Один из критериев хорошей статьи - придумать цепляющий заголовок :) Было интересно привлечь сюда и ТРИЗовцев, а без такого заголовка Вы, наверное, сюда не зашли. В целом, перед тем как дать название статье я исходил из того что и ТРИЗ и нейросеть являются методами ускорения генерации инноваций, но по содержанию они конечно абсолютно разные

Ознакомлюсь, спасибо! В старших классах школы увлекался ТРИЗ, но потом увлекся программированием, поэтому некоторые вещи могу либо не знать, либо не помнить

Все-таки это не совсем случайный набор фраз. В примерах видно, что если задача, скажем, по металлургии, то модель выдает химическую формулу материала, а не совсем что-то из другой области. Безусловно инженеры все могут придумать и изобрести, но интерес заключался в том, чтобы попробовать автоматизировать этот процесс. Если вы считаете эту публикацию не имеющей практического смысла - это ок, но думаю кто-то нашел ее интересной. Быть может среди этих ребят будут те, кто сделает что-то подобное, но при этом сильно улучшит результаты.

True Machine - Программный продукт на основе ТРИЗ в начале 00-ых неплохо продавался, и кажется, помогал своим пользователям создавать что-то новое. Поправьте, если я не прав https://habr.com/ru/post/596403/

Согласен с вами, выборка маленькая. Но дальнейшие эксперименты с моделью показали примерно такие же результаты. Тут важно понимать еще два момента. Первый момент: модель обученная в данной статье довольно маленькая (GPT3 в 1000 раз больше), чем больше модель, тем лучше качество генерации. Второй момент: 300000 примеров или 1.2 ГБ текста, тоже довольно маленький объем данных для языковых моделей (обычно их обучают на сотнях гигабайт текста). Было бы интересно взглянуть на работу большой языковой модели, весьма вероятно качество было бы лучше. Данная публикация скорее попытка обратить внимание на новый подход, а качество реализации идеи безусловно можно улучшить

Системы, которые базируются на ТРИЗ уже были представлены на рынке, например True Machine. И они имели определенный успех. Не хотелось повторяться. В свою очередь, данная публикация является скорее вычислительным экспериментом - попыткой создать Github Copilot, но для изобретателей.

Проблематика, которую вы описали касается комплексного вопроса, лежащего в двух областях: этики искусственного интеллекта (какие задачи можно доверить ИИ?) и валидации человеком решении ИИ (что можно считать корректным ответом?). Однозначного ответа на оба вопроса для любых задач пока нет, их еще предстоит найти

В данной публикации главный вопрос: "могут ли большие языковые модели ускорить процесс создания инноваций?". ТРИЗ создавалась с похожей целью, однако идеи описанные здесь не базируются на ТРИЗ. Поэтому эти подходы можно назвать аналогами в плане поставленных перед ними целей, но не по содержанию

Согласен с вами, на этом направлении AI еще очень много работы. Пока созданные человеком ассистенты, не похожи на тех чутких и умных компаньонов, которых мы видим в научно-фантастических фильмах. Как будет дальше - увидим :)

Иногда глубокое понимание алгоритма при написании кода тоже нужно. Например, когда вы пишете специфичный код завязанный на внешнюю систему (скажем, оптимизируете sql запрос для СУБД) или железо (пишите прошивку для роутера). В этом нетривиальном случае языковая модель вряд ли сможет вам помочь, ее "мышление" лежит в одной плоскости, т.к. в основном она училась по коду из GitHub перебирать элементы массива. Но даже если вы ей покажете как писать оптимизированные sql запросы, то далеко не факт, что ей будет удаваться писать их в 100% случаев. Для этого либо нужно предоставить модели огромную обучающую выборку с кодом, учитывающую все возможные тонкости работы с базой, либо нужно понимать как СУБД внутри работает. Именно за это понимание программисты и инженеры получают свои зарплаты, и пока на горизонте 5-10 лет им ничего не угрожает

Именно поэтому инженеры и программисты получают свои большие зарплаты, за свою умственную работу, и пока не идет речи о том, чтобы их полностью заменил AI :)

1

Информация

В рейтинге
Не участвует
Откуда
Тольятти, Самарская обл., Россия
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Backend Developer, ML Engineer
Senior
Python
Linux
Docker
Machine learning
Natural language processing
Neural networks
Git
C
Java
C++