Обновить
4
@alexhuread⁠-⁠only

Пользователь

Отправить сообщение

Часть 2. Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей»

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.8K

Первая часть - https://habr.com/ru/articles/970614/

Но это отдельная история. Когда ты пытаешься решить сложную задачу, ты придумываешь, как языковая модель становится из самой цели сделать модель побольше, становится инструментом для создания мультиагентной системы. И на самом деле тут много новых инструментов появляется, как раз связанных с тем, что необходимо действительно писать достаточно сложный код. И в мае этого года вышла статья Alpha Evolve от компании DeepMind, которая показала, что большая языковая модель может на самом деле сама писать код и решать задачи, если ты можешь проверить решение этой задачи.

То есть много задач, ты можешь проверить, что решение правильное, например, решить какое-нибудь уравнение, но найти само решение сложно.

Или, например, ты хочешь построить, даже в самом простейшем случае, написать какой-то промп, который хорошо помогает решить тебе конкретную задачу. Ты можешь, написав этот промп, запустить систему, получить ответ и проверить, получить метрику на бенчмарке, но как написать сам промп, непонятно. И, собственно, вот эти эволюционные алгоритмы – это для очень ленивых людей, таких как я. Ты просто даешь ей постановку задачи, просишь написать решение, она пишет какое-то решение, ты проверяешь это решение и просишь переписать это решение еще раз.

Дальше применяешь достаточно хитрые подходы, связанные с эволюционными алгоритмами, где фактически в качестве оператора мутации выступает большая языковая модель. У нее есть опыт предыдущий, память. в виде программы результатов, есть некоторые инсайты, что она придумала, и ее задача состоит в том, чтобы эти инсайты, соответственно, объединять в новые программы. Собственно, первый автор статьи «Альфа Эволф» Саша Новиков – это мой аспирант, который уехал довольно давно, но тем не менее очень много не менее талантливых людей работают в институте.

Читать далее

Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей»

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели7K

Я распечатал доклад, стараясь не поломать авторскую речь и мысль. Но всё таки доклад не читался, а произносился по памяти и слайдам, поэтому несколько слов убрал или заменил. Доклад на полчаса, выложу в двух частях.

Представление - Доктор физико-математических наук, профессор РАН, генеральный директор института Айри, декан факультета искусственного интеллекта МГУ Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей».

Дальше говорит Оселедец.

Да, всем доброе утро. На самом деле у меня будет такое, с одной стороны, рассказ действительно об успехах, некоторые анонсы нашего института, и в конце я немножко порассуждаю о проблемах, которых много, и над чем, собственно, мы думаем, над чем работаем, какие были получены в этом году результаты. В целом, на самом деле, институт и наши сотрудники неплохо поработали в этом году. У нас мы считали 93 статьи на конференции, то есть больше, чем все остальные центры которые этим занимаются что приятно, но конечно статьи не является самой целью, у нас довольно много практических историй.

Если переходить к докладу, то недавно вышло интервью Андрея Карпаты. Очень интересный, кто не видел, посмотрите. Полтора часа, и не суммаризация . Много интересных мыслей. Одна из мыслей, за которую я так зацепился, которая была не очень очевидна.

Иногда говорят, что языковые модели просто запоминают. Мы долго-долго объясняли, как работают языковые модели, что есть этап предобучения, мы сгружаем все данные из интернета и обучаем модель. Наконец-то general public, если говорить по-английски, обыватели поняли это, это хорошо. Но, с другой стороны, поняли все равно многие неправильно.

Читать далее

Экспертная система в отраслях: почему человеческий фактор остается ключевым

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели3.9K

Несколько раз бывало, что меня привлекали на поздних стадиях к провальным проектам, по крайней мере три раза отчетливо помню детали по крупным проектам. Тогда работал на металлургическом комбинате, занимался качеством сортовых и фасонных профилей — уголки, балки, рельсы, сортовая заготовка и ещё сотня наименований в прокатных цехах. А прокатный цех это вершина технологий и опыта металлургии, выше не было.

Происходило это не так что бы сказать осознанно — собирали совещание или звонили и предлагали дать рекомендации что делать и почему не получается достичь результата. Это очень нехорошая ситуация — там уже очень длительно работали команды и группы, сформированные приказом или как минимум распоряжением, много месяцев работали и зашли в тупик. При этом отказаться нельзя — дать рекомендации это распоряжение руководства, проигнорировать нельзя.

Суть работы по таким проектам — подготовить документацию, оснастку и опытную партию продукции для нового клиента, учесть особенности страны клиента, выполнить повышенный запрос клиента по качеству продукции или наоборот понять почему многолетние клиенты не хотят продлевать заказы или почему у клиентов массово выходит из строя наша продукция.

И рассматривая наработанные материалы группы, я понимал что они с самого начала всё делали неправильно. То есть люди они были может быть и не плохие, но вот теорию знали не всю и особенно не понимали практические моменты производства, испытаний и эксплуатации. Реакция людей когда им говорят, что они не понимают сути вопроса бывала разная — от истерик до ступора, ведь весь их результат работы ничтожен и нужно начинать заново — тут редко у кого нервы выдержат. И руководство обычно задавало мне вопрос — А почему об этом вы говорите только сейчас?

Читать далее

Техническая отсталость не должна быть игнорирована, если предприятие хочет выжить на рынке

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели3.3K

Показываю пример управления качеством продукции на реальном металлургическом производстве, на примере производства железнодорожных рельс.

Исходные данные — как заготовка дана сырая рельса (сразу после прокатки, не термообработанная) и нам предстоит её термоупрочнить, повысить механические характеристики прочности и не сильно ухудшить пластичность. Процесс закалки при моделировании прост — рельс с помощью валков с механическим приводом принудительно протягивают через индуктора, котоые токами высокой частоты её нагревают, дальше водовоздушной смесью охлаждают. Управлять мы можем скоростью движения рельсы через зону индукционного нагрева и количеством подаваемого охладителя в виде водовоздушной смеси. Всё просто.

Зачем это мне понадобилось? Конечно же существуют инструкции и разработаны режимы закалки, но может быть удастся путём изменения параметров внутри диапазона допустимых инструкцией значений получить хоть на несколько единиц твёрдости больше? Зачем это нужно — это напрямую связано с эксплуатацией рельсы в железнодорожном полотне. Хоть это уже и не моя головная боль (эксплуатация жд путей), но мы же клиентоориентированное предприятие? мы заинтересованы в росте качества продукции? тем более когда нам это ничего не стоит, кроме небольших интеллектуальных затрат. И да, эти все изменения должны быть в рамках ранее установленных режимов, что бы не остановить производство серией дополнительных испытаний и согласований.

Несмотря на специфичный сплав используемый для производства рельс, сама рельса довольно мягкая — это по отношению к железнодорожному колесу. А эти колёса ещё работают в паре, они сотрут рельсу по шейку и очень быстро. Поэтому рельс термообрабатывают процессом закалки — на каких то предприятиях полностью рельс, а самый лучший способ — это закалить только головку рельса, а остальное тело оставить мягким и пластичным. Вот этот процесс и разберём.

Читать далее

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность