Pull to refresh
4
@alexhuread⁠-⁠only

User

Send message

Часть 2. Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей»

Level of difficultyEasy
Reading time9 min
Reach and readers4.8K

Первая часть - https://habr.com/ru/articles/970614/

Но это отдельная история. Когда ты пытаешься решить сложную задачу, ты придумываешь, как языковая модель становится из самой цели сделать модель побольше, становится инструментом для создания мультиагентной системы. И на самом деле тут много новых инструментов появляется, как раз связанных с тем, что необходимо действительно писать достаточно сложный код. И в мае этого года вышла статья Alpha Evolve от компании DeepMind, которая показала, что большая языковая модель может на самом деле сама писать код и решать задачи, если ты можешь проверить решение этой задачи.

То есть много задач, ты можешь проверить, что решение правильное, например, решить какое-нибудь уравнение, но найти само решение сложно.

Или, например, ты хочешь построить, даже в самом простейшем случае, написать какой-то промп, который хорошо помогает решить тебе конкретную задачу. Ты можешь, написав этот промп, запустить систему, получить ответ и проверить, получить метрику на бенчмарке, но как написать сам промп, непонятно. И, собственно, вот эти эволюционные алгоритмы – это для очень ленивых людей, таких как я. Ты просто даешь ей постановку задачи, просишь написать решение, она пишет какое-то решение, ты проверяешь это решение и просишь переписать это решение еще раз.

Дальше применяешь достаточно хитрые подходы, связанные с эволюционными алгоритмами, где фактически в качестве оператора мутации выступает большая языковая модель. У нее есть опыт предыдущий, память. в виде программы результатов, есть некоторые инсайты, что она придумала, и ее задача состоит в том, чтобы эти инсайты, соответственно, объединять в новые программы. Собственно, первый автор статьи «Альфа Эволф» Саша Новиков – это мой аспирант, который уехал довольно давно, но тем не менее очень много не менее талантливых людей работают в институте.

Читать далее

Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей»

Level of difficultyEasy
Reading time7 min
Reach and readers6.9K

Я распечатал доклад, стараясь не поломать авторскую речь и мысль. Но всё таки доклад не читался, а произносился по памяти и слайдам, поэтому несколько слов убрал или заменил. Доклад на полчаса, выложу в двух частях.

Представление - Доктор физико-математических наук, профессор РАН, генеральный директор института Айри, декан факультета искусственного интеллекта МГУ Иван Оселедец с докладом «Успехи и проблемы больших языковых моделей».

Дальше говорит Оселедец.

Да, всем доброе утро. На самом деле у меня будет такое, с одной стороны, рассказ действительно об успехах, некоторые анонсы нашего института, и в конце я немножко порассуждаю о проблемах, которых много, и над чем, собственно, мы думаем, над чем работаем, какие были получены в этом году результаты. В целом, на самом деле, институт и наши сотрудники неплохо поработали в этом году. У нас мы считали 93 статьи на конференции, то есть больше, чем все остальные центры которые этим занимаются что приятно, но конечно статьи не является самой целью, у нас довольно много практических историй.

Если переходить к докладу, то недавно вышло интервью Андрея Карпаты. Очень интересный, кто не видел, посмотрите. Полтора часа, и не суммаризация . Много интересных мыслей. Одна из мыслей, за которую я так зацепился, которая была не очень очевидна.

Иногда говорят, что языковые модели просто запоминают. Мы долго-долго объясняли, как работают языковые модели, что есть этап предобучения, мы сгружаем все данные из интернета и обучаем модель. Наконец-то general public, если говорить по-английски, обыватели поняли это, это хорошо. Но, с другой стороны, поняли все равно многие неправильно.

Читать далее

Экспертная система в отраслях: почему человеческий фактор остается ключевым

Level of difficultyEasy
Reading time10 min
Reach and readers3.9K

Несколько раз бывало, что меня привлекали на поздних стадиях к провальным проектам, по крайней мере три раза отчетливо помню детали по крупным проектам. Тогда работал на металлургическом комбинате, занимался качеством сортовых и фасонных профилей — уголки, балки, рельсы, сортовая заготовка и ещё сотня наименований в прокатных цехах. А прокатный цех это вершина технологий и опыта металлургии, выше не было.

Происходило это не так что бы сказать осознанно — собирали совещание или звонили и предлагали дать рекомендации что делать и почему не получается достичь результата. Это очень нехорошая ситуация — там уже очень длительно работали команды и группы, сформированные приказом или как минимум распоряжением, много месяцев работали и зашли в тупик. При этом отказаться нельзя — дать рекомендации это распоряжение руководства, проигнорировать нельзя.

Суть работы по таким проектам — подготовить документацию, оснастку и опытную партию продукции для нового клиента, учесть особенности страны клиента, выполнить повышенный запрос клиента по качеству продукции или наоборот понять почему многолетние клиенты не хотят продлевать заказы или почему у клиентов массово выходит из строя наша продукция.

И рассматривая наработанные материалы группы, я понимал что они с самого начала всё делали неправильно. То есть люди они были может быть и не плохие, но вот теорию знали не всю и особенно не понимали практические моменты производства, испытаний и эксплуатации. Реакция людей когда им говорят, что они не понимают сути вопроса бывала разная — от истерик до ступора, ведь весь их результат работы ничтожен и нужно начинать заново — тут редко у кого нервы выдержат. И руководство обычно задавало мне вопрос — А почему об этом вы говорите только сейчас?

Читать далее

Техническая отсталость не должна быть игнорирована, если предприятие хочет выжить на рынке

Level of difficultyEasy
Reading time9 min
Reach and readers3.3K

Показываю пример управления качеством продукции на реальном металлургическом производстве, на примере производства железнодорожных рельс.

Исходные данные — как заготовка дана сырая рельса (сразу после прокатки, не термообработанная) и нам предстоит её термоупрочнить, повысить механические характеристики прочности и не сильно ухудшить пластичность. Процесс закалки при моделировании прост — рельс с помощью валков с механическим приводом принудительно протягивают через индуктора, котоые токами высокой частоты её нагревают, дальше водовоздушной смесью охлаждают. Управлять мы можем скоростью движения рельсы через зону индукционного нагрева и количеством подаваемого охладителя в виде водовоздушной смеси. Всё просто.

Зачем это мне понадобилось? Конечно же существуют инструкции и разработаны режимы закалки, но может быть удастся путём изменения параметров внутри диапазона допустимых инструкцией значений получить хоть на несколько единиц твёрдости больше? Зачем это нужно — это напрямую связано с эксплуатацией рельсы в железнодорожном полотне. Хоть это уже и не моя головная боль (эксплуатация жд путей), но мы же клиентоориентированное предприятие? мы заинтересованы в росте качества продукции? тем более когда нам это ничего не стоит, кроме небольших интеллектуальных затрат. И да, эти все изменения должны быть в рамках ранее установленных режимов, что бы не остановить производство серией дополнительных испытаний и согласований.

Несмотря на специфичный сплав используемый для производства рельс, сама рельса довольно мягкая — это по отношению к железнодорожному колесу. А эти колёса ещё работают в паре, они сотрут рельсу по шейку и очень быстро. Поэтому рельс термообрабатывают процессом закалки — на каких то предприятиях полностью рельс, а самый лучший способ — это закалить только головку рельса, а остальное тело оставить мягким и пластичным. Вот этот процесс и разберём.

Читать далее

Information

Rating
Does not participate
Registered
Activity