Если бы меня новая метла стала бы аттестовывать, да ещё и с проходным порогом и перспективами пересдачи, я бы тоже уволился. Просто чтобы не поддерживать тенденций.
В чем смысл привнесения людям внезапного дополнительного стресса с перспективой увольнения, или как минимум подрыва репутации у начальства? Почему вместо этого не собрать аккуратно матрицы компетенций и потом индивидуально прорабатывать?
Обычно изменения начинаются не с "это вы один геройский герой затащили очередную имбу", а с понимания "так жить нельзя" и "старые процессы максимально неадекватны тому что есть, а в действительности происходит совсем не то, что на самом деле." А то, что происходит в действительности, команда воспринимает ни как нечто, леденящее душу, а как "геройские герои героически тащат всё на своём горбу при сопротивлении этому злодейских бюрократов". Откуда и возникает её сопротивление изменениям. Кому охота из геройского героя снова стать закрывателем тасок?
Единственный рабочий вариант, который я видел, это скармливать изменения совсем по чуть-чуть и как-бы не относящиеся к делу. Условно, сегодня мы вводим канбан-доску, просто как средство визуализации состояния дел, на следующем аврале вводим лимиты (строго для разргребания аврала, вы что?) потом, как бы невзначай начинаем делать приоритет на задачах от других команд над внутренними, и вот мы сами не заметили как все уже работают по канбану...
Весь мой печальный опыт с сетевыми файловыми системами говорит ровно об одном. Вам не нужны сетевые распределённые файловые системы. И даже если бизнес хочет lift and shift уже существующего легаси, то распределённая сетевая posix-совместимая файловая система принесёт только гемморой.
Приведите пожалуйста примеры контекстов, на которых у вас Gemma фейлится в RAG. Вы вставляете контекст в system turn? По опыту это очень сильно повышает устойчивость.
Утверждать, что одна из лучших по цене-качеству локальных моделей, при этом с уникальным фитом в виде адекватной мультилингвальностиь "кастрированая по самое нехочу" - несколько самонадеянно. Не надо так, даже для самоутверждения.
Единственный недостаток который у неё есть, как для локальной модели, это очень большое потребление VRAM на длинных контекстах. (О чём в этой статье, к сожалению не говорится.)
Большая часть истории человечества - это долгая, тяжелая каждодневная работа чтобы не помереть и экономика дара. Войны, доминирование и людоедство это продукт уже цивилизованых эпох.
Доказывать и обосновывать надо что-то рецензентам в правильных журналах. А тут, на хабре - высказал я своё мнение. Кто захочет - найдёт почему оно так и проверит, почему оно так, а кто не захочет - тому хуже. Или мне хуже, если я не прав.
Жизнь слишком коротка, чтобы тратить её на обоснования комментов в интернетах.
Если бы меня новая метла стала бы аттестовывать, да ещё и с проходным порогом и перспективами пересдачи, я бы тоже уволился. Просто чтобы не поддерживать тенденций.
В чем смысл привнесения людям внезапного дополнительного стресса с перспективой увольнения, или как минимум подрыва репутации у начальства? Почему вместо этого не собрать аккуратно матрицы компетенций и потом индивидуально прорабатывать?
Обычно изменения начинаются не с "это вы один геройский герой затащили очередную имбу", а с понимания "так жить нельзя" и "старые процессы максимально неадекватны тому что есть, а в действительности происходит совсем не то, что на самом деле."
А то, что происходит в действительности, команда воспринимает ни как нечто, леденящее душу, а как "геройские герои героически тащат всё на своём горбу при сопротивлении этому злодейских бюрократов". Откуда и возникает её сопротивление изменениям. Кому охота из геройского героя снова стать закрывателем тасок?
Никак. Команда будет сопротивляться всегда.
Единственный рабочий вариант, который я видел, это скармливать изменения совсем по чуть-чуть и как-бы не относящиеся к делу. Условно, сегодня мы вводим канбан-доску, просто как средство визуализации состояния дел, на следующем аврале вводим лимиты (строго для разргребания аврала, вы что?) потом, как бы невзначай начинаем делать приоритет на задачах от других команд над внутренними, и вот мы сами не заметили как все уже работают по канбану...
Весь мой печальный опыт с сетевыми файловыми системами говорит ровно об одном. Вам не нужны сетевые распределённые файловые системы.
И даже если бизнес хочет lift and shift уже существующего легаси, то распределённая сетевая posix-совместимая файловая система принесёт только гемморой.
Зато проблему последней мили в связи глобально уже решили.
Сплитать модели на несколько GPU модные инференсы научились где-то сразу после того как к ним прикрутили CUBLAS.
Впрочем, поиграться так поиграться. Кто я такой чтобы спорить?
Это сказано в описании модели, а в шаблоне для instruct режима мы имеем вот что:
И как ни странно, системный промт работает достаточно хорошо, чтобы давать заметные и ощутимые профиты.
Приведите пожалуйста примеры контекстов, на которых у вас Gemma фейлится в RAG.
Вы вставляете контекст в system turn? По опыту это очень сильно повышает устойчивость.
Для установки локальной ллм на комп не нужны дорогие карты на 80GB
Утверждать, что одна из лучших по цене-качеству локальных моделей, при этом с уникальным фитом в виде адекватной мультилингвальностиь "кастрированая по самое нехочу" - несколько самонадеянно. Не надо так, даже для самоутверждения.
Единственный недостаток который у неё есть, как для локальной модели, это очень большое потребление VRAM на длинных контекстах. (О чём в этой статье, к сожалению не говорится.)
Можно.
И даже за относительно разумные деньги.
Большая часть истории человечества - это долгая, тяжелая каждодневная работа чтобы не помереть и экономика дара. Войны, доминирование и людоедство это продукт уже цивилизованых эпох.
После чего тебя увольняют за токсичность.
Самая неприятная неприятность это неконсистентность стиля.
Доказывать и обосновывать надо что-то рецензентам в правильных журналах. А тут, на хабре - высказал я своё мнение. Кто захочет - найдёт почему оно так и проверит, почему оно так, а кто не захочет - тому хуже. Или мне хуже, если я не прав.
Жизнь слишком коротка, чтобы тратить её на обоснования комментов в интернетах.
И это был софт, который прошёл все потребные аудиты и сертификации.
Простейший плейбук на ансибл звучит как оксюморон, будем честны.
И как, поставили?
Доказывать не тому, кому интересна тема, а стремящемуся в Дарт'Аньяны? Много чести.
@Exosphere А в ответ тишина...
Мило.
Вы не против, если я немножко попишу об этом в своих соцсетях?