"Почему" - все просто: деньги сейчас главная ценность. Чем меньше можно купить за деньги, и запрет передачи наследства - тем меньше будет таких проблем. Но как только приуменьшается роль денег - обнажается обратная сторона медали "лентяйство". Потому я и говорю - никто не догадался как решать эти проблемы.
В целом это во-первых - риски для бизнеса (никто не ответит за такую блокировку, а бизнес можно потерять), второй момент - все сохранять и считать - каждый чек, каждый "чих" и нужен бухгалтер даже для маленького бизнеса. Но проблема ведь глубже - никто не догадался как ее решать, зато к процветанию наличных и пложению франчайзеров это точно приведет.
В целом, если подытожить - десктопная система, в отличие от системы заточенной под конкретную задачу, приоритет отдает пользователю и оболочке с которой он взаимодействует. Т.е. взаимодействие с пользователем важнее запущенного даже от рута любого другого процесса. Серверная винда не дотягивает до линукса в ключевой задаче так же, как и линукс не дотягивает до винды в плане ориентации на юзера.
Хотя никсами пользуюсь более 10 лет уже, но всегда рядом есть Windows и тому есть ряд причин:
1. Windows не "разнообразен" - да многое делается через пень-колоду, но если ищешь настройки монитора например - то они в одном и том же месте. Если у тебя есть простая программа написанная для 7ки или 2003, то она на 11 будет работать - никаких glibc с зоопарком версий (uClibc, musl), без докера, без chroot - просто будет работать, да еще портабельная с флешки.
2. В Windows NT в ядре, еще начиная с 3.хх уже были объекты, да те самые объекты реализованные на простом си и да "те самые объекты" с проработанной структурой, с заданным поведением которое не меняется в корне от версии к версии. Есть dispatch_header - можно ожидать, есть тип, размер, набор функций и т.д, куча объектов синхронизации под конкретную ситуацию. В ядре никсов ... Спасибо Торвальдсу за то, что не дает системные вызовы хоть менять, а то вообще мрак.
3. В Windows реализовано увеличение приоритетов потоков для окон и приложений с которыми взаимодействует пользователь - т.е. вот прямо ОС подстраивается под пользователя. Так же есть и всякие фишки типа HDR+ и прочих. Да в никсах есть что то похожее, но реализовано ...
4. Linux desktop "зависает". Да, сама система не зависает (хотя и тут проблемы - Вы пользовались ею, когда железо "навороченое" и есть thunderbolt 5 ?), а вот оболочка виснет. В никсах многие "правильные" идеи в виде X-ов с передачей картинки по сети губятся "загаженной" архитектурой и вейланд ни разу не спасение.
5. Шаг к десктопу - люди любят красивые вещи и простоту. Например макбук - попробуйте без танцев с бубном поставить никсы на него. Но на 2026 год есть и плюсы - nvidia "забила" на геймеров точнее на 3D, а LLM прочно входят в нашу жизнь и, возможно, в игры - и тут linux посоревнуется с Windows.
6. А кэширование файлов? - в винде для "рядового" железа скорость доступа к файлам выше, чем в никсах.
7. Еще хотелось бы вспомнить про отладку приложений для десктопа под никсами в сравнении с виндой ...
НО для большинства задач бизнеса, а не развлечений - линукс уделывает винду.
"порассуждать о назначении эмбеддингов" - это скорее про "скалярное произведения этих векторов и косинуса угла между ними", про гиперплоскости (хотя наверное нужно начинать с более простого - с функции задающей линию в 2D, функции задающей плоскость в 3D и т.д. поскольку понятие гиперплоскость не совсем "школьное") - смысл в том чтобы математически "чувствовать" как это происходит. Кстати, наверное дальше будет упоминание про softmax() функцию - которая "вдруг" для многих производит нормализацию, а вот почему используется степень числа е и основной смысл нормализации - это будет? Или Вы вот упомянули про "Позиционное кодирование", а почему простое суммирование (а не умножение или возведение в степень) "добавляем позиционный вектор к вектору эмбеддинга" тут работает? В чем различие в эмбеддинге, например предложений "собака перепрыгнула через кошку" и " кошка перепрыгнула через собаку"
Мда, смешано все: токены, многомерные векторы (простите embeddings), положение этого вектора.
Вот просто если взять только понятие токен - это часть текста - целое число token id, которое обозначает либо целое слово, либо часть этого слова - т.д. проще говоря словарь где ключом будет слово или его часть, а значением целое число.
Первый шаг - разбиение текста на токены. И тут можно статью писать: 1) Что делать, если слово - это какое-то новое никогда не встречающееся слово - понятно - несколько токенов - но как выбирать? ну и про <|endoftext|> упомянуть 2) Если цикл статей направлен на LLM, то вот еще вопрос - одинаковые ли id токенов скажем в gpt-2, qwen и т.п. - поскольку без глубокого понимания этого нельзя делать даже finetuning модели.
Шаг второй - вектор эмбеддинга - тоже множество вопросов. От случайно заполненной, обучаемой матрицы эмбеддингов (которая не входит в повторяющиеся блоки трансформера) до скалярное произведения этих векторов и косинуса угла между ними (хотя и тут вопросы - где лучше это рассматривать - возможно при рассмотрении внимания).
В целом, статья больше "запутывает" - что-то реально полезное то на ютубе есть неплохое видео от Sebastian Raschka - вот там по полочкам все.
За все время работы в IT (это уже больше 30 лет), то только в случае написания КРИТИЧЕСКОГО кода: 70% времени уходило на речечь проблемы, 20% на написание кода, 10% тестирование и фикс багов. Если подходить к ИИ инструментам с практической точки зрения, то ресеч ИИ ускоряет, написание кода - практически все забирает (НО ПРИ ПРАВИЛЬНЫХ промтах - если ты не провел предварительный ресечь - "правильных" промтов не будет), тестирование практически все остается. Бизнес с КРИТИЧЕСКИМ кодом - это большие компании. Однако малому бизнесу важна скорость, иногда она настолько важна, что от нее зависит весь бизнес - с этим тоже сталкивался и тут не важно что код будет уровня джуна - главное вовремя - то что Вы называете "набросками кода" - в этом случае сразу идет в продакшн, и вот конкретно с применением ИИ В этом кейсе я не сталкивался - агенты на сегодня еще не зрелые.
"Почему" - все просто: деньги сейчас главная ценность. Чем меньше можно купить за деньги, и запрет передачи наследства - тем меньше будет таких проблем. Но как только приуменьшается роль денег - обнажается обратная сторона медали "лентяйство". Потому я и говорю - никто не догадался как решать эти проблемы.
В целом это во-первых - риски для бизнеса (никто не ответит за такую блокировку, а бизнес можно потерять), второй момент - все сохранять и считать - каждый чек, каждый "чих" и нужен бухгалтер даже для маленького бизнеса. Но проблема ведь глубже - никто не догадался как ее решать, зато к процветанию наличных и пложению франчайзеров это точно приведет.
В целом, если подытожить - десктопная система, в отличие от системы заточенной под конкретную задачу, приоритет отдает пользователю и оболочке с которой он взаимодействует. Т.е. взаимодействие с пользователем важнее запущенного даже от рута любого другого процесса. Серверная винда не дотягивает до линукса в ключевой задаче так же, как и линукс не дотягивает до винды в плане ориентации на юзера.
Хотя никсами пользуюсь более 10 лет уже, но всегда рядом есть Windows и тому есть ряд причин:
1. Windows не "разнообразен" - да многое делается через пень-колоду, но если ищешь настройки монитора например - то они в одном и том же месте. Если у тебя есть простая программа написанная для 7ки или 2003, то она на 11 будет работать - никаких glibc с зоопарком версий (uClibc, musl), без докера, без chroot - просто будет работать, да еще портабельная с флешки.
2. В Windows NT в ядре, еще начиная с 3.хх уже были объекты, да те самые объекты реализованные на простом си и да "те самые объекты" с проработанной структурой, с заданным поведением которое не меняется в корне от версии к версии. Есть dispatch_header - можно ожидать, есть тип, размер, набор функций и т.д, куча объектов синхронизации под конкретную ситуацию. В ядре никсов ... Спасибо Торвальдсу за то, что не дает системные вызовы хоть менять, а то вообще мрак.
3. В Windows реализовано увеличение приоритетов потоков для окон и приложений с которыми взаимодействует пользователь - т.е. вот прямо ОС подстраивается под пользователя. Так же есть и всякие фишки типа HDR+ и прочих. Да в никсах есть что то похожее, но реализовано ...
4. Linux desktop "зависает". Да, сама система не зависает (хотя и тут проблемы - Вы пользовались ею, когда железо "навороченое" и есть thunderbolt 5 ?), а вот оболочка виснет. В никсах многие "правильные" идеи в виде X-ов с передачей картинки по сети губятся "загаженной" архитектурой и вейланд ни разу не спасение.
5. Шаг к десктопу - люди любят красивые вещи и простоту. Например макбук - попробуйте без танцев с бубном поставить никсы на него. Но на 2026 год есть и плюсы - nvidia "забила" на геймеров точнее на 3D, а LLM прочно входят в нашу жизнь и, возможно, в игры - и тут linux посоревнуется с Windows.
6. А кэширование файлов? - в винде для "рядового" железа скорость доступа к файлам выше, чем в никсах.
7. Еще хотелось бы вспомнить про отладку приложений для десктопа под никсами в сравнении с виндой ...
НО для большинства задач бизнеса, а не развлечений - линукс уделывает винду.
"порассуждать о назначении эмбеддингов" - это скорее про "скалярное произведения этих векторов и косинуса угла между ними", про гиперплоскости (хотя наверное нужно начинать с более простого - с функции задающей линию в 2D, функции задающей плоскость в 3D и т.д. поскольку понятие гиперплоскость не совсем "школьное") - смысл в том чтобы математически "чувствовать" как это происходит. Кстати, наверное дальше будет упоминание про softmax() функцию - которая "вдруг" для многих производит нормализацию, а вот почему используется степень числа е и основной смысл нормализации - это будет? Или Вы вот упомянули про "Позиционное кодирование", а почему простое суммирование (а не умножение или возведение в степень) "добавляем позиционный вектор к вектору эмбеддинга" тут работает? В чем различие в эмбеддинге, например предложений "собака перепрыгнула через кошку" и " кошка перепрыгнула через собаку"
Мда, смешано все: токены, многомерные векторы (простите embeddings), положение этого вектора.
Вот просто если взять только понятие токен - это часть текста - целое число token id, которое обозначает либо целое слово, либо часть этого слова - т.д. проще говоря словарь где ключом будет слово или его часть, а значением целое число.
Первый шаг - разбиение текста на токены. И тут можно статью писать: 1) Что делать, если слово - это какое-то новое никогда не встречающееся слово - понятно - несколько токенов - но как выбирать? ну и про <|endoftext|> упомянуть 2) Если цикл статей направлен на LLM, то вот еще вопрос - одинаковые ли id токенов скажем в gpt-2, qwen и т.п. - поскольку без глубокого понимания этого нельзя делать даже finetuning модели.
Возможно стоит упомянуть https://github.com/openai/gpt-2/blob/master/src/encoder.py и осветить библиотеку tiktoken
Шаг второй - вектор эмбеддинга - тоже множество вопросов. От случайно заполненной, обучаемой матрицы эмбеддингов (которая не входит в повторяющиеся блоки трансформера) до скалярное произведения этих векторов и косинуса угла между ними (хотя и тут вопросы - где лучше это рассматривать - возможно при рассмотрении внимания).
В целом, статья больше "запутывает" - что-то реально полезное то на ютубе есть неплохое видео от Sebastian Raschka - вот там по полочкам все.
Только Robivox и ElevenLabs более или менее, остальные периодически "обламываются".
За все время работы в IT (это уже больше 30 лет), то только в случае написания КРИТИЧЕСКОГО кода: 70% времени уходило на речечь проблемы, 20% на написание кода, 10% тестирование и фикс багов. Если подходить к ИИ инструментам с практической точки зрения, то ресеч ИИ ускоряет, написание кода - практически все забирает (НО ПРИ ПРАВИЛЬНЫХ промтах - если ты не провел предварительный ресечь - "правильных" промтов не будет), тестирование практически все остается. Бизнес с КРИТИЧЕСКИМ кодом - это большие компании. Однако малому бизнесу важна скорость, иногда она настолько важна, что от нее зависит весь бизнес - с этим тоже сталкивался и тут не важно что код будет уровня джуна - главное вовремя - то что Вы называете "набросками кода" - в этом случае сразу идет в продакшн, и вот конкретно с применением ИИ В этом кейсе я не сталкивался - агенты на сегодня еще не зрелые.