Думали про кейс подсказки поверните на съезд мкад-восток "после съезда на мкад-запад"? Вот этот фрагмент "после чего-то", имхо, был бы полезным, чтобы чуть заранее быть готовым к манёвру, а не когда уже слишком поздно, ибо когда ты увидел именно нужный тебе знак, а едешь слишком быстро, чтобы успеть в него повернуть. Я понимаю, что есть предварительные подсказки про то, что ваш поворот через 500 метров... но в условиях GPS нестабильности в дефолт сити все эти относительные метры часто пальцем в небо.
Почему не пробовали фриду и Qwen3-Embedding? Просто руки не дошли или чем-то не нравятся? фрида для русского прям неплоха. Qwen3 вообще очень сильный эмбеддер, по крайней мере 4b. Я попробовал на нём посчитать близость для вопросов про лук и команды - на всё ответил правильно. Ну и они в принципе в топе лидербордов mteb
я пробовал кодить в cline на 3090 через qwen3-coder:30b контекст 32к Имхо, на грани... точнее наверно даже сверх грани по памяти, а 16к контекст уже прям совсем мало. Поэтому надо что-то больше, согласен. Но к R9700 у меня опять же вопрос: ежели она вдвое (хотя где вы вообще её видели за рекомендованную цену? крайне сомнительно) дороже б/у 3090, то зачем брать её, если можно взять две 3090 и получить 48GB?
Pro карты, опять же, имхо, стоит брать когда явно больше двух и полностью в серверную стойку и чтоб с турбинами охлаждения они были и вот это всё. А одна-две ну хз.
PS по поводу требуемых ресурсов именно для 10 человек не буду комментировать, ибо реальной практики нет. Мы сами еще только планируем начинать к этому подступаться. Железо уже есть, но пока еще в процессе отладки бизнес-процессов. Но кажется, что 32 гигами тут не обойтись. Cline думает минутами над одной задачей. Если несколько человек начнут засылать таски ему, то памяти сожрётся изрядно... ну если они прям реально, конечно, будут юзать систему ))
фанаты бдсм наборов тоже однозначно что-то знают, но проверять как-то пока желания не возникло. Технически, смотрю, дипсик 32b на ней крутится с 17 т/с через олламу. Но эт прям негусто. У меня на 3090 qwen3:30b выдает 85 т/с, gpt-oss:20b - 65 т/с. Ну и плюс опять же... имхо, до сих пор велик шанс, что шаг влево, шаг вправо и без cuda ничего не запустится кроме самых массовых историй.
для токенофанов пока вродь без изменений: если вам хватает 16 гигов, то 5060ti топчик за свои деньги, если надо 24 и надо только ollama модели, то можно взять две 3060 на 12 по двадцатке (оллама без гемора автоматом раскидывает слои на несколько карт). Если надо 24 и хотите играться с полноценными трансформерами с HF, то 3090 за 55-60. Я пробовал все три варианта... остановился на 3090 ввиду специфики рабочих задач.
да банальная история: пробуем делать сортировку списков (в пределах десятков позиций) самых различных товарных наименований по релевантности к искомой фразе (выборка товаров не из БД, поэтому традиционно просто поискать по заранее предрасчитанным векторам нет возможности). На текущий момент юзаем Qwen3-Reranker-0.6B. Он неплох, но в эмбеддингах фрида лучше. А квеновский реранкер 4B в свою очередь хоть и сильнее... но тяжелый, а фрида кажется была бы оптимальной посерединке.
PS на объективность оценки не претендую, математически/статистически значимых тестов не проводили
PPS плюсану комментатора выше про проблему ложноположительной близости товарных позиций, в названии которых есть артикул и он отличается на одну цифру-букву. Типо когда с одной стороны хоть iPhone 16 по семантике и похож на iPhone 17, но это совсем другая штука. Я верю, что реранкеры и эмбеддеры не для этой задачи... но тем не менее хотелось бы её решать без костылей как щас путем постпроцессинга названий и явного поиска в них слов-артикулов, чтобы сравнивать их как обычно побуквенно.
поэтому я сделал оговорку, что в разное время список варьируется )) Плюс я бы всё таки отделял собссно драйвера от сопутствующего необязательного софта для настройки мигания подсветкой. А по поводу материнок важнее даже наверно не их опять же бесполезный софт, а контроллеры, которые они накидывают на платы. И ААА бренды (особенно в былые годы) ставили всё ж куда более понятные, распространенные и стабильные чипы, которые заводились сразу из базового набора дров винды или с винапдейта.
последняя действительно нестабильная винда на моей памяти была бета версия Висты в период лета 2006 года на 4 пеньках. Вот тогда я готов признать, что страдал, когда переходил на неё с ХР... но ровно до тех пор пока осенью не апнулся на свежий core 2 duo, и всё наладилось настолько, что с тех пор я ни разу не возвращался на стабильный канал, а сидел и сижу на бетах, прекрасно работая разработчиком в режиме сутра до ночи. Большинству остальных хочется лишь сказать, что многие проблемы либо очень субъективны и дело привычки, либо вы сами обрекли себя на потенциальные проблемы с железом, покупая не золотой стандарт интел+асус+нвидия+логитек и так далее по категориям периферии как минимум средней ценовой линейки (хотя само собой добавлю, что набор производителей условен, в разные десятителия топовым мог быть кто-то иной... главное, мораль в том, что несмотря на все заявления МС о всеядности... будем объективны: топовые вендоры в среднем пишут более стабильные драйвера и дольше их поддерживают, поэтому зачем с более высокой вероятностью страдать, когда можно не страдать?). Да, безусловно баги были, есть и будут, но при этом и инструментов их обойти в винде предостаточно вопреки распространенному мифу. Сложнее найти по сравнению с гайдами линукса? - да. Но это не отменяет того, что гибкость таки есть. И это скорее следствие того, что среднестатистическому пользователю линукса нужно куда чаще обращаться к помощи мануалов, чтобы решить проблему. Дыма-то без огня не бывает.
не исключаю, что сброс бы дал сопоставимый эффект (хотя геморрой от предустановленной рекламы всё равно бы вернулся и пришлось бы разбираться). Так же могу лишь порадоваться за ваш 12 андроид... на Note 7 последний официальный только 10 при одинаковом-то годе выпуске тела...
работает на родном стоке? У меня вот у отца был Redmi Note 7 (2019)... жил, жил, но последнее время он прям очень на него жаловался... всё тормозит, батарейка держит полдня и всё такое. Я рекламу-то всю давно выпилил, пытался лишнее удалять... но всё равно очень тухло он себя ощущал. В итоге купил ему тел посвеежее, а Note 7 взял себе вторым. Но само собой разлочил и накатил crDroid на 14 андроиде вместо 10. И свершилось чудо! Телефон просто заново переродился, живёт без зарядки чуть ли не неделю, базовые проги летают, ОС свежая, всё запускается и будет запускаться еще походу долго. Это я всё к тому, что без рута старые девайсы без свежей ОС всё же сильно теряют в юзабильности, хотя их потенциала бы еще хватило на несколько лет.
потому что одному только ктулху известно какой магией и статистиками, а не только по базе geoip некоторые сервисы определяют кому они хотят оказывать услуги, а кому нет, особенно гугл. При работе на ВМ проще отделять личное окружение от рабочего, заморачиваться отключением геолокации у себя и прочих историй с личными аккаунтами.... опять же повторюсь - это всё рамках контекста неподготовленного человека-пользователя, который ничего в этом не понимает и особо не должен на самом деле по своим прямым должностным обязанностям )
как видно из статьи RDP с гуем на сервере может поднять любой сын маминой подруги директора фирмы. А дальше уже любой менеджер может без спец подготовки пользоваться браузером там
учитывайте, что в большинстве обычных организаций таки нет админов, нет никого, прокаченней менеджера, способного спросить у алисы как запустить сайт на компе в другом далёком месте и тем более обучать этим правильным решениям обычных девочек-менеджеров на удалёнке. Подключиться к rdp с любого неподготовленного компа - это всё таки радикально более простой способ решить проблему.
В ответ многим скептикам в комментах тут рискну донести мысль: KPI система - это инструмент, а уж для каких целей вы будете его использовать - дело очень индивидуальное и зависит в том числе от конкретных условий устройства бизнеса компании. Лично я нахожу крайне удобным и главное наглядным отображение того, как в конце месяца будет выглядеть отчет о проделанных работах / багах перед заказчиком. Так как это бюрократия должна соблюдаться очень четко, есть лимиты, есть объемы. Но при этом это никак не коррелирует с требованиями / дедлайнами и эффективностью. Мы добросовестно выполняем работы в рамках способностей команды и заказчик доволен именно результатами, а не цифрами в отчетах. Но наверняка не только у нас одних "так исторически сложилось", что выделенный на год бюджет должен быть формально расписан по каждому потраченному рублю. KPI статистики позволяют хорошо автоматизировать этот процесс размазывания бюджета на выполняемые работы с учетом сложности и длительности, вовремя закрывать отчетность и не бегать в последний день в панике выясняя кто что делал.
что старая что новая цифра без хоть каких-то пояснений по методике - совершенно ни о чём не говорят и тем более не сравнимы... По количеству купленных лицензий? - так это число в теории не может уменьшиться, только увеличиться. По тому, сколько уникальных hardware Id было в интернете за последний месяц? - но это железки и физ лиц и ВМ и вообще не связаны с человеками. У меня вот дома несколько ноутов, HTPC, ВМ и прочего барахла с виндами, которые я включаю что-то реже, что-то чаще, что-то онлайн 24/7. За одного я или за десятерых?
Однако в любом случае умеет место быть факт, что всё больше людей уходят в планшеты, ибо они стали более чем достаточных для бытовых нужд. Но это не прям вендекапец в прямом смысле, а смена парадигмы в нишу, где у МС просто нет соответствующего продукта. Я бы и не уходил на iPadOS, если б был аналог девайса с ОС на ядре винды с аналогичным UX. И вот это проблема, а не то, что Вин11 - барахло. Типичных юзер же, приходя в магазин, не думает такой: ой что-то вин11 мне не зашла, куплю вместо сломавшего новый ноут на убунте! Он просто пойдёт и купит планшет.
Факт номер 2. Который беспокоит лично меня куда более и за что я переживаю так это за виндо сервер. Вот его судьба прям вообще безрадостная. Я более 20 лет держал у себя виндо сервера и считал их самым удобным инструментом для запуска разрабатываемого ПО на виндофреймворках, прежде всего на .Net. Однако за последние годы с повсеместным переходом на докер / кубер и вот это всё мне удалось перекинуть или переписать в контейнеры даже совсем старые сервисы, не оставив ни одного приложения в собссно хост машинах, в том числе полностью отказавшись от hyper-v виртуализации, потому что опять же больше не нужны полноценные изолированные ВМ. И вин сервера у меня крутятся только по остаточному принципу до каких-то крупных поломок или прочих телодвижений, и в тот момент наверняка я подниму новые железки уже на линуксе, ибо от сервера теперь реально нужен только докер, а винда для него всё ж мягко говоря - не лучший выбор.
был же ExpressGate у асуса... другой вопрос, а что им чинить? линукс? так он и сам вроде чинится руками из нужного места и конфигурацией загрузчика. Для этого отдельный-то линукс не шибко нужен. А винду всё ж удобнее чинить из виндового winpe.
Всё это, конечно, прекрасно, но в реальной жизни солюшена на 300-500 проджектов 95-99% времени уходит не на написание кода, а поиск куда бы его впихнуть, найти что с чем связано и вообще кто придумал этот бред. Ну хорошо, еще бывают задачи, когда 95% времени ищещь в какой из десятков sql бд, монги, сотен индексов эластика лежат требуемые данные и пытаешься их поджойнить теми самымы 10 строками кода, которые ты искал где написать в задаче перед этим. Как в этом поможет нейронка без каких-либо глубинных интеграций и доступа ко всем данным (ведь документации-то нет, само собой) - решительно непонятно. Вот когда эти вопросы придумают как порешать - заценим. А пока вот разве что сферический regexp в вакууме спросить как написать.
Думали про кейс подсказки поверните на съезд мкад-восток "после съезда на мкад-запад"? Вот этот фрагмент "после чего-то", имхо, был бы полезным, чтобы чуть заранее быть готовым к манёвру, а не когда уже слишком поздно, ибо когда ты увидел именно нужный тебе знак, а едешь слишком быстро, чтобы успеть в него повернуть. Я понимаю, что есть предварительные подсказки про то, что ваш поворот через 500 метров... но в условиях GPS нестабильности в дефолт сити все эти относительные метры часто пальцем в небо.
Почему не пробовали фриду и Qwen3-Embedding? Просто руки не дошли или чем-то не нравятся? фрида для русского прям неплоха. Qwen3 вообще очень сильный эмбеддер, по крайней мере 4b. Я попробовал на нём посчитать близость для вопросов про лук и команды - на всё ответил правильно. Ну и они в принципе в топе лидербордов mteb
я пробовал кодить в cline на 3090 через qwen3-coder:30b контекст 32к
Имхо, на грани... точнее наверно даже сверх грани по памяти, а 16к контекст уже прям совсем мало. Поэтому надо что-то больше, согласен. Но к R9700 у меня опять же вопрос: ежели она вдвое (хотя где вы вообще её видели за рекомендованную цену? крайне сомнительно) дороже б/у 3090, то зачем брать её, если можно взять две 3090 и получить 48GB?
Pro карты, опять же, имхо, стоит брать когда явно больше двух и полностью в серверную стойку и чтоб с турбинами охлаждения они были и вот это всё. А одна-две ну хз.
PS по поводу требуемых ресурсов именно для 10 человек не буду комментировать, ибо реальной практики нет. Мы сами еще только планируем начинать к этому подступаться. Железо уже есть, но пока еще в процессе отладки бизнес-процессов. Но кажется, что 32 гигами тут не обойтись. Cline думает минутами над одной задачей. Если несколько человек начнут засылать таски ему, то памяти сожрётся изрядно... ну если они прям реально, конечно, будут юзать систему ))
при 32к контекста 26 гигов (10% CPU / 90% GPU)... скорость падает примерно до 35 т/с
при 16к контекста 23 гига (100% GPU)... скорость 85 т/с
фанаты бдсм наборов тоже однозначно что-то знают, но проверять как-то пока желания не возникло. Технически, смотрю, дипсик 32b на ней крутится с 17 т/с через олламу. Но эт прям негусто. У меня на 3090 qwen3:30b выдает 85 т/с, gpt-oss:20b - 65 т/с. Ну и плюс опять же... имхо, до сих пор велик шанс, что шаг влево, шаг вправо и без cuda ничего не запустится кроме самых массовых историй.
для токенофанов пока вродь без изменений: если вам хватает 16 гигов, то 5060ti топчик за свои деньги, если надо 24 и надо только ollama модели, то можно взять две 3060 на 12 по двадцатке (оллама без гемора автоматом раскидывает слои на несколько карт). Если надо 24 и хотите играться с полноценными трансформерами с HF, то 3090 за 55-60. Я пробовал все три варианта... остановился на 3090 ввиду специфики рабочих задач.
да банальная история: пробуем делать сортировку списков (в пределах десятков позиций) самых различных товарных наименований по релевантности к искомой фразе (выборка товаров не из БД, поэтому традиционно просто поискать по заранее предрасчитанным векторам нет возможности). На текущий момент юзаем Qwen3-Reranker-0.6B. Он неплох, но в эмбеддингах фрида лучше. А квеновский реранкер 4B в свою очередь хоть и сильнее... но тяжелый, а фрида кажется была бы оптимальной посерединке.
PS на объективность оценки не претендую, математически/статистически значимых тестов не проводили
PPS плюсану комментатора выше про проблему ложноположительной близости товарных позиций, в названии которых есть артикул и он отличается на одну цифру-букву. Типо когда с одной стороны хоть iPhone 16 по семантике и похож на iPhone 17, но это совсем другая штука. Я верю, что реранкеры и эмбеддеры не для этой задачи... но тем не менее хотелось бы её решать без костылей как щас путем постпроцессинга названий и явного поиска в них слов-артикулов, чтобы сравнивать их как обычно побуквенно.
Есть ли в планах сделать реранкер потипу как у tomaarsen/Qwen3-Reranker-0.6B-seq-cls ?
поэтому я сделал оговорку, что в разное время список варьируется )) Плюс я бы всё таки отделял собссно драйвера от сопутствующего необязательного софта для настройки мигания подсветкой. А по поводу материнок важнее даже наверно не их опять же бесполезный софт, а контроллеры, которые они накидывают на платы. И ААА бренды (особенно в былые годы) ставили всё ж куда более понятные, распространенные и стабильные чипы, которые заводились сразу из базового набора дров винды или с винапдейта.
последняя действительно нестабильная винда на моей памяти была бета версия Висты в период лета 2006 года на 4 пеньках. Вот тогда я готов признать, что страдал, когда переходил на неё с ХР... но ровно до тех пор пока осенью не апнулся на свежий core 2 duo, и всё наладилось настолько, что с тех пор я ни разу не возвращался на стабильный канал, а сидел и сижу на бетах, прекрасно работая разработчиком в режиме сутра до ночи. Большинству остальных хочется лишь сказать, что многие проблемы либо очень субъективны и дело привычки, либо вы сами обрекли себя на потенциальные проблемы с железом, покупая не золотой стандарт интел+асус+нвидия+логитек и так далее по категориям периферии как минимум средней ценовой линейки (хотя само собой добавлю, что набор производителей условен, в разные десятителия топовым мог быть кто-то иной... главное, мораль в том, что несмотря на все заявления МС о всеядности... будем объективны: топовые вендоры в среднем пишут более стабильные драйвера и дольше их поддерживают, поэтому зачем с более высокой вероятностью страдать, когда можно не страдать?). Да, безусловно баги были, есть и будут, но при этом и инструментов их обойти в винде предостаточно вопреки распространенному мифу. Сложнее найти по сравнению с гайдами линукса? - да. Но это не отменяет того, что гибкость таки есть. И это скорее следствие того, что среднестатистическому пользователю линукса нужно куда чаще обращаться к помощи мануалов, чтобы решить проблему. Дыма-то без огня не бывает.
не исключаю, что сброс бы дал сопоставимый эффект (хотя геморрой от предустановленной рекламы всё равно бы вернулся и пришлось бы разбираться). Так же могу лишь порадоваться за ваш 12 андроид... на Note 7 последний официальный только 10 при одинаковом-то годе выпуске тела...
работает на родном стоке? У меня вот у отца был Redmi Note 7 (2019)... жил, жил, но последнее время он прям очень на него жаловался... всё тормозит, батарейка держит полдня и всё такое. Я рекламу-то всю давно выпилил, пытался лишнее удалять... но всё равно очень тухло он себя ощущал. В итоге купил ему тел посвеежее, а Note 7 взял себе вторым. Но само собой разлочил и накатил crDroid на 14 андроиде вместо 10. И свершилось чудо! Телефон просто заново переродился, живёт без зарядки чуть ли не неделю, базовые проги летают, ОС свежая, всё запускается и будет запускаться еще походу долго. Это я всё к тому, что без рута старые девайсы без свежей ОС всё же сильно теряют в юзабильности, хотя их потенциала бы еще хватило на несколько лет.
потому что одному только ктулху известно какой магией и статистиками, а не только по базе geoip некоторые сервисы определяют кому они хотят оказывать услуги, а кому нет, особенно гугл. При работе на ВМ проще отделять личное окружение от рабочего, заморачиваться отключением геолокации у себя и прочих историй с личными аккаунтами.... опять же повторюсь - это всё рамках контекста неподготовленного человека-пользователя, который ничего в этом не понимает и особо не должен на самом деле по своим прямым должностным обязанностям )
как видно из статьи RDP с гуем на сервере может поднять любой сын
маминой подругидиректора фирмы. А дальше уже любой менеджер может без спец подготовки пользоваться браузером тамучитывайте, что в большинстве обычных организаций таки нет админов, нет никого, прокаченней менеджера, способного спросить у алисы как запустить сайт на компе в другом далёком месте и тем более обучать этим правильным решениям обычных девочек-менеджеров на удалёнке. Подключиться к rdp с любого неподготовленного компа - это всё таки радикально более простой способ решить проблему.
иногда просто нужен firefox, чтобы сотрудники имели возможность пользоваться тем, чем в современных реалиях пользоваться "проблематично"
В ответ многим скептикам в комментах тут рискну донести мысль: KPI система - это инструмент, а уж для каких целей вы будете его использовать - дело очень индивидуальное и зависит в том числе от конкретных условий устройства бизнеса компании. Лично я нахожу крайне удобным и главное наглядным отображение того, как в конце месяца будет выглядеть отчет о проделанных работах / багах перед заказчиком. Так как это бюрократия должна соблюдаться очень четко, есть лимиты, есть объемы. Но при этом это никак не коррелирует с требованиями / дедлайнами и эффективностью. Мы добросовестно выполняем работы в рамках способностей команды и заказчик доволен именно результатами, а не цифрами в отчетах. Но наверняка не только у нас одних "так исторически сложилось", что выделенный на год бюджет должен быть формально расписан по каждому потраченному рублю. KPI статистики позволяют хорошо автоматизировать этот процесс размазывания бюджета на выполняемые работы с учетом сложности и длительности, вовремя закрывать отчетность и не бегать в последний день в панике выясняя кто что делал.
что старая что новая цифра без хоть каких-то пояснений по методике - совершенно ни о чём не говорят и тем более не сравнимы... По количеству купленных лицензий? - так это число в теории не может уменьшиться, только увеличиться. По тому, сколько уникальных hardware Id было в интернете за последний месяц? - но это железки и физ лиц и ВМ и вообще не связаны с человеками. У меня вот дома несколько ноутов, HTPC, ВМ и прочего барахла с виндами, которые я включаю что-то реже, что-то чаще, что-то онлайн 24/7. За одного я или за десятерых?
Однако в любом случае умеет место быть факт, что всё больше людей уходят в планшеты, ибо они стали более чем достаточных для бытовых нужд. Но это не прям вендекапец в прямом смысле, а смена парадигмы в нишу, где у МС просто нет соответствующего продукта. Я бы и не уходил на iPadOS, если б был аналог девайса с ОС на ядре винды с аналогичным UX. И вот это проблема, а не то, что Вин11 - барахло. Типичных юзер же, приходя в магазин, не думает такой: ой что-то вин11 мне не зашла, куплю вместо сломавшего новый ноут на убунте! Он просто пойдёт и купит планшет.
Факт номер 2. Который беспокоит лично меня куда более и за что я переживаю так это за виндо сервер. Вот его судьба прям вообще безрадостная. Я более 20 лет держал у себя виндо сервера и считал их самым удобным инструментом для запуска разрабатываемого ПО на виндофреймворках, прежде всего на .Net. Однако за последние годы с повсеместным переходом на докер / кубер и вот это всё мне удалось перекинуть или переписать в контейнеры даже совсем старые сервисы, не оставив ни одного приложения в собссно хост машинах, в том числе полностью отказавшись от hyper-v виртуализации, потому что опять же больше не нужны полноценные изолированные ВМ. И вин сервера у меня крутятся только по остаточному принципу до каких-то крупных поломок или прочих телодвижений, и в тот момент наверняка я подниму новые железки уже на линуксе, ибо от сервера теперь реально нужен только докер, а винда для него всё ж мягко говоря - не лучший выбор.
был же ExpressGate у асуса... другой вопрос, а что им чинить? линукс? так он и сам вроде чинится руками из нужного места и конфигурацией загрузчика. Для этого отдельный-то линукс не шибко нужен. А винду всё ж удобнее чинить из виндового winpe.
Всё это, конечно, прекрасно, но в реальной жизни солюшена на 300-500 проджектов 95-99% времени уходит не на написание кода, а поиск куда бы его впихнуть, найти что с чем связано и вообще кто придумал этот бред. Ну хорошо, еще бывают задачи, когда 95% времени ищещь в какой из десятков sql бд, монги, сотен индексов эластика лежат требуемые данные и пытаешься их поджойнить теми самымы 10 строками кода, которые ты искал где написать в задаче перед этим. Как в этом поможет нейронка без каких-либо глубинных интеграций и доступа ко всем данным (ведь документации-то нет, само собой) - решительно непонятно. Вот когда эти вопросы придумают как порешать - заценим. А пока вот разве что сферический regexp в вакууме спросить как написать.