Comments / Profile of Duxlab / Habr

Вячеслав@Duxlab

User

Вышла Kimi K2-Thinking. Новый ИИ из Китая доступен бесплатно

Сымитировал простой бытовой вопрос. На «Сколько можно БЖНЫ в день» вообще не ответило. На «Сколько можно выпить БЖНЫ в день» решило что опечатка ну точно. После третьей фразы выдумало напиток БЖУ. И да, есть этикетка на русском, там написано капсом БЖНИ.

Что было бы, спроси я «сколько в сутки можно БЖНУТЬ», даже не хочу представлять.

-1

Голосовой ввод текста: топ-5 бесплатных инструментов

Duxlab Aug 14 at 13:39

Распознавание речи оффлайн требует установки нейронки у себя.
Проблема даже не в том, что нет оффлайн-версии, а в том что нет отдельного приложения, поверх ОС. А не вот этих браузерных калек.

Топ-11 бесплатных нейросетей для генерации изображений: лучшие AI генераторы 2025 года

Duxlab Aug 1 at 22:35

локально inpaint-модели.

Топ-11 бесплатных нейросетей для генерации изображений: лучшие AI генераторы 2025 года

Duxlab Aug 1 at 22:34

Пока что отличаю, если она не мелкая в шуме и мыле. И если это не рисунок уровня чёрных линий и заливки.
Это для тебя может нереально.

Топ-11 бесплатных нейросетей для генерации изображений: лучшие AI генераторы 2025 года

Duxlab Aug 1 at 22:07

Скормил этим «лучшим» свои промпты. Как обычно. У нейронок максимальное «быдломышление» и ничего даже мало-мальски оригинального они не могут соорудить. Всё плохо. Ну точнее всё хорошо: у иллюстраторов есть работа и будет.

Новая генеративная модель Kandinsky 3D для создания 3D-объектов. Как она работает и кому будет полезна

Duxlab Jul 4 at 10:03

шото его глючит даже на этапе понимания начального промпта.

Новая генеративная модель Kandinsky 3D для создания 3D-объектов. Как она работает и кому будет полезна

Duxlab Jul 4 at 09:59

На деле нужен ассистент, который бы распознавал речь, давал поправить или ввести текст, открывал нужные окошки и вбивал указанные цифры. То есть убирал рутину. Сама генерация точного 3д не требуется, ибо и так есть программы.

Новая генеративная модель Kandinsky 3D для создания 3D-объектов. Как она работает и кому будет полезна

Duxlab Jul 4 at 09:52

Многие компании ударились в ИИ, который «умеет всё». Но умеет он плохо. Часто неприемлемо плохо.

Очень туго дела идут с более узкими, точными и эффективными инструментами.
Тот же Tencent к своей сетке уже прикрутил а) генератор картинки Т-позы из обычной позы
б) определение точек суставов и прикручивание рига к гуманоидным моделям.
Да, качество там ужас, но для драфта годится, сильно облегчает работу, а это главное.

При том что есть ряд библиотек с гуманоидами, есть ряд генераторов базовых мешей человека, нет ни одной нейронки, которая бы занималась следующим:
Посмотреть на картинку и описание, сделать выводы, какие ползунки в генераторе надо крутнуть, крутнуть эти ползунки, проверить модель на перехлёсты поверхностей, разгладить перехлёсты, надуть/деформировать детали для большего сходства с картинкой (силуэт, карта глубины), сделать несколько рендеров, проверить их на вменяемость (уродливые деформации, соответствие описанию), вправить деформации.

Зачем возиться с генератором? Да затем, что там изначально есть модель с хорошей топологией, развёрткой и регулируемая. То есть итог будет гораздо более пригоден для работы. Возня с этими ползунками и базовыми подправками сжирает пару часов.

«Но есть же метахуман!» скажут многие
А метахуман — дерьмина, которая порождает исключительно унылых однообразных и неприятных кукольных симметричных статистов третьего плана. Деформеры, которые там как бы выданы, прибиты гвоздями к лимитам и симметриям, к тому же деформеры являются костями, что сильно смыливает результат. А если экспортировать и переделывать ручками, то сначала нужно уничтожить многое, что сгенерировано и открутить многое прикрученное, что нерационально. Всё на что осмелились эпики — дать делать кривые зубы генератором. А вот свёрнутый или сломанный нос уже никак. В нулевых была какая-то программка примерно такого толка, и даже там был режим «потягать вершины руками».

Как бы да, задача генерировать «каких-то там прохожих массово» закрыта. Только вот прохожих и на стоках валом. И будет ещё больше.

А задача дать автору удобную болванку, частично приближенную к эскизу/описанию даже не начиналась. Тот же Тенцент куда ближе к этому подобрался.

AGI уже здесь

Duxlab Jul 3 at 08:07

8 миллиардов человек — источники креативности, целеполагания и смысла

Дальше я даже читать не буду. Тут не от всякого специалиста в своём деле и не каждый день креативности можно ожидать, а у тебя аж 8 миллиардов… Угу… 8 миллиардов мясных тушек. Некоторые из которых иногда озаряются. Причём в отличии от мозга, в котором то одни то другие, тут у нас стойкое меньшинство и хомяки

-1

Сказал боту «люблю» — что теперь? Мой опыт работы с ИИ-компаньонами

Duxlab Jul 1 at 20:20

Я очень надеюсь, что название команды происходит от приставки «фемто».
В противном случае это маркер острого поражения тканей мозга.

-1

GigaChat сдал медицинский экзамен по специальности «Ревматология»

Duxlab Jun 11 at 17:53

Забавно, конечно, но доверия нет к системе, которая всё ещё не может почитать слово по слогам, если прямо у неё об этом не спросить. Тут вам и суффикс -ое и слоги шн-нш…

Нейросети хороши в том, чтобы выдать набор вероятностей по потенциальным заболеваниям, исходя из большого набора данных о симптомах. Но уязвимы к галлюцинациям из-за малейших расхождений в данных.

Хотя человек тоже может наплести не того, потому что голодный и или хочет писать, а тут вопросы какие-то.

Acer представила игровой монитор SpatialLabs View Pro 27, поддерживающий стереоскопическое 3D и объёмный звук

Duxlab May 23 at 04:54

если бы параллакс работал через лентикулярную линзу, то есть изображение для двух глаз было бы разным — есть смысл, а так нафик

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

Duxlab May 15 at 09:08

остаётся начать переводить

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

Duxlab May 15 at 09:08

Перевод с озвучкой — дело хорошее. Синтез речи давно уже выше приемлемого уровня.
А вот перевод очень страдает даже в мало-мальски специализированных видео.

1. один и тот же термин в течение всего видео переводится по-разному.
2. Термин или слово переводится неправильно, абсолютно в отрыве от темы видео.

Это общая беда нейронок сейчас — отсутствие памяти со знаниями и вообще плотного взаимодействия с классическими алгоритмами. То есть определить тематику видео, собрать слова по применению, найти среди них термины, перевести термины в контексте тематики, сохранить этот перевод термина как правильный, использовать этот перевод термина на протяжении всего видео.

Ученая из Финляндии решила задачу, на которую математики не могли найти ответ более 40 лет

Duxlab Mar 29 at 00:26

вряд ли прям всегда, но представь это так.
Однажды появляется некий инструмент. У него точно есть какие-то рукоятки, стороны, какая-то форма. И этот инструмент лежит потом много лет нетленным. Высока вероятность, что однажды этот кусочек паззла отлично подойдёт куда-нибудь.
При бесконечном времени жизни человечества вероятность эта стопроцентна по идее.

Алмазная батарея, которая может работать тысячи лет. Не панацея, но тоже ничего

Duxlab Dec 8 2024 at 01:29

Возможно выводы с разных слоёв батареи, чтобы оставалась возможность тасовать последовательно/параллельно не запариваясь с преобразователем и потерями на нём.

Япония планирует использовать ИИ для борьбы с пиратством манги и аниме

Duxlab Dec 8 2024 at 00:47

Аналогично. Качаю демо-версию в «зелёном Стиме», большую часть удаляю меньше чем через час. Но то что прошёл или понравилось сильно — покупаю за сколько могу. В смысле что-то за полную цену, что-то за скидочную.

Купил пару раз наобум. Оба раза делал рефанд.
Например купился на картинку, а внутри баги, не дающие играть или прозрачные стены, усложняющие и затягивающие прохождение.

Например тонкий карниз, по которому персонаж сначала может идти а потом сталкивается этой невидимой стеной, идущей явно наискось. То есть решение как бы есть, оно видимое, но на деле, после запарных прыжков и залезания на карниз оказывается, что «это не то решение, которое разработчик считает единственно верным». ЪУЪ!
Потому при современном состоянии игр уж извините, но только постоплата. Ибо если я на 90% пройду игру а потом она баганёт и сотрёт мне все сохранёнки, нагадив в настроение, то почему я должен за такое разочарование ещё и вывалить денег? Мне вот на работе за результат платят.

Соцсеть X открыла доступ к чат-боту Grok всем пользователям без подписки

Duxlab Dec 8 2024 at 00:24

Не очень понял. А ГПТ пропитан? Можно пример, в чём это выражалось?
> обсуждать
Щас бы с википедией что-то обсуждать. Обсуждать стоит с умнейшими людьми планеты. Или с разбирающимися в конкретной узкой теме.
А в остальном — читать первоисточники. И просто приятно болтать с кем-то ради социального контакта.
Обсуждать с чатботом это как играть в игры (играю, люблю, если чо). Без шанса, что ты умрёшь или без шанса почувствовать себя идиотом.

-3

«Киотский ар-деко» от загадочного Кобаяси Каити и эволюция японской гравюры

Duxlab Dec 8 2024 at 00:20

Экскурс занимательный. Но само искусство… кхм… Мне кажется, чтобы такое ценить сейчас, нужно быть человеком прошлого, не насмотренным, неискушённым, не желающим сравнивать.

Глядя на такие фрагменты, я внутренне закипаю. Ну зачем было настолько повторять символьное лицо, причём лишь дважды? Это плохо работает как ритм и скорее читается как клон. Смысл имело бы исключительно в смысле «вторая лишь тень и копия первой, полное подчинение». Но даже с таким смыслом подобный клон-штамп неэстетичен.

Как человечество будет воевать с ИИ (если верить писателям-фантастам)

Duxlab Dec 8 2024 at 00:08

Уже сейчас человеческий разум не в силах оседлать то обилие тонких корреляций, которое нейросети могут превращать в простые ответы.
Дело в количестве, переходящем в качество. Системное свойство, или как модно ныне говорить «эмерджентность».
Человек способен на интуицию. На мой взгляд нейронки базово сейчас как раз работают аналогично интуиции. Только эдакого замороженного состояния интуиции, в силу статичного состояния обученной НС.

2 3 ...

6 7