Pull to refresh
388
5.2
Олег Чирухин @olegchir

Продакт GigaIDE Cloud, фаундер Anarchic

Send message

Ну это осознанный выбор всех этих людей, не? Можно купить автомобиль с автоматом, а можно поставить механику и постараться сломать ее в первый день. Хочет ломать - пусть ломает. Все взрослые люди.

Меня особенно поразили их промты.

Один из моих пет-проектов - анализ медицинских данных с помощью ИИ. (Вместе с Верой, которая переводила эту статью). Поэтому есть некий опыт набирания промтов к Claude, Grok, ChatGPT и Gemini.

Так вот, по моим наблюдениям, сказать: "У нас есть пацент с проблемами [проблема]. О Великий Вычислитель, подскажи, что с ним не так!" — это один из худших способов задать вопрос к LLM. А это ведь практически цитата из пейпера выше!

Обычно нейронке надо подробно объяснять, как ей нужно думать, куда смотреть, в какие области поыткаться первой. Тут можно сказать: ну это же нечестно, это "человеческий след" при создании промта. Ну так вы сделайте несколько этапов, на первом вы выбираете область действия промта, потом подбираете параметры, потом задаете сетке финальный рендер промта... Ну словом, всё как всегда в других областях типа программирования.

Кроме того, можно и нужно иметь какой-то RAG для похода в библиотечные данные, а не просто натренировать лору поверх PaLM или чего там они заюзали по причине того, что это это Google и использовать Claude - непатриотично. Блин, им было настолько стыдно, что они даже не выложили веса (аргументировав необычной опасностью информации, вдруг люди начнут самолечиться!).

Есть предположение, что если бы почти все авторы работы не были так или иначе аффилированы с Гуглом, и там в результате работала Claude с RAG-ом (хотя бы тем убогим, который у них сейчас есть по API), и промты писали в несколько этапов а не "о великий вычислитель, сделай хорошо" - результаты были бы куда радикальней. Не в пользу врачей радикальней.

С другой стороны, вроде бы, всё так и должно быть. Математики не соревнуются с калькулятором в способности перемножать матрицы. Почему нам нужно беспокоиться, что вместо врачей матрицы дифдиагнозов будет перемножать компьютер? Плюс, автоматический учет всей безумной бумагомарательной работы для документирования такового умножения. Наборот, замечательно. Может, у врачей высвободится время, чтобы заняться чем-то более полезным.

Если почитать там внутри, то ИИ ставил диагноз по подробному описанию кейса, а у людей которые с ним соревновались были ещё разные фотографии и рентгены (этот конкретный ИИ ещё не умеет смотреть на картинки). То есть, все невербальные штуки уже зафиксированы и переведены в текст, плюс проведена полная диагностика случая в размере, достаточном для дифдиагноза - то есть всякие штуки типа биохимии крови и рентгенов уже проведены.

То есть, здесь ИИ это замена не врача на первом 10-минутном приеме, это скорей замера Доктора Хауса, которая по всей совокупности всего с одного взгляда находит истинную причину. Но вначале для этого электронному Хаусу нужен кейс с достаточно хорошо собранными данными внутри.

Утверждение "из лжи следует что угодно" — прямое следствие из таблици истинности операции импликации.

Таблицы истинности логических высказываний - это 10-11 класс информатики в российской школе. Это есть в ЕГЭ по информатике.

Даже если школа очень плохая и там не было информатики, то на первом курсе технического вуза, на специальностях типа мехмата или информационных технологий обязательно есть предмет "математическая логика" или эквивалентный ему, и там это точно обсуждается на первых же занятиях.

Постановку задачи на разработку чего либо, в том числе - постановку на разработку архитектуры, нужно кому-то делать.

Кошка — это священное животное. Она применяется во всех случаях демонстрации второго закона термодинамики — неубывания энтропии в повседневной жизни. Например, как каноническая иллюстрация невозможности однозначно провернуть сгенерированный JIT-компилятором код (фарш) назад в исходный код (кошку).

Восславим Кошку! :)

Да!

Может, код не исчезнет, но точно станет другим. Например, сейчас многие работают на AI-first механизмами разметки кода, потому что тупой RAG по тексту неразмеченных исходников работает криво. Может даже, появятся специальные AI-first языки программирования.

Т.е. происходит тот же процесс, который когда-то прошли трансляторы, генерирующие ассембер и машинный код. Начиная с какого-то момента люди (в массе своей) перестали смотреть на то, какой именно код им сгенерировался в exe-файле.

По той же причине у нее не будет двухсот плюсов и срача не тысячу комментариев. А хотелось, бы наверное. Впрочем, черт с ним. Беспощадный срач у нас будет в статье про соревнование кодер vs LLM :)

Из Клода была скопирована только полная цитата из Терминатора. Ну и под конец попросил расставить запятые и поправить грамматические ошибки, но с этим Клод справляется не очень хорошо (случай r в strawberry)

Писать сейчас статью и не прогнать перед публикацией через нейронку - это чистая потеря времени читателей, которые без этого будут репортить тебе десятки опечаток. Всё, статьи совсем без ИИ больше не нужны. Это примерно как фоточки в Инстаграме, которые всегда прогоняются через фильтр перед отправкой.

Иронические истории Лёши обо всём на свете - не то же самое, чем он реально занимается :) Лёша - офигенный инженер, который решает тяжелые задачи и разгадывает сложные головоломки. Просто посмотри на его баги и раздел recent posts на сайте. Ему платят по факту решения всех этих трудных задач. Это то, что выясняется простым наблюдением за делами, а не за словами.

Не просто "будет", а все продвинутые чуваки с этим экспериментируют прямо сейчас :)

Кажется, тут очень важно попридираться к словам. Не все LLM одинаковые. Можно специально тренить LLM конкретно на StackOverflow. Или натянуть поверх ламы/квена/глм какую-нибудь лору - максимально нищебродский способ тюнинга. Можно забэкать это всё через RAG который ходит напрямую в дамп SO по архитектуре Perplexity с многоуровневыми моделями (лама онпрем для анализа, клод для финального синтеза результата). У SO очень четкая структура данных (многолетние драконовские правила), так что у тебя есть четкий план запроса.

Всё вместе в одну сторону - это уже очень похоже на "знает наизусть". Сейчас можно взять Perplexity и попросить ее поискать что-то, про что ты совсем недавно читал тикет на SO. С шансами она не только найдет этот тикет, а еще несколько тикетов которые намного лучше.

Внедрение нейронок не означает, что у разработчиков будет меньше работы, или она станет менее интенсивной.

Большинство инструментов повышения продуктивности для того и предназначены, чтобы ты мог работать больше и лучше.

Это не значит, что ты теперь сможешь работать 10 минут в день вместо 480, выполняя ту же самую норму производительности.

Нет, это значит только то, что норму и требования к тебе повысят в 48 раз.

Про это наша следующая статья. Stay tuned. Скину тебе ссылку или комментом или в личку.

Да, конечно. Это видно по публичным заявлениям и по перебалансировке приоритетов найма в бигтехе. Не только в США, но и в России.

Способов заработка у разработчика сильно больше, чем идти в инженеры и кодеры. Например, я не инженер.

Тут два момента.

Во-первых, перед тем как Вера опубликовала этот перевод, она показала его мне. Я каждый день, уже достаточно давно, читаю научную литературу по машинному обучению и медицине. Зачем: один из наших пет-проектов - ИИ для врачей, который умеет читать кардиограммы и анализы крови. Конечно же, я не профессиональный врач и не профессиональный химик, но перевод такой легкой статьи как здесь - вполне могу оценить. Этот текст не самый точный, не самый лучший на свете, но с пивом пойдет. Сильно лучше, чем если бы никакого перевода не было вообще, и люди не стали бы заморачиваться изучением этого материала.

Во-вторых, Хабр - это всё-таки не филиал Пабмеда. Люди с утра проснулись, пришли на работу и читают Хабру чтобы проснуться. Или наоборот, вечером пришли домой и под пивас читают разные ништяки на Хабре, рядом с Пикабу, прохождением Baldur's Gate 3 и вайб-кодингом ИИ стартапа на Питоне.

Классический дотошный перевод научной статьи не очень хорош для развлекательного употребления. Хотя бы потому, что научные статьи пишутся совершенно не для того, чтобы быть увлекательными. Например, в исследовании могут быть огромные таблицы с данными, которые в развлекательном формате никто читать, конечно, не станет. Это максимум материал для того, чтобы убрать под спойлер, который в реальности развернет ну может человека 3 из 30 тысяч открывших статью. Обычно люди просто верят, что раз уж ученые чего-то там решили, то какие-то данные у них есть.

В этом научпоп очень напоминает религию. Губерман в подкасте сказал, что нужно есть ежовик, потому что он чего-то там повышает - людям остается только поверить или не поверить Губерману. И если раньше Губерман аккуратно собирал референсы на то, что он там рассказывает, то с течением лет он забил на это дело - референсы всё равно почти никто не читает. У людей нет столько времени на это. Я как раз из тех, кто проверяет, и имхо, временами он несет какую-то сектантскую дичь. Но опять же, суммарный эффект его как инфлюенсера лучше, чем если бы он вообще ничего не нес.

Например, в этом адаптированном переводе так удален раздел про этику, где ученые старательно подстилали себе соломки, чтобы их потом не засудили. Это типичный раздел любой медицинской работы с людьми: мы можем сделать вот такие вещи по такому закону, а вот такие - по такому закону. Читать это в развлекальном формате неинтересно. Более того, практически никто не разбирается в законе других стран настолько, чтобы понять, о чем там идет речь и на какие статьи ссылались юристы.

В научных статьх две трети текста может быть (и реально является) самоповторами, просто чтобы добить объем текста до правильного размера. При адаптации для Хабры, имхо, всю эту дичь нужно фильтровать и удалять. В ходе такой кастрации может потеряться и что-то полезное. Штош, жизнь такова и никакова больше.

Поэтому я сразу говорю, что это некий адаптированный перевод. Который пропущен сквозь конкретных людей и их видение мира. Если ты не доверяешь этим людям, и тебе зачем-то нужна реальная точность данных (например, ты медик и для тебя это вопрос жизни и смерти на работе) - пожалуйста, пройди в оригинальный текст и читай всё на английском. Это будет больно и скучно, но у тебя будет точность.

Если тебе нужно под пивас почитать свежие пейперы - добро пожаловать.

В развитых странах на ВРТ приходится до 6% рождений. А еще больше людей просто не имеют финансовой возможности сделать ВРТ, или оно на них не работает по разным причинам. Это достаточно большой вклад. Не ключевой, но достаточно высокий.

Зачем? В шапке написано, что делали ребята из Conceivable Life Sciences. Это пост, оформленный как перевод - значит, там же в шапке есть первый в списке автор (Херардо Мендизабаль-Руис), и она ведет на полный текст статьи, где можно прочитать про коллектив и так далее. Это обычные для Хабра вещи.

Тема действительно сложная, но статья норм. По диагонали посмотреть стоит. Но перевод статьи - близкий к оригиналу, чтобы проще было читать. Если нужно по работе для цитирования в публикациях - лучше читать на английском, вот оригинал.

Information

Rating
202-nd
Location
Россия
Works in
Date of birth
Registered
Activity

Specialization

Chief Technology Officer (CTO), Chief Executive Officer (CEO)
Lead
From 2,000,000 ₽
Product management
Project management
Marketing research
Game Development
Web development
Software development