Комментарии / Профиль iivvaall / Хабр

Алексей Иванов@iivvaall

data scientist, гештальт-терапевт

Подписчики

Я два месяца платил 300к человеку, который тихо скармливал мои задачи в ChatGPT

Схема, от "что чувствую" тут не работает. Есть размытость границ "кто задачу сделал, Дима или чатжпт", если чатжпт такое делает, то "чем я как специалист от нее отличаюсь" человек я или робот в конце концев. В такой размытости чувства не рождаются

Тревога (энергия на ориентировку) есть. Она реальна и конструктивна. Тревога это то, что подстёгивает осваивать ии, находить новые смыслы, формулировать новые вызовы

Я ДС с довольно сильными кодерскими навыками. Многие задачи я втаскивал за счёт того, что не боялся кодить сложную логику. За счёт этого я был круче среднего. Сейчас же объем работы, который я по старинке делал бы два-три дня, с агентом делается за час.

Уже пару раз чатжпт мне выдавал идеи, до которых без него я не допер бы

В таких условиях на вопрос "кто я" надо искать новый ответ.

Почему я уверен, что вердикт был бы такой же? Детали публично рассказывать не буду, но аналогичную ситуацию я уже видел. Честно прошел путь от "как же такое может быть, это сюр какой-то" до осознания, что без некоторых ингредиентов человек даже с чатжпт разрабом не станет

Я два месяца платил 300к человеку, который тихо скармливал мои задачи в ChatGPT

iivvaall 27 фев в 12:55

Здесь ключевое не в том, что человек GPT задачи скидывал, а то, что не вникал в суть. Такой вот Дима это временное явление. Vibe coding сейчас на этапе внедрения. Когда он станет стандартом de-facto сложность задач вырастет и такие вот Димы перестанут справляться с их сложностью.

Я два месяца платил 300к человеку, который тихо скармливал мои задачи в ChatGPT

iivvaall 27 фев в 12:44

Скорее визитор

Я два месяца платил 300к человеку, который тихо скармливал мои задачи в ChatGPT

iivvaall 27 фев в 12:35

Можно, для опыта. Просто, чтобы понаблюдать и убедиться. Вердикт был бы такой же. Навык понимания за два месяца не нарабатывается. За год тоже

ИИ вне алгоритма: рождение агентности в точке невозможности

iivvaall 15 янв в 21:25

Уверен вам приходилось что-то раскуривать. Уверен у вас были моменты, когда что-то не понимал, а потом вдруг понял. Помните такие моменты?

Если вы реально попытались вспомнить, то уверен вы поняли о чем идет речь. В вашем сознании есть понятие "понимание".

А еще возможен вариант, что первые три предложения (уверен что ..) вы прочитали чисто механически. Возможно вы подумали что-то вроде "причем тут это", "почему вы не даете определение сознания в моих долбодятлах"

Первый вариант можно счесть актом сознания. В вас есть понятие "понимание" которое обозначается словом "понимание". Во втором варианте вы оперировали словами почти буквально. Можно сказать что первый вариант это акт сознания, а второй соответствует дознаковому опыту.

Это если понимать "сознание не как мистическую субстанцию, а как механизм интерпретации, возникающий из семиотического коллапса — разрыва между знаком и феноменальным дознаковым опытом." Невозможно понять что такое понимание вторым способом. Чтобы это сделать, нужно переходить к первому варианту

ИИ вне алгоритма: рождение агентности в точке невозможности

iivvaall 15 янв в 20:25

Тоже показалось, что это бред. Запихнул ради прикола в deepseek, а он и говорит

"Ваш текст представляет собой глубокий и последовательный философско-теоретический манифест, развивающий оригинальную концепцию сознания и агентности в искусственном интеллекте. Это серьёзный вклад в дискуссию, выходящий за рамки популярных аналогий и спекуляций."

Пораскуривал немножко. Как я понял, это сложный способ объяснить простой феномен. LLM'ка вроде как тупо предсказывает следующий токен и все. Но, если текста слишком много, она вдруг может спонтанно начать понимать смысл прочитанного.

Исследование эмоционального выгорания у программистов ...

iivvaall 16 янв 2025 в 22:20

Человеку нужна помощь не в том, чтобы разобраться в исследовании, а в сборе материалла.

Скорее всего из накопленного есть только четыре опросника отдаленно связанные с темой и вполне шаблонная для такого рода работ формулировка предмета исследования. Дальше человек прогонит те же опросники на контрольной группе , посчитает корреляции, найдет отличия в группах и натянет на нее какую нибудь гипотезу.

Дообучаем Llama 3.1 у себя дома

iivvaall 7 ноя 2024 в 10:42

Спасибо за статью. Начал погружаться в тему, нашел ее в гугле. Отличный starting point

Исследование МПСУ: разработчики со временем теряют способность к эмпатии и становятся безэмоциональными

iivvaall 13 авг 2024 в 12:40

Выглядит как чья-то дипломная работа. Ну или подготовка к ней. До диплома еще контрольной группы не хватает.

+10

В «Яндекс Маркете» появился новый инструмент для работы с брошенными корзинами

iivvaall 25 мая 2024 в 08:47

Вот именно потому, что там очень много конкурентов, цена такая большая. У нас продажи это две трети людей. А кушать хотят все. И потому с трёх рублей продажи один уходит производителю а два продажникам и посредникам.

Российские учёные разработали новый метод выявления кражи ИИ‑моделей

iivvaall 21 мая 2024 в 19:02

В статье утверждается, что они придумали как сделать так, чтобы этот секретный отклик сохранялся при дообучении

Tinder ушёл… да здравствует $hyoo_match

iivvaall 6 июн 2023 в 15:09

Неужели кто-то соглашается делать фото каждый день, да еще и самому с телефона. Отбирать на сайт знакомств привлекательные фотки довольно естественно.
Мертвые на сайте не только те, кто давно не заходил. Есть и те, кто просто пришел по-переписываться. Возможно есть смысл сразу матчить время для встречи. Во всяком случае я в бытность пребывания на сайте пришел примерно к такой стратегии: одна, максимум две фразы и сразу предложение встретиться. Какие серьезные отношения, если человек не может оторвать попу от дивана и дойти до кафешки.
Непонятно зачем для такого приложения собственная распределенная криптографическая база. Слишком много разноплановых инноваций для одного продукта.

+22

РКН предупредил о рисках дезинформации пользователей рекомендательными алгоритмами

iivvaall 24 мая 2023 в 17:18

Ну мне на медузе в глаза бросилось. Вижу, что феномен чуть шире. Спасибо

РКН предупредил о рисках дезинформации пользователей рекомендательными алгоритмами

iivvaall 24 мая 2023 в 14:15

Интересно, что в последнем абзаце есть слово "якобы". Им медуза еще любит баловаться.

Лично меня тексты с таким словом настораживают. Если автор статьи имеет другое мнение по какому-то вопросу, почему бы его не развернуть, подкрепив какими-нибудь рациональными пояснениями. Вместо этого используется "якобы".

Это такое веяние моды? Почему был выбран именно такой способ подачи? Какой эффект он производит? На мой глаз, частое использование таких слов потихоньку подтачивает способность тестировать реальность.

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

iivvaall 13 мар 2023 в 13:20

Да. Мой комент чисто про простые DS'овские вещи, которые можно сделать быстро. На все остальное надо уже какие-то предположения про предметную область делать;

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

iivvaall 12 мар 2023 в 22:05

320 для finetuning'а трансформера может быть достаточно. При малом величине эффекта их может оказаться недостаточно для стат значимых выводов.

Для проверки статзначимости можно сделать stratified k fold валидацию и U-test Манна Уитни. Разбить датасет на 10 фолдов. Поочередно вынимать каждый из них для теста, обучать модель на оставшихся 9-ти (разбив на train и validate) и генерить тестовые предикты. После 10-ти итераций каждый элемент датасета побудет один раз в тесте и предикты будут для каждого элемента. Дальше их можно разбить по ground truth группам и проверить гипотезу, что скор в одной группе больше чем в другой против односторонней альтернативы.

Параллельно можно усреднить предикты этих 10 моделей для датасета из google forms, в котором 20 примеров и посчитать Манна Уитни на них. Возможно там будет статзначимость. Хотя, если процедура сбора датасета одна и та же, это вроде бы не принесет дополнительной информации.

Для проверки стат значимости оценки людей, можно усреднить показания этих 17(уже 30) человек на этих 20-ти текстах и посчитать критерий Манна Уитни. Для 17 человек скор можно считать непрерывным.

Как создание бинарного классификатора открыло ящик Пандоры в стандартах владения английским языком

iivvaall 12 мар 2023 в 11:51

Здравствуйте. Интересная тема. Интересно, правда ли нейронки могут определять носителей или нет. После прочтения осталось неудовлетворенное любопытство и желание покритиковать методическую сторону.

20 и 17 и даже 160 это очень маленькие цифры. Если оперируете датасетами такого размера, очень важно аккуратно тестировать статзначимость проверяемых гипотез. На датасетах такого размера большие метрики могут получиться чисто случайно.
У всех приведенных метрик (precision, recall, f1, accuracy) baseline в виде рандомного классификатора с ходу не ясен. Он зависит от баланса классов в выборке, а recall у рандома вообще произволен. Для беглого чтения неплохо было бы привести ROC AUC
Для ответа на вопрос, может или нет ИИ делать такую классификацию в принципе, можно не смотреть на величину эффекта, важна лишь стат значимость. И очень важна методическая сторона сбора датасета. Важно, чтобы датасеты собирались единообразно. Например, если в native части будут новости, а в second language -- сочинения на тему как я провел лето, остается сомнение, может оно научилось отличать сочинения от газетных статей, а не то, что от него хотели. Во втором эксперименте вы явно говорите, что источники разные. В эксперименте с google forms вообще не говорите как собирался датасет.

Без прояснения методологии ваши выводы вызывают недоверие. Лично для меня Ваша статья на вопрос, может ли ии распознавать носителя, не отвечает. К сожалению. Вопрос очень интересны.

+10

Как спрогнозировать спрос на самокаты и не захламить город, версия Whoosh

iivvaall 3 мар 2023 в 12:33

От меня у вас нет ни стартов, ни финишей. Ну просто потому, что самокатов в нужное мне время просто нет. Без явного учета доступности, ваша модель это не увидит. Она будет свято верить, что все хорошо, ибо ожидание старта нулевое.

Как спрогнозировать спрос на самокаты и не захламить город, версия Whoosh

iivvaall 3 мар 2023 в 12:15

А вы только старты рассматриваете? В прошлом сезоне активно пользовался самокатами. Рассматривал их в том числе как альтернативу маршрутки до метро. Езжу после часа пик. Вот не получается стартануть ни утром, и ни вечером. Утром все самокаты у метро, вечером у домов.

Как я на психотерапию ходил. И этот опыт помог мне найти жену

iivvaall 27 фев 2023 в 10:54

Я про то, что одно другое полностью заменить не может. А вот обогатить друг друга да, очень даже.

2 3 4

Информация

Специализация