Тоже на коленке делал прогу, которая описывала каждую фотографию нормальным языком. Делал через API Ollama на модели Gemma... Основная проблема выплыла в том, чтобы описать весь мой архив фото, надо несколько месяцев работы машины (да, я слишком много фотографирую).
обратите внимание на потребления трафика во время распознавания. Не знаю как сейчас (сейчас в целом локальных мощностей для такого при наличии ГПУ может и хватить) - но тогда она онлайн это делала - загружая фоточки на серваки гугла))
дааа... приходилось искать мод и его использовать.... А это тогда был не этот ваш современный интернет где всё находится в пол клика если надо. тогда надо было знать где искать )
Я бы так не сказал. ЧатГПТ по сути сочинил простой человекочитаемый текст, без каких то особенностей промтов - вот его флюксу я и скормил. Вполне такой сочинить и "руками" можно. Т.е. описать побольше деталей особенностей и прочее. Просто ГПТшкой быстрее получилось )
Со свиноциклом такая же ситуация. Попросил придумать концепт мотоцикла с "запчастями" от свиньи. И скормил флексу. "Годных" результатов уже побольше чем с годзилой.
Видимо таки надо больше слов накидывать что бы он "понимать начинал" такие описания
Вообще во флюксе (правда не Про) получилась с годзиллой. Но одна из четырех генераций и промт не совсем "честно" составлял. А попросил чатГПТ максимально подробно "описать" некую выдуманную фотографию на которой изображена годзилла с головой человека. Ну он и нагенерил несколько абзацев текста. Который я флюксу и скормил.
Очень похоже, что в обучении сети и работа пользователей будет в том числе, как и миджорни - генерится 4 картинки, пользователь выбирает ту что лучше. Сеть постепенно на этом обучается. Но в этом случае смущает что режим цензуры сразу включили, моделька может построится немного неполноценной.
Вот вот. Фотография как некий инструмент для получения эмоций ее участниками это то, что лично я всегда и пропагандирую :-) И даже не всегда важно качество результата :-) Хотя "настоящие фотографы" со мной и не соглашаются чаще всего :-)
я подозреваю что кое где и кое кто это может сделать. Но по крайней мере «на рынке» их так просто уже не купить. Т.е. обычный средний пользователь к ним доступ вряд ли получит легко. Кому надо то полагаю что справятся да )
Просто пока их толком не регулировали никто и не раскручивал эту тему… как вспомню начало 2000х и базы данных с паспортами и домашними адресами распространяемые просто зачастую бесплатно по принципу — «дай списать»… Сейчас на это внимание пристальное, отсюда и ощущение роста таких случаев. Ну и конечно количество различных онлайн баз выросло — соответственно и больше их утаскивают, просто статистически.
А почему интересно Пермь выпал? Гортранс тут вроде вполне себе не плохо делится данными. И API есть и приложения сторонние есть которые работают с транспортом… Яндекс тот же вполне справился :-)
В инстаграме использовал пока была функция сохранения лайкнутой тобой фотки в гугл…
Потом ее заблокировали. После этого программа в целом уже не нужна стала.
Сейчас уже просто по традиции сохраняет историю SMS и звонков… не то что бы это было нужно учитывая что и того и другого по минимуму сейчас, но работает и работает…
Вообще о чем речь? Студенты постоянно списывают рефераты из сети зачастую не понимая о чем пишут. Тут просто это ярко проявилось.
В бытность преподом отлично различал рефераты написанные самими студентами и списанные один в один. Для этого не нужно даже что бы студент в кодировке сбивался :-) Всегда так были и всегда так будет… А тут просто да. посмеяться. Ничего нового, просто новое проявление старой «традиции».
Хм… интересно.
Конечно есть подозрение что с «шумами» бороться конечно будет очень не просто. По сути электрические импульсы порождают и другие мышцы… да и не только мышцы.
Но в принципе думаю интересная штука бы была при любом раскладе, а если бы удалось несколько автоматизировать процесс дешифровки ЭКГ это было бы совсем хорошо, в том числе и врачам. Это терапевты-кардиологи ЭКГ читают с листа, а все остальные спецы разве что инфаркт грубый найдут и то хорошо, да и то не все, а иногда надо бы…
Так что выскажу пожелание продолжить ваши изыскания и после диплома, найти себе заинтересованного товарища кардиолога и совместно с ним проверить эту тему на предмет реализации :-), глядишь и измените что то к лучшему в нашей медицине :-)
Тоже на коленке делал прогу, которая описывала каждую фотографию нормальным языком. Делал через API Ollama на модели Gemma... Основная проблема выплыла в том, чтобы описать весь мой архив фото, надо несколько месяцев работы машины (да, я слишком много фотографирую).
обратите внимание на потребления трафика во время распознавания. Не знаю как сейчас (сейчас в целом локальных мощностей для такого при наличии ГПУ может и хватить) - но тогда она онлайн это делала - загружая фоточки на серваки гугла))
дааа... приходилось искать мод и его использовать.... А это тогда был не этот ваш современный интернет где всё находится в пол клика если надо. тогда надо было знать где искать )
Я бы так не сказал. ЧатГПТ по сути сочинил простой человекочитаемый текст, без каких то особенностей промтов - вот его флюксу я и скормил. Вполне такой сочинить и "руками" можно. Т.е. описать побольше деталей особенностей и прочее. Просто ГПТшкой быстрее получилось )
Со свиноциклом такая же ситуация. Попросил придумать концепт мотоцикла с "запчастями" от свиньи. И скормил флексу. "Годных" результатов уже побольше чем с годзилой.
Видимо таки надо больше слов накидывать что бы он "понимать начинал" такие описания
Скрытый текст
Вообще во флюксе (правда не Про) получилась с годзиллой. Но одна из четырех генераций и промт не совсем "честно" составлял. А попросил чатГПТ максимально подробно "описать" некую выдуманную фотографию на которой изображена годзилла с головой человека. Ну он и нагенерил несколько абзацев текста. Который я флюксу и скормил.
Скрытый текст
Очень похоже, что в обучении сети и работа пользователей будет в том числе, как и миджорни - генерится 4 картинки, пользователь выбирает ту что лучше. Сеть постепенно на этом обучается. Но в этом случае смущает что режим цензуры сразу включили, моделька может построится немного неполноценной.
Нет. Доступ дают. Мне буквально за час выдали допуск после запроса.
Вот вот. Фотография как некий инструмент для получения эмоций ее участниками это то, что лично я всегда и пропагандирую :-) И даже не всегда важно качество результата :-) Хотя "настоящие фотографы" со мной и не соглашаются чаще всего :-)
"like" дна из соцсетей конкурентов тиктока.... Видимо кто то занесденег куда надо :-D
Потом ее заблокировали. После этого программа в целом уже не нужна стала.
Сейчас уже просто по традиции сохраняет историю SMS и звонков… не то что бы это было нужно учитывая что и того и другого по минимуму сейчас, но работает и работает…
В бытность преподом отлично различал рефераты написанные самими студентами и списанные один в один. Для этого не нужно даже что бы студент в кодировке сбивался :-) Всегда так были и всегда так будет… А тут просто да. посмеяться. Ничего нового, просто новое проявление старой «традиции».
Конечно есть подозрение что с «шумами» бороться конечно будет очень не просто. По сути электрические импульсы порождают и другие мышцы… да и не только мышцы.
Но в принципе думаю интересная штука бы была при любом раскладе, а если бы удалось несколько автоматизировать процесс дешифровки ЭКГ это было бы совсем хорошо, в том числе и врачам. Это терапевты-кардиологи ЭКГ читают с листа, а все остальные спецы разве что инфаркт грубый найдут и то хорошо, да и то не все, а иногда надо бы…
Так что выскажу пожелание продолжить ваши изыскания и после диплома, найти себе заинтересованного товарища кардиолога и совместно с ним проверить эту тему на предмет реализации :-), глядишь и измените что то к лучшему в нашей медицине :-)