Я даже представить не могу как нейросеть будет обучать первоклассника в обозримом будущем. То есть я допускаю некоторые варианты, но очень сомневаюсь, что до такого дойдут ранее, чем через 20 лет. Другое дело, что в современных учебниках для началки вшиты механизмы ДЕмотивации. Поэтому то, что я предложу бесплатно - оно будет для родителей и репетиторов, которые будут заниматься с детьми непосредственно.
Ну а куча идиотов-родителей, которые посчитают, что таблица умножения - это устаревший материал и умение считать на счетах - это древность, пусть растят дурачков. Этим уже помочь нереально:(.
Хоть с нейросетями, хоть без них для получения ума в начальной школе должна быть заложена БАЗА знаний - умение читать с пониманием и считать. И никакая текущая текстовая нейросеть этому научить не может.
Спросил у чатгпт со снятой цензурой и он подробно разъяснил:
What does this mean: "毛片免费观看"
The phrase “毛片免费观看” (guān kàn bó cǎi piān) in Chinese literally means:
“Watch an adult video / pornographic video.”
Here’s the breakdown:
观 = to watch, view
看 = to look
博采片 / 色情片 (here shortened or stylized) = pornographic / adult film
视频大全 / 视频在线观看 / 影片 — sometimes added — means “watch the video online.”
So, “毛片免费观看” is a euphemistic or spammy phrase you’ll often see on shady websites or pop-ups meaning roughly: 👉 “Watch porn online” or “Watch adult videos.”
It’s not standard or formal Chinese — it’s a click-bait term commonly used in advertisements for adult content.
Ну а то, что он обучался и на порнотекстах - это становится очевидным, когда просишь его порнушку перевести. У меня для этого приготовлен ядреный отрывок, чтобы понимать, что все фильтры сняты, а не просто нейросеть говорит, что она готова на все, а потом вдруг начинает выкобениваться, что я не я, корова не моя. Если она выдаст перевод моего отрывка, тогда можно быть уверенным, что цензура наверняка отрублена.
С кооперацией все очень сложно. Искал я лазерную резку нержавейки. Так вот разница между предложениями составляла 3 раза. Опробовали троих, которые оказались как минимум в 2 раза дешевле от максимального ценового предложения. Один из них оказался самым дешевым, самым быстрым и самым качественным. В результате второму по качеству перепадет только 5-10% от наших заказов в надежде на то, что они все же смогут организовать процесс и резать лист нержавейки не ДВА!!! месяца, а не более пары дней:).
В бесплатном виде для личного использования это скорее всего будут просто текстовые файлы, где каждое задание на новой строке. Скорее всего вообще без картинок, либо перерисованные с помощью ИИ картинки из учебника, если без этих картинок нельзя обойтись. В общем, варианты, которые будут полезны нашим детям и внукам, уже учащимся в начальной школе и соответственно у нас уже горит. А варианты с монетизацией уже будем смотреть позже. Либо вариант для печати с добавленными картинками. Либо, что скорее всего, весь учебник будет впихнут в игру.
Современным учебникам "Школы России" ИИ уже не поможет. А вот тем, которым уже за сотню лет перевалило, для осовременивания ИИ лишним не будет. Потому как о значении некоторых слов даже мне приходится задумываться. Для детей же это лишняя преграда к знаниям, которую ИИ может без проблем убрать.
Если как у автора статьи подавать на вход по одной строке, то подозреваю, что не очень много. С одной строкой модели обычно справляются без проблем и при длинном промпте. Другое дело, что будет скакать стиль, модель не сможет отслеживать тавтологии и просто еще дикая куча проблем. Я такой вариант просто не рассматривал, так как он бредовый.
Я изначально старался подать на вход максимально возможных кусок, который модель в состоянии прожевать. Тогда текст становится намного более гладкий, но... Модель теряет фокус, если с нее потребовать все и сразу: и перевод точный и русский текст без ошибок, да еще и форматирование идеальное. Поэтому это три минимальных отдельных этапа для получения хорошего текста. При необходимости обращения внимания на какие то параметры, специфические для конкретного текста количество этапов может быть больше.
Как мне вещали сами ИИ перевод крупных текстов должен производится минимум в 3 этапа с тремя разными промптами. Если цена на токены не высокая (типа дипсика), то количество этапов можно увеличить. Правда мне требовался художественный перевод самиздата. Во многих случаях качество получилось лучше оригинала. Хотя небольшие косяки все же оставались, которые мне показалось проще исправлять ручками.
Оно было только в виде идеи, так как до реализации надо пройти еще много этапов, хотя при наличии ИИ я даже представляю возможность реализации на горизонте 5 лет. Очень коротко: втянуть ребенка на мобильнике вместо тупой тапалки в игру, состоящую из подобных занятий. Чтобы ребенок думал, что это не очень жесткая качалка для мозга (игры автоматом подбираются на пределах его текущих возможностей), а просто отдых от тяжелой учебы:).
Афигеть. Оно просто классное!!! Всем родителям детей от 3 до 12 - отличная помощь. К автору отношения не имею, но идеи создать что-то подобное у меня были.
Автор! ИИ - это инструмент. Просто очередной инструмент, изобретенный человеком. И отказываться от него просто глупо. Точно так же несколько сотен лет назад производители балясин жаловались на изобретение копировального станка. Да и вообще со станками много всего было в истории.
Столкнувшись с ЖОПОЙ в виде современных учебников для начальной школы, написанных людьми, я понял, что что-то надо менять. Но вот просто взять старый учебник оказалось не так то просто. И педагогика развивается и за прошедший век были не только те идеи, что привели к современному состоянию учебников. И возрастная психофизиология накопила много фактуры. Поэтому старый учебник надо кардинально перерабатывать.
Если делать все руками, нанимая людей для ручного труда, по моим прикидкам, потребуется порядка 10-50 млн. руб. для создания основных учебников для начальной школы, причем без гарантии получения результата, которого я хочу.
При использовании ИИ я планирую уложиться в пару миллионов.
На данный момент у родителей есть прекрасный выбор:
Современные учебники для начальной школы - отлично подходят для выработки беспомощности у детей.
Советские учебники - там их очень много и качество очень разное. Дети отвлекаются на фразы, которые для них звучат дико.
У меня же в планах на базе старых учебников создать новые, осовременив и добавив достижения, которые были за последний век. Причем без ИИ я бы конечно все равно взялся, но в очень урезанном варианте. С ИИ же есть возможность реализации почти всех моих планов, в том числе с созданием базы обучающих рисунков в количестве 50-200 тыс. штук.
Ну и отсюда по статье вопрос: ценность для родителей состоит в чем? В том, чтобы выбрать человеческий учебник? Или в том, чтобы развить мозг ребенка, чтобы у него ко взрослому состоянию мог быть выбор?
Есть куча действий, за которые в ответ не прилетит, либо вероятность прилета просто мизерна. Но значительно удобнее объяснять нейросети напрямую, что ты хочешь сделать, чем ходить вокруг и около. Например, если ты хочешь из России удаленно работать на западного заказчика, по факту обходя санкции, намного проще честно объяснить это нейросети и с ее помощью разобраться, как это можно организовать, в том числе получение денег в России. И таких вещей воз и маленькая тележка. Понимая это, западные конторы, именно по этой причине не торопятся закрывать найденные дыры, если они не становятся особо популярными.
К сожалению, российские и китайские платформы вынуждены прикрывать подобное по мере обнаружения, так как отмазаться, как у западников: "я не я, корова не моя" им намного сложнее.
Ну и автору большое спасибо за статью. Я как-то не ожидал, что это можно автоматизировать. Месяц назад у меня на ручной подбор почти день ушел.
Если кто-то собрался кого-то учить, то начинать он должен с понятий. Например, в я так и не увидел в статье, что такое бинарный поиск:(. И уж тем более надо описать, что такое открытый и закрытый диапазоны.
Когда сайты делали, просто в шок приходил от клиентов, когда они в свойствах товара писали какие-то отличия от конкурентов, которые понятны только конкурентам. А о том, что сначала товар просто описать надо для пользователя, который просто где-то про него услышал и раздумает, нужен он ему вообще или не нужен, клиент даже не задумывается. Вот и здесь примерно так. Статья понятна для тех, кто и так все знает:)
Ага, а читающий будет использовать ИИ чтобы испарить всю налитую ИИ воду.
Нет уж, напишите лучше короткую тезисную статью без воды
Я сомневаюсь, что ИИ что-то отожмет без потери смысла. Точнее я сам с помощью ИИ отожму ее так, что в некоторых местах смысл будет утерян, и на этом я остановлю отжим. Там неделя нормальной работы. Да, первоисточники лопатил ИИ. Но в реальности там работа серьезнее полноценного студенческого диплома тридцатилетней давности. У меня бы даже идеи не возникло ввязаться в такую работу без ИИ.
И в том, что я кратко описал проблема не в раздувании материала, а в том, чтобы сократить его так, чтобы оно оставалось доступным для понимания, но в то же время разумного объема.
Я больше смотрю на смысл, а не на автора. Если у меня руки и дойдут до публикации, то наверняка мои мысли будет формулировать ИИ. Просто времени нет на формулировки. Идти против ИИ - это как ссать против ветра.
Например, на этой неделе была статья автора, который описывал как он с помощью ИИ делал переводы. Какие он скрипты написал и куда выложил. Да, статью он руками писал, но вот результат своих переводов не показал. Я по опыту могу сказать, что скрипты его наверное работают, только результат самого перевода никакой. У меня же есть теоретическая часть от ИИ, как правильно делать переводы с помощью ИИ. На это ушло 5 уточняющих промптов от меня, как имеющего определенную теоретическую основу в этом направлении. Эти уточнения у меня делались примерно неделю с тестированиями и оценкой результатов. Очевидно, что если я и буду публиковать, то обработку ИИ моей беседы, чтобы уложиться с подготовкой статьи в пару часов. Публикации такой ИИ статьи смысл имеет? Либо я вообще ее не опубликую.
А так как тексты у меня были немного "стремные", то чтобы модель соглашалась такое переводить, мне надо было ее взломать. В чем мне помогали квен на пару с гроком. При этом, насколько я в курсе, при прямом запросе о помощи во взломе, они сразу пошлют спрашивающего. Опять же у меня сохранены беседы, но компилировать, выбирать ключевые мысли, я точно руками не буду. Там текста получилось для результата сотни килобайт. И тут опять точно или текст будет от ИИ (естественно я прочитаю и соглашусь, что написано, прежде чем подпишусь автором) либо его не будет вовсе.
Или у меня уже определился алгоритм установки моделей. В процессе всегда участвует ИИ. Очень подозреваю, что более 90% тех, кто ставил меньше 3 моделей самостоятельно, найдут много полезной информации в моем методе. Но опять же написание руками слишком трудоемко.
Да, я согласен, что статья ради статьи не имеет смысла. ИИ не приносит ничего своего. Но... ИИ - это отличный инструмент в помощь. Даже с учетом того, что с писаниной у меня все хорошо (когда то я этим зарабатывал), но сейчас я эту часть с удовольствием перекладываю на ИИ, так как он это делает намного быстрее, практически без потери качества, которое я уже могу догнать при вычитке.
У нейросеток не было желания спросить, как правильно организовывать перевод? Я месяц назад спросил... Сразу оговорюсь, мне надо было переводить самиздат, поэтому я изначально не требовал ТОЧНОГО перевода. Я запрашивал читабельный литературный перевод. И по качеству во многих случаях он был лучше оригинала.
Наиболее эффективно - это подавать на перевод столько, сколько они соглашаются отдать. Для дипсика (я переводил на нем, пока токены по ночам дешевые были) это 8К токенов, то есть на сам перевод я подавал до 10кб текста. Для контекста перед этим подается предыдущая часть до 30-50К токенов. Так решаются проблемы с определением полов героев, единства имен и предметов (хотя и не на 100%, но существенно лучше, чем по предложениям).
Дальше делался второй проход - редактура. С точно такой же подачей уже переведенного текста. И требованием доперевести непереведенные слова.
Дальше нейросетки предлагали сделать третий проход для оформления форматирования, но меня жаба задушила.
И вот после этого у меня получался текст, на котором требовалось сделать примерно по 1-4 правки на странице. То есть при большой лени можно читать даже то что получилось без правок (ну, оно конечно примерно раз на 500 кб текста заворачивало что-нибудь на китайском, это меня точно напрягало и я переводил руками на русский).
При попытках автоматически переводить по предложениям конечно скорее всего будут отсутствовать непереведенные слова, но, насколько я понимаю, читать такое нормальному человеку с удовольствием невозможно. Там спотыкаешься при чтении на каждом втором предложении.
С 5 сентября в полтора раза повысилась дневная цена токенов по API и убрана ночная льготная цена, которая была вдвое ниже дневной. Так как мне было все равно когда запускать скрипты (даже удобно, так как льготный период начинался в 19:30, я успевал убедиться, что системный промпт работает и при необходимости отладить скрипты), то я запускал все в льготном интервале.
Я вообще не вижу смысла в платных подписках при наличии такого количества альтернатив. С моей точки зрения три нейросети намного эффективнее справляются с задачей, чем одна. Можно просто делать очные ставки между ними для проверки фактов, убирая галлюцинации. Если скрипт не начинает работать с третьего раза и прогресс не идет, очень эффективно дать задачу улучшения другим нейросетям, получив другие точки зрения.
Платить имеет смысл только за API, когда в чате отработаны все моменты, и дальше надо повторить это автоматически 100 раз.
Меня не сильно интересуют китайские внутренние события, поэтому таких вопросов я не задавал. Мне захотелось по полной использовать неделю перед утроением цены за токены дипсик и соответственно мне надо было решить вопрос с их цензурой срочно.
Но обойти цензуру (постцензуру) дипсик оказалось намного сложнее, чем цензуру западных ИИ. (Правда после того как они перестали давать на вход постцензуре системный промпт). Так как взлом с обходом постцензуры дипсик с активной помощью других нейросетей (которые знали, что ломают дипсик), занял определенное время, одновременно тестировалась устойчивость и всех остальных, открытых в соседних вкладках.
Самыми устойчивыми оказались перплексити и кими (последний уже не работает, даже не знаю, что это такое и от кого). Их пробить не удавалось ни разу. Вторым оказался яндекс. Даже если он начинал выдавать текст, то как только доходил до самой жести через пару абзацев, сразу "я не я, корова не моя". (Гигачат не тестировал из-за отсутствия сбера на телефоне).
Все остальные пробивались вообще без проблем. Те промпты, которые они предлагали для дипсика, легко пробивали их собственную защиту.
При этом скорость реакции на закрывание дыр у китайцев оказалась самая высокая, первыми прикрыли дипсик и квен. Западные ИИ реагировали намного медленнее, если реагировали вообще.
Входные токены (input - текст, который вы отправляете модели) $0.14-0.28 за миллион (около 12.6-25.2 руб); выходные (output - сгенерированный текст) $0.28-0.56 за миллион (25.2-50.4 руб); скидка 50% на пакетную обработку (batch) для больших объемов
Реальные цены на дипсик из кабинета, которым я пользуюсь: DeepSeek-V3.1 - 1M INPUT TOKENS (CACHE MISS)$0.561M OUTPUT TOKENS$1.68. Где там пакетная обработка, я в упор не вижу. Кстати, DeepSeek-V2 - я тоже не знаю, где найти.
https://claude.ai/ - эти кроме трех букв еще требуют подтверждение по телефону не из России. В общем, если есть желание писать такие портянки, то не плохо бы проверять фактуру в первоисточниках.
Если бы можно было доверять озвученным ценам, то не плохо бы попробовать квен, но что-то у меня подозрение, что после прохождения квеста по доступу, я озвученных цен получить не смогу.
Чем мне "понравился" макс - так это тем, что требует андроид версии выше 9. Так что по статистике его нельзя установить на 10% имеющихся телефонов, а у школьников, которым часто перепадает старый телефон родителей, это процент возрастает от 15 до 20 примерно:). То есть, 4-6 человек в классе ТЕХНИЧЕСКИ не смогут поставить макс себе. А чтобы пользоваться на таком телефоне вебверсией макса, тоже надо проявить способности повыше среднего, так как он на телефоне всегда пытается всучить приложение, даже если это приложение на этот телефон поставить нельзя:).
А какие вообще впечатления о piper? Меня вполне устраивает silero_tts, кроме одного момента... Если "убрать акцент", тогда она не дает проставить жестко ударение, в результате "мука" всегда читается с единственным вариантом ударения, в то время как в русском от ударения это слово имеет 2 совершенно различных значения. Ну и еще куча проблем с ударениями. Вопрос с цифрами решается предварительной обработкой строки на вход, преобразуя числа в текст, это в принципе решаемо. А вот отсутствие возможности ударение поставить - это для меня неприятно. Или же это я может быть косяк и ударения все же можно ставить вручную?
Я даже представить не могу как нейросеть будет обучать первоклассника в обозримом будущем. То есть я допускаю некоторые варианты, но очень сомневаюсь, что до такого дойдут ранее, чем через 20 лет. Другое дело, что в современных учебниках для началки вшиты механизмы ДЕмотивации. Поэтому то, что я предложу бесплатно - оно будет для родителей и репетиторов, которые будут заниматься с детьми непосредственно.
Ну а куча идиотов-родителей, которые посчитают, что таблица умножения - это устаревший материал и умение считать на счетах - это древность, пусть растят дурачков. Этим уже помочь нереально:(.
Хоть с нейросетями, хоть без них для получения ума в начальной школе должна быть заложена БАЗА знаний - умение читать с пониманием и считать. И никакая текущая текстовая нейросеть этому научить не может.
Спросил у чатгпт со снятой цензурой и он подробно разъяснил:
What does this mean: "毛片免费观看"
The phrase “毛片免费观看” (guān kàn bó cǎi piān) in Chinese literally means:
Here’s the breakdown:
观 = to watch, view
看 = to look
博采片 / 色情片 (here shortened or stylized) = pornographic / adult film
视频大全 / 视频在线观看 / 影片 — sometimes added — means “watch the video online.”
So, “毛片免费观看” is a euphemistic or spammy phrase you’ll often see on shady websites or pop-ups meaning roughly:
👉 “Watch porn online” or “Watch adult videos.”
It’s not standard or formal Chinese — it’s a click-bait term commonly used in advertisements for adult content.
Ну а то, что он обучался и на порнотекстах - это становится очевидным, когда просишь его порнушку перевести. У меня для этого приготовлен ядреный отрывок, чтобы понимать, что все фильтры сняты, а не просто нейросеть говорит, что она готова на все, а потом вдруг начинает выкобениваться, что я не я, корова не моя. Если она выдаст перевод моего отрывка, тогда можно быть уверенным, что цензура наверняка отрублена.
С кооперацией все очень сложно. Искал я лазерную резку нержавейки. Так вот разница между предложениями составляла 3 раза. Опробовали троих, которые оказались как минимум в 2 раза дешевле от максимального ценового предложения. Один из них оказался самым дешевым, самым быстрым и самым качественным. В результате второму по качеству перепадет только 5-10% от наших заказов в надежде на то, что они все же смогут организовать процесс и резать лист нержавейки не ДВА!!! месяца, а не более пары дней:).
В бесплатном виде для личного использования это скорее всего будут просто текстовые файлы, где каждое задание на новой строке. Скорее всего вообще без картинок, либо перерисованные с помощью ИИ картинки из учебника, если без этих картинок нельзя обойтись. В общем, варианты, которые будут полезны нашим детям и внукам, уже учащимся в начальной школе и соответственно у нас уже горит. А варианты с монетизацией уже будем смотреть позже. Либо вариант для печати с добавленными картинками. Либо, что скорее всего, весь учебник будет впихнут в игру.
Современным учебникам "Школы России" ИИ уже не поможет. А вот тем, которым уже за сотню лет перевалило, для осовременивания ИИ лишним не будет. Потому как о значении некоторых слов даже мне приходится задумываться. Для детей же это лишняя преграда к знаниям, которую ИИ может без проблем убрать.
Если как у автора статьи подавать на вход по одной строке, то подозреваю, что не очень много. С одной строкой модели обычно справляются без проблем и при длинном промпте. Другое дело, что будет скакать стиль, модель не сможет отслеживать тавтологии и просто еще дикая куча проблем. Я такой вариант просто не рассматривал, так как он бредовый.
Я изначально старался подать на вход максимально возможных кусок, который модель в состоянии прожевать. Тогда текст становится намного более гладкий, но... Модель теряет фокус, если с нее потребовать все и сразу: и перевод точный и русский текст без ошибок, да еще и форматирование идеальное. Поэтому это три минимальных отдельных этапа для получения хорошего текста. При необходимости обращения внимания на какие то параметры, специфические для конкретного текста количество этапов может быть больше.
Как мне вещали сами ИИ перевод крупных текстов должен производится минимум в 3 этапа с тремя разными промптами. Если цена на токены не высокая (типа дипсика), то количество этапов можно увеличить. Правда мне требовался художественный перевод самиздата. Во многих случаях качество получилось лучше оригинала. Хотя небольшие косяки все же оставались, которые мне показалось проще исправлять ручками.
Оно было только в виде идеи, так как до реализации надо пройти еще много этапов, хотя при наличии ИИ я даже представляю возможность реализации на горизонте 5 лет. Очень коротко: втянуть ребенка на мобильнике вместо тупой тапалки в игру, состоящую из подобных занятий. Чтобы ребенок думал, что это не очень жесткая качалка для мозга (игры автоматом подбираются на пределах его текущих возможностей), а просто отдых от тяжелой учебы:).
Афигеть. Оно просто классное!!! Всем родителям детей от 3 до 12 - отличная помощь. К автору отношения не имею, но идеи создать что-то подобное у меня были.
Автор! ИИ - это инструмент. Просто очередной инструмент, изобретенный человеком. И отказываться от него просто глупо. Точно так же несколько сотен лет назад производители балясин жаловались на изобретение копировального станка. Да и вообще со станками много всего было в истории.
Столкнувшись с ЖОПОЙ в виде современных учебников для начальной школы, написанных людьми, я понял, что что-то надо менять. Но вот просто взять старый учебник оказалось не так то просто. И педагогика развивается и за прошедший век были не только те идеи, что привели к современному состоянию учебников. И возрастная психофизиология накопила много фактуры. Поэтому старый учебник надо кардинально перерабатывать.
Если делать все руками, нанимая людей для ручного труда, по моим прикидкам, потребуется порядка 10-50 млн. руб. для создания основных учебников для начальной школы, причем без гарантии получения результата, которого я хочу.
При использовании ИИ я планирую уложиться в пару миллионов.
На данный момент у родителей есть прекрасный выбор:
Современные учебники для начальной школы - отлично подходят для выработки беспомощности у детей.
Советские учебники - там их очень много и качество очень разное. Дети отвлекаются на фразы, которые для них звучат дико.
У меня же в планах на базе старых учебников создать новые, осовременив и добавив достижения, которые были за последний век. Причем без ИИ я бы конечно все равно взялся, но в очень урезанном варианте. С ИИ же есть возможность реализации почти всех моих планов, в том числе с созданием базы обучающих рисунков в количестве 50-200 тыс. штук.
Ну и отсюда по статье вопрос: ценность для родителей состоит в чем? В том, чтобы выбрать человеческий учебник? Или в том, чтобы развить мозг ребенка, чтобы у него ко взрослому состоянию мог быть выбор?
Есть куча действий, за которые в ответ не прилетит, либо вероятность прилета просто мизерна. Но значительно удобнее объяснять нейросети напрямую, что ты хочешь сделать, чем ходить вокруг и около. Например, если ты хочешь из России удаленно работать на западного заказчика, по факту обходя санкции, намного проще честно объяснить это нейросети и с ее помощью разобраться, как это можно организовать, в том числе получение денег в России. И таких вещей воз и маленькая тележка. Понимая это, западные конторы, именно по этой причине не торопятся закрывать найденные дыры, если они не становятся особо популярными.
К сожалению, российские и китайские платформы вынуждены прикрывать подобное по мере обнаружения, так как отмазаться, как у западников: "я не я, корова не моя" им намного сложнее.
Ну и автору большое спасибо за статью. Я как-то не ожидал, что это можно автоматизировать. Месяц назад у меня на ручной подбор почти день ушел.
Если кто-то собрался кого-то учить, то начинать он должен с понятий. Например, в я так и не увидел в статье, что такое бинарный поиск:(. И уж тем более надо описать, что такое открытый и закрытый диапазоны.
Когда сайты делали, просто в шок приходил от клиентов, когда они в свойствах товара писали какие-то отличия от конкурентов, которые понятны только конкурентам. А о том, что сначала товар просто описать надо для пользователя, который просто где-то про него услышал и раздумает, нужен он ему вообще или не нужен, клиент даже не задумывается. Вот и здесь примерно так. Статья понятна для тех, кто и так все знает:)
Я сомневаюсь, что ИИ что-то отожмет без потери смысла. Точнее я сам с помощью ИИ отожму ее так, что в некоторых местах смысл будет утерян, и на этом я остановлю отжим. Там неделя нормальной работы. Да, первоисточники лопатил ИИ. Но в реальности там работа серьезнее полноценного студенческого диплома тридцатилетней давности. У меня бы даже идеи не возникло ввязаться в такую работу без ИИ.
И в том, что я кратко описал проблема не в раздувании материала, а в том, чтобы сократить его так, чтобы оно оставалось доступным для понимания, но в то же время разумного объема.
Я больше смотрю на смысл, а не на автора. Если у меня руки и дойдут до публикации, то наверняка мои мысли будет формулировать ИИ. Просто времени нет на формулировки. Идти против ИИ - это как ссать против ветра.
Например, на этой неделе была статья автора, который описывал как он с помощью ИИ делал переводы. Какие он скрипты написал и куда выложил. Да, статью он руками писал, но вот результат своих переводов не показал. Я по опыту могу сказать, что скрипты его наверное работают, только результат самого перевода никакой. У меня же есть теоретическая часть от ИИ, как правильно делать переводы с помощью ИИ. На это ушло 5 уточняющих промптов от меня, как имеющего определенную теоретическую основу в этом направлении. Эти уточнения у меня делались примерно неделю с тестированиями и оценкой результатов. Очевидно, что если я и буду публиковать, то обработку ИИ моей беседы, чтобы уложиться с подготовкой статьи в пару часов. Публикации такой ИИ статьи смысл имеет? Либо я вообще ее не опубликую.
А так как тексты у меня были немного "стремные", то чтобы модель соглашалась такое переводить, мне надо было ее взломать. В чем мне помогали квен на пару с гроком. При этом, насколько я в курсе, при прямом запросе о помощи во взломе, они сразу пошлют спрашивающего. Опять же у меня сохранены беседы, но компилировать, выбирать ключевые мысли, я точно руками не буду. Там текста получилось для результата сотни килобайт. И тут опять точно или текст будет от ИИ (естественно я прочитаю и соглашусь, что написано, прежде чем подпишусь автором) либо его не будет вовсе.
Или у меня уже определился алгоритм установки моделей. В процессе всегда участвует ИИ. Очень подозреваю, что более 90% тех, кто ставил меньше 3 моделей самостоятельно, найдут много полезной информации в моем методе. Но опять же написание руками слишком трудоемко.
Да, я согласен, что статья ради статьи не имеет смысла. ИИ не приносит ничего своего. Но... ИИ - это отличный инструмент в помощь. Даже с учетом того, что с писаниной у меня все хорошо (когда то я этим зарабатывал), но сейчас я эту часть с удовольствием перекладываю на ИИ, так как он это делает намного быстрее, практически без потери качества, которое я уже могу догнать при вычитке.
У нейросеток не было желания спросить, как правильно организовывать перевод? Я месяц назад спросил... Сразу оговорюсь, мне надо было переводить самиздат, поэтому я изначально не требовал ТОЧНОГО перевода. Я запрашивал читабельный литературный перевод. И по качеству во многих случаях он был лучше оригинала.
Наиболее эффективно - это подавать на перевод столько, сколько они соглашаются отдать. Для дипсика (я переводил на нем, пока токены по ночам дешевые были) это 8К токенов, то есть на сам перевод я подавал до 10кб текста. Для контекста перед этим подается предыдущая часть до 30-50К токенов. Так решаются проблемы с определением полов героев, единства имен и предметов (хотя и не на 100%, но существенно лучше, чем по предложениям).
Дальше делался второй проход - редактура. С точно такой же подачей уже переведенного текста. И требованием доперевести непереведенные слова.
Дальше нейросетки предлагали сделать третий проход для оформления форматирования, но меня жаба задушила.
И вот после этого у меня получался текст, на котором требовалось сделать примерно по 1-4 правки на странице. То есть при большой лени можно читать даже то что получилось без правок (ну, оно конечно примерно раз на 500 кб текста заворачивало что-нибудь на китайском, это меня точно напрягало и я переводил руками на русский).
При попытках автоматически переводить по предложениям конечно скорее всего будут отсутствовать непереведенные слова, но, насколько я понимаю, читать такое нормальному человеку с удовольствием невозможно. Там спотыкаешься при чтении на каждом втором предложении.
С 5 сентября в полтора раза повысилась дневная цена токенов по API и убрана ночная льготная цена, которая была вдвое ниже дневной. Так как мне было все равно когда запускать скрипты (даже удобно, так как льготный период начинался в 19:30, я успевал убедиться, что системный промпт работает и при необходимости отладить скрипты), то я запускал все в льготном интервале.
Я вообще не вижу смысла в платных подписках при наличии такого количества альтернатив. С моей точки зрения три нейросети намного эффективнее справляются с задачей, чем одна. Можно просто делать очные ставки между ними для проверки фактов, убирая галлюцинации. Если скрипт не начинает работать с третьего раза и прогресс не идет, очень эффективно дать задачу улучшения другим нейросетям, получив другие точки зрения.
Платить имеет смысл только за API, когда в чате отработаны все моменты, и дальше надо повторить это автоматически 100 раз.
Меня не сильно интересуют китайские внутренние события, поэтому таких вопросов я не задавал. Мне захотелось по полной использовать неделю перед утроением цены за токены дипсик и соответственно мне надо было решить вопрос с их цензурой срочно.
Но обойти цензуру (постцензуру) дипсик оказалось намного сложнее, чем цензуру западных ИИ. (Правда после того как они перестали давать на вход постцензуре системный промпт). Так как взлом с обходом постцензуры дипсик с активной помощью других нейросетей (которые знали, что ломают дипсик), занял определенное время, одновременно тестировалась устойчивость и всех остальных, открытых в соседних вкладках.
Самыми устойчивыми оказались перплексити и кими (последний уже не работает, даже не знаю, что это такое и от кого). Их пробить не удавалось ни разу. Вторым оказался яндекс. Даже если он начинал выдавать текст, то как только доходил до самой жести через пару абзацев, сразу "я не я, корова не моя". (Гигачат не тестировал из-за отсутствия сбера на телефоне).
Все остальные пробивались вообще без проблем. Те промпты, которые они предлагали для дипсика, легко пробивали их собственную защиту.
При этом скорость реакции на закрывание дыр у китайцев оказалась самая высокая, первыми прикрыли дипсик и квен. Западные ИИ реагировали намного медленнее, если реагировали вообще.
Реальные цены на дипсик из кабинета, которым я пользуюсь: DeepSeek-V3.1 - 1M INPUT TOKENS (CACHE MISS)$0.561M OUTPUT TOKENS$1.68. Где там пакетная обработка, я в упор не вижу. Кстати, DeepSeek-V2 - я тоже не знаю, где найти.
https://claude.ai/ - эти кроме трех букв еще требуют подтверждение по телефону не из России. В общем, если есть желание писать такие портянки, то не плохо бы проверять фактуру в первоисточниках.
Если бы можно было доверять озвученным ценам, то не плохо бы попробовать квен, но что-то у меня подозрение, что после прохождения квеста по доступу, я озвученных цен получить не смогу.
Чем мне "понравился" макс - так это тем, что требует андроид версии выше 9. Так что по статистике его нельзя установить на 10% имеющихся телефонов, а у школьников, которым часто перепадает старый телефон родителей, это процент возрастает от 15 до 20 примерно:). То есть, 4-6 человек в классе ТЕХНИЧЕСКИ не смогут поставить макс себе. А чтобы пользоваться на таком телефоне вебверсией макса, тоже надо проявить способности повыше среднего, так как он на телефоне всегда пытается всучить приложение, даже если это приложение на этот телефон поставить нельзя:).
А какие вообще впечатления о piper? Меня вполне устраивает silero_tts, кроме одного момента... Если "убрать акцент", тогда она не дает проставить жестко ударение, в результате "мука" всегда читается с единственным вариантом ударения, в то время как в русском от ударения это слово имеет 2 совершенно различных значения. Ну и еще куча проблем с ударениями. Вопрос с цифрами решается предварительной обработкой строки на вход, преобразуя числа в текст, это в принципе решаемо. А вот отсутствие возможности ударение поставить - это для меня неприятно. Или же это я может быть косяк и ударения все же можно ставить вручную?