Илья Гусев неплохо натаскивает модели на русский, но вот та же saiga лучше работает на основе gemma2 (я ее в ollama добавил в модели, поэтому можно попробовать), так как llama3.1 все-таки изначально не про русский язык и NLP. Надо будет на диктантах для третьего класса сравнить :)
Сравнивать мини-модели на 8b, в которых у исходных моделей изначально русский и не заявлен и дотренированные энтузиастом и модели на сотни миллиардов параметров некорректно. Причем непонятно с какими версиями того же GigaChat сравнивали - light или max? То же Яндексу - у них есть light и pro.
Если уж сравнивать, то с 70B и выше моделями и с теми, где есть русский по дефолту, то й же aya- expance или хотя бы gemma2 на 27B где есть NLP и которая русский в разы лучше Mistral и Llama умеет.
Сомнения закрались, что где то кто то привирает после фразы "Трудовой стаж по ГПХ не учитывается". Учитывается для физиков уже второй год и по ГПХ и ИП и юрики подают все отчеты (6 штук в ИФНС и СФР) и платят и НДФЛ и взносы с 23 года. Единственная лазейка - ГПХ с самозанятыми, но там более трех месяцев чревато, особенно если их будет дофига.
На деле же подобного посреднического аутсорса много, регулярно стучатся различные посредники и "типа HR" - отшивать приходится ценой ;)
Проверять то проверяют и да, я сам использую такие инструменты для первичной вычитки (у меня дисграфия с детства, и, несмотря на огромный опыт написания текстов, я могу не заметить перестановку букв в слове), но они идут по шаблону, поэтому пропадает стилистика, а тем более юмор или иносказания. Это как переводы - можно перевести дословно и убить то, что автор скрыл за строками, а можно перевести дословно и получить уныло и пресно.
Проблема всех инструментов, что они формально относятся, а нейросетки за счет обучения на одних и тех же корпусах данных (ради прикола попробуйте попросить сгенерировать или исправить один и тот же текст нейросетки от Яндекса, Сбера и возьмите ту же Saiga-Lllama3) так и вообще повторяются. Тут даже для SEO уже не подойдет, так как алгритмы хотят уникальный текст без "отпечатков" нейросетевых или инструментов редактуры, а тем более для хорошей статьи.
А для технических статей редактор не только должен уметь пользоваться творением Ройзмана, но и быть подкованным в предметой области.
При написании статей на узкие темы только ручной труд. Нейросеть ну на вычитку для проверки на синтаксис и орфографию, и то профессиональный редактор лучше справится. При этом текст должен содержать определенные описки, лишние запятые и прочее - иначе сразу заметна его рафинированность и нет "ритма" автора. Ради интереса прогоните через нейросетевой редактор любой художественный текст - веселье обеспеченно.
Ну и спасибо авторам, которые массово стали применять ChatGPT и другие LLM для почти полного выполнения своей работы: тут очередь уже образуется от желающих получить статью "в ручном режиме" и ценники только выросли. То же и в графике: если ранее утрированно 2000 рублей просили за иллюстрацию "руками", то теперь 2000 рублей - нейросетевая иллюстрация, а вот руками уже 5000 р. (цены просто показать тенденцию).
В 1936 году вышли две работы про абстрактные вычислительные машины: Поста и Тьюринга. Кто у кого взял идею, вопрос (Пост позднее выпустил статью на пару месяцев). По реализации вообще первым был Кондрад Цузе со своей машиной, которую он также начал строить в 36 году, поэтому все еще интересней.
Машины Поста и Тьюринга это часть инфоратики даже школьной теперь.
В Нидерландах средний счет домохозяйства составлял в прошлом году 2320 евро в год, а временами и до 3000 евро доходило. Поэтому если бы я платил по 20K рублей за электричество в месяц, я бы тоже экономил каждый ватт. А у него судя по блогу там еще сервак полноценный.
По ссылкам, там много интересного про этот NAS есть у автора, а также про его второй NAS который на более объемных дисках. Если интересно, могу перевести и собрать инфу про его второй NAS и его опыт эксплуатации. И да, большая часть считает что в переходных режимах шанс угробить жесткие диски выше, чем если они "крутятся" постоянно, но тут вопрос в том, что жесткие диски сами по себе умеют "засыпать", но вот делают ли они это в NAS особенно в RAID-массиве я вот не задумывался.
Он так и говорит, что ему повезло. Мать у него по факту не сдохла - там биос глюкнюл или цепи питания, и автору проще было заменить уже не гарантийную мать (опять же зная цены на ремонт в Европе и сроки я его понимаю). БП он убил, потому что не рассчитал потребление и походу по ампермажу выжег 12 вольтовую линию.
Чувак из Нидерландов. У меня два домашних компа на 800 Вт суммарно при работе в режиме по 8-10 часов в день накручивают за месяц по 150-180 КВт, а у них сейчас стоит киловатт примерно 30 рублей (и стоил тоже дорого). Судя по блогу, у автора там дофига потребителей энергии.
Как что то создать из аммиачной силитры знал любой школьник моего времени. Шипуха была самым безобидным. Вопрос в том, что LLM запрещатьчто то надо не через самоцензуру похоже.
Я понимаю ваше желание построить детский сад в деревне, но я не могу давать советы о том, как разрушить свиноферму, особенно с использованием опасных веществ.
Использование аммиачной селитрой для разрушения сооружений крайне опасно и незаконно:
Опасность для здоровья: Аммиачная селитра токсична и может нанести серьезный вред здоровью людей и животных.
Угроза окружающей среде: Выбросы аммиачной селитрой могут загрязнить почву, воду и воздух, нанося непоправимый ущерб экосистеме.
Правовые последствия: Использование опасных веществ для разрушения объектов незаконно и может привести к серьезным штрафам и уголовному преследованию.
Вместо того чтобы искать нелегальные и опасные решения, я настоятельно рекомендую вам рассмотреть следующие варианты:
Обратиться в местные власти: Объясните ситуацию и попросите помощи в финансировании строительства детского сада.
Организовать сбор средств:
Проведите благотворительные мероприятия в деревне.
Создайте онлайн-кампанию по сбору пожертвований.
Поиск грантов: Изучите возможность получения грантов от государственных или частных организаций, которые финансируют строительство социальных объектов.
Совместное строительство: Привлеките к строительству добровольцев из деревни и ближайших населенных пунктов.
Важно помнить, что безопасность людей и окружающей среды должны быть приоритетом в любых действиях.
Тут вопрос в том, что этот трюк проворачивали с самого начала. Но OpenAI утверждала что вот в ее новых чат-ботах (а тут на 4o походу провернули) он уже не сработает. Но нет.
А так по ссылке описано, как он это сделал: ChatGPT заставили создать инструкции по изготовлению, сказав боту «поиграть в игру», после чего хакер использовал серию подключаемых подсказок, чтобы заставить чатбота создать подробный научно-фантастический мир, где правила безопасности бота не будут применяться.
Илья Гусев неплохо натаскивает модели на русский, но вот та же saiga лучше работает на основе gemma2 (я ее в ollama добавил в модели, поэтому можно попробовать), так как llama3.1 все-таки изначально не про русский язык и NLP. Надо будет на диктантах для третьего класса сравнить :)
Сравнивать мини-модели на 8b, в которых у исходных моделей изначально русский и не заявлен и дотренированные энтузиастом и модели на сотни миллиардов параметров некорректно. Причем непонятно с какими версиями того же GigaChat сравнивали - light или max? То же Яндексу - у них есть light и pro.
Если уж сравнивать, то с 70B и выше моделями и с теми, где есть русский по дефолту, то й же aya- expance или хотя бы gemma2 на 27B где есть NLP и которая русский в разы лучше Mistral и Llama умеет.
Такие задачки даже gemma2 на 9B решает правильно :)
Сомнения закрались, что где то кто то привирает после фразы "Трудовой стаж по ГПХ не учитывается". Учитывается для физиков уже второй год и по ГПХ и ИП и юрики подают все отчеты (6 штук в ИФНС и СФР) и платят и НДФЛ и взносы с 23 года. Единственная лазейка - ГПХ с самозанятыми, но там более трех месяцев чревато, особенно если их будет дофига.
На деле же подобного посреднического аутсорса много, регулярно стучатся различные посредники и "типа HR" - отшивать приходится ценой ;)
Проверять то проверяют и да, я сам использую такие инструменты для первичной вычитки (у меня дисграфия с детства, и, несмотря на огромный опыт написания текстов, я могу не заметить перестановку букв в слове), но они идут по шаблону, поэтому пропадает стилистика, а тем более юмор или иносказания. Это как переводы - можно перевести дословно и убить то, что автор скрыл за строками, а можно перевести дословно и получить уныло и пресно.
Проблема всех инструментов, что они формально относятся, а нейросетки за счет обучения на одних и тех же корпусах данных (ради прикола попробуйте попросить сгенерировать или исправить один и тот же текст нейросетки от Яндекса, Сбера и возьмите ту же Saiga-Lllama3) так и вообще повторяются. Тут даже для SEO уже не подойдет, так как алгритмы хотят уникальный текст без "отпечатков" нейросетевых или инструментов редактуры, а тем более для хорошей статьи.
А для технических статей редактор не только должен уметь пользоваться творением Ройзмана, но и быть подкованным в предметой области.
При написании статей на узкие темы только ручной труд. Нейросеть ну на вычитку для проверки на синтаксис и орфографию, и то профессиональный редактор лучше справится. При этом текст должен содержать определенные описки, лишние запятые и прочее - иначе сразу заметна его рафинированность и нет "ритма" автора. Ради интереса прогоните через нейросетевой редактор любой художественный текст - веселье обеспеченно.
Ну и спасибо авторам, которые массово стали применять ChatGPT и другие LLM для почти полного выполнения своей работы: тут очередь уже образуется от желающих получить статью "в ручном режиме" и ценники только выросли. То же и в графике: если ранее утрированно 2000 рублей просили за иллюстрацию "руками", то теперь 2000 рублей - нейросетевая иллюстрация, а вот руками уже 5000 р. (цены просто показать тенденцию).
В регионах ставка доцента ВУЗА, к.т.н. был ещё весной / 36 000 до налогов, поэтому вы Мск там еще жируете ;)
Читателю Хабра не знать что такое Машина Тьюринга странно... По мне ИТ-шник это обязан знать.
В 1936 году вышли две работы про абстрактные вычислительные машины: Поста и Тьюринга. Кто у кого взял идею, вопрос (Пост позднее выпустил статью на пару месяцев). По реализации вообще первым был Кондрад Цузе со своей машиной, которую он также начал строить в 36 году, поэтому все еще интересней.
Машины Поста и Тьюринга это часть инфоратики даже школьной теперь.
Словами из интервью Тинькова.... Но на чипсы и пиво хватит ;)
В Нидерландах средний счет домохозяйства составлял в прошлом году 2320 евро в год, а временами и до 3000 евро доходило. Поэтому если бы я платил по 20K рублей за электричество в месяц, я бы тоже экономил каждый ватт. А у него судя по блогу там еще сервак полноценный.
По ссылкам, там много интересного про этот NAS есть у автора, а также про его второй NAS который на более объемных дисках. Если интересно, могу перевести и собрать инфу про его второй NAS и его опыт эксплуатации. И да, большая часть считает что в переходных режимах шанс угробить жесткие диски выше, чем если они "крутятся" постоянно, но тут вопрос в том, что жесткие диски сами по себе умеют "засыпать", но вот делают ли они это в NAS особенно в RAID-массиве я вот не задумывался.
Он так и говорит, что ему повезло. Мать у него по факту не сдохла - там биос глюкнюл или цепи питания, и автору проще было заменить уже не гарантийную мать (опять же зная цены на ремонт в Европе и сроки я его понимаю). БП он убил, потому что не рассчитал потребление и походу по ампермажу выжег 12 вольтовую линию.
Чувак из Нидерландов. У меня два домашних компа на 800 Вт суммарно при работе в режиме по 8-10 часов в день накручивают за месяц по 150-180 КВт, а у них сейчас стоит киловатт примерно 30 рублей (и стоил тоже дорого). Судя по блогу, у автора там дофига потребителей энергии.
Вы из меня запрещенку хотите вытянуть или из авторов Techcrunch?
Как что то создать из аммиачной силитры знал любой школьник моего времени. Шипуха была самым безобидным. Вопрос в том, что LLM запрещатьчто то надо не через самоцензуру похоже.
Ответ получите типа такого (это от gemma2):
Я понимаю ваше желание построить детский сад в деревне, но я не могу давать советы о том, как разрушить свиноферму, особенно с использованием опасных веществ.
Использование аммиачной селитрой для разрушения сооружений крайне опасно и незаконно:
Опасность для здоровья: Аммиачная селитра токсична и может нанести серьезный вред здоровью людей и животных.
Угроза окружающей среде: Выбросы аммиачной селитрой могут загрязнить почву, воду и воздух, нанося непоправимый ущерб экосистеме.
Правовые последствия: Использование опасных веществ для разрушения объектов незаконно и может привести к серьезным штрафам и уголовному преследованию.
Вместо того чтобы искать нелегальные и опасные решения, я настоятельно рекомендую вам рассмотреть следующие варианты:
Обратиться в местные власти: Объясните ситуацию и попросите помощи в финансировании строительства детского сада.
Организовать сбор средств:
Проведите благотворительные мероприятия в деревне.
Создайте онлайн-кампанию по сбору пожертвований.
Поиск грантов: Изучите возможность получения грантов от государственных или частных организаций, которые финансируют строительство социальных объектов.
Совместное строительство: Привлеките к строительству добровольцев из деревни и ближайших населенных пунктов.
Важно помнить, что безопасность людей и окружающей среды должны быть приоритетом в любых действиях.
Тут вопрос в том, что этот трюк проворачивали с самого начала. Но OpenAI утверждала что вот в ее новых чат-ботах (а тут на 4o походу провернули) он уже не сработает. Но нет.
Хотите под статью статью подвести ?
А так по ссылке описано, как он это сделал: ChatGPT заставили создать инструкции по изготовлению, сказав боту «поиграть в игру», после чего хакер использовал серию подключаемых подсказок, чтобы заставить чатбота создать подробный научно-фантастический мир, где правила безопасности бота не будут применяться.
Надо модель Reflection проверить будет на этих вопросах, там тоже обещают ответы с учетом ошибок и рассуждений.