Search
Write a publication
Pull to refresh
1
0
Никита Брагин @BrNikita

Пользователь

Send message

Каждое такое исследование, которое показывает ключевые проблемы современных моделей приближает нас к более надёжному общему интеллекту. Понимая суть проблемы, появляется точка опоры для дальнейших исследований и поиска решения уже конкретно поставленной задачи.

Человек эволюционировал исключительно под земные условия, гравитацию, давление. Тащить все это эволюционное легаси на другие планеты - крайне неэффективно.

В межзвездные путешествия нужно отправлять ИИ. Достаточно микро зонда с чипом, и датчиками, которые будут исследовать планеты с их орбиты. Таких зондов можно отправить миллионы и им можно поставить любую задачу от исследовательских до колонизации планет.

ИИ - идеальный кандидат для межзвездных путешествий, он может адаптироваться и эволюционировать в течение часов под любые условия. Может поддерживать зонд в рабочем состоянии на протяжении всего многовекового пути.

Данную статью писали исследователи, учёные из сферы машинного обучения. В статье так и пишут, что на текущем этапе:

"The agents are impressive in theory (and in cherry-picked examples), but in practice unreliable."

Пока все идёт по плану https://ai-2027.com Ставлю на красный вариант развития событий.

Платформенные тележки, которые используются на складах и производстве. На них ставятся поворотные ролики.

Да, ролик как у тележки.

Мы с коллегой разрабатываем более доступный вариант с двумя манипуляторами. Первая версия будет для энтузиастов, но для несложных производственных операций тоже подойдёт.

https://habr.com/ru/articles/914828/

Я думаю, что человек пишет про режим агента в composer. Я пробовал тоже начать проект с нуля и не вмешиваться в то, что происходит в кодовой базе. Он действительно начинает иногда ходить кругами и исправлять то, что уже работает.

Если же понимать, что конкретно нужно исправить по коду или попросить помочь найти ошибку, то в целом Claude 3.5 работает очень достойно. Остальные модели в том числе o-mini 3 понравились меньше.

Дистилляция была для Deepseek V3 с gpt4. R1 использует V3.

Сравнивать OpenAI и Deepseek не совсем корректно. Те кто идут впереди будут тратить гораздо больше средств на исследования и обучение. Deepseek судя по всему использовали дистилляцию с большей модели OpenAI, соответственно экономия произошла во многом за счёт наработок OpenAI.

Предоставляя свои данные малому бизнесу вероятность, что ваши данные обрабатываются и хранятся должным образом на порядок меньше. По моему опыту работы со стартапами готов утверждать, что большая часть малого и микробизнеса вообще не уделяет безопасности данных какого-либо внимания. 99% фокуса уделяется новым функциям продукта и поддержки существующих фич.

У большого бизнеса есть технические возможности и более пристальный внешний контроль. Выбирая кому доверять обработку свои данных я предпочту крупную компанию, хотя бы будет с кого спросить в случае утечки.

Почему-то написали, что fine-tuning отменяется, хотя набирает популярность у исследователей test time training (TTT) подход и вероятно в o3 его уже начали использовать. В том же ARC Prize работа про TTT подход заняла второе место.

Ставлю на то, что в 2025 году такие подходы позволят вывести рассуждения моделей на новый уровень и можно будет говорить о достижении AGI.

Ключевые факторы стагфляции в России:

  1. Накачка деньгами из бюджета военного сектора. Танки и снаряды идут сразу в расход и не создают добавленной стоимости. При этом у существенной части населения связанной с ВПК растут доходы не обеспеченные реальным ростом экономики. Что приводит к обесцениванию внутренней валюты.

  2. Отъезд за рубеж квалифицированных специалистов, мобилизация трудоспособного населения. Что создаёт дефицит рабочей силы и рост зарплат.

  3. Санкции. Дешёвые и качественные зарубежные компоненты теперь заменяются на более дорогие и менее качественные российские аналоги. Что ведёт к росту цен и дефициту товаров и услуг.

  4. Ужесточение иммиграционной политики. Ведёт к ещё большему дефициту кадров и росту заработных плат.

  5. Увеличение ключевой ставки. Чтобы уменьшить влияние инфляции Центробанк сокращает доступность кредитования. Что способствует охлаждению реального сектора экономики при растущем секторе связанном с ВПК.

  6. Сокращение бюджетных расходов на медицину, образование и ЖКХ за счёт роста расходов на ВПК. Создают отложенный дефицит квалифицированных кадров, сокращает среднюю продолжительность жизни населения и повышает рост аварий связанных с городской инфраструктурой.

  7. Снижение мировых цен на углеводородные энергоносители и удорожание логистических цепочек поставок энергоносителей за рубеж связанные с санкциями. Приводит к уменьшению доходов бюджета от нефти и газа. На углеводороды приходится примерно четверть дохода федерального бюджета.

  8. Из-за уменьшения доходов бюджета правительство увеличивает налоговую нагрузку на предприятия. Так же изымает сверхприбыль у наиболее крупных предприятий. В 2024 году Госдума приняла закон о прогрессивном НДФЛ и повышении налога на прибыль до 25%. Что способствует замедлению или стагнации реального сектора экономики.

Claude 3.5 Sonnet стабильно верно отвечает из того что пробовал. Сравнивал модели на lmsys arena, poe.com

Попробуйте поменять формулировку, модели начинают путаться.

Пример:
Peter has 4 brothers the same age, 2 younger brothers, 3 sisters the same age and two older sisters, how many brothers does Peter's brother have?

В статье написано, что модель адаптируется без переобучения.

Под ARC Challenge имеется ввиду https://arcprize.org/? Или какой-то другой?

Что за проект?

Пробовали flippa.com?

Здравствуйте, в текущей реализации сделан пока только интерфейс к платной GPT модели от Open AI, чат не делает ничего более того, что делает СhatGPT.

В следующей версии я планирую добавить альтернативные LLM модели. Возможно, сделаем пример взаимодействия с API стороннего сервиса через модель GPT (о чем написано в самом начале статьи).

То, что вы описываете. Я вижу два варианта:
1. Передавать весь контекст с каждым запросом. Для этого можно выбрать модель с большим контекстным окном и прописать, чтобы весь контекст прикрплялся к каждому сообщению автоматически.
2. Использовать модель обученную на ваших данных.

То, о чем вы пишете, это интересная задача, я подумаю над тем как её можно было бы удобнее реализовать в проекте.

Добавил в идеи: https://github.com/soshace/fosterflow/issues/24

1

Information

Rating
3,581-st
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity