Logos AI Assistant: Дайте "глаза и руки“ нейросети на вашем рабочем столе

Вспомните, сколько раз вам приходилось заниматься ручной, механической работой: переносить данные из одной программы в другую, кликая по одним и тем же кнопкам,
или выполнять последовательность команд в терминале для рутинной задачи. Это отнимает время и силы, которые можно было бы потратить на что‑то более важное.

Мы создали Logos AI Assistant не как замену человеку, а как инструмент‑исполнитель. Это мост между мощными языковыми моделями (LLM) и вашим к омпьютером. Проще
говоря, Logos — это «глаза и руки», которые позволяют нейросети взаимодействовать с вашим рабочим столом, в то время как «мозг» — это LLM, которую вы сами
выбираете.

С чего всё началось?

Давайте посмотрим на эволюцию взаимодействия с компьютером: сначала были перфокарты, потом — командная строка, затем — графический интерфейс (GUI), который
доминирует до сих пор. Но что дальше? Мы уверены, что следующий шаг — это полноценный диалоговый интерфейс.

Проблема в том, что большинство современных «ИИ-ассистентов» заперты в своем чат-окне. Они могут дать вам информацию, но не могут действовать за его пределами.
Они не могут нажать на кнопку в вашей любимой программе или перетащить файл на рабочем столе.

Проект Logos начался с простого вопроса: «А что, если выпустить нейросеть из этой клетки?». Мы захотели дать LLM возможность пользоваться компьютером так же, как
это делает человек — с помощью мыши, клавиатуры и зрения. Поэтому мы создали не просто очередной чат, а платформу-эксперимент. Это наша попытка заглянуть в
будущее и исследовать, каким может быть следующий этап взаимодействия человека и машины.

Кроссплатформенность: Сделано для любой современной ОС

Logos AI Assistant создан с прицелом на максимальную доступность и универсальность. Мы понимаем, что пользователи работают в разных операционных системах, и не
хотим никого ограничивать.

Именно поэтому интерфейс программы разработан на базе PySide6 — мощного и гибкого фреймворка, который позволяет запускать приложение практически на любой
современной операционной системе. Будь то Windows, macOS или Linux, вы получите единый, стабильный и привычный графический интерфейс.

При проектировании архитектуры мы сознательно закладывали принципы кроссплатформенности. Все ключевые модули, от обработки настроек до взаимодействия с языковыми моделями, спроектированы таким образом, чтобы работать независимо от особенностей конкретной ОС. Мы стремились к тому, чтобы Logos AI Assistant был по-настоящему «домашним» для каждого пользователя, независимо от его выбора программного обеспечения.

Три режима для разных задач

Logos AI работает в трёх ключевых режимах. Важно отметить, что ассистент работает в одном выбранном режиме, не переключаясь между ними автоматически.

1. Режим «Зрения» (Vision Mode) — Автоматизация в графическом интерфейсе

В этом режиме ассистент «видит» ваш экран с помощью движка OmniParser, который анализирует интерфейс и передаёт его структуру нейросети.

Как это работает? Перед выполнением задачи ассистент составляет пошаговый план (например, «1. Кликнуть по кнопке 'Файл'. 2. Выбрать пункт 'Открыть'. 3. Ввести имя
файла...»), который вы можете проверить и одобрить. После этого он начинает выполнять действия.

Внимание: В режиме «Зрения» ассистент полностью перехватывает управление вашей мышью и клавиатурой. Это необходимо для точного выполнения команд. Однако у вас
всегда есть возможность:

  • Полностью остановить выполнение задачи.

  • Приостановить выполнение, чтобы дать ассистенту подсказку или комментарий, если вы видите, что он «завис» или действует не так, как ожидалось. После этого вы сможете продолжить выполнение.

Конечно, это не мгновенный процесс. Анализ экрана и распознавание текста требуют времени и напрямую зависят от мощности вашего компьютера. Скорость принятия
решений, в свою очередь, полностью зависит от того, насколько быстро ответит выбранная вами языковая модель. Это не замена вашим быстрым ручным кликам, а
инструмент для автоматизации рутинных, многошаговых сценариев.

2. Режим «Терминала» (Terminal Mode) — ИИ-агент в командной строке

В этом режиме Logos действует как автономный агент, выполняя команды в терминале шаг за шагом. Здесь нет предварительного плана; вы даёте задачу, и ассистент
итеративно движется к цели, анализируя результат каждой выполненной команды. Это мощный инструмент для разработчиков и системных администраторов, позволяющий
автоматизировать сложные задачи в командной строке.

3. Режим «Чата» (Chat Mode) — Быстрый доступ к знаниям

Простой и понятный диалог с LLM для быстрых вопросов и анализа файлов. Вы можете «прикрепить» файл к запросу через символ @, и ассистент учтёт его содержимое.
Если потребуется, он самостоятельно найдёт информацию в интернете.

Арсенал инструментов под капотом

Каждый режим наделён своим набором специализированных инструментов, которые LLM использует для выполнения ваших задач.

  • Инструменты режима «Чата»: web_search, web_fetchs.

  • Инструменты режима «Зрения»: работа с мышью (click, scroll), клавиатурой (write_text, hotkey), системой (launch_app, finish) и пользователем (show_warning).

  • Инструменты режима «Терминала»: работа с файловой системой (list_directory, write_file), редактирование файлов (replace), выполнение команд (execute_shell) и веб-инструменты (download_file).

Ключевая идея: Logos — это исполнитель, а мозг — LLM по вашему выбору

Важно правильно понимать философию нашего инструмента. Logos AI сам по себе «не думает». Его главная задача — предоставить выбранной вами нейросети возможность
действовать на вашем компьютере.

  • ��ыбор за вами. Мы предоставляем вам единый интерфейс для работы с лучшими LLM-провайдерами: Anthropic (Claude), Google (Gemini), OpenAI (GPT) и xAI (Grok). Вы также можете использовать их через агрегатор OpenRouter.

  • Качество зависит от «мозга». Качество, скорость и «интеллект» автоматизации напрямую зависят от того, какую языковую модель вы выберете. Logos — это лишь руки и глаза, а решения принимает LLM. Если модель даст неверную команду, Logos её выполнит. Если модель будет долго отвечать, Logos будет ждать.

  • Унификация и доступность. Наша цель — унифицировать доступ к возможностям ведущих нейросетей и дать вам удобный инструмент для их применения в повседневных задачах прямо на вашем рабочем столе.

Лёгкая установка — без головной боли

Мы максимально упростили процесс установки. Готовые скрипты для Windows и Linux сделают всё за вас.

  • Для Windows: 1 powershell./setup_windows.ps1

  • Для Linux (Ubuntu/Debian): 1 bash./setup_ubuntu.sh

При установке через наши скрипты, в контекстном меню Windows/Linux появится удобная опция «Открыть с Logos», которая позволит запускать ассистента сразу в нужной
папке. При первом запуске удобный мастер настройки поможет вам выбрать и настроить подключение к желаемому LLM-провайдеру.

Важные примечания по совместимости:

  • Работа на Linux была проверена только на Ubuntu 24.

  • Для корректной работы требуется графический сервер X.Org (X11). Графический интерфейс Wayland на данный момент не поддерживается.

Если вы давно искали способ применить мощь современных нейросетей для автоматизации своих рутинных задач, Logos AI Assistant может стать именно тем инструментом, который
вам нужен.

Мы рассматриваем текущую версию Logos AI Assistant как базовой фундамент, на котором предстоит построить еще много всего интересного. Это только начало пути. В
наших планах — дальнейшее улучшение скорости анализа, добавление новых инструментов и, возможно, одна из самых ожидаемых функций — научить ассистента "бесшовно" переключаться между режимами зрения и терминала в рамках одной большой задачи.

Но самый ценный компас в этом путешествии — это ваше мнение. Мы создаем этот инструмент для вас, и нам невероятно важно знать, что вы о нем думаете. Какие именно
проблемы он мог бы решить в вашей повседневной работе?

Пожалуйста, напишите в комментариях:

  • Ваш сценарий: Опишите задачу, которую вы бы с радостью переложили на плечи ИИ-ассистента.

  • Идеи: Какие новые возможности или интеграции сделали бы Logos незаменимым для вас?

  • Критика: Что сейчас работает не так, как вам бы хотелось?

Любая обратная связь поможет нам сделать Logos AI Assistant по-настоящему полезным. Давайте формировать будущее настольных ИИ-ассистентов вместе!

Попробуйте Logos AI Assistant уже сегодня!

Вы можете найти проект и начать работу с ним по ссылке