Pull to refresh
58
0
bugman @bugman

Make software to happen

Send message

Для истории - наши сервисы до сих пор все лежат. Шмяндекс считает инцидент исчерпанным и предлагает обращаться в поддержку. Обратился в поддержку - молчат.

Подозреваю, что это естественная но немного запоздалая реакция на критическое количество хипстеров-смузихлёбов в Гугл, КПД которых стремится к нулю.

- Давайте разрабатывать промышленных роботов!
- Мяу... денег дай...
- Ну давайте хотя бы стандарты ПО для них разработаем!

Ну его нах... этот Windows, вместе с его Photos

Написано с такой помпой, будто сервера делать стали. А это всего лишь сборочный конвейер из готовых комплектующих. Очковтирательство бл...ть, отверточная сборка. Ни в этой статье, ни в оригинальной на сайте ни слова о стране-происхождения компонент.

Велосипедостроители вместо того чтобы примкнуть к одному из множества существующих коллективов велосипедостроителей, решили создать свой велосипед

Сам долгие годы пользовался tor hidden services и tailscale. Но с тором в последнее время стало плохо - постоянно подливать новых мостов, а tailscale пошёл по пути отмены всего русского (http error code 451). Есть конечно и self-hosted open source версия сервера его, как упомянули выше (headscale). Но клиента на тот же андроид или iOS уже официально не поставить, только через приседания.

Сейчас я больше склоняюсь в сторону Nebula от Slack - https://github.com/slackhq/nebula

Для меня важные звонки - это мои собственные исходящие и звонки от людей в моей записной книжке

Нет чтоб порадоваться за ребят, которые заделиверили крутую штуку, так надо брызнуть сарказмом

Выражаю глубокий респект всем участникам этого проекта. Вы проделали крутую работу. Планы у вас отличные и направление на открытость, которое вы взяли, очень подкупает. С нетерпением ждем публичного релиза. Надеюсь, руководство выпишет вам всем бонусов ?

История наимутнейшая, согласен. Как и с датасетом OpenAI. В отсутствии достоверной возможности проверить, что они там использовали для тренировки (а наверняка там было что-то по вирусной GPLv3), им бы не упоминать даже об ограничениях по части использования результатов инференса.

Нашел ваш анонс (https://dtf.ru/u/637184-viktor-nosko/1695665-rossiyskie-razrabotchiki-obyavili-o-starte-fractalgpt-analoga-chatgpt-i-gpt-4-ot-openai), где было сказано вот это:

Особенно ярко проблема контроля генерации трансформеров видна при решении символьных задач в математике, физике, биологии и других точных науках, поиске фактов, ответах на вопросы - и поэтому в этих отраслях использовать даже большие языковые модели(LLM) опасно. Даже те кейсы, в которых ChatGPT показывает себя хорошо, такие как генерация сниппетов кода и исправление ошибок по описанию - все равно не расширяются на структурное написание нового кода, собственно потому, что архитектура GPT принципиально не подходит для решения такого рода задач.

Я не претендую на глубокие знания в области NN и трансформеров, но будучи регулярным пользователем последних, позволю себе не согласиться полностью с вашими выводами. По моему мнению то, что вы называется структурной проблемой требующей смены парадигмы и архитектуры, есть лишь побочный эффект сырости подходов в тренировке, файнтюнинге и сырости первых имплементаций. Кодогенерация ChatGPT образца ноября-декабря 2022 и кодогенерация ChatGPT сегодня это значительный шаг вперед. Я даже не говорю о dedicated трансормерах, типа GitHub Copilot, Amazon CodeWhisperer и прочих. А новые открытые и условно открытые модели, появляющиеся на рынке буквально каждую неделю, очень ярко подчёркивают этот тренд.

Но вам в любом случае успеха в ваших исследованиях. В этой области (как и во многих других подобных областях новых знаний) понять, что что-то работает лучше или хуже можно только после того, как получил что-то работающее в руках и сравнив это с конкурентами. Я вполне допускаю, что подход за который вы топите, будет еще более эффективен.

Датасеты Альпаки и Викуньи получены из ChatGPT, а OpenAI прямо запрещает использовать output своих моделей для тренировки коммерческих конкурентов

Крадешь бабки, отмываешь, кладешь отмытое в банк

Собрать открытый датасет пристойного качества, который можно использовать для создания продукта под лицензией Apache 2 - это вполне себе задача. Вот железо найти, как раз не проблема. Оно уже в проекте есть, судя по тому, что они сами пишут

Можно ссылочку? Сходу не нашёл, что там за история изменения лицензии

С новыми моделями типа open-assistant.ai это уже реально. Да, пока они не очень оптимизированы по части требований к ресурсам и для их локального запуска действительно потребуется GPU, который будет стоить как пару Алис. Но ведь есть и промежуточные варианты. Как и новые модели, которые появляются с каждым днём.

1
23 ...

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Chief Technology Officer (CTO), Software Architect
Lead
Git
Linux
Docker
Database
High-loaded systems
SQL
English
Software development
Algorithms and data structures
Development of integration solutions