Обновить
-2
Павел Стасиньски(Pawel Stasinski)@fuwiak

ИИ инжинер

0,1
Рейтинг
6
Подписчики
Отправить сообщение

До эры ИИ я не помню, чтобы новичкам было намного легче чем сейчас. Да и опытным специалистам тоже нелегко — после 6 этапов отбора и более

Мне нравится эта идея, а вы подсчитывали, во сколько обойдётся содержание всего этого комплекта? Насколько больше электроэнергии потребляет такая конфигурация? И т. д.?

Интереснее было бы сравнить какую то модель с Яндекса и Гигачат

У тебя такой высокомерный тон, будто в свои 17 лет ты реализовал более 10 крупных проектов и заработал миллион долларов, а даже с LLM не видишь разницы между полной настройкой и Lora. Это даже не смешно

17-летний ML-инженер из Питера.


У меня нет больше вопросов, не буду издеваться над ребенком)))) Что там тебе чат гпт подсказал?)))

  Ответ такой: зарубежные провайдеры предоставляют LLM по API (модель находится на внешних серверах), что может не соответствовать, например, 152-ФЗ или правилам защиты корпоративных данных

1)Автор вы знаете что русские провайдеры уже предоставляют по апи большинство зарубежный моделей и по 152-ФЗ все у них точно чики бомбони по этому поводу?
Зачем это упоминать в контексте fine tune моделей?
2) LoRA — это не равно полноценному fine-tuning.
3) Один запуск, одна эпоха, небольшой датасет и слабая методология оценки — какие серьёзные выводы из этого вообще можно сделать?

Здесь скорее студенческий Colab-эксперимент: нет нормальной инженерной рамки — отсутствует мониторинг, трекинг обучения и деплоя, непонятно, на каком серьёзном железе это запускать и как масштабировать. Вы точно Team Lead?




ВЫ как раз только подтверждаете мою мысль 🙂 Я ведь специально назвал нижние вилки, чтобы не выглядело преувеличением. А автор статьи при этом всерьёз обсуждает 300 тыс(это же услованя стройка) или оценивает кого-то в 800 $, что выглядит довольно комично на фоне того, сколько в некоторых странах платят за физическую работу, где учиться годами, как в IT, вообще не нужно.

Узкие горизонты, честно говоря. 🙂 В ЕС на физической работе спокойно зарабатывают 1500–2000 €, и никто не считает это “раздутыми ожиданиями”. А $5000 / месяц для разработчика — это не “мечта”, а средний (а в США и вовсе скромный) уровень для нормального спеца. Просто нужно смотреть чуть шире, чем родной рынок с демпингом и очередями на джуна.

Cursor ai за 20$ это все делает или очень дешевый qroq. за 200$ можно взять openAI и не париться

Рабочий день (8 часов)
90 руб/ч × 8 ч = 720 рублей в день

21 дня (С учетом 21–22 рабочих дней)
90 × 8 × 21 = 15 120 рублей

Это по сегодняшнему курсу +- 200$, супер opensource за 200 баксов :)

Сомнительные советы, особо про использование ИИ, ATS системы часто отклоняют резюме, если увидят использование Generative AI.

В процесс обучения AI входит: 

  • сбор и подготовка данных (1-3 месяца). Сложности добавляют «грязные» данные (неверная информация), которые нужно чистить.

  • обучение и тестирование (2-6 месяцев). Подбираются алгоритмы, настраиваются гиперпараметры, проводится тестирование.

  • валидация (1-2 месяца). Проверка модели на тестовых и реальных кейсах бизнеса. Изучается корректность работы AI.

  • интеграция в продакшен (от 2-ух недель до нескольких месяцев). Модель внедряется в бизнес, подключается API и проводятся A/B-тестирования.





Эти строки взяты прямо из какой-то генеративной модели, даже вы не проверяете, что вставляете в сеть.

В статье упоминаются ключевые методы, которые влияют на точность RAG, но не приводится явных метрик, cможете сказать какие метрики вы использовали?

Я не совсем понимаю, почему все сравнивают MLFlow с Kubeflow. Действительно, у них есть общая функциональность, но сама идея Kubeflow гораздо шире, чем просто мониторинг и версионирование модели. Но я полностью согласен с автором, Kubeflow проблематичен в установке и поддержке, после многих проблем с ним у моих клиентов, я предлагаю другие решения((что угодно, только не Kubeflow :):):)), которые не создают таких частых проблем.

Чего мне действительно не хватает в этой статье, так это конкретных примеров, например, чтобы сделать бенчмарк на, например, titatic dataset и различных наборах параметров, , какой метод занимает сколько времени и т д.

Вы, ребята, придумываете все более и более слабые истории, видимо идет далеко не все по плану, если не смогли нанять толкового копирайтера.

Никто не хотел брать его на работу, но на фрилансе, где нужно быть гораздо более независимым и надежным специалистом, он уже пробился без проблем? Само описание процесса собеседования и описанных после него задач настолько инфантильно, что создается впечатление, что вся эта история произошла, но в "голове" автора.

Я понимаю, что это всего лишь перевод, поэтому здесь есть несколько ошибок и недосказанностей.

- в файле manifest не хватает "/" в пути
- не указано или это мак с процесором интель или м 1/2, для интеля нужно использовать такую строку

minikube start --driver=hyperkit --kubernetes-version=1.16.15      --cpus=6 --memory=8g --disk-size=40g --profile kf      --extra-config=apiserver.service-account-issuer=api      --extra-config=apiserver.service-account-signing-key-file=/var/lib/minikube/certs/sa.key      --extra-config=apiserver.service-account-api-audiences=api

иначе не сработает(все таки с проблемами, но хотя запупскаетя)

- Если у вас недостаточно оперативной памяти (менее 16 Гб, это все равно может не сработать, потому что некоторые поды не сработают).

Есть замечания:

  • В статье вы не показываете, как поделиться или сделать развертывание модели для производства, поскольку вы уже упомянули onnx.

    • "Я показал простой способ создать систему распознавания лиц, дающую довольно высокий уровень качества. "


    Мне не хочется вас огорчать, но без демонстрации матрицы ошибок "точность" абсолютно ничего не значит. И нельзя с уверенностью сказать. что это хорошая модель. Не говоря уже о кроссвалидации или проверке на переобучение

Все об ООП в Python хорошо, просто автор немного недостаточно образован и не совсем понимает, о чем он пишет...

Я спрашивал про ваш опыт, другие benchmark смогу сам и найти.

1

Информация

В рейтинге
3 512-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность