Как стать автором
Обновить
30
0
Олег Соколов @skleg

ML Engineer and CTO at Tatradev

Отправить сообщение

Все так, я не смотрел в деталях цивитовские, думаю мы чуть больше трейнили на большем датасете, но может не прав

У нас все кадры, поэтому связность выше, но кадров меньше

В принципе эту роль могут взять образовательные каналы всяких разных онлайн школ, которых уже сотни, у многих уже свои техно амбассадоры так сказать)
Просто они как-то их скорее в своих целях используют, а не развивают их канал там или блог напрямую

или вы о другом обслуживании ? ну бизнес уже может нанять одну команду для своих блогеров, кто будет монтировать снимать, развлекать публику в том числе

большая редкость ? в основном скорее как плюс указывают, но фокус немного другой

Согласен, такой заметил эффект такой от блога.

Если будете интересно писать, то точно повезет. Сейчас столько мусорного контента, который просто повторяет старый и очень большой спрос на контент в узких нишах, но это мне так может кажется

Ну вот видео как раз как собрать себе стол в любом месте из книг и палок ) другое дело что на съемных квартирах зачастую нет книг столько

прямо по работе надо знать о Stable Diffusion ? Завидую вам )

Спасибо, интересный ресурс, не видел ?

Пока что можно взять сделать свой экзекьютор просто по аналогии с TestMessageAdder, тогда он развернется как FastApi сервис внутри докера

https://github.com/TatraDev/pipertool/blob/main/tests/base_test.py

По описанию звучит интересно, не слышал о них. Но похоже на baseten и думаю еще можно поискать пару проектов. Пока фундаментальная разница, что у нас опенсорс , а платно мы только доп модули будем продавать и облако для развертывания пайпера.

Пока не увидел ни у кого что-то подобного. И в таких проектах часто пытаются полностью подсадить на их парадигму, чтоб извлечь побольше денег, у нас нет задачи затягивать в Пайпер через ограничения, наоборот через количество модулей, которых у подобных конкурентов часто 3 штуки крестом.

И у кого пригорело от этих файлов - приходите контрибьютить. У нас весело - кодогенерации, кишки питона, рефакторинг видимо еще теперь !

Да, лаим на Слона, сомневаюсь что ребята в курсе, вы не оттуда?) мы начали в этом году они лет 7 назад ?

Реальные примеры покажем в туториалах, обещаю.

Методика довольно субъективная, я кроме как - дать двум разработчикам н раз делать с Piper таску и без него - не вижу способа. И это тоже не очень точно звучит. Мне кажется не хватит у нас разработчиков и ресурсов набрать достоверную оценку прям.

Если нет модуля - вы добавляете свой. В этом основа фреймворка. Да, действительно, данные в наших проектах еще раз не готовили, так как уже были модули с полностью такой же обработкой данных по аналогии. Так что, тут, вы правы это время никуда не денется и это решительно невозможно как-то автоматически делать полностью. Это уже какой-то сильный ИИ нужен. Но Piper позволит взять сразу взять pandas/spark модуль и тут же заняться подготовкой данных не запариваясь об установке настройке, причем можете даже разными версиями пользоваться в разных участках кода, если нужно или разной конфигурацией Спарк. Тут выигрыш во времени мизерный, но по опыту знаю, что если что-то сработало в ноутбуках вообще не факт, что оно просто соберется в простом микросервисе. Так что выигрыш после это наш больший фокус.

Я хочу добавить AutoML и модули для генерации автоматических фичей, плюс будут модули разряда «забрать весь текст с PDF». С такими закрутками на зиму можно немного и препроцесинг данных ускорить, но сами мы его конечно не напишем.

Спасибо за интересные вопросы ?? пишите еще

Нет никакого хейта, так получилось, что наш проект из России, где по сути мало подобных конкурентов, просто это хороший вызов, быть на уровне таких крутых проектов ??

Этот файл еще не растащили в тесты, пережиток прошлого, когда перенесём его вообще не будет. Я придерживаюсь подхода, при котором сначала важный функционал, потом рефакторинг. Линтер конечно добавим когда-то, документацию понятную и пр. Без этих вещей мало кто будет пользоваться конечно. Но также никто не будет пользоваться, если не будет пользы и смысла, пока на нем концентрируемся

Все совпадения случайны) Аналогия не с дудочником, а с некой трубой которую можно из частей собрать

Действительно неконструктивно звучит без конкретного код ревью )
Тяжело читать мысли, я видел этот main файл
Заголовок же свое дело сделал,
Я верю в успех нашей концепции в Piper.
C радостью ждем Ваш ревью или PR

Рандомный файлик из интернетов, нужен был реальный документ.
Мы уже поменяли на тестовый другой, в папке tests/ocr

да, можно хоть куда уже, Python отлично подходит для разных экспериментов, систем без больших нагрузок, хотя в целом и там можно поколдовать

У меня они были, но странным образом исчезли :(

1

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность