Spyman29 янв 2025 в 10:15

LLM в Pet проектах

Простой

6 мин

6.3K

Искусственный интеллект

Из песочницы

Комментарии 10

НЛО прилетело и опубликовало эту надпись здесь

Spyman 29 янв 2025 в 10:48

Попытался понять, что именно делает gptchat в вашем проекте, но сходу не понял - если опишете кейс - будет круто))
А по поводу openai api - верю что с ним нет проблем, но в pet проектах не доверяю сторонним api - потому что они имют свойства меняться, отключаться, уходить под санкции - а я предпочитаю решив задачу, больше к поддержке никогда не возвращться - работает - не трогай)

НЛО прилетело и опубликовало эту надпись здесь

Maksclub 30 янв 2025 в 03:46

прикольная, но кажется немного опасная

gfiopl8 29 янв 2025 в 10:55

Что конкретно может делать 8б моделька работающая со скоростью несколько символов в секунду?

Яндекс не просто так не может добавить скилы на человеческом языке, они не могут свой ии даже научить нормально реагировать на команды типа поставь на паузу, это не так просто как кажется.

Spyman 29 янв 2025 в 11:04

Даже моделька 1.5b - вполне может разобрать текстовый запрос и выдать номера приборов которые надо включить / выключить. Я собственно это проверял (правда тогда таких маленьких моделей на русском не было, и я проверял на английском). И она даже на процессоре будет выдавать ответ почти мгновенно, тем более что нам и не нужно от неё сложных рассуждений, а нужно как раз несколько символов.

А про яндекс - скорее всего это не так просто как кажется - если речь идет о миллионах запросов, которые им надо обрабатывать и уровне качества при котором включить не тот прибор - это катастрофа. А вот в домашнем варианте - где больше 1 запроса в секунду - уже почти невероятный сценарий, и точность в 95% удовлетворительна - всё сильно проще. Сложность механизмов почти всегда растёт ассимптотически при приближении к идкеальному результату)

JBFW 29 янв 2025 в 14:56

Осталось найти небольшую коробочку, желательно безвентиляторную, с много-много-памяти.

Потому что так-то, в общем, ollama можно запустить даже на одноплатнике ARM с 4 гигами, но этого мало.

Spyman 29 янв 2025 в 15:43

Решил для себя эту проблему выделив на дне кладовки место под пару full-Tower машин (в конце концов где то ведь и nas должен быть свой, и git). Времена когда rapberry pi были в 10 раз дешевле x86-64 машины как будто уже и прошли, а б/у пк можно достать за копейки (или, что еще проще, не продавать старый при переходе на современное желео :D ).

Ну и даже в небольшой квартире чаще всего можно оборудовать место (например верхние полки шакфов в прихожей до которых никогда не дотянешься, углы кладовки, угловые ящики в п-образной кухне)

Хотя может в недалеком будущем в ollama добавят поддержку нейроускорителей, которые есть на актуальных arm чипах, и мы что-то карманного форм фактора получим))

JBFW 29 янв 2025 в 16:26

Времена когда rapberry pi были в 10 раз дешевле x86-64 машины как будто уже и прошли

Сейчас можно по копеечной стоимости TV-боксы брать, они и маленькие, и жрут мало энергии.
Очень удобно для всякой автоматизации. Но вот с памятью там беда...

Большой х86-64, прежде всего, гудит, а я этого терпеть не могу, отвык. Хотя, можно и вынести куда подальше...

supersmeh 30 янв 2025 в 05:12

У НВидеа есть похожая коробочка, там 8 Гигов: nvidia.com/en-us/autonomous-machines/embedded-systems/jetson-orin/nano-super-developer-kit/
Со специальными CUDA ядрами. Как у нас достать не знаю.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий