Комментарии 6
Фармацевтическая компания, выпускающая сахарные шарики без действующего вещества по цене лекарства, автоматизировала обман своих пользователей при помощи QSOFT, программисты которой даже не поняли, что обрабатывают не информацию, а лженаучное мракобесие.
Вот меморандум Российской Академии Наук о лженаучности гомеопатии https://www.antibiotics-chemotherapy.ru/jour/announcement/view/142?locale=ru_RU
Мне кажется, что если среди сотрудников QSOFT ещё остались адекватные люди, а не только любители получать деньги за счёт обмана других, данный меморандум поможет им осознать в какое именно мошенничество они ввязались и подумать о том, как в таком больше не участвовать и перестать называть сахарные шарики медициной.
Да какая там адекватность?
Взяли чанкинг с оверлапом. Самую примитивщину. И такие о, пойдём текст адаптируем под него.
Интересно что им джемини выдаёт, когда они табличные данные предоставляют на 1000к строк.
99% успешности rag систем это как раз тотальный контроль за тем как нарезается текст неструктурированных данных, в какую базу он векторизируется и какой моделью, и какими алгоритмами происходит поиск по этой базе. А не выбор llm модели.
Я Вообще прочитал - мы взяли примитивщину облачную, и теперь мучаемся с ней, потому что было лень разбираться как строить rag вменяемый. Кстати, вменяемый rag - это про его архитектуру, а не про питон и langchain.
langchain из коробки даёт кучу абстракций бестолковых. Есть библиотеки, которые он использует под капотом, и использует их криво. Лучше брать сразу их. Но это детали.
Хорошо внедрять AI в области гомеопатии. Что бы он ни генерировал, состояние пациентов не изменится.
полезная статья - спасибо что раскрыли трудности практические и как их решали (чанкинг в частности). я бы конечно поподробнее поспрашивал про расходы на токены яндекса, но тут наверное остается только поверить. бюджеты (расходы) так просто никто не раскроет
RAG-бот на YandexGPT без Python и оркестраторов. Кейс внедрения «Яндекс Агента» в медицине