Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

Тоже замечал, ChatGPT затрудняется в ответе на вопросы типа X > Y ? даже если он точно знает значения X и Y. Так как такие вопросы надо решать в несколько шагов, сначала узнать значения X и Y и затем их сравнить. Кроме того посмотрев несколко популярных видео и статей сложилось впечатление, что сначала вопрос векторизуется таким же способом как и тексты (предполагаемо содержащие ответ). Но при таком подходе семантический поиск будет работать только если в самом вопросе хотя бы частично содержится смысл ответа, иначе непонятно почему косинусное расстояние между вопросом и ответом должно быть мало если смыслы семантика вопроса и ответа не пересекаются!

Спасибо! А вот еще вопрос, если речь идет о специализированной документации, и там например прибор с название "крутойприбор1159па71", и вопрос будет о нем, то,кажется, стандартный эмбедер ничего в себе с таким буквосочетанием не найдет? и не сможет его векторизовать? А поиск в точности по слову может не дать результатов т.к. прибор может быть устаревших и уже отсутствовать в доках или наоборот - совсем новый и его не будет в документации т.к. еще не успели внести и обновить базу документов?

Я помотрел как Gpt4 - иногда он довольно удачно что-то похожее, но не совпадающее по названию находит... ?

По поводу запроса из одного слова - его надо форматировать как один чанк которые делаются на стадии загрузки документов? Будет много пустых полей? Чем их заполнить - рандомными строками из документации или просто рандомными или пустыми?

Разъясните плиз, каждый локалбный документ представили векторами (с помощью чего?) и сохранили в векторной базе. А что вы делаете с вопросом юзера? Правильно ли я понял что вопрос юзера пусть даже из одного слова надо также преобразовать в вектор строго того же типа и спомощью тех же средств, что использовались для векторизации локальных документов? Но ведь документы могут большими, но тем не менее не содержать ни одного слова из запроса, который может состоять просто из одного слова?

поясните пожалуйста, в случае ФИО человека или страны проживания или часового пояса локации каким образом добавляется шум и что такое будет шум?

К предыдущему посту - а не имеется ли тут огромная коррупционная ёмкость? Кто и как будет отбирать и как с ним познакомиться? :)

хотя бы много реальной воды или реального льда нашли бы... или уже нашли?

в компании где я работаю причина вот в чем! Сейчас на одно место претендует 20-30 НОВЫХ человек, т.е. выбирают самого достойного по каким-то критериям, он выиграл конкурс и потому может взять более высокую зарплату. Сотрудник, что уже работает - в фирме стараются сделать так, чтобы незаменимых не было, т.е. любого долго работающего сотрудника на невысокой должности при правильной организации труда по мнению руководство легко заменить другим из фирмы или с рынка труда, т.е. его ценность низка и начальсмтво уверено, что в открытом конкурсе в соревновании со свежими только что с рынка труда когда конкурс 20-30 человек на место старый сотрудник почти наверняка проиграет.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность