Комментарии / Профиль guitarfx / Хабр

Пользователь

Профиль Публикации Комментарии 7Закладки 3

Общение с ChatGPT-4 на предмет выяснения информации о...

Тоже замечал, ChatGPT затрудняется в ответе на вопросы типа X > Y ? даже если он точно знает значения X и Y. Так как такие вопросы надо решать в несколько шагов, сначала узнать значения X и Y и затем их сравнить. Кроме того посмотрев несколко популярных видео и статей сложилось впечатление, что сначала вопрос векторизуется таким же способом как и тексты (предполагаемо содержащие ответ). Но при таком подходе семантический поиск будет работать только если в самом вопросе хотя бы частично содержится смысл ответа, иначе непонятно почему косинусное расстояние между вопросом и ответом должно быть мало если смыслы семантика вопроса и ответа не пересекаются!

Посмотреть

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

guitarfx 19 апр в 18:33

Спасибо! А вот еще вопрос, если речь идет о специализированной документации, и там например прибор с название "крутойприбор1159па71", и вопрос будет о нем, то,кажется, стандартный эмбедер ничего в себе с таким буквосочетанием не найдет? и не сможет его векторизовать? А поиск в точности по слову может не дать результатов т.к. прибор может быть устаревших и уже отсутствовать в доках или наоборот - совсем новый и его не будет в документации т.к. еще не успели внести и обновить базу документов?

Я помотрел как Gpt4 - иногда он довольно удачно что-то похожее, но не совпадающее по названию находит... ?

По поводу запроса из одного слова - его надо форматировать как один чанк которые делаются на стадии загрузки документов? Будет много пустых полей? Чем их заполнить - рандомными строками из документации или просто рандомными или пустыми?

Посмотреть

guitarfx 19 апр в 17:26

Разъясните плиз, каждый локалбный документ представили векторами (с помощью чего?) и сохранили в векторной базе. А что вы делаете с вопросом юзера? Правильно ли я понял что вопрос юзера пусть даже из одного слова надо также преобразовать в вектор строго того же типа и спомощью тех же средств, что использовались для векторизации локальных документов? Но ведь документы могут большими, но тем не менее не содержать ни одного слова из запроса, который может состоять просто из одного слова?

Посмотреть

Дифференциальная приватность в машинном обучение

guitarfx 27 янв в 01:06

поясните пожалуйста, в случае ФИО человека или страны проживания или часового пояса локации каким образом добавляется шум и что такое будет шум?

Посмотреть

Xbox запустила программу продвижения инди-игр Indie Selects

guitarfx 26 янв в 07:22

К предыдущему посту - а не имеется ли тут огромная коррупционная ёмкость? Кто и как будет отбирать и как с ним познакомиться? :)

Посмотреть

За миллионы лет на поверхности Марса то и дело появлялись потоки воды

guitarfx 26 янв в 07:21

хотя бы много реальной воды или реального льда нашли бы... или уже нашли?

Посмотреть

Почему новым сотрудникам платят больше, чем работающим давно?

guitarfx 26 янв в 00:20

в компании где я работаю причина вот в чем! Сейчас на одно место претендует 20-30 НОВЫХ человек, т.е. выбирают самого достойного по каким-то критериям, он выиграл конкурс и потому может взять более высокую зарплату. Сотрудник, что уже работает - в фирме стараются сделать так, чтобы незаменимых не было, т.е. любого долго работающего сотрудника на невысокой должности при правильной организации труда по мнению руководство легко заменить другим из фирмы или с рынка труда, т.е. его ценность низка и начальсмтво уверено, что в открытом конкурсе в соревновании со свежими только что с рынка труда когда конкурс 20-30 человек на место старый сотрудник почти наверняка проиграет.

Посмотреть