Когда говорят о дополнении контекста в системах типа RAG, это работает примерно так:
Запрос пользователя сначала преобразуется в набор чисел (вектор) с помощью специальной программы, которая «понимает» текст.
Поиск по базе данных: Этот вектор запроса сравнивается с векторами, которые уже сохранены в базе данных, чтобы найти похожие тексты (например, статьи или документы).
Получение контекста: Найденные тексты извлекаются и добавляются к исходному запросу. Это помогает системе лучше понять, о чём был вопрос.
Создание ответа: Эти тексты не смешиваются с запросом в математическом смысле. Вместо этого они просто присоединяются к оригинальному запросу. Получившийся текст (вопрос + найденные данные) отправляется в большую языковую модель (LLM), которая уже генерирует ответ.
То есть, контекст просто добавляется к запросу в виде дополнительной информации, а не как набор чисел. Это помогает системе давать более точные ответы.
Статья - обобщающий термин, по сути это - любой артефакт, который готовит аналитик. У нас для работы аналитика используется стандартная связка Confluence + Jira. Все артефакты по аналитике мы храним в Confluece - это могут быть статьи, спецификации, описания решений - в общем, название артефакта на языке заказчика, и для публикации мы остановились на термине "статья". В jira мы добавляем ссылки на Confluence, дизайн и прочие артефакты + краткая постановка задачи разработчику на человеческом языке.
Вообще, на русском языке этому обучают в МАДИ (и даже пишут, что по окончании выдадут «Удостоверение о повышении квалификации») и еще нескольких не очень популярных площадках. На английском есть курсы в Udemy и Codeacademy.
Крупные edtech-проекты свои курс по промпт-инжинирингу еще не запустили.
Мы и сами в шоке, как так получается. Обычно в качестве ответа мы видим вот это:
return sorted(list1 + list2)
Ваше решение, кстати, тоже достаточно редкий кейс. Но мы нашли как его сломать? : list1 = [1, 1, 2, 4] list2 = [1, 3, 5]
А про лакончиный вариант, спасибо, мы ждали такого коммента: действительно, так сильно проще, но заметили мы это уже после монтажа. Видимо, подвела зацикленность на решении такой же задачи на списках питона)
Да, согласны. Пожалуй, стоило прописать сразу же, что замена в тесте на 405 статус это, скорее, один из вариантов, и явно не самый лучший. К тому же, при таком статусе могут ещё и к безопасности возникнуть вопросы.
Но мы решили, что всё же не погружаться в эту тему и оставить тест таким, потому что статья, которая изначально планировалась «лёгким чтивом», по нашему мнению и без того уже выросла в объёме.
Не совсем так. Вакансий в целом на рынке стало меньше (если не учитывать Go). О причинах уменьшения количества вакансий сложно говорить, потому что крупные компании официально не объявляли о заморозке найма, как это было в феврале-марте. Но если смотреть на дистанции с середины июля по середину октября, то вакансий стало меньше.
Данные мы собирали следующим образом: вводим запрос с названием стека и указываем «искать только в названии вакансии». Поиск производился в отрасли «информационные технологии», по всей России, график работы не важен. Если сейчас сделать такой запрос по Angular по этим параметрам, то всего на площадке размещено 200 вакансий.
Данные собраны во временном диапазоне с середины июля по середину октября.
Это не глубинное исследование, а мини-вариант (о чем мы, кстати, указали в заголовке), чтобы показать тренд.
Разбор определений нужен был для более подробного описания модели и для использования этих терминов в будущих статьях.
В первом абзаце есть ссылка на proposal, в котором упоминается о использовании данной модели в Swift 5.5 Если обратиться к википедии, то мы увидим следующую терминологию:
"Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing execution to be suspended and resumed."
Swift с новой поточкой подходит под все характеристики, а именно: У нас non-preemptive multitasking, мы можем приостанавливать задачи и продолжать их выполнение.
Возможно, мы ошибаемся, тогда хотелось бы услышать, в чём фундаментально заключается отличие async/await от Kotlin.
Все организации шлют нам данные не синхронно, то есть за день нам могут прийти данные и от 10 и от 500 организаций. Средний размер видео это 2-3гб. Что связанно с CentOS, хоть сама Luna и поставляется в докере, но Visionlabs предоставляет свои бинарники и скрипты развертывания и обслуживания написанные под CentOS. Так же они поставляют свои пакеты, нужные для работы системы в виде rpm.
Кажется, мы промахнулись тредом и ответили не в той ветке. Бтв, ответ ниже :)
Когда говорят о дополнении контекста в системах типа RAG, это работает примерно так:
Запрос пользователя сначала преобразуется в набор чисел (вектор) с помощью специальной программы, которая «понимает» текст.
Поиск по базе данных: Этот вектор запроса сравнивается с векторами, которые уже сохранены в базе данных, чтобы найти похожие тексты (например, статьи или документы).
Получение контекста: Найденные тексты извлекаются и добавляются к исходному запросу. Это помогает системе лучше понять, о чём был вопрос.
Создание ответа: Эти тексты не смешиваются с запросом в математическом смысле. Вместо этого они просто присоединяются к оригинальному запросу. Получившийся текст (вопрос + найденные данные) отправляется в большую языковую модель (LLM), которая уже генерирует ответ.
То есть, контекст просто добавляется к запросу в виде дополнительной информации, а не как набор чисел. Это помогает системе давать более точные ответы.
Статья - обобщающий термин, по сути это - любой артефакт, который готовит аналитик. У нас для работы аналитика используется стандартная связка Confluence + Jira. Все артефакты по аналитике мы храним в Confluece - это могут быть статьи, спецификации, описания решений - в общем, название артефакта на языке заказчика, и для публикации мы остановились на термине "статья". В jira мы добавляем ссылки на Confluence, дизайн и прочие артефакты + краткая постановка задачи разработчику на человеческом языке.
С уважением, Алексей Аксянов
Разбивка по процентам есть на странице лонгрида. Сюда только скрины сложили
Мы сравниваем сентябрь 2022 с сентябрем 2023. Причем здесь февраль 2022?
Мы только подготовили перевод оригинального текста. Но, как вариант, мы дополним статью блоком про CSS
Материал для тех, кто хочет опробовать Bun на практике. Конечно, никто не запрещает пользоваться webpack
Вообще, на русском языке этому обучают в МАДИ (и даже пишут, что по окончании выдадут «Удостоверение о повышении квалификации») и еще нескольких не очень популярных площадках. На английском есть курсы в Udemy и Codeacademy.
Крупные edtech-проекты свои курс по промпт-инжинирингу еще не запустили.
Кстати, ее доработку оценили в 300 млрд рублей. Релиз обещают в 2027 году
Речь шла о магазинах приложений Google Play и AppStore, но мы ценим ваше замечание. Спасибо
Мы же только начали...
Вполне рабочий вариант. Не проверяли, как по памяти оно работает?
Мы и сами в шоке, как так получается. Обычно в качестве ответа мы видим вот это:
Ваше решение, кстати, тоже достаточно редкий кейс. Но мы нашли как его сломать? :
list1 = [1, 1, 2, 4]
list2 = [1, 3, 5]
А про лакончиный вариант, спасибо, мы ждали такого коммента: действительно, так сильно проще, но заметили мы это уже после монтажа. Видимо, подвела зацикленность на решении такой же задачи на списках питона)
Отвечает автор статьи:
Да, согласны. Пожалуй, стоило прописать сразу же, что замена в тесте на 405 статус это, скорее, один из вариантов, и явно не самый лучший. К тому же, при таком статусе могут ещё и к безопасности возникнуть вопросы.
Но мы решили, что всё же не погружаться в эту тему и оставить тест таким, потому что статья, которая изначально планировалась «лёгким чтивом», по нашему мнению и без того уже выросла в объёме.
Не совсем так. Вакансий в целом на рынке стало меньше (если не учитывать Go). О причинах уменьшения количества вакансий сложно говорить, потому что крупные компании официально не объявляли о заморозке найма, как это было в феврале-марте. Но если смотреть на дистанции с середины июля по середину октября, то вакансий стало меньше.
Данные мы собирали следующим образом: вводим запрос с названием стека и указываем «искать только в названии вакансии». Поиск производился в отрасли «информационные технологии», по всей России, график работы не важен. Если сейчас сделать такой запрос по Angular по этим параметрам, то всего на площадке размещено 200 вакансий.
Данные собраны во временном диапазоне с середины июля по середину октября.
Это не глубинное исследование, а мини-вариант (о чем мы, кстати, указали в заголовке), чтобы показать тренд.
Продолжение в работе :) Скоро опубликуем
Разбор определений нужен был для более подробного описания модели и для использования этих терминов в будущих статьях.
В первом абзаце есть ссылка на proposal, в котором упоминается о использовании данной модели в Swift 5.5 Если обратиться к википедии, то мы увидим следующую терминологию:
"Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing execution to be suspended and resumed."
Swift с новой поточкой подходит под все характеристики, а именно: У нас non-preemptive multitasking, мы можем приостанавливать задачи и продолжать их выполнение.
Возможно, мы ошибаемся, тогда хотелось бы услышать, в чём фундаментально заключается отличие async/await от Kotlin.
Никита Сосюк, автор статьи
Говорят, еще похож на лого World of Tanks, но нам так не кажется :)
Отвечает автор:
Все организации шлют нам данные не синхронно, то есть за день нам могут прийти данные и от 10 и от 500 организаций. Средний размер видео это 2-3гб. Что связанно с CentOS, хоть сама Luna и поставляется в докере, но Visionlabs предоставляет свои бинарники и скрипты развертывания и обслуживания написанные под CentOS. Так же они поставляют свои пакеты, нужные для работы системы в виде rpm.
По ценам не можем сориентировать, к сожалению :(