А могли бы дать прямую ссылку на ваш проект, а то меня гугл выводит на какие-то разные сайты. Поскольку мне эта тема в определённой мере интересна, то хотелось бы посмотреть как оно работает.
И ещё. Насколько понимаю из описания в статье, самок узкое место - это собрать предварительно информацию об интересах пользователя. На мой взгляд, ИМХО, можно это стимулировать следующим образом: взять те же уже готовые профили из датасета и предожить пользователю выбрать, какие ему нравятся, какие нет. Для него это не сложно и даже интересно.
весь процесс начинается с формальной спецификации (контракта) интерфейсов, форматов данных или архитектурных правил. Спецификация становится единственным «источником истины» для всех участников проекта.
Это всё хорошо. Но как вы поступаете в ситуации, когда по ходу разработки оказывается, что в спецификации не всё учтено, или допущены ошибки? Мы ведь все знаем, что наибольшее количество изменений и дополнений и у пользователей, и у самих разработчиков, возникает на этапе, когда создан прототип.
Например, создана подробная спецификация, которая покрывает все вопросы. Но потом оказывается, что в одной или нескольких задачах требуются существенные изменения, некоторые задачи вообще убираются, а некоторые, наоборот, появляются только по ходу разработки. Получается, что спецификацию надо переписывать. И хорошо, если это достаточно локальные задачи, а если они взаимосвязаны с другими? Тогда объёмы переписывания спецификации возрастают кратно.
В эту тему напрашивается и вопрос о том, откуда берётся цвет в восприятии человека? Также, как кстати, как и звук. Ведь физически ни того, ни другого не существует, есть только физические параметры того, что мы называем световыми и звуковыми волнами. Цвета и звуки появляются и существуют только в голове человека. И если их нет в природе, то откуда человек их берет? Очень подходят на роль галлюцинаций.
Когда пишут "тот самый учёный", то возникает образ такого зрелого мужчины. На самом деле, ему тогда было порядка 25-28 лет. Он иммигрант из Гватемалы и получил работу в Carnegie Mellon University (Питтсбург, США). Если не ошибаюсь, он там работает и сейчас.
Он тогда был там профессором компьютерных наук, но выглядел как недавний выпускник, такой живой пацан.
Важно отметить, что обе идеи (CAPTCHA и ReCAPTCHA) появились именно в академической среде как исследовательские проекты вместе со студентами и коллегами.
Потом, действительно, его проект reCAPTCHA был выкуплен Google и стал использоваться в том числе для защиты сервисов и оцифровки книг в Google Books.
Когда первый раз узнал об этом, то как-то сильно позавидовал преподам и студентам таких универов. Это вот не просто написать эссе и выполнить лабораторку, а сделать эксперимент, в котором участвуют не десятки или сотни, а миллионы пользователей!
Ну и вишенка на тортике. Потом, он же, с одним из своих очередных студентов, замутили проект, который сейчас называется Duolingo! На сегодняшний день количество пользователей этого сервиса более 50 миллионов в день!
Вот здесь ссылка с видео его давнего выступления на TED. Там он рассказывает и про CAPTCHA, и про то как им пришла в голову идея сделать бесплатный сервис для изучения иностранных языков. Тогда это была только идея.
Наверное даты перепутали, вместо 1-го апреля опубликовали 13-го
Российские учёные систему искусственного интеллекта для проведения исследований и генерации научных статей.
Похоже, что данная "система искусственного интеллекта" пишет статьи с ашипками. Да и название то какое эпохальное - "система искусственного интеллекта"! Не какие-то там LLM.
Работа этой системы была принята на неназванную флагманскую международную конференцию в области информационных технологий (класс А*)
Офигеть как круто! "Неназванная", но все равно "флагманская", да ещё и "класс А". Трепещите человеки!
Ну вот, Хабр отстаёт от прогресса, банит, понимаешь, статьи, написанные ИИ. А вот наши учёные опять впереди планеты всей, теперь будут писать статьи через "систему искусственного интеллекта" и посылать их на неназванные флагманские конференции класса А. Как тебе такое, Маск?
Раньше мы теряли второстепенные навыки и сохраняли самые важные - мышление, творчество.
Раньше люди сами строили самолёты, автомобили, радиоприемники и компьютеры. И это были супер творческие задачи, где необходимо было использовать мышление на полную мощь. Теперь это делают только специалисты и редкие энтузиасты. Так что то, что называют "деградацией", уже давно произошло и происходит. Только вот это совсем не деградация, если человек управляет автомобилем или пользуется компьютером и понятия не имеет как оно устроено внутри. И да, если машины сломаются, то обычный человек, не специалист, не сможет ничего сделать. То же самое будет происходить и с ИИ - сломался, процесс остановился. Кто-то сможет без него, кто-то нет. Так что, никогда такого не было и вот опять.
довольно интересно. Тем не менее есть некоторые ассоциации и вопросы. Например:
assets — он уже весит около 800 МБ, потому что там лежат книги, Telegram-экспорты, расшифровки голосовых сообщений и другие источники
А это разве не то же, что и RAG?
Если совсем кратко, сама память держится на четырех вещах: маршрутизация по слоям, чтобы каждый факт попадал в свой тип файлов; нормализация новых данных, чтобы сырые заметки и архивы превращались в короткие структурированные записи; правила обновления базы, чтобы не плодить дубли и не ломать иерархию; и постоянное разделение между источниками и нормализованной памятью.
А не сложно ли поддерживать такое количество вспомогательного контекста? Один раз создать это ещё нормально, но если что-то меняется, добавляется, или наоборот, устаревает и меняется, насколько легко проходить по всем уровням, чтобы находить и исправлять? Не получится ли так, что трудозатраты на поддерживание всего этого набора инструментов в актуальном состоянии превысят ценность результата?
profile/ — стабильная информация обо мне
areas/ — основные сферы жизни: работа, здоровье, обучение, дом
events/ — хронология и важные изменения
preferences/ — вкусы, ограничения, паттерны, способы работы
roles/ — режимы ответа под разные задачи
skills/ — локальные процедуры и правила
my-notes/ — короткие заметки и временные фиксации
assets/ — источники: книги, Telegram-архивы, внешние индексы
inbox/ — сырые, еще не нормализованные штуки
Пару вопросов:
Насколько велики эти файлы?
Каким образом LLM использует эти файлы? Например, прочитывает все заново каждый раз или как-то по-другому?
Если будете продолжать эту тему, то мне лично было бы интересно почитать про то "как устроена сама память"
Спасибо за перевод! Наконец-то нормальная статья, из которой понятно зачем это и как это работает.
Но честно говоря, задачи какие-то немного стрёмноватые. Если посмотреть в тексте: рассортировать файлы на рабочем столе, видеозаписи и чеки. Одна и та же задача, только файлы разные.
Автор статьи беспокоится, что мы теряем навыки. Ну да, так мы давно их теряем. Раньше таблицу умножения учили наизусть, без неё было никак. Потом появились калькуляторы и необходимость в ней отпала. Навыки устного счёта явно деградировали.
Потом, врач типа не сможет работать, потому что ChatGPT офлайн. Так это и так уже давно происходит. Если отключается интернет, то и банки не работают, и много чего ещё, как это прямо на днях случается.
Далее, программист типа не понимает код, который написал ИИ. А сколько было и есть разговоров о том, что программисты не понимают код, который написали другие программисты до них? Как с деградацией в этом случае?
автоматизация в бухгалтерской фирме напрямую привела к эрозии навыков
Рассмешили. Это знают все автоматизаторы, что со временем программисты лучше ориентируются в алгоритмах учёта, чем бухгалтеры.
В общем, ёжики будут колоться, но продолжать делать своё дело.
А в таких текстах заметно недостаточное количество логического / критического мышления. А именно: почему всё упирается в противопоставительное и взаимоисключащее слово "или"? Например: ИИ - это или хорошо, или плохо. Почему не использовать объединяющий союз "и" - ИИ это и хорошо, и плохо.
Т.е., у ИИ есть и плюсы, и минусы. И скорее всего оно так будет и дальше.
Не знаю как у автора получилось запихнуть в ИИ документы по 80 и 200 страниц. Однажды попытался проверить чисто ошибки в тексте на 60 страниц с помощью ChatGPT, так он его просто не осилил. Выдал страниц 5 и спекся. А резать и скармливать кусками тот ещё гемор.
А могли бы дать прямую ссылку на ваш проект, а то меня гугл выводит на какие-то разные сайты. Поскольку мне эта тема в определённой мере интересна, то хотелось бы посмотреть как оно работает.
И ещё. Насколько понимаю из описания в статье, самок узкое место - это собрать предварительно информацию об интересах пользователя. На мой взгляд, ИМХО, можно это стимулировать следующим образом: взять те же уже готовые профили из датасета и предожить пользователю выбрать, какие ему нравятся, какие нет. Для него это не сложно и даже интересно.
Это всё хорошо. Но как вы поступаете в ситуации, когда по ходу разработки оказывается, что в спецификации не всё учтено, или допущены ошибки? Мы ведь все знаем, что наибольшее количество изменений и дополнений и у пользователей, и у самих разработчиков, возникает на этапе, когда создан прототип.
Например, создана подробная спецификация, которая покрывает все вопросы. Но потом оказывается, что в одной или нескольких задачах требуются существенные изменения, некоторые задачи вообще убираются, а некоторые, наоборот, появляются только по ходу разработки. Получается, что спецификацию надо переписывать. И хорошо, если это достаточно локальные задачи, а если они взаимосвязаны с другими? Тогда объёмы переписывания спецификации возрастают кратно.
В эту тему напрашивается и вопрос о том, откуда берётся цвет в восприятии человека? Также, как кстати, как и звук. Ведь физически ни того, ни другого не существует, есть только физические параметры того, что мы называем световыми и звуковыми волнами. Цвета и звуки появляются и существуют только в голове человека. И если их нет в природе, то откуда человек их берет? Очень подходят на роль галлюцинаций.
Автор упустил пару интересных моментов:
Когда пишут "тот самый учёный", то возникает образ такого зрелого мужчины. На самом деле, ему тогда было порядка 25-28 лет. Он иммигрант из Гватемалы и получил работу в Carnegie Mellon University (Питтсбург, США). Если не ошибаюсь, он там работает и сейчас.
Он тогда был там профессором компьютерных наук, но выглядел как недавний выпускник, такой живой пацан.
Важно отметить, что обе идеи (CAPTCHA и ReCAPTCHA) появились именно в академической среде как исследовательские проекты вместе со студентами и коллегами.
Потом, действительно, его проект reCAPTCHA был выкуплен Google и стал использоваться в том числе для защиты сервисов и оцифровки книг в Google Books.
Когда первый раз узнал об этом, то как-то сильно позавидовал преподам и студентам таких универов. Это вот не просто написать эссе и выполнить лабораторку, а сделать эксперимент, в котором участвуют не десятки или сотни, а миллионы пользователей!
Ну и вишенка на тортике. Потом, он же, с одним из своих очередных студентов, замутили проект, который сейчас называется Duolingo! На сегодняшний день количество пользователей этого сервиса более 50 миллионов в день!
Вот здесь ссылка с видео его давнего выступления на TED. Там он рассказывает и про CAPTCHA, и про то как им пришла в голову идея сделать бесплатный сервис для изучения иностранных языков. Тогда это была только идея.
https://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration#t-313580
Enjoy!
такое впечатление, что это переводная статья, наши авторы так не пишут!))
Интересный тренд: раньше была одна новость про ChatGPT, потом две, теперь три новости одна за одной про то как вышла новая версия ChatGPT 5.5
да, стала лучше. В предыдущей версии просил флипнуть изображение справа налево - не получалось ни в какую. Сейчас дал то же задание - сделала легко.
Полезная информация, спасибо за перевод!
Зависит от количества токенов по тарифному плану
Наверное даты перепутали, вместо 1-го апреля опубликовали 13-го
Похоже, что данная "система искусственного интеллекта" пишет статьи с ашипками. Да и название то какое эпохальное - "система искусственного интеллекта"! Не какие-то там LLM.
Офигеть как круто! "Неназванная", но все равно "флагманская", да ещё и "класс А". Трепещите человеки!
Ну вот, Хабр отстаёт от прогресса, банит, понимаешь, статьи, написанные ИИ. А вот наши учёные опять впереди планеты всей, теперь будут писать статьи через "систему искусственного интеллекта" и посылать их на неназванные флагманские конференции класса А. Как тебе такое, Маск?
Раньше люди сами строили самолёты, автомобили, радиоприемники и компьютеры. И это были супер творческие задачи, где необходимо было использовать мышление на полную мощь. Теперь это делают только специалисты и редкие энтузиасты. Так что то, что называют "деградацией", уже давно произошло и происходит. Только вот это совсем не деградация, если человек управляет автомобилем или пользуется компьютером и понятия не имеет как оно устроено внутри. И да, если машины сломаются, то обычный человек, не специалист, не сможет ничего сделать. То же самое будет происходить и с ИИ - сломался, процесс остановился. Кто-то сможет без него, кто-то нет. Так что, никогда такого не было и вот опять.
довольно интересно. Тем не менее есть некоторые ассоциации и вопросы. Например:
А это разве не то же, что и RAG?
А не сложно ли поддерживать такое количество вспомогательного контекста? Один раз создать это ещё нормально, но если что-то меняется, добавляется, или наоборот, устаревает и меняется, насколько легко проходить по всем уровням, чтобы находить и исправлять? Не получится ли так, что трудозатраты на поддерживание всего этого набора инструментов в актуальном состоянии превысят ценность результата?
про Cray не так уж много кто слышал, а с комментариями сталкиваются здесь все
Пару вопросов:
Насколько велики эти файлы?
Каким образом LLM использует эти файлы? Например, прочитывает все заново каждый раз или как-то по-другому?
Если будете продолжать эту тему, то мне лично было бы интересно почитать про то "как устроена сама память"
Спасибо за перевод! Наконец-то нормальная статья, из которой понятно зачем это и как это работает.
Но честно говоря, задачи какие-то немного стрёмноватые. Если посмотреть в тексте: рассортировать файлы на рабочем столе, видеозаписи и чеки. Одна и та же задача, только файлы разные.
так вы ведь сами написали в предыдущем комментарии про автоматику
Интересно вообще представить, как пилоты летают на ИИ ))
ой ли?
значит всё-таки делают свой ИИ
Автор статьи беспокоится, что мы теряем навыки. Ну да, так мы давно их теряем. Раньше таблицу умножения учили наизусть, без неё было никак. Потом появились калькуляторы и необходимость в ней отпала. Навыки устного счёта явно деградировали.
Потом, врач типа не сможет работать, потому что ChatGPT офлайн. Так это и так уже давно происходит. Если отключается интернет, то и банки не работают, и много чего ещё, как это прямо на днях случается.
Далее, программист типа не понимает код, который написал ИИ. А сколько было и есть разговоров о том, что программисты не понимают код, который написали другие программисты до них? Как с деградацией в этом случае?
Рассмешили. Это знают все автоматизаторы, что со временем программисты лучше ориентируются в алгоритмах учёта, чем бухгалтеры.
В общем, ёжики будут колоться, но продолжать делать своё дело.
А в таких текстах заметно недостаточное количество логического / критического мышления. А именно: почему всё упирается в противопоставительное и взаимоисключащее слово "или"? Например: ИИ - это или хорошо, или плохо. Почему не использовать объединяющий союз "и" - ИИ это и хорошо, и плохо.
Т.е., у ИИ есть и плюсы, и минусы. И скорее всего оно так будет и дальше.
Не знаю как у автора получилось запихнуть в ИИ документы по 80 и 200 страниц. Однажды попытался проверить чисто ошибки в тексте на 60 страниц с помощью ChatGPT, так он его просто не осилил. Выдал страниц 5 и спекся. А резать и скармливать кусками тот ещё гемор.