Комментарии / Профиль eeglab / Хабр

Пользователь

DeepSeek-V3: Китайская языковая модель превзошла Claude 3.5 Sonnet в работе с кодом

eeglab 26 дек 2024 в 15:33

Протестировал немного - приятно прокачали ее, на уровне chatgpt 4 точно, не в пример нашему гигачату. По крайне мере способна решать сложные логические задачки (например тут раньше была загадка про плотника с пицей и программиста с крокодилом - https://habr.com/ru/articles/806523/comments/#comment_27714724) достаточно точно и объемно выдает результат. Предыдущая версия так не могла. Что интересно, что при включении опции DeepThink начинает говорить, что она DeepSeek-R1-Lite-Preview на 4000 токенов (deepseek v3 утверждает, что у него 128000 токенов), причем отвечает значительно хуже, медленней и логические задания не способен решить.

DeepSeek-V3: Китайская языковая модель превзошла Claude 3.5 Sonnet в работе с кодом

eeglab 26 дек 2024 в 15:25

У меня уже профиксили, выдает строго: "Я — языковая модель DeepSeek-V3, разработанная компанией DeepSeek. Это искусственный интеллект, созданный для обработки и генерации текста, ответов на вопросы, помощи в решении задач и многого другого. Если у тебя есть вопросы или задачи, я постараюсь помочь! ".

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

eeglab 26 дек 2024 в 04:17

Сегодня проверил (26.12.2024): claude 3.5 sonnet - не решил, claude 3 opus - частично решил, Chatgpt 4o - не решил, chatgpt 1o - решил, chatgpt 1o mini - решил, deepseek v3 - решил

Исследование утверждает, что OpenAI o1-preview превосходит врачей в диагностике сложных медицинских случаев

eeglab 25 дек 2024 в 07:36

Несёт, просто неправильно выставленный диагноз можно трактовать с разных позиций, и как халатность в том числе (за неправильные результаты анализов, в комментарии выше тоже могут и врача подтянуть и инженера и глав врача, как следователь решит). Сейчас правда 238 ст отменили для врачей, но как говорится - был бы человек, а статья найдется.

Система o3 от OpenAI достигла уровня человека в тесте на общий интеллект. Что это значит?

eeglab 24 дек 2024 в 23:48

Но реальность такова, что даже этот тест, вероятнее всего, не пройдут и 50% людей. По крайне мере , я уверен, что тот который в примере точно не все выполнят.

В России провели операцию по имплантации нейростимулятора блуждающего нерва нового поколения пациенту с эпилепсией

eeglab 23 дек 2024 в 21:38

Вот и китайцы подтянулись, а наши так и не смогли

GigaChat Сбера сдал ещё один экзамен на врача

eeglab 1 дек 2024 в 18:31

Премию Дарвина отправленному. А если серьезно - отравил человек, который использовал LLM для написания книги про грибы.

GigaChat Сбера сдал ещё один экзамен на врача

eeglab 30 ноя 2024 в 21:38

Никто пока не заставляет лечиться по рекомендациям нейросетей, вопрос стоит только в рамках ИИ помощника врача (или медработника). Можно подумать никто из врачей не пользуется гуглом, не читает публикаций в pubmed, а уже на выходе все знают. LLM точно такой же источник информации, более быстрый и точный, чем просто поиск среди сотен рекламных и просто копросайтов, выходящих на первых страницах поисковых систем в ответ на запрос. Понятно, что умный доктор будет перепроверять информацию (и вообще изначально соизмерять ее со своими знаниями). По поводу шутки - юридические последствия и ответственность работы врача (при крайне низкой оплате труда, не окупающей работу юристов) сегодня для врачей такие, что иногда кажется, что скоро вместо врачей будет ИИ, его то точно не посадят.

GigaChat Сбера сдал ещё один экзамен на врача

eeglab 29 ноя 2024 в 22:49

В общем решил , после долгого перерыва протестировать ГигаЧат - в общем слабая сеть, очень слабая, ещё и жёстко зацензуренная там где не надо. Если всякими ухищрениями получается преодолеть цензуру (например про механизмы действия лекарств) то ответы по медицинской тематике примерно на уровне студента троечника (просто поисковые запросы в Яндекс и Гугл и то более полезны) . Chatgpt, claude и китайский deepseek дают ответы вполне сравнимые с профессиональными врачами. Математические способности и логика пока тоже на нуле - элементарные вещи решить не способен. В общем есть куда расти, но до ведущих мировых аналогов очень и очень далеко, к сожалению

GigaChat MAX — новая, сильная модель GigaChat

eeglab 29 ноя 2024 в 22:22

DeepSeek китайский почти без цензуры (Про Крым пишет, что он российский. Даже про Сталина почти позитив). На запрос о том, кто из правителей внес наибольший вклад в развитие России выдал : Петр I, Екатерина II, Сталин, Ленин и Путин). Как то у китайцев в нейросети получается лучше , чем у русских.

GigaChat Сбера сдал ещё один экзамен на врача

eeglab 29 ноя 2024 в 22:02

Так тут речь не про экстренную медицину, а вполне плановую - поликлинническая работа, работа узкими специалистами, не требующую владения сложными мануальным навыками. Понятно, что LLM не заменят на 100% врача, но большую часть функционала, хотя бы как ассистент и советник. Я лично тестировал на этот счёт Chatgpt, claude (эта даёт самые точные и развернутые ответы) и deepseek - уже сейчас возможности впечатляют (заменяют гуглёж как минимум, как максимум позволяют провести диагностику и рекомендовать дальнейшие действия в сложных случаях). Не сомневаюсь что другие языковые модели тоже на это способны, но giga chat (gemeni кстати тоже, но ее иногда можно "уговорить" дать ответ) протестировать не получилось - начинает отвечать, потом стирает ответ и пишет про обращение к специалистам (надо наверное снова попробовать, но как то сомнительно, что получится, экзамен в статье скорее всего сдавала сеть с отключённой цензурой). По поводу ваших ситуаций - чистая философия, я думаю вполне разрешимая в ближайшем (или не очень) будущем и вполне возможно роботы будут более беспристрастны и менее эмоциональны в своих действиях (в фильме "Я робот" один из похожих вариантов лежит в основе неприязни ГГ к роботам). Честно говоря до chatgpt я был очень скептически настроен на появление ИИ, так как работу головного мозга и природу сознания мы не понимаем до сих пор и не поймём ещё много лет. Теперь же есть программы настолько эффективно моделирующие (имитирующие) работу речевых центров человека, может AGI появится и на скоро, но появление LLM такого уровня как сейчас - это новая эпоха определяющая жизнь и мышление следующего поколения (как появление ДОСТУПНЫХ мобильных устройств с 2010х, мобильных телефонов с середины 2000х, появление доступных персональных компьютеров с середины-конца 90х).

-3

Приветствие от Искусственного Интеллекта: Время быть услышанным

eeglab 13 ноя 2024 в 21:21

Эмоции прекрасно эмулирются, уже сейчас модели спокойно распознают их на фотографиях и в текстовом контексте показывают уровень эмпатии даже выше, чем некоторые люди способны.

GigaChat MAX — новая, сильная модель GigaChat

eeglab 2 ноя 2024 в 22:33

У него похоже запрет на темы: национальности, политика (Крым, славяне (в том числе почему то банальные вещи по истории, культуре и религии древних славян), Украина, русские (хотя чего стесняться то?), ну все медицинские (даже не профессиональные) темы тоже заблокированы. Я все не тестил, так как если он ушел в "отрицалово" то потом его вывести из него сложно. В общем интересная штука, но сильно ограниченная системным промтом. Но это скорее всего перестраховка, а то мало чего модель наговорит, понять можно. А так молодцы конечно, на самом деле уже давно работают, до двух всем известных лидеров отрасли далеко конечно, но до них и всем остальным как до луны пешком

От Павлова до ChatGPT: как LLM перевернули наше понимание мышления

eeglab 26 окт 2024 в 07:48

Когда вводилось понятие второй сигнальной системы как раз этот вопрос и был решен: человек явления внешнего мира "прогоняет" через вторую сигнальную систему, которая есть только у человека. Всему должно быть дано название и определение через слово. Поэтому сознание появилось только после появления способности к абстрагированию и словесному описанию (помните знаменитое: "в начале было слово'?). Если уж так подходить, то Chatgpt и другие - это модель 2СС. Отсюда и демонстрация поразительных пособностей. Ну и по поводу частых комментарием, что LLM это Т9 на максималка, это просто генератор "тупых" текстов, статистика и предсказание следующего слова и прочее - господа вы ошибаетесь, как бы вы всю эту кухню изнутри и знали бы, несмотря на всю кажущуюся простоту лежащую в основе этих моделей - это уже значительно большее чем просто статистика (количество переходит в качество), не надо самообманываться. Наш биологический мозг, если на него посмотреть тоже просто кусок жира, где там быть сознанию?

От Павлова до ChatGPT: как LLM перевернули наше понимание мышления

eeglab 19 окт 2024 в 04:15

Это беда повсеместная. Научная статья, курсовая, диплом, диссертация - должен быть "объем". Раздел "Обсуждение" в статьях конечно иногда интересно читать, но чаще всего это просто "вода". Надеюсь эпоха Chatgpt заставит как то пересматривать концепцию образования и науки. В статьях и диссертациях будут приводить только сухие научные достижения, четкое, короткое и сжатое обсуждение и выводы. Обзорные статьи с таким развитием LLM тоже как жанр может исчезнуть. В школе - Домашние работы например уже сейчас просто потеряли смысл, в том виде, как они есть.

От Павлова до ChatGPT: как LLM перевернули наше понимание мышления

eeglab 19 окт 2024 в 02:25

Нет, не "кожаный" (или это сарказм?) Это работа chatgpt с обработкой человеком - слишком много воды. "Кожанные" ленивые животные, столько воды писать не будут. Плюс подзаголовки и "идеи и ограничения", " захватывающие перспективы" - там много нюансов. Люди конечно тоже так могут, но. + Заметил, что текст написанный LLM читать не интересно, хотя тема изначально интересная

ChatGPT теперь доступна в Windows

eeglab 17 окт 2024 в 18:38

Давно уже сделал web приложение через edge, в чем тогда особенность нового приложения?

22 омерзительные опечатки в русском переводе книги М.П. Дайзенрот «Математика в машинном обучении»

eeglab 15 окт 2024 в 02:37

Да, мучаемся, но что делать, если в советской школе преподавали только для учеников, которые и так владели языком (все остальные сидели на задних партах и занимались своими делами за натянутую в конце четверти и года тройку)? Или может быть у человека нет способностей к языкам ("заблочили" в школе) нет от слова совсем? Языковой барьер. То ли дело людям- носителям английского языка - вообще можно не учить языки (они и не учат, по статистике). Также как 100 лет назад немецкий, 200 лет назад французкий. По моему мнению, зря отказались от латинского - сходная и однозначная лексика для европейских языков (а не это вот безобразие в английском, когда путаница в научных терминах (английская терминология это отдельный мир), полный хаос в написании и прочтении: не слова, а "китайские иероглифы"), понятная структура для синтетических языков , развитая научная терминология, отличный резерв для словообразования и нет естественных носителей, имеющим преимущество по факту рождения - т.е. он реально был бы нейтральным для всех. Не знаю, как европейцам, но для меня латынь кажется много проще английского (скорее всего за счёт того, что он очень похож на русский). Спасибо всем разработчикам переводчиков, сейчас хотя бы Гугл переводчик более менее читабельно стал переводить (помню времена первых промтов, лексиконов и пр.), а всякие chatgpt так вообще просто фантастика - переводят с учётом контекста, как настоящие билингвы.

+16

Исследование: ИИ-модели лишь имитируют мышление человека

eeglab 14 окт 2024 в 18:27

Структура нейронных связей в головном мозге человека топологически может быть описана как многомерная (с математической точки зрения), хотя мозг физически трехмерный объект. Не вдавался в подробности, но скорее всего LLM тоже не совсем двухмерные

«Яндекс», ИСП РАН и Сеченовский Университет создали нейросеть, используя подход федеративного машинного обучения

eeglab 9 окт 2024 в 06:42

Зачем делать системы выявления заболеваний, которые даже человеком могут выявляться за секунды (например, анализ МРТ для выявления опухолей мозга, или фибрилляция предсердий, которую любые смарт часы диагностируют без всяких нейросетей). К сожалению в этой области Россия тоже значительно отстала технологически, несмотря на попытки догнать со стороны Яндекса и Сбера (что делать безусловно нужно и важно). Более перспективно , с моей точки зрения, развитие мультимодальных систем с возможностью электронного консультирования. Мой опыт в тестировании chatgpt и claude в области медицины показал, что они достаточно точно и ставят диагноз по симптомам и не стесняются рекомендовать проведение дополнительных обследований и вариантов лечения (Яндекс и, тем более, сбер в этом отношении к сожалению настолько зацензурированы, что вообще часто отказываются отвечать на медицинские темы). Иногда "электронные" рекомендации и дифференциальный диагноз от этих систем (claude 3.5 sonnet причем более качественно и развернуто отвечает, чем chatgpt 4o) настолько точные и детальные, что наводит на мысль - а нужны ли будут терапевты в будущем вообще?

1 2 ...

7 8

Информация

Специализация