Pull to refresh
932
440.2
Денис @denis-19

Информационная служба Хабра

Send message

Исследовательская группа Model Evaluation & Threat Research из Калифорнийского университета в Беркли представила новый способ измерения прогресса больших языковых моделей. Вместо привычных метрик вроде точности ответов или скорости генерации учёные предложили другой аспект: сколько времени требуется человеку на задачу, которую ИИ может успешно выполнить хотя бы в 50% случаев?

Согласно расчётам, с каждым годом модели справляются с всё более объёмными задачами, и темп этого роста — экспоненциальный. С 2019 года способности LLM в решении задач улучшаются вдвое каждые 7 месяцев:

  • GPT-2, вышедший в 2019 году, мог справиться только с ответами на вопросы, что в среднем занимает у человека до минуты;

  • GPT-4, который появился в 2023, уже мог брать на себя задачу вроде «найти факт в интернете», которая занимает у человека от 8 до 15 минут;

  • более продвинутые модели вроде Claude 3.7 и OpenAI o1 могут бать на себя задачи, выполнение которых человеком выходит за пределы часа.

Если темпы роста сохранятся, то уже к 2030 году языковые модели смогут решать за часы задачи, которые потребовали бы 167 часов работы человека — это условный месяц работы в графике 5/2. Речь идёт о комплексной интеллектуальной работе: от оптимизации архитектуры кастомного чипа до запуска нового продукта или даже написания содержательной книги.

В исследовании, например, в 167 часов оценена задача открыть новую компанию. Авторы исследования считают, что к 2030 году ИИ сможет браться за такую задачу автономно, то есть не в виде ассистента, а как самостоятельный исполнитель.

Исследование не учитывает внешние ограничивающие факторы, и авторы сами об этом говорят. Даже если ИИ будет таким умным, как его описывают, его возможности могут упереться в вычислительные мощности или доступ к памяти.

Tags:
0
Comments1

Представлен проект для геймеров «Can I Run It?». Это онлайн-ресурс, где можно проверить мощность ПК на соответствие требованиям к различным играм. Сервис поясняет, потянет ли текущий ПК игру на минимальных или рекомендованных требованиях. Также проект может подсказать, какое компоненты ПК нужно улучшить.

Tags:
+1
Comments2

Исследование показало, что некоторые учёные начали оставлять в своих научных статьях скрытые промты для ChatGPT, чтобы нейросеть хвалила их работу.

При проверке научного портала arXiv уже нашлись 17 работ от 14 ведущих вузов мира — в каждой статье были скрытые промпты, которые просили ИИ хвалить её и не подсвечивать минусы. Учёные в научных статьях прячут нужный промпт для ИИ в белом тексте минимального размера, а на выходе получают похвалы и восхищение их трудом от «прочитавших» статью ИИ-сервисов.

Tags:
+20
Comments2

Компьютерные игроки выяснили, что пользовательское соглашение Ubisoft содержит неоднозначную строчку, что предписывает покупателям игр в случае бана их аккаунта уничтожить все копии игры, которыми они владеют. Условие тут же вызвало критику в сторону издателя — неудивительно, учитывая предыдущие заявления Ubisoft и другие нюансы EULA вроде сбора данных.

Оказалось, что подобный пункт можно найти в пользовательских соглашениях других издателей. Например, он есть в EULA Baldur's Gate 3 от Larian Studios и Phasmophobia от Kinetic Games. Разработчики последней тоже сталкивались с вопросами от игроков — они пояснили, что это стандартная практика для многих игр.

Tags:
0
Comments2

Ресурс Counterpoint Research раскрыл, как Apple тестирует свои гаджеты в различных условиях, включая климатические тесты, водные тесты, краш‑тесты и вибрационные тесты.

Климатические тесты проводятся, чтобы устройства выдерживали разные погодные условия. В лаборатории Apple их подвергают воздействию соли в течение 100 часов, яркого света, а также пыли из пустыни Аризоны, чтобы проверить, как песок влияет на динамики или порты зарядки. Для AirPods даже создают искусственный пот и ушную серу, чтобы смоделировать реальные условия.

Водные испытания Apple проводит для проверки защиту от воды и пыли по стандартам IP. Например, iPhone 16 Pro имеет рейтинг IP68 — это высший уровень защиты, который означает полную устойчивость к пыли и способность работать после погружения в воду на глубину до 6 метров в течение часа.Тесты начинаются с простого сымитированного «дождя», затем устройства обливают водой под давлением и погружают в воду в специальных резервуарах. Apple также тестирует устройства на устойчивость к другим жидкостям, например, газировке, сокам, солнцезащитному крему и духам.

В краш‑тестах на возможные падения Apple использует робота, который роняет устройства с разных высот, углов и на разные поверхности — от гранита до асфальта. Каждый такой тест анализируется через специальное приложение, чтобы понять, как устройство справляется с ударами.

Вибрационные тесты помогают проверить на устойчивость гаджетов к вибрациям, которые могут возникнуть, например, при поездке на мотоцикле по неровной дороге. Для этого используется вибростенд, который имитирует различные частоты и условия, включая транспортировку. По полученным результатам регулируют внутреннюю компоновку элементов и корпус.

Tags:
0
Comments0

Семь индийских инженеров потратили 200 миллионов рупий на строительство автомобильного моста (путепровода) и сделали в проекте поворот на 90°. Архитекторы отстранены от работ, в том числе два главных инженера.

Строительная компания и консультант по проектированию были внесены в чёрный список. В Индии создан комитет для внесения необходимых улучшений в конструкцию путепровода, который будет открыт только после внесения улучшений.

Путепровод стоимостью 180 миллионов рупий (165 млн рублей), недавно построенный в районе Айшбаг города Бхопал, предназначался для улучшения связи между Махамай Ка Баг, Пушпа Нагар и районом вокзала с Новым Бхопалом, что принесло бы пользу примерно 300 тысячам человек.

Инженеры утверждают, что у них не было другого выбора, кроме как построить мост таким образом, учитывая нехватку земли и наличие станции метро поблизости. По их словам, если бы было доступно немного больше земли, то поворот на 90° можно было бы преобразовать в более плавный.

Tags:
+3
Comments10

Представлен обновлённый проект Awesome Black Hat Tools, где собраны все инструменты, которые когда-либо были представлены на ИБ-конференциях Black Hat. Инструменты аккуратно структурированы по странам, где проходила конференция, по годам и категориям Red Teaming, Blue Teaming, OSINT & Recon, Exploit Development, Malware Analysis, DFIR & Forensics, Threat Intelligence, ICS/IoT/SCADA и Application Security (AppSec).

Также все презентации с выступлений Black Hat, начиная с 2023 года, собраны на отдельной странице GitHub.

Tags:
0
Comments0

77-летняя Шерон Лейн из США продала всё имущество и купила себе билет в почти «Бесконечный круиз». Теперь её дом: лайнер Villa Vie Odyssey, который 15 лет без остановки будет плавать по миру, заходя в лучшие порты планеты. Стоимость круиза составляет $129 000 за одноместную каюту. Пассажирам также придётся платить ежемесячные взносы, которые начинаются от $2000 с человека, но в них входит бесплатная еда и безалкогольные напитки, алкоголь за ужином, Wi-Fi и визиты к врачу. В взносы также входит круглосуточное обслуживание номеров, еженедельная уборка и стирка два раза в неделю.

Tags:
+2
Comments10

Доступен репозиторий Project Ideas and Resources с десятками пет-проектов для реализации, где разработчики собрали огромное пошаговое руководство к наработке железных навыков программирования. Ресурс предоставляет бесплатный доступ к проектам разного уровня сложности: от простого шахматного приложения до полноценного клона Airbnb. Есть пошаговое руководство для реализации каждого проекта на самых популярных языках программирования: Java, Python, JS, C#, а также ссылки на теоретические выкладки, книги и видео по различным темам программирования.

Tags:
+2
Comments0

В открытый доступ вышла книга по машинному обучению Machine Learning Q and AI. Ранее целый год фундаментальный труд Себастьяна Рашки можно было купить только на Амазоне, и вот автор открыл книгу для всех бесплатно.

Внутри огромный сборник тем по Deep Learning, 30 глав отборной, понятной и подробной информации по компьютерному зрению, LLM, эвалу и методам деплоя моделей, а также множество примеров и практических пояснений — автор все объясняет на схемах и картинках. Также есть упражнения после каждой главы.

Tags:
+3
Comments0

Представлен первый трейлер фильма «Проекта „Аве Мария“» с Райаном Гослингом.

Астронавт Райленд Грейс просыпается на космическом корабле, не помня ни себя, ни свою миссию. Постепенно мужчина приходит к выводу, что он — единственный выживший из экипажа, отправленного в солнечную систему Тау Кита в поисках спасения от катастрофы на Земле с помощью научных знаний, изобретательности и помощи Роки.

Сценарий фильма написали Энди Уир и Дрю Годдард, работавшие над «Марсианином» Ридли Скотта. Релиз «Проекта „Аве Мария“» намечен на март 2026 года. «Проект „Аве Мария“» (англ. Project Hail Mary) — научно-фантастический роман, написанный Энди Вейером в 2021 году.

Tags:
+6
Comments2

Представлена большая база PNG-картинки без фона для дизайнеров. На сайте pngimg доступны тысячи картинок на любые темы — техника, животные, авто и так далее с удобным поиском по категориям, а также в высоком разрешении и бесплатно.

Tags:
-3
Comments0

Спустя 26 лет чуть не истёк срок действия домена half-life3.com. Домен был создан ещё в 1999 году и раньше перенаправлял на сайт The Orange Box. Однако 28 июня домен прекращал своё существование, из-за чего некоторые фанаты начали бить тревогу и даже связались со службой поддержки Valve, которая сообщила, что домен в безопасности — его продлили некоторое время назад.

Tags:
+1
Comments1

Исследование показало, что работа с людьми повышает риск диабета сразу на 47%.

Общение, эмоциональные перегрузки, регулярные конфликты — всё это увеличивает уровень стресса, активирует симпатическую нервную систему, сбивает гормональный фон и буквально ломает обмен веществ. В список потенциально опасных профессий попали учителя, медсёстры, соцработники, водители, охранники, юристы и сотрудники сферы обслуживания.

Tags:
0
Comments0

В BBC показали, как съёмочная группа использует камеру, замаскированную под кучу слоновьего навоза. Устройство под названием Dung Cam не только выглядит как навоз, но и пахнет соответствующе. Всё ради того, чтобы не вызывать подозрений у животных.

Dung Cam оснащена объективом, позволяющим снимать крупным планом каждое движение животных. Более того, она может «разбрасывать» миниатюрные камеры в виде навозных шариков, чтобы снимать с разных ракурсов. Один из них — радиоуправляемый и умеет передвигаться бесшумно и незаметно. Такие устройства помогают удалённым операторам наблюдать за слонами в их привычной среде обитания, не нарушая покой животных.

Tags:
0
Comments0

Электромобиль Tesla Model Y с помощью системы Full Self-Driving (FSD) впервые самостоятельно доехал до покупателя прямо с фабрики.

«Первая полностью автономная доставка Tesla Model Y с завода до дома клиента через весь город, включая автомагистрали, была завершена на день раньше запланированного срока», — сообщил Илон Маск.

«Tesla самостоятельно доехала от Gigafactory Texas до дома своего нового владельца примерно за 30 минут — пересекая парковки, шоссе и город, чтобы добраться до своего нового владельца», — пояснили в Tesla.

Tags:
+2
Comments2
1
23 ...

Information

Rating
Does not participate
Location
Россия
Works in
Registered
Activity