Как стать автором
Обновить
483.83
Сбер
Технологии, меняющие мир
Сначала показывать

CodeBert для автогенерации комментариев к коду

Уровень сложностиСложный
Время на прочтение10 мин
Количество просмотров2.4K

Код программ отличается от естественного языка из-за его формализма и строгости, однако ничто не мешает воспринимать его как последовательность токенов и работать с ним, как с обычным языком. Существуют исследования, которые показали, что модель BERT, обученная на большом наборе данных, неплохо справляется с некоторыми задачами, связанными с обработкой программного кода. В этом посте я буду решать задачу автогенерации комментариев к нему. Вы узнаете, как подготовить данные для обучения, настроить нейросеть и получить результат.

Читать далее
Всего голосов 11: ↑10 и ↓1+9
Комментарии0

Правильное подключение к БД: почему, зачем и как

Время на прочтение5 мин
Количество просмотров15K


Как подключить базу данных? Казалось бы, простейший вопрос, однако частенько здесь совершают ошибки. Как правило, даже если сделать всё плохо, проблем не возникнет, но это до поры до времени. Как только проект вырастет и увеличится нагрузка, эти ошибки дадут о себе знать, и отследить их будет сложно.


В этой небольшой статье, я последовательно буду создавать подключения к БД, а затем показывать на примере, что может пойти не так. На мой взгляд, понимание, почему нужно делать именно так, а не иначе, лучше, чем простое заучивание и использование паттернов.


Статья рассчитана на начинающих и всех, кто интересуется этой темой.

Читать дальше →
Всего голосов 18: ↑17 и ↓1+16
Комментарии18

Энергия ветра: как развивается возобновляемая энергетика, и когда она вытеснит уголь

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6.6K

В апреле 2023 года шведская компания Freja Offshore подала в местное Министерство климата и бизнеса заявку на строительство крупнейшей ветряной электростанции в мире с установленной мощностью 2500 МВт [источник, источник]. Сообщается, что при отсутствии бюрократических препятствий первое электричество потребители получат к 2028 году. Для сравнения, сейчас крупнейшей ветряной электростанцией считается Hornsea 2 в Великобритании, которая заработала в сентябре 2022 года и располагает 1300 МВт установленной мощности [источник]. Очевидно, что мировая энергетика переживает активную стадию перехода на «зеленые» технологии, и за последний год побито немало рекордов в отрасли. Рассмотрим, в каком состоянии сейчас возобновляемая генерация, и сможет ли она полностью вытеснить уголь в ближайшем будущем.

Читать далее
Всего голосов 23: ↑17 и ↓6+11
Комментарии26

Кто съест весь пластик и сможем ли мы найти этого героя

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.8K

В марте ученые из Техасского университета объявили о создании фермента, который сможет расправиться с миллионами тонн пластика на свалках по всему миру! Новый фермент получил яркое название FAST-PETase: он и functional (функциональный), и active (активный), и stable (стабильный), и tolerant (допустимый). И перерабатывает ПЭТ (PET) пластик за сутки, максимум неделю, когда в природе на это требуются сотни лет!

Вы уже не раз видели подобные новости? Еще одно открытие не будоражит воображение? В этом посте мы расскажем почему.

Читать далее
Всего голосов 17: ↑15 и ↓2+13
Комментарии57

Почему в присутствии некоторых людей выходят из строя приборы?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров29K

Рассказы о людях, способных одним своим присутствием вносить помехи в работу техники и электроники, наверняка слышали многие. Для одних это легенды и страшилки, а другие и сами сталкивались с подобными случаями. Что же это за явление, и можно ли его объяснить с научной точки зрения?

Читать далее
Всего голосов 81: ↑47 и ↓34+13
Комментарии136

От 50 % консольного рынка США до заката за три года: история Sega

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров4.3K

1992 год. Sega со своей Genesis выглядела как новичок по сравнению с гигантом Nintendo, но подошла к захвату рынка во всеоружии. У Sega был Sonic. Была John Madden Football и целая линейка других спортивных симуляторов. Наконец, была «реалистичная» Mortal Kombat — в семейной версии Nintendo был невзрачный «серый пот», который даже не падал на арену. Было продано 30 миллионов консолей Sega Genesis — из них 20 миллионов в США. Огромный тираж для тех лет… Как же получилось, что уже в 1995 году Sega получила удар, от которого так и не оправилась? В этом посте — базовая и углубленная версия этого противостояния.

Читать далее
Всего голосов 18: ↑16 и ↓2+14
Комментарии3

Как мы принимаем решения, которые нам вредят

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.6K

Помните Буратино, перед которым было две дороги — в школу или в кукольный театр? Он решил повернуть к развлечениям, и вскоре начались его несчастья. Закончилось всё хорошо, но это сказка, а в реальной жизни последствия неправильного решения могут быть более плачевными. Почему так происходит и можно ли этого избежать?

Читать далее
Всего голосов 27: ↑21 и ↓6+15
Комментарии14

Гибкие смартфоны: как развивается рынок, и есть ли у него будущее

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров8.2K

В марте 2023 года компания Tecno представила свой первый складной смартфон в истории — PHANTOM V FOLD. Новый гаджет имеет толщину сгиба всего 0,11 мм и выдерживает более 200 тыс. складываний. Теперь практически у всех ведущих производителей телефонов, если не считать Apple, есть свое «гибкое решение». На фоне инфоповода вспомним, как развивалась индустрия складных экранов, оценим существующие решения на рынке и постараемся заглянуть в будущее для оценки перспектив.

Читать далее
Всего голосов 22: ↑22 и ↓0+22
Комментарии22

RUDOLPH: освещая дорогу к AGI

Уровень сложностиСложный
Время на прочтение19 мин
Количество просмотров3.7K

Как можно описать последние два года в области машинного обучения и искусственного интеллекта? Пожалуй, подойдет словосочетание «расцвет генеративных моделей». Очень ярко прослеживается тренд и на развитие мультимодальности (и особенно активно развиваются бимодальные модели, работающие на стыке модальностей текстов и изображений). Если нашумевшая модель ChatGPT, построенная на основе архитектуры InstructGPT и принципах Reinforcement Learning with Human Feedback, работает только в текстовой модальности и может отвечать на текстовые вопросы различной степени сложности, то её последователь GPT-4 работает уже в двух модальностях, текст и изображение, но выдает только текстовый ответ. Похожим образом работают и модели FlamingoFROMAGeKosmos-1MiniGPT-4LLaVa. Можно заметить, что большинство моделей «однонаправлены», то есть либо переводят текст в соответствующее ему изображение, либо генерируют текстовый ответ по мультимодальному запросу.

Тем не менее, кажется, что модель, которая сможет работать с модальностями (в нашем случае, текстами и изображениями) равноценно и симметрично (то есть по факту решать zero-shot или после файнтюнинга все задачи на стыке двух модальностей, в том числе и генеративные) сможет более правильно оценивать совместные вероятности «токенов» текста и изображения и за счёт этого более качественно решать каждую из задач в отдельности (описывать изображения, генерировать изображения по тексту, отвечать на вопросы по тексту, отвечать на вопросы по изображениям, распознавать рукописный текст итд). Назовём такую способность модели гиперзадачностью (hyper-tasking).

Чтобы проверить гипотезу, сформулированную выше, мы задумались над модификацией генеративной модели Kandinsky 1.0 (ruDALL-E 12B), а именно над изменением процесса обработки входной последовательности. Результатом наших экспериментов стала модель RUDOLPH (RUssian Decoder On Language Picture Hyper-tasking), которая представляет собой авторегрессионную модель, способную решать разные типы задач в текстово-визуальном домене.

Читать далее
Всего голосов 23: ↑22 и ↓1+21
Комментарии1

Долговременная поддержка софта: примеры, советы и роль регуляторов

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.5K

Прекращение поддержки софта — это проблема, которая так или иначе касается многих, но внимания ей при этом уделяют недостаточно. Представьте, что вы, поддавшись рекламе, покупаете не обычный, а дорогой умный холодильник, с wi-fi и кучей фичей для умного дома. А через два года производитель холодильника прекращает поддержку серверов этой модели. Аппаратная часть, которая могла прослужить еще десятки лет, перестает работать, потому что программная часть больше не функционирует. То же самое справедливо и для индустрии разработки: совместимость устаревшего софта с постоянно обновляемыми платформами — это головная боль.

Пост подготовлен по материалам подкаста Software Engineering Radio. В этом выпуске Росс Андерсон, профессор компьютерных наук и инженерии из университета Кембриджа, автор книги Security Engineering, a Guide to Building Dependable Systems, рассказал о проблемах, связанных с циклом поддержки софта, на примере автомобильного и других рынков.

Читать далее
Всего голосов 10: ↑9 и ↓1+8
Комментарии8

Что хотят добывать на дне океана, и чем это может кончиться

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров9.8K

В 2023 году добыча полезных ископаемых официально выйдет на новый уровень; точнее, на новую глубину. Планируется оформить в правовом поле разработку на уровне «deep seabed» — то есть более 200 метров от поверхности. Хотя это направление начало формироваться еще в середине прошлого века, именно сейчас в силу некоторых обстоятельств оно переживает второе рождение. Далее в посте мы расскажем, почему так произошло, где и что можно добывать на дне океана и какие последствия у этой деятельности могут быть.

Читать далее
Всего голосов 40: ↑38 и ↓2+36
Комментарии29

Это не чат, это GigaChat. Русскоязычная ChatGPT от Сбера

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров112K

Хайп вокруг нейросетей, выровненных при помощи инструкций и человеческой оценки (известных в народе под единым брендом «ChatGPT»), трудно не заметить. Люди разных профессий и возрастов дивятся примерами нейросетевых генераций, используют ChatGPT для создания контента и рассуждают на темы сознания, а также повсеместного отнимания нейросетями рабочих мест. Отдадим должное качеству продукта от OpenAI — так и подмывает использовать эту технологию по любому поводу — «напиши статью», «исправь код», «дай совет по общению с девушками».

Но как достичь или хотя бы приблизиться к подобному качеству? Что играет ключевую роль при обучении — данные, архитектура, ёмкость модели или что-то ещё? Создатели ChatGPT, к сожалению, не раскрывают деталей своих экспериментов, поэтому многочисленные исследователи нащупывают свой путь и опираются на результаты друг друга.

Мы с радостью хотим поделиться с сообществом своим опытом по созданию подобной модели, включая технические детали, а также дать возможность попробовать её, в том числе через API. Итак, «Салют, GigaChat! Как приручить дракона?»

Читать далее
Всего голосов 243: ↑232 и ↓11+221
Комментарии233

«Дамбфоны» в 2023 году: что и почему выбирают любители ретрозвонилок

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров12K

Некоторые считают, что молодое поколение, чье детство пришлось на начало XXI века, плохо ладят с кнопочными девайсами. Вполне возможно, ведь для этих ребят гораздо привычнее сенсорные интерфейсы. Тем не менее благодаря поколению двадцатилетних кое-где вновь набирают популярность примитивные мобильные телефоны (dumb phones), и этот тренд не раз отмечали разные СМИ. Мы расскажем об этом явлении чуть подробней, посмотрим, как отвечает на него современный рынок и что в принципе популярно у пользователей.

Читать далее
Всего голосов 32: ↑31 и ↓1+30
Комментарии24

Задача со звёздочкой: как мы автоматизировали тестирование плагина IDE

Уровень сложностиСложный
Время на прочтение8 мин
Количество просмотров2.4K

Привет, Хабр! На связи Марк Ерофеев и Никита Потапов из команды Platform V UI Workflow СберТеха. Мы затронем одну из наименее раскрытых тем — тестировании плагинов IDE. Если вы хотя бы раз пытались протестировать плагин, то знаете, что примеров с хорошим покрытием тестами днём с огнём не найти. Плагины либо не тестируются вовсе, либо логика их настолько проста, что хватает элементарной проверки функциональности.

Мы расскажем, как автоматизировали тестирование плагина для IntelliJ IDEA. Статья будет полезна всем, кто ищет информацию на эту специфическую тему или вообще интересуется нетривиальными задачами в области тестирования.

Читать далее
Всего голосов 18: ↑18 и ↓0+18
Комментарии0

Кто все вот эти на полках: краткое руководство по новым брендам ноутбуков

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров34K

Когда-то, лет 10–15 назад, далёким от хай-тека приятелям было стыдновато показать шильдик Huawei на своём телефоне. Когда свыклись с Huawei, пришла очередь Oppo. Характеристики «топа за свои деньги» (нет, мы не только о Xiaomi) всё время оказывались сильнее каких-то фонетических неудобств. А за последний год в пользу китайских ноунеймов добавился ещё один существенный аргумент. Мобильные телефоны с непривычными названиями уже не пугают, но сегмент ноутбуков более консервативен, и обилие новых имён здесь может поставить в тупик.

В этом посте мы расскажем о ряде новых ноутбучных — и необязательно китайских — брендов, которые обосновались на полках крупных ретейлеров и маркетплейсов.

Читать далее
Всего голосов 33: ↑24 и ↓9+15
Комментарии63

Masterpiece as a service: итоги недели нейроарта

Время на прочтение9 мин
Количество просмотров16K

Не так давно завершились сезоны Kubernetes и Machine Learning, подарившие Хабру множество качественных технических статей. В межсезонье мы решили отвлечься от технохардкора и предложили вместо того, чтобы писать о технологии, использовать технологию и показать её результат с точки зрения пользователей. С 4 по 14 апреля мы провели на Хабре Неделю Нейроарта. Всё это время хабраюзеры неустанно публиковали статьи с тегом Kandinsky art, сопровождая их иллюстрациями, сгенерированными нейросетью Kandinsky 2.1.

Сегодня расскажем, как жилось авторам в симбиозе с искусственным интеллектом, и по результатам недели посмотрим, смогут ли генеративные модели составить конкуренцию художникам и иллюстраторам. А заодно объявим, кто те трое счастливчиков, что благодаря этому симбиозу получат по новенькому iPhone 14 Pro.

Узнать результаты
Всего голосов 38: ↑30 и ↓8+22
Комментарии12

RoboGames возвращаются: разбираем все дисциплины крупнейших робоигр

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.8K

Не все регулярные офлайн-мероприятия возвращаются к жизни после пандемии. К счастью, организаторы крупнейших в мире соревнований роботов Robogames нашли силы и ресурсы, чтобы вернуться в 2023 году после пятилетнего затишья. С 6 по 9 апреля крупнейшие игры роботов прошли в Плизантоне, штат Калифорния. В этом посте мы расскажем, как проходят Robogames и какие дисциплины включают (спойлер: это не только бойня странных железок на большой арене).

Читать далее
Всего голосов 14: ↑12 и ↓2+10
Комментарии1

Как мы упростили жизнь высоконагруженным сервисам с Platform V SessionsData. Часть 1

Время на прочтение12 мин
Количество просмотров2.6K

Привет, Хабр! Меня зовут Андрей Чернов, я Java-архитектор микросервисов в СберТехе — компании, которая создала цифровую облачную платформу Platform V для разработки бизнес-приложений. Наша команда развивает продукт Platform V SessionsData — высокопроизводительное распределённое in-memory-хранилище для общего контекста сессионных и key-value-запросов, которое СберБанк Онлайн использует в качестве микросервиса на своей серверной стороне. Продукт актуален не только для решения задач СберБанка Онлайн: он доступен рынку и может использоваться для аналогичных целей в любых отраслях.

В статье расскажу, почему мы решили создать собственный микросервис, чем он нам помогает, а также как мы справлялись с нагрузкой СберБанка Онлайн. У статьи будет продолжение. Во второй части поговорим о том, как мы достигаем высокой доступности сервиса, а в третьей — какие доработки нужны нам, чтобы развивать Platform V SessionsData.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии0

Как мы строим архитектуру микросервисов для мобильного приложения СберБизнес

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.6K

Привет, Хабр! Прежде чем погружаться в проблемы, давайте я расскажу, как у нас устроена микросервисная архитектура и куда мы идём. К сожалению или к счастью, в сегменте B2B в банковском и околобанковском обслуживании клиенты чаще пользуются веб-версиями приложений. Большие списки, зарплатные ведомости, работа с документами — всё это проще делать на большом экране. Постепенный переход в мобильную среду начинается только сейчас. 

Читать далее
Всего голосов 15: ↑12 и ↓3+9
Комментарии8

Electronic Entertainment Expo (E3): главные релизы игровой выставки с 1995 года

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров2.2K

Е3 отменили второй раз подряд. Эта новость как заточка под ребро геймера-миллениала... хорошо, что годам к 25–30 в жизни есть и другие интересы. В конце прошлого десятилетия выставка Electronic Entertainment Expo считалась главным событием в индустрии игр. Но крупнейшие компании, которые ежегодно оплачивали бо́льшую часть праздника, пересмотрели свои приоритеты, и теперь показывают все новинки самостоятельно. С 2020 года мы увидели только одну E3, да и то в онлайне. Вряд ли к нам вернётся «геймерский Новый Год» — и это хороший повод вспомнить главные релизы всех прошедших выставок.

Читать далее
Всего голосов 14: ↑14 и ↓0+14
Комментарии0

Информация

Сайт
www.sber.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия