Как стать автором
Обновить

Все потоки

Сначала показывать
Порог рейтинга
Уровень сложности

GigaAM: класс открытых моделей для обработки звучащей речи

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров6.1K

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

Читать далее
Всего голосов 23: ↑26.5 и ↓-3.5+30
Комментарии17

Самые горячие новости инфобеза за март 2024 года

Время на прочтение8 мин
Количество просмотров1.1K

Всем привет! Первый весенний месяц позади, так что подводим его итоги. В марте шуму наделал бэкдор в XZ Utils под Linux — он не успел добраться до стабильных релизов, но в перспективе мог стать инцидентом космических пропорций. В начале месяца Black Cat провернула экзит-скам, а натужные попытки LockBit создать видимость продолжения операций никого особо не убедили. Кроме того, санкции в России дотянулись до облаков, телекоммуникационный провайдер AT&T в США получил неприятный привет из прошлого, а ЦРУ признало ценность OSINT. Об этом и других громких ИБ-событиях марта читайте под катом!

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Почему я стал использовать Алгоритмические собеседования при подборе команды

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров21K

Эта тема многократно поднимается в сообществах разработчиков, есть те кто поддерживает данный вид собеседований и те кто против. Вот и я, рискуя быть раскритикован сообществом, решил высказаться :)

Признаюсь, сам длительное время не был сторонником данного вида собеседований, мне казалось, что классический подход лучше, когда тебя, ну или ты собеседуешь кандидата проходя от азов до углубленных знаний.

Объективно, где мы используем в работе алгоритмы?

Возможно у кого-то в проекте есть ручное написание сортировок или обходы графов, но как правило разработчики используют стандартные или дополнительные библиотеки, которые закрывают подобные потребности.

Однако, все изменилось в один день) мне потребовалось подобрать пару-тройку разработчиков в команду, и проводя пятое или шестое собеседование мне попался кандидат, который идеально отвечал на все теоретические вопросы (базовые и не очень), однако переходя от темы к теме меня все больше настораживал легкий звук, прибавив громкость наушников я услышал аккуратный шелест листочков....

Читать далее
Всего голосов 36: ↑24.5 и ↓11.5+13
Комментарии124

Концепция «все есть файл» — давно устарела

Время на прочтение4 мин
Количество просмотров42K

Собственно, сабж.

На это указывает ряд моментов в существующих решениях.

Прежде всего, давайте вспомним, какими важными характеристиками обладает файл?

Читать далее
Всего голосов 59: ↑30.5 и ↓28.5+2
Комментарии153

Кадровая текучка в ИТ — мнения HR-партнеров компаний SSP SOFT и Softorium

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.9K

Какие айтишники чаще меняют работу и почему, как текучка кадров влияет на работу в командах и что с этим делать? Евгения Забелина, HR бизнес-партнёр SSP SOFT обсудила эту тему с Анной Сабадаш, управляющим партнёром Softorium. Ситуация в разных сферах ИТ может разниться, в данном случае разговор идет о сфере разработки заказного ПО.

Читать далее
Всего голосов 12: ↑9.5 и ↓2.5+7
Комментарии15

Распознаем голосовые сообщения Telegram без СМС и пересылок ботам

Время на прочтение7 мин
Количество просмотров10K

Как всем известно, люди делятся на две категории:

1. Те, кто любит отправлять голосовые сообщения

2. Те, кто кто надеются, что для первых приготовлен отдельный котел

Но мы здесь не для того чтобы осуждать какую-то из этих категорий. Читать сообщения я люблю больше, чем слушать и здесь я расскажу, как я попробовал решить для себя эту проблему.

Читать далее
Всего голосов 31: ↑33.5 и ↓-2.5+36
Комментарии30

История работы и увольнения в Super.web

Время на прочтение4 мин
Количество просмотров8.8K

Я не совсем новичок в IT, но так получилось, что карьеру именно backend-разработчика я начал с небольшой самарской веб-студии, которая гордо именует себя Super.web. Студия совсем крохотная. Вместе со мной и основателем там работали 5 человек. Расположена в полуподвальном помещении на 2 комнаты, с туалетом со сломанным замком и кухонной зоной площадью в 3 квадратных метра. Это совсем не похоже на описание офисов IT-компаний, но там есть монитор, компьютер, стол и стул, а, значит, работать можно. И вроде бы хороший вариант, но проработать мне там не удалось и 3 месяца.

Как же так получилось?

Читать далее
Всего голосов 57: ↑52.5 и ↓4.5+48
Комментарии32

Объединить большие языковые модели реально с помощью mergekit?

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров2K

Искусственный интеллект развивается, используя подход, аналогичный коллективному интеллекту людей. Вместо одной мощной системы, разработчики создают много маленьких систем с разными специализациями, которые взаимодействуют между собой. 

Сейчас в открытом доступе уже есть огромное количество ИИ-моделей, которые разработчики улучшают и комбинируют, чтобы создавать новые модели для более глубоких и сложных задач. И нынешние технологии позволяют им делать это, не тратя много времени и ресурсов на обучение.

Слияние моделей — это методика, которая объединяет две или более LLM-модели в одну. Это относительно новый и экспериментальный метод создания новых моделей без использования GPU, а значит, недорого. И да, это работает. Причем работает на удивительно хорошо, что в результате дает множество современных моделей на доске лидеров Open LLM.

Сегодня  мы рассмотрим, как работает объединение больших языков моделей с использованием библиотеки mergekit.  Если более конкретно, то мы рассмотрим четыре метода слияния и предоставим примеры конфигураций. Затем мы воспользуемся mergekit для создания собственной модели, Marcoro14-7B-slerp, которая стала самой эффективной моделью на доске лидеров Open LLM (02/01/2024).

Код доступен на GitHub и Google Colab. Кстати, для простого запуска mergekit можно использовать LazyMergekit.

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Комментарии0

Континент 4 Getting Started 2.0. Веб-фильтрация

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров551

Приветствуем всех читателей в пятой статье цикла «Континент 4 NGFW Getting Started 2.0».

В предыдущей статье мы с вами рассмотрели настройку портала аутентификации, создали локального пользователя и добавили доменную группу. Также мы создали правило, работающее только с авторизованными пользователями.

В данном материале мы познакомимся с:

Читать далее
Рейтинг0
Комментарии4

Как выбрать правильный стат тест для разных метрик

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1K

Привет, Хабр!

Статистические тесты позволяют анализировать большие объемы информации, выявлять закономерности, которые могут быть неочевидны на первый взгляд, и проверять гипотезы, делая выводы на основе данных. Они также помогают минимизировать ошибки, связанные с выборкой и измерениями, позволяя проводить корректные исследования и делать выводы, основанные на объективных фактах.

В этой статье мы рассмотрим, как правильно выбрать статистический тест для анализа разнообразных метрик.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии1

Лучшее и новое: что расскажут о тестировании на Heisenbug 2024 Spring

Время на прочтение14 мин
Количество просмотров1.3K

До конференции по тестированию Heisenbug всего ничего, её программа уже известна, и пришло время рассказать о ней Хабру.

Каждый раз в Heisenbug есть и то, за что его знают и любят, и новое.

Что уже знакомо? Снова будут привычные тематические блоки: «инструменты и фреймворки», «мобильное тестирование», «нагрузочное» и так далее. Снова будут некоторые спикеры, полюбившиеся многим по предыдущим Heisenbug: Артём Ерошенко (поговорит о том, умерло ли тестирование), Дмитрий Тучс (продолжение темы JUnit extensions), Константин Волков (всегда что-то интересное про Flipper Zero). Снова будет формат «хоть приходите на конференцию ногами, хоть смотрите в онлайне».

А что будет нового? Конкретные темы докладов — они-то всегда свежие. И рассказываем Хабру, какие именно в этот раз:

Программа Heisenbug 2024 Spring
Всего голосов 6: ↑7 и ↓-1+8
Комментарии0

Отмена карт «МИР» и разоблачение нейроиндийцев Amazon

Время на прочтение6 мин
Количество просмотров11K

Почти все самые важные и интересные финансовые новости в России и мире за неделю: скандал с заменой денежной массы в РФ на вермишельную массу, налоговая рассказала что знает о зарубежных счетах россиян, греки проверяют сделки за наличность, что будет с госдолгом США, а также хорошая память у Incognito-режима гугловского браузера.

Читать далее
Всего голосов 29: ↑23.5 и ↓5.5+18
Комментарии51

Лучшее время для Яндекс BugBounty

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров934

Здравствуйте, дорогие хабровчане. Я давно уже хотел изучить результаты программы Яндекс BugBounty. Вот, наконец руки дошли. В этой простой и небольшой статье я рассмотрел доступные данные по ней, нашёл некоторые закономерности и вывел топ багхантеров. Если кому интересно, в каком квартале года больше всего отчётов об ошибках, или какой месяц самый лучший для их поиска, прошу под кат.

Читать далее
Всего голосов 5: ↑3 и ↓2+1
Комментарии7

Ближайшие события

Мобильная разработка за неделю #533 (1 — 7 апреля)

Время на прочтение4 мин
Количество просмотров1.4K
В новом выпуске динамические фреймворки и роботы Apple, Telegram на Android-смартфоне 14-летней давности, игра в безопасность, скрытые сокровища интерфейсного дизайна, самые скачиваемые и зарабатывающие приложения в России в марте, фальшивая социальная сеть, которая сама ставит вам лайки, и многое другое! Подключайтесь!

Подписывайтесь на наш Telegram-канал Mobile Insights, где еще больше материалов для мобильных разработчиков. А в IT Insights — много об интересном коде и технологиях.

Читать дальше →
Всего голосов 3: ↑4.5 и ↓-1.5+6
Комментарии0

Новая линейка СХД АЭРОДИСК ENGINE AQ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.3K

Здравствуйте, Хабровчане!

Сегодня мы хотим рассказать о новых продуктах АЭРОДИСК в области систем хранения данных – моделях СХД ENGINE AQ Лайт, AQ 440 и AQ 450. Это очень значимое обновление линейки СХД в этом году, и, что немаловажно, оно связано не только с обновлением на программном уровне, но и с изменениями в аппаратном обеспечении.

Чтобы первым узнать про новую линейку СХД Engine АQ и функциональные возможности каждой модели – записывайтесь на наш вебинар «Синергия технологий: Обзор новой линейки СХД от Аквариус и АЭРОДИСК» 9 апреля в 15:00 (МСК).

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии0

Что нужно знать джависту, чтобы пройти собеседование

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров15K

Небольшая заметка с технологиями и полезными ссылками, которые позволили мне пройти собеседование и работать в Сбере.

Читать далее
Всего голосов 21: ↑16.5 и ↓4.5+12
Комментарии17

Заставляем дружить OpenGL c JVM на macOS

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1K

Исторически так сложилось, что macOS сильно отличается от других операционных систем, когда дело доходит до нативной работы с окнами и графикой. И нельзя сказать, что это определенно плохо или хорошо. В этом плане Apple решили пойти своей любимой дорогой: "мы лучше знаем что тебе нужно, поэтому сделали все за тебя". Как же это проявляется?

Читать далее
Всего голосов 5: ↑5.5 и ↓-0.5+6
Комментарии2

Жажда «цифровой крови»: как Google, OpenAI и Meta переступают черту ради развития ИИ

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров18K

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

Читать далее
Всего голосов 30: ↑25 и ↓5+20
Комментарии91

Open Source GraphQL CDN / Edge Cache с Cloudflare, Fastly и Fly.io

Время на прочтение12 мин
Количество просмотров545

Мы недавно объявили, что WunderGraph теперь полностью открыт в исходном коде. Сегодня мы хотели бы объяснить, как вы можете использовать нашу платформу для разработчиков API, чтобы добавить кэширование на уровне Edge в ваши GraphQL API, не привязывая себя к конкретному поставщику.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Расшифровка BitLocker — добыча ключа из микросхемы TPM

Время на прочтение4 мин
Количество просмотров16K

Подключение сниффера к модулю TPM по шине LPC

Полнодисковое шифрование BitLocker в ОС Windows считается довольно надёжным способом сохранения данных. По умолчанию оно использует алгоритм Advanced Encryption Standard (AES) в режиме сцепления блоков (CBC) или в режиме подстроенной кодовой книги с кражей шифротекста (XTS) на базе xor-encrypt-xor (XEX) со 128- или 256-битным ключом.

В теории это довольно крепкая схема. Проблема только в том, что секретный ключ BitLocker хранится в Trusted Platform Module (TPM), а в некоторых случаях (на некоторых компьютерах) его можно извлечь, получив физический доступ к устройству.
Читать дальше →
Всего голосов 23: ↑24.5 и ↓-1.5+26
Комментарии42
12 ...
50