Пользователь
Подбираем параметры сессии в Apache Spark, чтобы не стоять в очереди
Бывало у вас так, что некоторые аналитики запрашивают побольше вычислительных ядер и оперативной памяти для своих Jupyter-ноутбуков, а у вас в это время ничего не работает? У меня бывало, ведь недостаточно уметь разрабатывать код на Spark — еще нужно уметь его настраивать, правильно инициализировать сеансы работы и эффективно управлять доступом к вычислительным ресурсам. Если отдать настройку на волю случая, Spark может (и будет) потреблять ресурсы всего кластера, а другие приложения будут стоять в очереди.
Меня зовут Владислав, я работаю Дата инженером в Альфа-Банке, и в этой статье мы поговорим о том, как правильно подобрать необходимое количество параметров и не положить кластер на коленочки.
Times New Roman, Arial и другие: как возникли самые распространённые компьютерные шрифты?
При всей современной «клиповой культуре», стриминговых видео и графических мемах интернет — прежде всего текстовая среда. А где есть текст, там всегда есть шрифт. Какие-то, как Times New Roman, знают и используют практически все. Какие-то, как используемый для интерфейсов Windows Segoe, мы видим очень часто, но обычно не знаем их названий. Некоторые даже вызывают массу эмоций, как мемно ненавидимый Comic Sans. Но в сети и за монитором мы видим тексты, набранные теми или иными шрифтами, почти всегда. Как возникли самые популярные и мемные гарнитуры шрифтов, и почему именно они вошли в топ самых используемых в электронных текстах?
Что не так с техническими собеседованиями в IT?
Регулярно имею дело с собеседованиями: как прохожу, так и провожу их. Накопив опыт, решил поделиться мнением, что с техническими собеседованиями не так. Разберу частые ошибки собеседующих и расскажу как, а главное зачем можно улучшать процесс технических интервью.
Быстрая Data Quality проверка на базе алгоритма adversarial validation
Привет, Хабр! Всем привет, меня зовут Максим Шаланкин, я Data Science Team Lead в команде Финтеха Big Data МТС. Из этой статьи вы узнаете, как оценивать качество данных при помощи алгоритма adversarial validation с использованием spark user defined function. В частности, я расскажу, почему такой подход хорошо масштабируется и может быть успешно применен к различным типам данных, становясь универсальным инструментом для встраивания в ваши продуктовые процессы. Все подробности — под катом.
Лучшие альтернативы ChatGPT для QA
Привет, Хабр! Меня зовут Иван, я Full Stack QA. Сегодня поговорим про альтернативы ChatGPT, которые работают на территории РФ без костылей и совершенно бесплатно.
Каждую из LLM моделей я использую как в повседневной жизни, так при написании автотестов, изучения нового материала, подготовки ручных тест-кейсов, генерации изображений и т.д.
Главное правило ручного тестировщика - для начала нагугли проблему спроси у GPT и только после обращайся с вопросом к ментору.
🤖 Первый аналог - Coze.com | Открыть модель
Первый ИИ работает в телеграм-боте и всегда будет у вас под рукой...
Информация
- В рейтинге
- Не участвует
- Зарегистрирован
- Активность