Pull to refresh
0
@sam0sva1read⁠-⁠only

User

Send message

Что бы я сделал, если бы сегодня начинал учить Data Science / ML?

Level of difficultyEasy
Reading time7 min
Views29K

Machine Learning и Data Science — это одни из самых популярных и востребованных направлений в IT. Но вместе с этим — они и одни из самых сложных для входа. Здесь огромное количество тем, инструментов, библиотек, подходов и постоянно появляющихся технологий.

Из-за этого многие новички начинают обучение с энтузиазмом, но через пару месяцев теряют интерес. Причины могут быть разные: слишком много теории, мало практики, нет чёткого плана или понимания, зачем вообще всё это нужно.

Эта статья — не очередной «гайд по ML для новичков». Это мой личный взгляд на то, как бы я подошёл к обучению, если бы начинал с нуля уже сегодня, учитывая свой опыт работы в крупных компаниях, проваленные проекты, ошибки и победы.

Читать далее

Организация ML-проекта с примерами

Level of difficultyMedium
Reading time5 min
Views2.5K

Организация - это важно. То же относится к ML-проектам. Из каких компонент он должен состоять? Как оформить проект, чтобы всего хватало и было удобно это масштабировать? Рассмотрим организацию по шаблону CookieCutter с примерами.

Читать далее

Код, теория и практика: подборка книг по NLP

Reading time6 min
Views4.6K

Привет! Это Никита Малыхин, Tech Lead в команде AdTech в Центре Big Data МТС. В прошлый раз я поделился подборкой книг о нейронных сетях и рекомендательных системах. В 2к25 поиск практических советов по NLP в книгах может выглядеть как сизифов труд, ведь это одно из самых быстроразвивающихся направлений в ML. Тем не менее, сегодня будет втораячасть подборки — на этот раз сфокусируемся на материалах по естественному языку и книгам с практическими советами по машинному обучению. Хорошие специалисты в этой сфере на вес золота, а книги как раз помогают прокачать навыки. Все будет по делу, с примерами и практикой. Поехали!

Читать далее

Зарабатывай на нейросетях: 5 реальных способов с примерами и инструментами

Reading time3 min
Views34K

Искусственный интеллект уже зарабатывает миллионы, но как на этом могут зарабатывать обычные люди? Разбираем 5 конкретных способов монетизации ИИ с инструментами, примерами и потенциальными доходами.

Читать далее

Чтобы побеждать, достаточно одной книги

Level of difficultyMedium
Reading time12 min
Views66K

Есть два правдивых утверждения.

Первое прозвучит плохо для культуры, в которой инженеров мотивируют извиняться за сам факт их существования, а не умеющий кодить мошенник вправе заявлять, что он является «идейным вдохновителем». Утверждение заключается в том, что я — один из лучших инженеров в моей непосредственной рабочей среде. Я изучаю приблизительно на два-три порядка больше, чем средний инженер рядом со мной. Мне делала оффер на должность сениора одна из лучших компаний в стране, разные Серьёзные Люди с радостью повторно нанимают меня и радостно наблюдают, как я разгребаю лениво составленные примечания к коммитам. Дела мои вполне хороши.

Второе прозвучит плохо, потому что иногда мне приходится убеждать людей нанять меня: я очевидно хуже, чем те, кто пишет мне связанные с работой письма. Я смутно лишь могу догадываться, как с тремя-четырьмя годами опыта качественной работы в психологии я смог стать «сениор-инженером». Я писал тесты только для личных проектов, потому что ни у одного моего работодателя не было никаких рабочих тестов, как и интереса в их написании. Код для моей магистерской я полностью написал без контроля версий, потому что один из лучших университетов страны ему не обучал. Если вкратце, я ни разу не решал по-настоящему сложной задачи, а лишь нажимал на кнопочку «сэкономить полмиллиона долларов», которую не замечал никто другой. Я просто тупица.

Я знаю, что второе утверждение истинно, потому что вижу, насколько сложными вещами занимаются другие люди, и знаю, что истинно первое, ведь я, иммигрант, без проблем попал в 3-4% людей, получающих самую высокую зарплату в стране. Как эти два утверждения могут быть истинны одновременно?
Читать дальше →

Неизвестный библейский алгоритм кластеризации

Level of difficultyMedium
Reading time6 min
Views9.5K

Времена, когда горящий куст мог принести озарение, давно прошли. Примитивный опыт уже не может стать источником открытий. А всё потому, что он обобщён и впитан в культуру человечества. И чтобы подключиться к мудрости предков нужно опереться на философию. В этой статье мы познакомимся с новым алгоритмом кластеризации и поверхностно затронем некоторые философские категории. Перевернём объективность в субъектность и обратно.

Читать далее

Как пройти алгоритмическое собеседование: полный гид по алгоритмам, сложностям и стратегиям

Reading time31 min
Views42K

Не тратьте время на задачи – сначала разберитесь в основах. В статье:

1. Как проходят собеседования (ВАЖНО!)
2. Big O, оценка сложности алгоритмов
3. Популярные техники: два указателя, DFS, динамическое программирование и другие
4. Какие задачи решать, чтобы пройти в Яндекс

Читаем, практикуемся, получаем оффер!

Читать далее

Межсистемная аутентификация — самый подробный туториал с котами

Level of difficultyEasy
Reading time11 min
Views6.5K

Экс‑биолог и преподаватель собрала все полезное в одном месте, чтобы объяснить основные принципы межсистемной аутентификации для начинающих аналитиков.

Кликай, если любишь котов

Agents 101: Как создать своего первого ИИ-агента за 30 минут

Level of difficultyEasy
Reading time8 min
Views26K

ИИ-агенты становятся всё более востребованными для автоматизации задач и улучшения взаимодействия с пользователем. В этой статье вы узнаете, как создать собственного агента с помощью CopilotKit и LangGraph. Пошаговое руководство, примеры с исходным кодом и разбор ключевых компонентов помогут вам быстро освоить процесс и запустить своего первого ИИ-ассистента за 30 минут.

Читать далее

Custom- и Generic-планы в PostgreSQL

Level of difficultyMedium
Reading time20 min
Views3.4K

Всем привет! Я Тимур, инженер в команде Databases Т-Банка. Занимаюсь решением проблем и настройкой производительности СУБД Oracle и PostgreSQL. 

По мере увеличения числа инстансов PostgreSQL оптимизация вычислительных ресурсов становится все более актуальной. Рассмотрим простую, но эффективную оптимизацию — prepared statements. В статье расскажу о некоторых особенностях custom и generic планов в PostgreSQL при выполнении prepared statements.

Читать далее

Одна React-задача, демонстрирующая ключевые навыки на собеседовании

Level of difficultyEasy
Reading time7 min
Views30K

Как всего одна небольшая React-задача помогает глубже понять уровень кандидата на собеседовании? Разбираем нюансы работы с хуками, асинхронностью, состоянием гонки и сайд-эффектами. На первый взгляд задача кажется простой - всего лишь компонент, загружающий данные по username. Но в процессе решения выявляются ключевые моменты: правильно ли кандидат управляет состоянием, учитывает ли смену пропсов, обрабатывает ошибки и предотвращает race conditions. Этот вопрос помогает не просто проверить знания, а увидеть, как кандидат рассуждает и принимает технические решения.

Читать далее

С++ — это настоящий кайфǃ

Level of difficultyEasy
Reading time18 min
Views49K

Я хочу, чтобы вы задали себе один вопрос и честно на него ответили. Когда в последний раз вы получали настоящее удовольствие от программирования? Оглядываясь назад, я понимаю, что не испытывал подобных ощущений, наверное… уже лет десять. Удовольствия у меня не было ни от JavaScript, ни от Python, ни от Ruby или C — ни от чего. Когда я говорю «удовольствие» — я имею в виду ощущения человека, которого во время работы над неким проектом переполняет искренний восторг. Этот человек постоянно ловит себя на такой мысли: «Ох, ну какая ж круть. Поверить не могу, что моя безумная идея и правда сработала!».

Например, я писал маленькую игру-«рогалик». У меня была такая идея: «Готов поспорить, что у меня получиться воспользоваться этим вашим алгоритмом Дейкстры для соединения комнат при генерировании карты, сначала инвертируя карту, а потом его запуская. Вероятно, мне удастся прокопать отличнейшие туннели между комнатами». То было благословенное время, когда я пытался справиться с этой задачей, и при этом не чувствовал, что C++ мне мешает. Мне тогда удалось решить эту задачу, попутно многому научившись. Потом у меня появилась такая мысль: «Интересно, получится мне взять пользовательский интерфейс, сделанный на FTXUI, и просто напрямую его отрендерить в окно визуализации SFML?». Как и следовало ожидать, у меня всё отлично получилось. И хотя это было не так уж и сложно, я по ходу дела много узнал о том, как в C++ обрабатывается юникод. Ни одна из этих задач лёгкой не была, но все их, в принципе, можно было решить, и я не могу напридумывать себе достаточно много «подводных камней», которыми C++ мог бы помешать мне сделать то, что я хочу. Это — то, что я называю «удовольствием».

Читать далее

Как сделать из iPhone dumb phone и начать жить осознаннее

Level of difficultyEasy
Reading time2 min
Views13K

В этой статье я расскажу, что такое dumb phone, кому он нужен и как превратить свой iPhone в минималистичный гаджет. А если это вам не нужно, то, как минимум, вы сможете красиво настроить телефон :b

Читать далее

Как стать продакт-менеджером с нуля: пошаговое руководство для новичков в IT

Level of difficultyEasy
Reading time3 min
Views5.4K

Все счастливые продакт-менеджеры счастливы по-своему, но начинать, пожалуй, каждый должен одинаково.

В этой статье, дорогой читатель, мы разберём, какие шаги помогут вам приблизиться к мечте стать продактом.

Читать далее

Как управлять проектом: 3 инструмента без которых не выжить

Level of difficultyEasy
Reading time7 min
Views18K

Моя работа на руководящих ролях в международной корпорации быстро меня научила, что или ты оперативно познаешь искусство проджект менеджмента, или будешь бесконечно сражаться с неуправляемым хаосе задач, который рано или поздно выйдет из-под контроля и даст тебе по затылку. В статье я буду говорить о том, как это искусство использовать, но делать это с умом и высокой полезностью.

Что меня поражает, так это то, что многие мои коллеги и партнёры упорно забивают на простые и доступные инструменты и стараются управлять проектом силой «мышц». Как итог: безумные трудозатраты, отсутствие ясности действий, сорванные сроки и ярость вовлечённой команды. Что я стараюсь добиться от своих команд — использования простых базовых инструментов, а именно...

Читать далее

Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Level of difficultyEasy
Reading time12 min
Views13K

Мы успешно обновили кластер PostgreSQL с версии 13 до 16, обеспечив минимальный простой и высокую производительность. Процесс включал в себя создание новой реплики через логическую репликацию, перенос роли мастера на обновлённую реплику и настройку потоковой репликации. Несмотря на некоторые сложности, такие как управление LSN и проблемы с подписками, нам удалось сохранить данные и обеспечить синхронизацию.

Подробности читайте в статье.

Читать далее

20 неочевидных вариантов использования GPT-4o, которые реально улучшат вашу повседневную жизнь

Level of difficultyEasy
Reading time8 min
Views71K

Сегодня я расскажу о 20 практических вариантах использования GPT-4o, в которых возможности визуального ИИ используются так, как вы, возможно, никогда не думали — и нет, это не типичные промпты «напишите письмо».

Читать далее

10 инструментов для облегчения backend-разработки

Level of difficultyEasy
Reading time11 min
Views14K

Backend-разработка может быть довольно сложной из-за огромного количества инструментов, библиотек и пакетов, из которых приходится выбирать.

Однако правильные инструменты способны значительно облегчить работу разработчика.

Сегодня мы познакомимся с 10 инструментами, которые сделают backend-разработку проще.

Этот список вас удивит.

<h2>1. Encore — фреймворк для backend‑разработки на TypeScript и Go, предназначенный для создания надёжных и типобезопасных приложений.</h2>

Создание масштабируемых приложений с использованием облачных сервисов часто сопряжено с плохим опытом разработки. Разработчикам приходится управлять сложной инфраструктурой и выполнять рутинные задачи, что замедляет их работу.

Encore помогает решить эту проблему, предлагая полный набор инструментов, ускоряющий разработку приложений.

Это как если бы у вас была кухня, полностью укомплектованная ингредиентами и инструментами, и вы могли бы сразу приступить к готовке, не тратя время на сбор всего необходимого.

Encore предоставляет opensource-фреймворк для backend-разработки (на TypeScript и Go), который позволяет определять инфраструктуру в виде типобезопасных объектов прямо в вашем приложении, объединяя инфраструктуру с кодом приложения. Encore автоматически занимается предоставлением инфраструктуры и DevOps, анализируя код приложения.

Это позволяет быстро создавать готовые к продакшену backend’ы, используя такие инструменты, как микросервисы, Postgres и Pub/Sub, без излишней сложности и забот о DevOps. Дополнительно вы получаете:

Читать далее

Делаем опенсорс курс C++ 17+. Присоединяйтесь

Level of difficultyEasy
Reading time9 min
Views14K
Небольшой командой энтузиастов мы уже два года развиваем проект Senior Junior. Это площадка с курсами от программистов для программистов. Из отзывов и разговоров с пользователями мы накопили любопытные наблюдения. Например, какие трюки помогают не бросить обучение на пол-пути и как избавиться от самообмана «ха, я точно понял эту тему».

Настало время для работы над курсом по самому сложному из мейнстримных языков — C++. Обсудим, почему индустрия нуждается в проработанном курсе по C++ прямо сейчас, и как именно он может выглядеть.


Читать дальше →

Оптимизируем дообучение LLM: теория + гайд

Level of difficultyEasy
Reading time22 min
Views14K

В эпоху стремительного развития искусственного интеллекта большие языковые модели (Large Language Models, LLM) становятся неотъемлемой частью множества приложений – от интеллектуальных чат-ботов до систем анализа данных. 

Эффективное применение больших языковых моделей не обходится без тонкой настройки, потому что базовые модели, обученные на обобщенных данных, могут не учитывать уникальные особенности конкретных задач или доменов. Тонкая настройка позволяет адаптировать модель к специфическим требованиям приложения, что улучшает ее производительность и точность [1]. 

Согласно исследованию Brown et al. (2020) о модели GPT-3, тонкая настройка на специализированных наборах данных значительно повышает эффективность модели в узконаправленных задачах, таких как медицинская диагностика или юридический анализ [2].

Однако тонкая настройка может потребовать значительных вычислительных ресурсов, особенно в части использования графических процессоров (GPU). Более того, сами большие языковые модели, запускаемые локально, сделают много боли (дорого!) при покупке мощностей для их эффективной работы [3, 4]. 

Дальше я расскажу как настроить небольшую LLM (llama-3.2-3b-instruct) так, чтобы снизить требования к оборудованию и ускорить процесс интеграции модели в бизнес-процессы.

Читать далее

Information

Rating
Does not participate
Registered
Activity