Обновить
8K+
7
Александр Локис@abletobetable

ML engineer и ментор по Data Science

4
Рейтинг
22
Подписчики
Отправить сообщение

Топ вопросов с NLP собеседований: GPT, стратегии генерации текста и метрики оценки LLM

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели11K

На NLP/LLM-собеседованиях часто проверяют не то, знаешь ли ты слова top-k, top-p и BLEU, а понимаешь ли ты, что происходит с распределением вероятностей, почему greedy decoding зацикливается, зачем нужна temperature и почему BLEU плохо оценивает ответы современных LLM.

В этой статье - чеклист по языковому моделированию, стратегиям генерации и метрикам качества. Это не полноценная лекция с нуля, а тренажёр, по которому стоит пройтись перед техническим интервью по NLP, чтобы закрыть пробелы и вспомнить необходимую базу.

Читать далее

Топ вопросов по математике для ML и Data Science собесов: линейная алгебра и матан

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели11K

Математикой часто пугают новичков ML и Data Science. В этой статье разберем, что спрашивают и до какой глубины изучать математику для собеседований.

Читать далее

Топ вопросов с NLP собеседований: трансформеры и внимание до малейших деталей

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели10K

Архитектура трансформера и его сердце механизм внимания уже давно стали базой собесов на NLP, LLM и даже CV. В работе трансформеры тоже доминируют. Именно поэтому очень важно до деталей разбираться в том, как они устрены, из каких частей состоят, как работают и где применяются на практике.

Разберем архитектуру по слоям с примерами кода и большим количеством картинок и схем.

Читать далее

Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

Уровень сложностиПростой
Время на прочтение18 мин
Охват и читатели11K

Знание классики - база любых собеседований на все грейды в DS!

Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.

В этой части разберем:

Деревья и ансамбли, метрические модели, кластеризацию

кластеризацию

Узнать вопросы и ответы на них

Топ вопросов с Data Science собеседований: Основы Classic ML, Линейные модели, Метрики классификации и регрессии

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели29K

Секрет успешного трудоустройства — в дотошной подготовке к собеседованиям!

Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.

В этой части разберем: основы машинного обучения, переобучение и кросс‑валидация, линейные модели, метрики классификации и регрессии.

Узнать вопросы и ответы на них

Обзор техник RAG: Retrieval Augmented Generation

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели22K

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Читать далее

Информация

В рейтинге
1 589-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность