Обновить
0
Леонид Петров@Leoon

.NET, ML

Отправить сообщение

Два падавана и море ошибок в наставничестве

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.3K

Ошибки новичков давно разобраны на молекулы — об этом пишут статьи, говорят на конференциях и шутят в мемах. Но что насчет ошибок тех, кто учит этих новичков? Даже самые опытные наставники допускают промахи, которые превращают карьерный путь подопечного в настоящий ад или ставят крест на его профессиональном будущем.

Меня зовут Катя , я системный аналитик продукта ALD Pro и автор канала "Анализ, цветы, коты и Катя". Два года назад мне поручили стать наставником двух подающих надежды, но совершенно неопытных стажеров. Будучи уже опытным специалистом и имея за плечами бэкграунд преподавания в университете, я думала, что это будет легко. Как же я ошибалась! В этой статье расскажу о том, какие ошибки совершила как наставник и как их можно избежать тем, кто решит окунуться в наставничество. Будет немного смешно, временами больно, но главное — поучительно.

Читать далее

Главные отличия PCA от UMAP и t-SNE

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели13K

Здесь будет рассказано о главных отличиях самого старого и базового алгоритма снижения размерности - PCA от его популярных современных коллег - UMAP и t-SNE. Предполагается, что читатель уже предварительно что-то слышал про эти алгоритмы, поэтому подробного объяснения каждого из них в отдельности приведено не будет. Вместо этого будут объяснены самые важные для практики свойства этих алгоритмов и то, на какие связанные с ними подводные камни можно налететь при неосторожности. Все особенности будут описаны на примерах, с минимумом теории; те пытливые умы, что почувствуют в процессе чтения жажду математической строгости, смогут удовлетворить её в литературе, ссылки на которую будут даны по ходу дела и в конце статьи.

Читать далее

Как устроено пространство, в котором думают языковые модели?

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели23K

С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?

Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM).

Читать далее

Самая сложная программа

Время на прочтение5 мин
Охват и читатели133K
От переводчика: я нашел на Quora вопрос: Какую программу или код можно назвать самыми сложными из когда-либо написанных? Ответ одного из учасников был настолько хорош, что вполне тянет на статью.

Пристегни ремни.

Самая сложная программа в истории была написана командой людей, имена которых нам неизвестны.

Это программа – компьютерный червь. Червь был написан, судя по всему, между 2005 и 2010 годами. Поскольку этот червь является таким сложным, я могу дать лишь общее описание того, что он делает.
Читать дальше →

Настоящее предназначение OpenAI SORA: как и зачем симулировать «Матрицу» для ChatGPT

Уровень сложностиСредний
Время на прочтение41 мин
Охват и читатели122K

Ну что, уже успели прочитать восхищения небывалым качеством видео от нейросетки SORA у всех блогеров и новостных изданий? А теперь мы вам расскажем то, о чем не написал никто: чего на самом деле пытается добиться OpenAI с помощью этой модели, как связана генерация видео с самоездящими машинами и AGI, а также при чем здесь культовая «Матрица».

Войти в симуляцию →

History of one Google Chrome bug

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели19K

Эта статья посвящена уязвимости, которую мне удалось обнаружить в браузере Google Chrome в конце прошлого года, а также рассказывает об истории её возникновения. Уязвимость существовала в течение продолжительного периода и была устранена 31 октября 2023 года. Компания Google оценила её в 16000$

Читать далее

Экстремальные практики программирования: что, как и зачем

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели13K

Всем привет! Меня зовут Сергей Бережной, я работаю в Яндексе уже 18 лет: в 2005 году пришёл разработчиком интерфейсов, потом руководил подразделениями разного размера, а сейчас я директор по взаимодействию с разработчиками. Ещё я много занимаюсь обучением: в рамках наших сезонных школ и в Практикуме (где я работал над курсом «Управление командой разработки»).

Познакомившись с практиками экстремального программирования ещё в начале карьеры, позже я стал внедрять их в свои команды. По моим наблюдениям, они позволяют улучшить качество кода, ускорить подготовку релизов и в целом сделать процессы более гладкими. Если вам интересно узнать, почему и как, — эта статья для вас. Я поделюсь своим опытом и расскажу, что это вообще такое, какие практики бывают и что они дают. 

Сразу оговорюсь, что со времён появления этих практик степень их «экстремальности» и инноваторства сильно уменьшилась. Некоторые из них стали стандартом де-факто в индустрии — их используют широко и не выделяют в отдельную категорию. Например, рефакторинг и непрерывная интеграция когда-то считались экстремальными, а сейчас ими никого не удивишь.

Читать далее

Почему новым сотрудникам платят больше, чем работающим давно?

Время на прочтение7 мин
Охват и читатели134K

Один из самых поучительных моментов в моей карьере случился, когда я узнал, что новый коллега зарабатывает больше меня. Однажды я без задней мысли спросил его: «Какая у тебя зарплата?» Когда я услышал, что она на 40 тысяч долларов в год больше моей, то ощутил обиду, ревность и недооценённость. Как человек, имеющий ту же должность и тот же опыт, может получать на 40% больше меня? После этого открытия я начал раньше уходить из офиса, оправдывая это тем, что мне не платят справедливо. В конце концов, несколько месяцев спустя я ушёл из компании. Она предложила мне контроффер, пообещав повышение и увеличение зарплаты, но тогда я чувствовал себя оскорблённым.

Так почему же компании так поступают? Они намеренно стремятся вызвать у своих сотрудников недовольство? Они действительно думают, что работники не узнают об этой ситуации? Или они считают, что мы всё равно останемся, ведь они одни из самых лучших работодателей в мире? Позже я поработал какое-то время в отделе оплаты труда и увидел, «как делают колбасу», так что хочу поделиться размышлениями о том, почему новым работникам платят больше и почему лучший способ добиться улучшения зарплаты — перейти в новое место.
Читать дальше →

Кремниевая Долина: бомжи, AI, rock and roll

Время на прочтение7 мин
Охват и читатели25K

Я довольно долго прожил в Сиэтле и Калифорнии, и один из первых вопросов, который мне всегда задают: как там, в стране американской мечты? Я всегда отвечаю — это зависит. Пока что этот ответ никого не удовлетворил…

Очевидно, этот вопрос часто задаётся не из пустого любопытства, особенно если я разговариваю с человеком из IT. Многие технические специалисты думают о том, чтобы испытать удачу в США.

Итак, как там на самом деле? Мы видели много разных публичных мнений, от очень хайпового фильма «Кремниевая Долина» Юрия Дудя, изображающего идиллический и солнечный образ, до очень негативного от Артемия Лебедева.

Могут ли они оба быть правдой? Да, могут. Все зависит от того, на какие аспекты вы смотрите и какие из них для вас наиболее важны. В этой статье вы не найдете типичного сравнения зарплат, аренды и цен на продукты тут и там. Я думаю это все не так важно в вопросе заводить ли трактор. Дело совсем не в этих вещах.

Давайте посмотрим что есть что.

Читать далее

С новым годом: GPT в 500 строках на SQL

Время на прочтение42 мин
Охват и читатели44K

В минувшем году все только и говорили об ИИ и о том, как он может всё за вас сделать.

Мне нравится, когда кто-то или что-то работает за меня. Поэтому решил: попрошу-ка ChatGPT написать за меня новогодний пост:

«Эй, ChatGPT. А ты можешь реализовать большую языковую модель на SQL?»
«Нет, SQL не подходит для реализации больших языковых моделей. Язык SQL предназначен для выполнения запросов к данным, хранящимся в РСУБД и для управления этими запросами. Для реализации большой языковой модели требуются сложные алгоритмы, обширные датасеты, а зачастую — и фреймворки для глубокого обучения. SQL всеми этими возможностями не обладает.»

Что ж, лишний раз убеждаешься, что, если хочешь что‑то сделать хорошо – сделай это сам.

Давайте же воодушевимся этим оптимистическим планом и реализуем большую языковую модель на языке SQL.

Читать далее

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели118K

Улучшение Том и Джерри из 480p в 1440p

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране.

Мур-мур-мур

Что порой кроется за «успехом»

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели44K

Хочу рассказать вам свой путь в поиске новой работы в 2023 году и поддержать тех, кто сейчас проходит через это. За 6 месяцев я собеседовался в 25 компаний, прошел 54 этапа (а какие-то не прошел), получил 2 оффера и в итоге один из них принял. Если вы сейчас в поиске работы, эта статья будет для вас глотком свежего воздуха. Если же вы матерый специалист, устраивающий процессы онбординга в своей компании, вам это может быть интересно с другой стороны.

Читать далее

Нейронные сети, графы и эмерджентность

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели8.7K

В этой статье я хочу попробовать осветить некоторые интересные, на мой взгляд, области науки, с которыми я сталкивался в контексте работы с нейронными сетями, и найти между ними взаимосвязь. Данная статья не претендует на истину в последней инстанции и является всего лишь попыткой посмотреть на нейронные сети под другим углом. Сразу предупреждаю - я не являюсь каким то глубоким специалистом в этих сферах.

Читать далее

А далее наша планета попробует в IT без генералистов

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели20K

Простите, я тут повангую и поностальгирую немного. Когда-то, лет в 22-25, я "почти все знал про IT". Конечно, не в полной мере, но имел представление обо всем, какой-то хотя бы небольшой опыт во многом. Да, отчасти это можно списать на юношескую самоуверенность и Даннинга-Крюгера (где-то я возможно не видел границы своей некомпетентности), но только отчасти.

Я считаю себя генералистом. То есть, такой "универсальный солдат", могу кун-фу, могу самбо, могу стрелять из гаубицы и из лука, управлять гироскутером, камазом и звездолетом, и все это делаю одинаково плохо (но, тем не менее, гравицапу установить и координаты в тентуре расчитать смогу). Думаю, что я достаточно важный и ценный сотрудник там, где я работаю, и очень неплохо зарабатываю, в пересчете на час работы. Однако, если бы я пошел на собеседование на более скромную позицию какого-нибудь программиста или админа - наверняка завалил бы продвинутые тесты по множеству тем, кроме нескольких. Любой узкий специалист который 10 лет делает одно дело, знает это дело лучше и глубже.

Сфера IT в мои 20+ самом деле была гораздо меньше, чем сейчас. Через пару десятков лет после первого сеанса братьев Люмьер было несложно стать киноведом, который видел все фильмы.

К примеру, MySQL и PostgreSQL вышли в середине 90-ых. Тогда было несложно знать эти новые крошечные и простые проекты. Отработал JOIN слева, JOIN справа - и вот у тебя уже черный пояс по SQL, а значит и по базам данных в целом (потому что больше пока что ничего просто и нет). До появления Redis (key-value) было еще 10+ лет, до CockroachDB и Prometheus - 20 лет - можно было ничего о них не знать, и быть полноценным гуру в СУБД с полными знаниями о теме! Сейчас я не уверен, что смогу назвать даже все типы СУБД которые есть (реляционные, key-value, документные, графовые, time-series, ....), не говоря уже о названиях проектов. Что мы сейчас (в суровой реальности) можем ожидать от программиста в сфере баз данных? Мы ему объясняем проект, он нам распишет схему, как ее по табличкам разбить, какие индексы создать и что подкрутить с настройками СУБД под нашу специфику. Но это очень плохой уровень . А что я хочу от эксперта? Чтобы он сказал, к примеру: тут вам лучше вообще не реляционную использовать, а NOSQL, вот либо СУБД А, либо B, либо C (она только в прошлом году появилась, но очень итересная!). Но у A плохая лицензия, подходят только B и С. По скорости, для ваших задач лучше подойдет B, она на таком типе нагрузок по бенчмаркам быстрее работает, но у вас Debian на серверах? А у нее на Debian есть утечки памяти - возможно это блокирующая проблема. Еще, вы хотите из Java с ней работать? Для Java у нее нет клиента, только для C и Python, так что, придется доработать или дождаться.

Читать далее

Идеальные паразиты человека и «тихая пандемия»: привет, ветрянка и герпес

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели35K
image
Мы решили, что красочные фотографии генитального герпеса — это не прям то, что вы хотели бы видеть. Поэтому вот вам модель вируса герпеса второго типа, который его вызывает.

Почти все из нас в детстве болели ветрянкой. Некоторые, впрочем, не успели в детском саду поучаствовать в важных ритуалах по нанесению традиционной окраски под зелёного леопарда. В итоге во взрослом возрасте эти счастливчики вынуждены экстренно эвакуироваться как можно дальше при виде пятнистых детей характерной окраски. И не зря.

Сегодня мы будем говорить о целой группе заболеваний, которые на первый взгляд вроде бы не связаны между собой: это герпес, ветрянка и другие проявления вирусов из семейства Herpesviridae. С вероятностью выше 90 % вы инфицированы хотя бы одним из них. В целом они относительно безвредные паразиты, но иногда могут приводить к интересным спецэффектам вроде попытки самостоятельного удаления своих зубов плоскогубцами. Об этом и многом другом мы сегодня и поговорим. Кладите рядом мазь с ацикловиром, зелёнку и приступим.
Читать дальше →

Завершён проект воссоздания человеческого мозга в компьютере стоимостью €600 млн. Что в итоге?

Время на прочтение9 мин
Охват и читатели39K

Потребовалось 10 лет, около 500 учёных и около 600 млн евро, и вот проект "Человеческий мозг" - одно из самых масштабных исследований, когда-либо финансировавшихся Европейским союзом, - подходит к концу. Его дерзкая цель заключалась в том, чтобы понять человеческий мозг, смоделировав его на компьютере.

За время существования проекта учёные из проекта Human Brain Project (HBP) опубликовали тысячи работ и добились значительных успехов в нейронауке, таких как создание подробных 3D-карт не менее 200 областей мозга, разработка мозговых имплантатов для лечения слепоты, использование суперкомпьютеров для моделирования таких функций, как память и сознание, а также для разработки методов лечения различных заболеваний мозга.

«Когда проект начинался, почти никто не верил в потенциал больших данных и возможность использования их или суперкомпьютеров для моделирования сложного функционирования мозга», - говорит Томас Скордас, заместитель генерального директора Европейской комиссии в Брюсселе.

Читать далее

PostgreSQL и временные таблицы

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели62K

Мы много лет уже используем в качестве основной базы данных PostgreSQL. За это время он зарекомендовал себя быстрой и надежной СУБД. Однако, есть в PostgreSQL одна проблема, с которой приходится сталкиваться достаточно часто. К сожалению, реализация логики временных таблиц в нем имеет ряд недостатков, которые отрицательно сказываются на производительности системы.

Одним из свидетельств наличия проблемы является то, что для временных таблиц в Postgres Pro была добавлена специальная функция fasttrun, а в Postgres Pro Enterprise существенно доработана работа с ними (см. пункт 4). 

Наиболее активно временные таблицы используют платформы, в которых разработчик не работает напрямую с базой данных, а таблицы и запросы генерируются непосредственно самой платформой. В частности, к ним относится платформа или ее открытый и бесплатный аналог - платформа lsFusion.

В этой статье я опишу почему приходится использовать временные таблицы, в чем суть проблемы, и как улучшить производительность путем настроек операционной системы и PostgreSQL.

Читать далее

Как сделать солнечную батарею из белил, баклажанов и не только…

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели15K
Картинка Vecstock, Freepik

Мы привыкли к тому, что стандартные солнечные элементы питания представляют собой фотоэлектрические устройства на основе p-n перехода. Тем не менее существует интересная альтернатива, использующая принцип разделения функций переноса заряда и световой абсорбции. И такой альтернативой является создание фотохимических полупроводниковых ячеек, сенсибилизированных красителем.
Читать дальше →

Как один российский банк пытался запустить бренд-медиа об ИИ. Нечеловеческая комедия в 3 частях

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели5.9K

Привет, я журналист и редактор с 16-летним опытом работы в крупных российских СМИ, в основном, в сфере ИТ и экономики/бизнеса, в т.ч. банковского ИТ. В моём активе из профильных изданий опыт работы в CNews, РБК, «Секрете фирмы», «Ведомостях», а также запуск бренд-медиа (бизнес/экономика) в холдинге VK в качестве шеф-редактора.  

В роли шеф-редактора я пытался создать в крупном российском банке бренд-медиа об ИИ. На момент публикации проект, по моему мнению, находится в состоянии гальванизированного трупа, а почти вся редакция под давлением в течение года ушла. Я постараюсь аргументированно описать неработающие механизмы банка, они не уникальны. Имена изменены. 

Читать далее

Алгоритмы не важны

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели46K

Прошу простить заранее за несколько кликбейтный заголовок )

Не так давно писал в соцсетях хейт‑пост по поводу «алгоритмических секций» при приёме на работу в Яндекс.

Да и многие другие софтверные компании это практикуют и считают навыки написания алгоритмов — чуть ли не самым важным навыком для программистов.

И ставят данной компетенции очень высокий приоритет при приёме на работу.

Попробую сегодня развить эту мысль и объяснить почему ставить навыки написания алгоритмов на первый план — не правильно, почему этот «алгоритмический» критерий не релевантен и не отражает реальной ценности / уровня / потенциальной пользы от данного программиста.

Читать далее
1
23 ...

Информация

В рейтинге
Не участвует
Откуда
Киров (Кировская обл.), Кировская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Инженер по данным
Средний
От 400 000 ₽
C#
Visual Studio
Объектно-ориентированное проектирование
Разработка программного обеспечения