Комментарии / Профиль PastorGL / Хабр

Как стать автором

Alexey Evdokimov @PastorGL

Software engineer. Practicioner, not a theorist.

Хабр Карьера

ПрофильСтатьи19ПостыНовостиКомментарии566

Одноклассовый энтерпрайз

PastorGL 7 июн в 16:42

Батенька, я три года отсеньорил в епаме на банковских проектах, а потом мне как-то довелось поревьюить то, что пишут в ростелекоме для госов.

Так индусы пишут в разы лучше, чем то, на чём всякие сберы и госуслуги в этой стране сделаны.

Посмотреть

Одноклассовый энтерпрайз

PastorGL 7 июн в 15:26

Не очень понятна причина такой тряски. Вполне обычная энтерпрайзная лапша, даже с некоторыми довольно остроумными находками. (Ну, разве что WS и RS в одних и тех же бинах смешивать действительно не стоит. Но я лично и похуже вещи в продакшене видал.)

И тот факт, что в столь разных серверах, имплементирующих все эти J### стандарты по-своему, такое густо намазанное высокоуровневой метой безобразие заводится с минимальной доводкой, должен радовать, и очень даже сильно. Работает ведь? Ну так в чём проблема? Обычно всё-таки вендорлок куда сильнее выражен.

А что касается бытового расизма в отношении индусов, то вас он совсем не красит.

Посмотреть

Иногда приходится¹ копаться² в кишках³ Apache Spark

PastorGL 29 мая в 22:40

а вы почитайте исходники dataframe api, сразу станет понятно.

если кратко, то это «подход №1» со всем его оверхедом.

Посмотреть

Иногда приходится¹ копаться² в кишках³ Apache Spark

PastorGL 29 мая в 03:27

тогда должны знать, что гранты выдают очень разные фонды (коммерческие, некоммерческие, государственные, частные, и т.д.) на совершенно разных условиях (например: разработка продукта с нуля, коммерциализация существующего продукта, поддержка инновации, внедрение технологии, и т.п.).

вообще, никому не советую делать далеко идущих conjectures на основе неполной информации. вы ведь понятия не имеете, какие именно вводные были у нас (а раскрывать их я, конечно же, не буду — не имею права). но покритиковать очень хочется, да?

Посмотреть

Иногда приходится¹ копаться² в кишках³ Apache Spark

PastorGL 28 мая в 18:50

я что-то не догоняю причин вашего негодования.

грант был выдан с конкретной темой: «разработка инструмента для ETL». цель достигнута, инструмент успешно разработан. более того, выложен в открытый доступ: https://github.com/PastorGL/datacooker-etl — кто угодно может брать и пользоваться.

а бизнес-модель конторы, в которой он внедрён, это дело только самой конторы. вы вообще в курсе, как и на что выдаются гранты?

Посмотреть

Иногда приходится¹ копаться² в кишках³ Apache Spark

PastorGL 28 мая в 13:02

одно другому не мешает. или вы думаете, что все гранты должны тупо проедаться без реального выхлопа?

я вот вполне себе (то есть нам) нормальный продукт написал.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 18:37

Надо будет — решу конечно. В чём сложность-то?

Принципы профилирования за 25 лет не поменялись, а профайлер сейчас прямо в браузер встроен. Последний раз я такое делал под IE7 (надо было отображать/фильтровать/сортировать табличку на 10к ячеек), тогда приходилось цепляться из вижуалстудии, было неудобно.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 18:01

Я почти 10 лет занимался веб-разработкой. Правда, начинал ещё с Perl/CGI. Такие очень древние технологии, когда для ускорения бэка приходилось писать поначалу модули на сях, а для фронта — аплеты на допотопной жабе. Потом какое-то время у меня был хайлоад на оракле, далее — всякий и разный жабоэнтерпрайз в нескольких вариациях, а последние лет 8 я занимаюсь биг датой. Нормальной такой, с петабайтами геоданных.

«Необычным» программистом я себя при этом не считаю. Ну знаю два десятка языков и пять разных платформ, но это ведь наживное. Написать прошивку для станка? Хм, если такая задача вдруг возникнет, то почему нет? Для роутеров и фотоаппаратов я прошивки собирал... справлюсь, думаю.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 17:49

Пруфы-то легко гуглятся, но пока вы придерживаетесь механистических взглядов, они вам никак не помогут :)

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 15:58

Слава богу, за 25 лет мне ни разу не доводилось заниматься тупой обезьяньей работой. Всё время какой-нибудь R&D, интерпретаторы, контейнеры, и прочая дичь. Значит, никакие ИИ не для меня, так и буду продолжать руками писать... точнее, головой :)

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 15:51

Абстрактное мышление ни в какой кремний запихнуть нельзя.

Вы бы хоть матчасть для начала изучили, а именно, какие конкретно части мозга активируются при обдумывании тех или иных понятий. Если изучите, сильно удивитесь. Потому что никакого абстрактного мышления не существует.

Когда думаешь о наборе текста на клавиатуре, задействуются ровно те же самые нейроны, которые двигают твоими пальцами. Просто слегка иначе. Когда думаешь о счётных множествах, то те же нейроны, которые реагируют на что-то большое в поле зрения. Просто чуть по-другому. И так вообще со всем.

Человеческое сознание всего лишь побочный артефакт нашего wetware. Повезло вот миллион лет назад предкам людей получить пару мутаций в энергетическом обмене, которые позволяют поддерживать альтернативный режим работы мозга помимо его прямой функции — управления триллионами клеток тела.

Никакая модель с такой задачей не справится.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 01:05

Механисты, которые не знают, что в настоящем человеческом мозге между двумя соседними нейронами могут быть тысячи синапсов, причём совершенно разных — как по скорости реакции, так и по медиаторным молекулам, которые бывают как стимулирующие, так и тормозные, — просто понять не могут, что повторить его в софте физически невозможно.

А ведь даже один синапс это ещё и объём + время. И сколько вокселей надо, чтобы в точности его смоделировать? А потом помножить на параллельную обработку, причём честно параллельную — ведь каждый нейрон уже сам по себе как независимое процессорное ядро со своим тактовым интервалом.

И в мозге их чуть более чем дофига, да ещё и конфигурация самого wetware меняется всё время. Никакими квинтиллионами параметров такое не замоделить. Но кажется, что вот-вот, что ещё чуть-чуть... Ну, пускай кажется, что ли.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 22 мая в 00:51

Один мой вузовский препод (ох и мерзкий же был дядька) любил повторять, что большинство начинающих программистов было бы рациональнее заменить дрессированной макакой. (25 лет назад ИИшенок ещё в продакшене не было, так что да, действительно, хорошо выдрессированная под типовые задачи макака вероятно казалась ему лучше бестолкового студента.)

Вот только помимо типовых задач, которые раньше копировались со стековерфлоу, а теперь пишутся бредогенерилками (обученными на том же самом выхлопе стековерфлоу по большей-то части), есть нетиповые. Решений для которых в обучающих выборках нет.

А если нет качественно обучающей выборки, то никакая языковая модель ничего полезного по неизвестному ей контексту не напишет. Так уж они устроены.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 21 мая в 20:47

тяжело и глупо игнорировать тот факт, что агенты, MCP тулы, промпт инженеринг, индексирование с RAG и т.д. очень сильно улучшают продуктивность

Прям так и хочется как в Википедии поставить [кому?] [когда?] и прочие метки.

В вашем-то случае может и помогает, если вы натренировали их на всей кодовой базе дотнета, и собственно для дотнета и используете. Для автоматизации написания перекладывалок из джейсонов в постргю тоже, наверное, неплохо такие тулы подойдут. Но вот только стоит заняться чем-то более редким, полезность их уменьшается экспоненциально.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 21 мая в 20:39

Ровно так же как все генералы готовятся к давно закончившейся войне, искусственные идиоты не могут выдать ничего сверх того, на чём были обучены. Бесконечный ремикс с фантазией на подмешанные из промпта токены — сколько угодно.

Вот только смысла сгенерированной ими же самими последовательности токенов они понимать не могут, и покуда не научатся, у кожаных есть преимущество. Ну а что касается этого самого понимания смысла, то у современных моделей его даже близко не просматривается. Это просто гигантские формулы с миллиардами коэффициентов. А формула, какой бы гигантской ни была, не может чего-то осознавать.

Посмотреть

На Reddit обнаружили, что ИИ Copilot на GitHub медленно сводит с ума сотрудников Microsoft

PastorGL 21 мая в 16:11

Ну как что. Софт просто развалится. Все эти «сопилоты» не видят общей картины, значит, через пару бездумных прогонов через них любая кодовая база превратится в месиво. А как тяжело заставить бредогенерилку исправить стиль отлично видно на этих примерах.

(Но всё равно хайп сдуется рано или поздно.)

Посмотреть

Проводим слепой тест переводов прямо на Хабре

PastorGL 11 мая в 15:41

Ого, я даже угадал. Действительно, человеки обошлись с this/that ровно так, как в русском языке положено обходиться с английским указательным артиклем, а нейронки везде навтыкали мерзотный «этот».

(Дисклеймер: я почему-то не смог осилить «Дюну». Начинал читать в оригинале несколько раз, так до конца даже первой книги не дотянул, бесит она меня.)

Посмотреть

Проводим слепой тест переводов прямо на Хабре

PastorGL 11 мая в 09:56

Хммм... значит, LLM по какой-то причине очень любят оставлять в тексте английское this/that, и в переводе получаем сплошное «этот-этот-этот». Омерзительно.

Посмотреть

ООП — это скам

PastorGL 10 мая в 19:25

Тоже верно. В зависимости от того, какой метод применялся для моделирования предметной области, получившаяся абстрактная модель может быть разной. (И если продукт в итоге не дошёл до релиза, значит, неправильный был выбран метод... :)

Посмотреть

Не смотрите наверх

PastorGL 10 мая в 19:12

Таки раскрылся. Правда, ещё больше 40 лет назад. За аппаратом всё это время таки наблюдали, известно точно.

Посмотреть

1

2 3 ...

В рейтинге: 962-й

Откуда: Ижевск, Удмуртия, Россия

Зарегистрирован: 10 октября 2011

Активность: вчера в 23:34

Бэкенд разработчик, Архитектор программного обеспечения

Ведущий

Большие данные

Apache Spark

Java

Базы данных

Геоинформационные системы

Разработка программного обеспечения

Алгоритмы и структуры данных

Управление разработкой

Автоматизация процессов

ETL