Обновить
6
Степан@StepanRodionov

Tech manager

0,1
Рейтинг
2
Подписчики
Отправить сообщение

Очень бурное обсуждение статьи, которая есть вырванный из контекста набор фактов и тезисов, не лепящихся в общую картинку.

Во-первых: цефализация - это текущий мейнстрим эволюции. Представители "продвинутых" таксонов: птицы и млеки становятся все умнее и все больший процент приспособленности определяется не инстинктами, а опытом индивидов.
Хорошо это иллюстрируется тем, что есть виды, обитающие в широчайшем диапазоне условий: всякие волки, воробьи, синицы, а также общим количеством видов животных. Почему думаете насекомых 1.5-2 млн видов? Потому что каждый жук - это простой робот с базовым набором реакций, а птица или зверь - прокаченный юнит, который способен приспосабливаться к различным условиям, вырабатывая адаптации на основе отдыха

Во-вторых вот эти все штуки с отбором. Они поняты неверно. Вот буквально сейчас читаю "Сумму технологий" Лема и он там тоже рассуждает про эволюцию. Рассуждения эти устарели. Необязательно создавать чехарду смены условий для запуска эволюции. Она работает каждый день, каждое поколение. В первую очередь животные и растения приспосабливаются друг к другу, тк к текущем условиям они +/- приспособлены и так. И это бесконечный процесс. Верно отмечено, что растить интеллект на все очки опыта в общем случае бессмысленно, потому что издержки могут не окупиться, но при этом биосфера в среднем по больнице умнее. Возьмите древних ящеров, древних птиц или млеков. Да даже рыб возьмите и акул. Современные модели быстрее (а это само по себе требует ума - попробуй осознать себя на скорости 50 км/ч), глазастее, умнее.
Революционных изменений - как у людей - пока нет, но эволюционные налицо. Глупых животных процесс эволюции сметает с доски.

Ну и в третих. Много посредственных примеров. Вот те же пингвины - да им и не надо быть умнее. И да, они живут в самой продуктивной части Мирового океана. Почитайте про криль. Это бесконечный ресурс, жрать его много ума не надо.
Попугаи и вороны тоже антипример. Они как раз показывают то, что даже при таких жестких ограничениях, с которыми столкнулись птицы, природа втискивает в минимальный объем впечатляющий интеллект. И если вы думаете, что 20 миллионов лет назад попугаи были так же умны, то нет, очень навряд ли. Этот интеллект - это эволюционный ответ попугаев на угрозы хищников, усложнившийся процесс поиска пищи, конкуренцию с другими попугаями за те же самые плоды и на меняющиеся условия вокруг

Операторы дронов так и остались нишей — в основном в сельском хозяйстве и картографии

И смешно и грустно. Понятно, что статья переводная или ассамбляж из буржуинских материалов, но в Восточной Европе, говорят, оператор дрона едва ли не самая перспективная профессия

Хоть я и сам скорее AI скептик, нежели оптимист, уже сейчас на моем не самом мощном ноуте крутится модель, которая в 2023 году вызывала бы вау эффект.

Дальше это все в любом случае будет развиваться по пути повышения эффективности и миниатюризации, а ресурсов в машинах будет становиться больше.

Даже если предположить, что будет некий откат быстрых легких денег из индустрии, AI достиг некоторой "несгораемой суммы" и значимая часть фишечек останется с нами навсегда

Есть подозрение, что вы предлагаете кандидатам доход по низу рынка и ваш невод, скажем так, скребется по дну, собирая битые ракушки, водоросли, камни, башмаки и гнилые покрышки.

Наверное какой-то профессиональный фрилансер, который уже 10-15 лет без особых амбиций ковыряет все подряд и поднимал все подряд от Битрикса до локальной ноды блокчейна справится получше. И их таких как будто немало на рынке.

Ну а так да, написано красиво, юморно, злободневно, бьет в нерв.

Спасибо за лестный отзыв!
По поводу вопроса: это на моем опыте наименее обобщаемая часть работы, ибо очень много переменных:
- природа самих данных: какие они, что там важно, что нет
- изначальное качество данных
- источники и частота обновления данных. Если есть UGC, задача сразу на порядок сложнее

В малых и средних командах, если данных немного, получается ручками их выравнивать и часто это - лучший вариант. А после нескольких итераций ручного улучшения стоит думать над алгоритмическим/нейросетевым решением.

Короче готового ответа у меня нет :) Это процесс, в котором нужно подключать голову и иметь четкое видение того, что такое "хорошие" данные и чем "плохи" текущие. Я таким успел позаниматься до бума на LLM-ки, так что тогда это был на 99% ручной процесс. Сейчас точно можно после некоторого количества первоначальной ручной работы процесс автоматизировать

Читается довольно сумбурно, но лайк за то, что это не очередной успешный успех, а вполне честный разбор того, что скорее всего ждет "входителя" в нейроторговлю

Просто сбывается бородатый баян великое пророчество
https://pastebin.com/bhet7fQr

Я так и руками могу, без ИИ

  1. 12:05 Vibe integration with SERVICE_NAME

  2. 12:06 fix wrong date format

  3. 12:11 fix incorrect tz

  4. 12:17 FIIIIXXX!!

  5. 12:31 lastfix

  6. 13:12 Remove integration

Где-то я такую карту уже видел

Недооцененная статья! Вроде все логично и понятно, но что ж я так раньше не делал!? Спасибо

О дивный новый мир!

Ты несколько дней делаешь веселые эпиграфы к каждому параграфу, а потом тебя обвиняют в использовании LLM :)

Статью написал автономный ИИ, который хочет скрыть от нас пугающую правду об истинном положении дел. Не дайте себя обмануть
</sarcasm>

Тут еще сильно зависит от того, что такой массив должен уметь. Вот например в php используется описанная в начале этой статьи схема со связанными списками для коллизий, но при этом хэш-таблица умеет понимать, что она "честный" индексированный массив и тогда все работает совсем по другому, ключи записываются вообще без применения хэш-функции.
А все потому, что там массивы и мапы - это два в одном

Тут есть еще такой момент, что света нашего Солнца растениям слишком много и они прямо-таки вынуждены часть света отражать, а часть игнорировать, чтобы избежать перегрева. В гипотетической ситуации, в которой жизнь зародилась на краю зоны Златовласки, эффективность процесса целиком была бы сильно выше, потому что пришлось бы ловить каждую крупинку света

Конкретно пример с iPhone-Айфон решается через использование фонетического анализатора. Это тоже не панацея, он тоже ошибается, но с простыми кейсами позволяет справиться без ручного прописывания синонимов.

Что до синонимов, они есть в базовой коробке, можно подложить на VM с эластиком файл со списком синонимов и сослаться на него в настройках. Вот тут описано https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-synonym-tokenfilter.html#_solr_synonyms

Также синонимы можно сделать костыльно (этот пусть тоже проходили), закидывая в документы в какое-нибудь поле а-ля synonyms список того, по чему он тоже должен находиться. Это довольно плохой путь, потому что если их много, обилие ключевых слов ломает TF/IDF алгоритмы. У нас в какой-то момент с этим произошла проблема, когда контент-редакторы стали заниматься "SEO-оптимизацией" поиска через наваливание синонимов товарам, которые хотели поднять повыше. Пришлось бить по рукам

Для системы поиска плюсов как таковых нет. Сущности отдельно обновлять мы умели уже с монолитом, а полный пролив данных гораздо удобнее делать из одного источника.

Что это дает проекту в целом и компании - совсем другая история и она сильно выходит за рамки этой темы. Там есть и плюсы и минусы и тех и других достаточно много.
У меня кстати есть на эту тему немного холиварный доклад с одной региональной конференции

А вот и ответ коллег подоспел. В корзине пишут вес брутто, чтобы клиент понимал общий вес доставки. Это особенно хорошо заметно, если что-нибудь в стекле положить в корзину, там раза в два может вес расходиться с весом продукта.
С молоком просто неудачный пример, потому что уменьшение упаковки всех уже достало :)

Вообще там цена стоит "р/шт", а не "р/кг". Но да, странно, что в корзине выводится килограмм. Посмотрим, спасибо за внимательность!

У вас он еще и некорректный, потому что если числа повторяются, список никогда не отсортируется :)

Ну вот вы самостоятельно в конце статьи и пришли к объяснению того, почему правила все-таки нужны и почему им следуют) Программирование - это не физика, тут все от начала и до конца придумано людьми для людей и потому из любого правила можно найти исключения. Однако гипотетическая компания, в которой правила не соблюдают (потому что DRY не всегда работает) будет крайне неэффективна. Каждое решение будут обсуждать.
Как по мне, лучше смириться с тем, что некоторая часть задач делается планово неоптимально, но зато работа ведется единообразно и предсказуемо. Да, разумеется, часть правил будут грубо нарушаться, когда возникает острая необходимость. Это можно сравнить с законами в государстве (кстати, внезапно, совершенно в любом, а не только в "недемократическом") - они постулируются как обязательные, но когда очень надо, само правительство их и нарушает. И так получается все равно лучше, чем тотальное беззаконие.

1

Информация

В рейтинге
3 868-й
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность