Очень бурное обсуждение статьи, которая есть вырванный из контекста набор фактов и тезисов, не лепящихся в общую картинку.
Во-первых: цефализация - это текущий мейнстрим эволюции. Представители "продвинутых" таксонов: птицы и млеки становятся все умнее и все больший процент приспособленности определяется не инстинктами, а опытом индивидов. Хорошо это иллюстрируется тем, что есть виды, обитающие в широчайшем диапазоне условий: всякие волки, воробьи, синицы, а также общим количеством видов животных. Почему думаете насекомых 1.5-2 млн видов? Потому что каждый жук - это простой робот с базовым набором реакций, а птица или зверь - прокаченный юнит, который способен приспосабливаться к различным условиям, вырабатывая адаптации на основе отдыха
Во-вторых вот эти все штуки с отбором. Они поняты неверно. Вот буквально сейчас читаю "Сумму технологий" Лема и он там тоже рассуждает про эволюцию. Рассуждения эти устарели. Необязательно создавать чехарду смены условий для запуска эволюции. Она работает каждый день, каждое поколение. В первую очередь животные и растения приспосабливаются друг к другу, тк к текущем условиям они +/- приспособлены и так. И это бесконечный процесс. Верно отмечено, что растить интеллект на все очки опыта в общем случае бессмысленно, потому что издержки могут не окупиться, но при этом биосфера в среднем по больнице умнее. Возьмите древних ящеров, древних птиц или млеков. Да даже рыб возьмите и акул. Современные модели быстрее (а это само по себе требует ума - попробуй осознать себя на скорости 50 км/ч), глазастее, умнее. Революционных изменений - как у людей - пока нет, но эволюционные налицо. Глупых животных процесс эволюции сметает с доски.
Ну и в третих. Много посредственных примеров. Вот те же пингвины - да им и не надо быть умнее. И да, они живут в самой продуктивной части Мирового океана. Почитайте про криль. Это бесконечный ресурс, жрать его много ума не надо. Попугаи и вороны тоже антипример. Они как раз показывают то, что даже при таких жестких ограничениях, с которыми столкнулись птицы, природа втискивает в минимальный объем впечатляющий интеллект. И если вы думаете, что 20 миллионов лет назад попугаи были так же умны, то нет, очень навряд ли. Этот интеллект - это эволюционный ответ попугаев на угрозы хищников, усложнившийся процесс поиска пищи, конкуренцию с другими попугаями за те же самые плоды и на меняющиеся условия вокруг
Операторы дронов так и остались нишей — в основном в сельском хозяйстве и картографии
И смешно и грустно. Понятно, что статья переводная или ассамбляж из буржуинских материалов, но в Восточной Европе, говорят, оператор дрона едва ли не самая перспективная профессия
Хоть я и сам скорее AI скептик, нежели оптимист, уже сейчас на моем не самом мощном ноуте крутится модель, которая в 2023 году вызывала бы вау эффект.
Дальше это все в любом случае будет развиваться по пути повышения эффективности и миниатюризации, а ресурсов в машинах будет становиться больше.
Даже если предположить, что будет некий откат быстрых легких денег из индустрии, AI достиг некоторой "несгораемой суммы" и значимая часть фишечек останется с нами навсегда
Есть подозрение, что вы предлагаете кандидатам доход по низу рынка и ваш невод, скажем так, скребется по дну, собирая битые ракушки, водоросли, камни, башмаки и гнилые покрышки.
Наверное какой-то профессиональный фрилансер, который уже 10-15 лет без особых амбиций ковыряет все подряд и поднимал все подряд от Битрикса до локальной ноды блокчейна справится получше. И их таких как будто немало на рынке.
Ну а так да, написано красиво, юморно, злободневно, бьет в нерв.
Спасибо за лестный отзыв! По поводу вопроса: это на моем опыте наименее обобщаемая часть работы, ибо очень много переменных: - природа самих данных: какие они, что там важно, что нет - изначальное качество данных - источники и частота обновления данных. Если есть UGC, задача сразу на порядок сложнее
В малых и средних командах, если данных немного, получается ручками их выравнивать и часто это - лучший вариант. А после нескольких итераций ручного улучшения стоит думать над алгоритмическим/нейросетевым решением.
Короче готового ответа у меня нет :) Это процесс, в котором нужно подключать голову и иметь четкое видение того, что такое "хорошие" данные и чем "плохи" текущие. Я таким успел позаниматься до бума на LLM-ки, так что тогда это был на 99% ручной процесс. Сейчас точно можно после некоторого количества первоначальной ручной работы процесс автоматизировать
Читается довольно сумбурно, но лайк за то, что это не очередной успешный успех, а вполне честный разбор того, что скорее всего ждет "входителя" в нейроторговлю
Тут еще сильно зависит от того, что такой массив должен уметь. Вот например в php используется описанная в начале этой статьи схема со связанными списками для коллизий, но при этом хэш-таблица умеет понимать, что она "честный" индексированный массив и тогда все работает совсем по другому, ключи записываются вообще без применения хэш-функции. А все потому, что там массивы и мапы - это два в одном
Тут есть еще такой момент, что света нашего Солнца растениям слишком много и они прямо-таки вынуждены часть света отражать, а часть игнорировать, чтобы избежать перегрева. В гипотетической ситуации, в которой жизнь зародилась на краю зоны Златовласки, эффективность процесса целиком была бы сильно выше, потому что пришлось бы ловить каждую крупинку света
Конкретно пример с iPhone-Айфон решается через использование фонетического анализатора. Это тоже не панацея, он тоже ошибается, но с простыми кейсами позволяет справиться без ручного прописывания синонимов.
Также синонимы можно сделать костыльно (этот пусть тоже проходили), закидывая в документы в какое-нибудь поле а-ля synonyms список того, по чему он тоже должен находиться. Это довольно плохой путь, потому что если их много, обилие ключевых слов ломает TF/IDF алгоритмы. У нас в какой-то момент с этим произошла проблема, когда контент-редакторы стали заниматься "SEO-оптимизацией" поиска через наваливание синонимов товарам, которые хотели поднять повыше. Пришлось бить по рукам
Для системы поиска плюсов как таковых нет. Сущности отдельно обновлять мы умели уже с монолитом, а полный пролив данных гораздо удобнее делать из одного источника.
Что это дает проекту в целом и компании - совсем другая история и она сильно выходит за рамки этой темы. Там есть и плюсы и минусы и тех и других достаточно много. У меня кстати есть на эту тему немного холиварный доклад с одной региональной конференции
А вот и ответ коллег подоспел. В корзине пишут вес брутто, чтобы клиент понимал общий вес доставки. Это особенно хорошо заметно, если что-нибудь в стекле положить в корзину, там раза в два может вес расходиться с весом продукта. С молоком просто неудачный пример, потому что уменьшение упаковки всех уже достало :)
Ну вот вы самостоятельно в конце статьи и пришли к объяснению того, почему правила все-таки нужны и почему им следуют) Программирование - это не физика, тут все от начала и до конца придумано людьми для людей и потому из любого правила можно найти исключения. Однако гипотетическая компания, в которой правила не соблюдают (потому что DRY не всегда работает) будет крайне неэффективна. Каждое решение будут обсуждать. Как по мне, лучше смириться с тем, что некоторая часть задач делается планово неоптимально, но зато работа ведется единообразно и предсказуемо. Да, разумеется, часть правил будут грубо нарушаться, когда возникает острая необходимость. Это можно сравнить с законами в государстве (кстати, внезапно, совершенно в любом, а не только в "недемократическом") - они постулируются как обязательные, но когда очень надо, само правительство их и нарушает. И так получается все равно лучше, чем тотальное беззаконие.
Очень бурное обсуждение статьи, которая есть вырванный из контекста набор фактов и тезисов, не лепящихся в общую картинку.
Во-первых: цефализация - это текущий мейнстрим эволюции. Представители "продвинутых" таксонов: птицы и млеки становятся все умнее и все больший процент приспособленности определяется не инстинктами, а опытом индивидов.
Хорошо это иллюстрируется тем, что есть виды, обитающие в широчайшем диапазоне условий: всякие волки, воробьи, синицы, а также общим количеством видов животных. Почему думаете насекомых 1.5-2 млн видов? Потому что каждый жук - это простой робот с базовым набором реакций, а птица или зверь - прокаченный юнит, который способен приспосабливаться к различным условиям, вырабатывая адаптации на основе отдыха
Во-вторых вот эти все штуки с отбором. Они поняты неверно. Вот буквально сейчас читаю "Сумму технологий" Лема и он там тоже рассуждает про эволюцию. Рассуждения эти устарели. Необязательно создавать чехарду смены условий для запуска эволюции. Она работает каждый день, каждое поколение. В первую очередь животные и растения приспосабливаются друг к другу, тк к текущем условиям они +/- приспособлены и так. И это бесконечный процесс. Верно отмечено, что растить интеллект на все очки опыта в общем случае бессмысленно, потому что издержки могут не окупиться, но при этом биосфера в среднем по больнице умнее. Возьмите древних ящеров, древних птиц или млеков. Да даже рыб возьмите и акул. Современные модели быстрее (а это само по себе требует ума - попробуй осознать себя на скорости 50 км/ч), глазастее, умнее.
Революционных изменений - как у людей - пока нет, но эволюционные налицо. Глупых животных процесс эволюции сметает с доски.
Ну и в третих. Много посредственных примеров. Вот те же пингвины - да им и не надо быть умнее. И да, они живут в самой продуктивной части Мирового океана. Почитайте про криль. Это бесконечный ресурс, жрать его много ума не надо.
Попугаи и вороны тоже антипример. Они как раз показывают то, что даже при таких жестких ограничениях, с которыми столкнулись птицы, природа втискивает в минимальный объем впечатляющий интеллект. И если вы думаете, что 20 миллионов лет назад попугаи были так же умны, то нет, очень навряд ли. Этот интеллект - это эволюционный ответ попугаев на угрозы хищников, усложнившийся процесс поиска пищи, конкуренцию с другими попугаями за те же самые плоды и на меняющиеся условия вокруг
И смешно и грустно. Понятно, что статья переводная или ассамбляж из буржуинских материалов, но в Восточной Европе, говорят, оператор дрона едва ли не самая перспективная профессия
Хоть я и сам скорее AI скептик, нежели оптимист, уже сейчас на моем не самом мощном ноуте крутится модель, которая в 2023 году вызывала бы вау эффект.
Дальше это все в любом случае будет развиваться по пути повышения эффективности и миниатюризации, а ресурсов в машинах будет становиться больше.
Даже если предположить, что будет некий откат быстрых легких денег из индустрии, AI достиг некоторой "несгораемой суммы" и значимая часть фишечек останется с нами навсегда
Есть подозрение, что вы предлагаете кандидатам доход по низу рынка и ваш невод, скажем так, скребется по дну, собирая битые ракушки, водоросли, камни, башмаки и гнилые покрышки.
Наверное какой-то профессиональный фрилансер, который уже 10-15 лет без особых амбиций ковыряет все подряд и поднимал все подряд от Битрикса до локальной ноды блокчейна справится получше. И их таких как будто немало на рынке.
Ну а так да, написано красиво, юморно, злободневно, бьет в нерв.
Спасибо за лестный отзыв!
По поводу вопроса: это на моем опыте наименее обобщаемая часть работы, ибо очень много переменных:
- природа самих данных: какие они, что там важно, что нет
- изначальное качество данных
- источники и частота обновления данных. Если есть UGC, задача сразу на порядок сложнее
В малых и средних командах, если данных немного, получается ручками их выравнивать и часто это - лучший вариант. А после нескольких итераций ручного улучшения стоит думать над алгоритмическим/нейросетевым решением.
Короче готового ответа у меня нет :) Это процесс, в котором нужно подключать голову и иметь четкое видение того, что такое "хорошие" данные и чем "плохи" текущие. Я таким успел позаниматься до бума на LLM-ки, так что тогда это был на 99% ручной процесс. Сейчас точно можно после некоторого количества первоначальной ручной работы процесс автоматизировать
Читается довольно сумбурно, но лайк за то, что это не очередной успешный успех, а вполне честный разбор того, что скорее всего ждет "входителя" в нейроторговлю
Просто сбывается
бородатый баянвеликое пророчествоhttps://pastebin.com/bhet7fQr
Я так и руками могу, без ИИ
12:05 Vibe integration with SERVICE_NAME
12:06 fix wrong date format
12:11 fix incorrect tz
12:17 FIIIIXXX!!
12:31 lastfix
13:12 Remove integration
Где-то я такую карту уже видел
Недооцененная статья! Вроде все логично и понятно, но что ж я так раньше не делал!? Спасибо
О дивный новый мир!
Ты несколько дней делаешь веселые эпиграфы к каждому параграфу, а потом тебя обвиняют в использовании LLM :)
Статью написал автономный ИИ, который хочет скрыть от нас пугающую правду об истинном положении дел. Не дайте себя обмануть
</sarcasm>
Тут еще сильно зависит от того, что такой массив должен уметь. Вот например в php используется описанная в начале этой статьи схема со связанными списками для коллизий, но при этом хэш-таблица умеет понимать, что она "честный" индексированный массив и тогда все работает совсем по другому, ключи записываются вообще без применения хэш-функции.
А все потому, что там массивы и мапы - это два в одном
Тут есть еще такой момент, что света нашего Солнца растениям слишком много и они прямо-таки вынуждены часть света отражать, а часть игнорировать, чтобы избежать перегрева. В гипотетической ситуации, в которой жизнь зародилась на краю зоны Златовласки, эффективность процесса целиком была бы сильно выше, потому что пришлось бы ловить каждую крупинку света
Конкретно пример с iPhone-Айфон решается через использование фонетического анализатора. Это тоже не панацея, он тоже ошибается, но с простыми кейсами позволяет справиться без ручного прописывания синонимов.
Что до синонимов, они есть в базовой коробке, можно подложить на VM с эластиком файл со списком синонимов и сослаться на него в настройках. Вот тут описано https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-synonym-tokenfilter.html#_solr_synonyms
Также синонимы можно сделать костыльно (этот пусть тоже проходили), закидывая в документы в какое-нибудь поле а-ля synonyms список того, по чему он тоже должен находиться. Это довольно плохой путь, потому что если их много, обилие ключевых слов ломает TF/IDF алгоритмы. У нас в какой-то момент с этим произошла проблема, когда контент-редакторы стали заниматься "SEO-оптимизацией" поиска через наваливание синонимов товарам, которые хотели поднять повыше. Пришлось бить по рукам
Для системы поиска плюсов как таковых нет. Сущности отдельно обновлять мы умели уже с монолитом, а полный пролив данных гораздо удобнее делать из одного источника.
Что это дает проекту в целом и компании - совсем другая история и она сильно выходит за рамки этой темы. Там есть и плюсы и минусы и тех и других достаточно много.
У меня кстати есть на эту тему немного холиварный доклад с одной региональной конференции
А вот и ответ коллег подоспел. В корзине пишут вес брутто, чтобы клиент понимал общий вес доставки. Это особенно хорошо заметно, если что-нибудь в стекле положить в корзину, там раза в два может вес расходиться с весом продукта.
С молоком просто неудачный пример, потому что уменьшение упаковки всех уже достало :)
Вообще там цена стоит "р/шт", а не "р/кг". Но да, странно, что в корзине выводится килограмм. Посмотрим, спасибо за внимательность!
У вас он еще и некорректный, потому что если числа повторяются, список никогда не отсортируется :)
Ну вот вы самостоятельно в конце статьи и пришли к объяснению того, почему правила все-таки нужны и почему им следуют) Программирование - это не физика, тут все от начала и до конца придумано людьми для людей и потому из любого правила можно найти исключения. Однако гипотетическая компания, в которой правила не соблюдают (потому что DRY не всегда работает) будет крайне неэффективна. Каждое решение будут обсуждать.
Как по мне, лучше смириться с тем, что некоторая часть задач делается планово неоптимально, но зато работа ведется единообразно и предсказуемо. Да, разумеется, часть правил будут грубо нарушаться, когда возникает острая необходимость. Это можно сравнить с законами в государстве (кстати, внезапно, совершенно в любом, а не только в "недемократическом") - они постулируются как обязательные, но когда очень надо, само правительство их и нарушает. И так получается все равно лучше, чем тотальное беззаконие.