Обновить

Моя лента

Тип публикации
Порог рейтинга
Уровень сложности
Предупреждение
Войдите или зарегистрируйтесь, чтобы настроить фильтры
Статья

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели6.1K

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например.

Но, внезапно, мне в личку постучались с таким проектом.

Читать далее
Пост

К 2060 году андроидов может стать больше, чем автомобилей

Аналитики Bank of America опубликовали прогноз: рынок гуманоидных роботов способен вырасти до 4 млрд устройств по всему миру. Примечательно, что большинство из них окажется не на производственных линиях, а в жилых домах.

62% — домашние роботы

По оценке аналитиков, около 2 млрд гуманоидов будут использоваться в быту: уборка, уход за пожилыми, рутинные домашние задачи. Для сравнения — сегодня проникновение таких устройств практически нулевое. Технология только начинает выходить из стадии лабораторных прототипов.

Почему это может случиться

Основной драйвер — демографический. Население стареет, рабочей силы становится меньше, спрос на автоматизацию растёт. В этом контексте даже несовершенный гуманоид может оказаться экономически оправданным.

Аналитики формулируют условие просто: роботу не нужно быть лучше человека. Достаточно быть дешевле. Плюс работа без выходных, отпусков и увольнений по собственному желанию. Если юнит-экономика сойдётся — масштабирование может произойти быстро.

Что это означает на практике

Если прогноз реализуется, гуманоидные роботы пройдут тот же путь, что смартфоны и автомобили — от нишевой экзотики до массового устройства в каждом доме. Вопрос в этом сценарии уже не «случится ли это», а «в каком десятилетии».

Отдельный интересный момент: порог входа для массового рынка — это не технологическое совершенство, а ценовая точка. Как только стоимость опустится ниже годовой зарплаты домашнего персонала в конкретной стране, рынок в этой стране может открыться резко.

Теги:
0
Комментарии2
Статья

Вот как без инвесторов построить IT-компанию на $50 млрд. Вам нужна кредитка и ящик пива

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели19K

В марте 2022 года Atlassian объявляют об уходе из России. Сначала останавливают продажи новых лицензий, потом перестают продлевать старые.

Россияне начали искать выход. Кто-то готовил обходные пути, кто-то взламывал лицензии через генератор на GitHub, кто-то регистрировал аккаунты через зарубежные филиалы. Много компаний мигрировали на отечественные аналоги.

До ухода Atlassian большинство российских компаний работали на их продуктах. Jira была дефолтным инструментом для разработчиков, Trello уже как синоним канбан-доски, а Confluence — единственная корпоративная база знаний, которая не вызывает отвращение.

Два студента из Австралии в 2002 году взяли $10 тысяч с кредитки и создали продукты, которыми через 20 лет пользуются миллионы команд по всему миру.

Сейчас расскажу, как Atlassian стала стандартом индустрии.

Читать далее
Пост

Приглашаем на встречу о профессии «Специалист по информационной безопасности»!

  • Как превратить интерес к поиску уязвимостей в карьеру?

  • Как устроена работа в департаментах по реагированию на инциденты, и почему здесь важна скорость реакции и аналитический склад ума?

  • Какие навыки и знания необходимы новичку для успешного старта в индустрии?

Обо всём этом в эту субботу расскажет Борис Степанов, руководитель направления по анализу безопасности в «Криптоните», вместе с представителями других ИБ-компаний!

Где: в Музее криптографии (Москва, улица Ботаническая, дом 25, строение 4)
Когда: 21 марта, суббота, начало в 15:00
Как попасть: посещение встречи бесплатное. Нужно только зарегистрироваться по ссылке

Встреча проходит в рамках профориентационного проекта «Ключ к профессии», которые проводит Музей криптографии. Эти встречи полезны для старшеклассников и студентов младших курсов, планирующих связать жизнь с наукой и инженерией.

Теги:
+1
Комментарии0
Статья

Как мы автоматизировали сбор бизнес-идей

Время на прочтение7 мин
Охват и читатели6K

Продолжаем серию статей о нашем функциональном и удобном корпоративном портале.

Открытость — часть культуры Sminex. Своё мнение принято высказывать, устаревшие бизнес-процессы — совершенствовать и менять. Любой сотрудник может предложить идею, изменить устаревшие и неэффективные правила и технологии. И не только предложить, но и заработать, если идея соответствует определённым критериям и выгодна компании. Это отличная мотивация для команды. Для реализации на практике работает корпоративный сервис «Идеи». Раньше технической базы для него не было. Всё сводилось к отдельному почтовому ящику и группе сотрудников, координировавших процесс. Единого подхода к подаче идей тоже не было: предложения поступали в свободной форме, не всегда содержали нужную информацию и часто повторялись.

Читать далее
Статья

Считаем логарифмы в уме

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели20K

В 1957 году писатель-фантаст Роберт Хайнлайн так представлял себе людей XXI века: «Делала перерасчет прочности гидропонических оранжерей, но выходило с ошибками. Дважды забывала логарифмы, так что пришлось лезть в таблицу».

Однако наша цивилизация выбрала другую ветку развития — и в нашей версии XXI века все за человека делают машины: от сложения двузначных чисел до написания статей на Хабре. Считать в уме, а уж тем более помнить наизусть логарифмы — звучит, как не самая востребованная сверхспособность.

Зато, чтобы обрести эту сверхспособность, не требуются укусы радиоактивных пауков — достаточно просто прочитать эту статью, а уж пригодится ли в жизни — решайте сами. Может быть в нужный момент калькулятора под рукой не окажется, а может быть просто захочется произвести впечатление на коллег небрежно брошенной фразой: «Корень седьмой степени из пяти это примерно 1,25». Хотите научится быстро считать? Тогда добро пожаловать под кат!

Читать далее
Новость

MSI объявила о росте цен на свою продукцию до 30% из-за дефицита компонентов

Время на прочтение2 мин
Охват и читатели6K

Тайваньская MSI прогнозирует подорожание своей продукции на 15-30% из-за стремительного роста цен на твердотельные накопители и оперативную память. Объёмы продаж могут снизиться, но компания оптимистично оценивает перспективы роста выручки за текущий финансовый год благодаря повышению цен. У MSI есть запасы оперативной памяти на 1-2 месяца.

Читать далее
Статья

Изменения в G1/Parallel/Serial GC в JDK 26

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.6K

JDK 26 выходит уже совсем скоро. Тем временем в GC закрыли около 380 задач (почти в 2 раза больше, чем в прошлом релизе), но в этот раз акцент сместился с  больших фич в пользу практичных доработок.

Главное для всех сборщиков: нормальный учет CPU GC. Теперь считают не только stop-the-world паузы, но и конкурентную работу и дедупликацию строк. Можно посмотреть через лог cpu=info при завершении VM, обновили Hsperf-счетчики, есть доступ из кода. Плюс новый JFR-ивент с деталями по string dedup.

JEP 516: Aot Cache стал независим от выбранного GC и опций VM. Включение через опцию -XX:+AOTStreamableObjects.

G1 получил самые заметные улучшения: JEP 522 уменьшает синхронизацию между GC и приложением (цель - увеличить throughput). Еще: целевое использование CPU G1 по умолчанию снижено с 8% до 4%, добавили важнейший флаг UseGCOverheadLimit.

Читать далее
Статья

Прогнозирование цен на Airbnb в Нью-Йорке

Время на прочтение13 мин
Охват и читатели7.1K

Привет, Хаброжители! Мы открыли предзаказ на книгу «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ» Марка Райана и Луки Массарона. Предлагаем ознакомиться с главой 3 «Машинное и глубокое обучение».

Чтобы сравнить машинное и глубокое обучение с точки зрения простоты, сопоставим два решения для конкретной задачи классификации табличных данных: прогнозирование того, будет ли объект недвижимости, предлагаемый в аренду на платформе Airbnb в Нью-Йорке (NYC), иметь цену больше или меньше средней цены в объявлениях Airbnb на этом рынке.

Читать далее
Статья

Автоматические TLS-сертификаты в Angie с модулем ACME

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.9K

В этой статье посмотрим на модуль ACME веб‑сервера Angie. Модуль позволяет с минимальными усилиями получить TLS‑сертификаты и автоматически их обновлять. Наверняка вы уже работали с бесплатными сертификатами от Let«s Encrypt и можете задать закономерный вопрос: зачем это делать веб‑сервером, когда есть утилиты вроде certbot, acme.sh и acmebot? Для ответа нужно хотя бы один раз попробовать модуль ACME и удобство конфигурации станет очевидным.»

Начнём с краткого введения в тему ACME.

Читать далее
Новость

Стартап Percepta встроил «компьютер» внутрь ИИ — он выдает 30 тыс. токенов в секунду

Время на прочтение2 мин
Охват и читатели12K

Исследователи стартапа Percepta научили нейросеть выполнять программы на C самостоятельно — без вызова внешних инструментов. Модель на обычной архитектуре трансформера выдает более 30 000 токенов в секунду на CPU и безошибочно выполняет миллионы вычислительных шагов подряд.

Читать далее
Новость

Дни ЭРЕМЕКС в промышленных центрах Поволжья – встречаемся в Чебоксарах и Казани

Время на прочтение3 мин
Охват и читатели4.7K

В этом году мы продолжаем серию мероприятий в городах, где сконцентрирован потенциал отечественной электронной отрасли. В марте мы проведем две встречи в Чебоксарах и Казани, ставя перед собой цель – сделать наши мероприятия эффективной площадкой не только для детальной демонстрации предлагаемых программных пакетов, но прежде всего для диалога с заказчиками, обсуждения актуальных вопросов по внедрению, решения конкретных технических задач, в т.ч. по интеграции САПР ЭРЕМЕКС в существующую ИТ-инфраструктуру предприятия.

Читать далее
Новость

Новая конфигурация AI-тренинга и другие улучшения в продуктах Selectel

Время на прочтение2 мин
Охват и читатели4.9K

Привет, Хабр! Самый короткий месяц года запомнился большими обновлениями. Пополнили линейку конфигураций мощными флагманскими серверами для AI-тренинга и кластерных задач, добавили поддержку ephemeralStorage в Cluster Autoscaler и Karpenter и добавили новые образы в AI-маркетплейс. Под катом делимся главными улучшениями, а больше деталей ищите в Академии Selectel.

Читать далее

Ближайшие события

Статья

Почему нормализация контактных данных сложнее, чем кажется: опыт разработки движка очистки CRM-баз на Python

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.4K

Грязные данные в CRM — это всегда дубли, ошибки в рассылках и «кривая» аналитика. В статье рассказываю, как я реализовал API для автоматической нормализации телефонов, email и имен на FastAPI, и почему простая проверка регулярками не заменяет систему оценки качества данных (QC).

Попробовать Demo API
Статья

Как мы отсеиваем 95% мусора из Telegram-чатов до того, как сообщение попадёт в LLM

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.6K

Привет, Хабр!
Меня зовут Артём, я фаундер Leadl.ai. Мы строим AI-агента для поиска b2b-клиентов, и одна из его ключевых задач это мониторинг чатов и различных источников.
Звучит просто, пока не сталкиваешься с масштабом.

У нас в пуле 20000+ чатов в 15 источниках. Суммарно около 1000 000 000 сообщений в сутки. Из них реально полезных (запросы на услуги, поиск подрядчиков, вакансии) от силы 3-5%. Остальное: флуд, криптоспам, «доброе утро», мемы и бесконечные стикеры.

Задача: вытащить эти 3-5% качественных сообщений. Первой мыслью было отдать всё на откуп большой LLM типа GPT-4o. Посчитали. Среднее сообщение 50 токенов. 100 000 сообщений 50 токенов/сообщение ($10 / 1M токенов) = $50 в день только на input. Добавьте сюда output и prompt — и счёт легко перевалит за $100-150/день или $3000-4500/месяц. Для стартапа это путь в никуда.

Нам нужен был pipeline, который бы отсеивал мусор на ранних этапах, чтобы до дорогого LLM-скоринга доходило не более 5-10% от всего потока. Вот как мы его построили, через какие грабли прошли и что из этого вышло.

Читать далее
Статья

Temporal: долгий процесс решения проблемы времени в JavaScript

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели7.7K

Как меняется JavaScript?

JavaScript уникален тем, что работает во всех браузерах. У него нет какого-то одного «владельца», поэтому нельзя внести изолированное изменение и ждать, что оно будет применено везде. Эволюция происходит через TC39 — Технический комитет, отвечающий за ECMAScript.

Предложения должны пройти последовательность этапов развития:

• Этап 0: идея.

• Этап 1: принято пространство задач.

• Этап 2: выбрана архитектура драфта, но работа продолжится.

• Этап 2.7: предложение одобрено в принципе; ожидает тестирования и обратной связи.

• Этап 3: реализация и обратная связь.

• Этап 4: предложение стандартизовано.

В 2018 году, когда я впервые изучал Temporal, он находился на Этапе 1. Комитет TC39 был убеждён, что проблема реальна. Это было радикальное предложение по добавлению в JavaScript новой библиотеки дат и времени. Она должна была:

• Стать заменой Date.

• Добавить новые типы DateTime (вместо единого API).

• Стать неизменяемой.

• Добавить поддержку часовых поясов и календаря.

Но как мы к этому пришли? Почему Date вызывает столько проблем? Чтобы ответить на эти вопросы, нужно вернуться назад.

Читать далее
Статья

Как писать изолированные интеграционные тесты с Testcontainers

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.3K

Интеграционные тесты любят все на словах, пока не доходит до окружения, зависимостей и плясок с подготовкой стенда. В статье разберем более практичный подход: как писать изолированные интеграционные тесты с Testcontainers, не превращая их в хрупкую конструкцию из моков и костылей. На примере PostgreSQL и .NET посмотрим, как собрать тестовую среду, которая ведет себя достаточно близко к реальности, но при этом остается воспроизводимой и управляемой. Тема не новая, а боль до сих пор вполне живая — так что давайте разбираться.

Разобрать подход
Статья

Как недорогой MacBook Neo за $600 меняет рынок ноутбуков на Windows

Время на прочтение4 мин
Охват и читатели12K

Apple неожиданно выкатилa MacBook Neo — ноутбук всего за шесть сотен долларов. Само по себе устройство не выглядит чем-то экзотическим: компактный корпус, фирменный чип, обычный набор возможностей. Но именно цена сразу привлекла внимание. Макбуков за такие деньги раньше просто не было, поэтому новинка быстро стала одной из самых обсуждаемых тем в индустрии. Последствия для рынка могут быть весьма неожиданными. Попробуем разобраться, почему эта модель вызвала столько внимания и что она способна изменить.

Читать далее
Пост

С моей точки зрения, программно‑аппаратный хакинг — это понимание того, как устроен объект исследования на самом низком уровне. Плата, компоненты, соединения и защитные механизмы — это первое, что мы изучаем, получив в руки новую «игрушку» для исследований.

И одна из задач специалистов в этой области — реверс‑инжиниринг. Мы разбираем устройство не ради разборки, а для чтобы понять его архитектуру, логику работы и способы защиты. И одним из инструментов, который для этого используется, является рентгеновское просвечивание.

Главная задача рентгена — это помочь нам разобраться в том, как разведена плата, где расположены ключевые компоненты и как они соединены между собой.
Кроме того, с учетом развития этого направления и роста ИБ‑зрелости вендоров‑разработчиков IoT, многие устройства специально проектируются для того, чтобы затруднить исследование: с ловушками, скрытыми дорожками, экранами, защитными слоями и другими элементами, которые не видны снаружи. Особенно это актуально в случаях, когда устройство или его отдельные узлы намеренно залиты компаундом. В таких обстоятельствах обычный визуальный анализ почти бесполезен, и на помощь приходит рентген, который позволяет понять, что именно скрыто внутри, без разрушения объекта на первом этапе.

Для нашей команды это не экзотика и не разовая практика, а стандартный рабочий инструмент. Мы располагаем необходимым оборудованием для выполнения таких исследований и регулярно используем рентгеновское просвечивание как часть базового процесса анализа устройств. Это позволяет нам быстрее получать представление о внутренней архитектуре изделия, заранее выявлять потенциальные антитамперные механизмы и аккуратнее планировать дальнейшие этапы реверс‑инжиниринга.

Возвращаясь к фото на превью: сможете ли вы сказать, какие компоненты присутствуют на плате, их предназначение и, в принципе, что это за устройство?

🧠 Обязательно поделись с теми, кому это может быть полезно:
💬 Телеграм | 💬 Max | 📝 Хабр | 💙 ВКонтакте

Теги:
-3
Комментарии7
Статья

Что больнее OT или CRDT в совместном редактировании? И почему до сих пор нет идеала?

Уровень сложностиСредний
Время на прочтение26 мин
Охват и читатели9.1K

Привет, Хабр!

Меня зовут Антон Леонтьев, я старший разработчик в команде ядра редакторов МойОфис. Мы создаём офисные приложения, которыми ежедневно пользуются более 12 500 организаций, и совместное редактирование — одна из ключевых возможностей наших продуктов.

И знаете, что самое обидное в этой теме? За 35 лет исследований были опубликованы сотни научных работ. Google Docs работает с 2006 года. У Figma, Notion и Linear свои реализации. Казалось бы, задача давно решена, но стоит копнуть глубже, и становится понятно: универсального решения нет.

В Google Drive и Dropbox до сих пор всплывают баги с одновременным перемещением папок. В Notion при параллельном редактировании одного и того же абзаца можно потерять часть изменений. Даже Yjs — самая популярная CRDT-библиотека — не хранит полную историю документа в привычном для нас виде.

В этой статье разберём теорию, узнаем, какие проблемы решают Operational Transformation (OT) и Conflict-free Replicated Data Types (CRDT), на каких математических идеях они основаны, чем отличаются архитектурно и какие компромиссы неизбежно возникают в каждом подходе.

Интересно узнать, почему даже Google не смог сделать идеальное решение? Детали под катом.

Читать далее