Публикации / Моя лента / Хабр

Статья

okoloboga 16 мар в 14:20

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Средний

14 мин

6.1K

TensorFlow * Машинное обучение * Обработка изображений * Поисковые технологии *

Кейс

Recovery Mode

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например.

Но, внезапно, мне в личку постучались с таким проектом.

Пост

GarantexAi

16 мар в 14:172K

Статистика в ITРобототехникаНаучно-популярноеИскусственный интеллектБудущее здесь

К 2060 году андроидов может стать больше, чем автомобилей

Аналитики Bank of America опубликовали прогноз: рынок гуманоидных роботов способен вырасти до 4 млрд устройств по всему миру. Примечательно, что большинство из них окажется не на производственных линиях, а в жилых домах.

62% — домашние роботы

По оценке аналитиков, около 2 млрд гуманоидов будут использоваться в быту: уборка, уход за пожилыми, рутинные домашние задачи. Для сравнения — сегодня проникновение таких устройств практически нулевое. Технология только начинает выходить из стадии лабораторных прототипов.

Почему это может случиться

Основной драйвер — демографический. Население стареет, рабочей силы становится меньше, спрос на автоматизацию растёт. В этом контексте даже несовершенный гуманоид может оказаться экономически оправданным.

Аналитики формулируют условие просто: роботу не нужно быть лучше человека. Достаточно быть дешевле. Плюс работа без выходных, отпусков и увольнений по собственному желанию. Если юнит-экономика сойдётся — масштабирование может произойти быстро.

Что это означает на практике

Если прогноз реализуется, гуманоидные роботы пройдут тот же путь, что смартфоны и автомобили — от нишевой экзотики до массового устройства в каждом доме. Вопрос в этом сценарии уже не «случится ли это», а «в каком десятилетии».

Отдельный интересный момент: порог входа для массового рынка — это не технологическое совершенство, а ценовая точка. Как только стоимость опустится ниже годовой зарплаты домашнего персонала в конкретной стране, рынок в этой стране может открыться резко.

Статья

olegplatonovv 16 мар в 14:15

Вот как без инвесторов построить IT-компанию на $50 млрд. Вам нужна кредитка и ящик пива

Простой

11 мин

19K

Развитие стартапаИстория ITБизнес-модели * IT-компанииУправление проектами *

Обзор

Из песочницы

В марте 2022 года Atlassian объявляют об уходе из России. Сначала останавливают продажи новых лицензий, потом перестают продлевать старые.

Россияне начали искать выход. Кто-то готовил обходные пути, кто-то взламывал лицензии через генератор на GitHub, кто-то регистрировал аккаунты через зарубежные филиалы. Много компаний мигрировали на отечественные аналоги.

До ухода Atlassian большинство российских компаний работали на их продуктах. Jira была дефолтным инструментом для разработчиков, Trello уже как синоним канбан-доски, а Confluence — единственная корпоративная база знаний, которая не вызывает отвращение.

Два студента из Австралии в 2002 году взяли $10 тысяч с кредитки и создали продукты, которыми через 20 лет пользуются миллионы команд по всему миру.

Сейчас расскажу, как Atlassian стала стандартом индустрии.

Пост

ledevik

16 мар в 14:062.1K

Блог компании КриптонитИнформационная безопасность * Учебный процесс в IT

Приглашаем на встречу о профессии «Специалист по информационной безопасности»!

Как превратить интерес к поиску уязвимостей в карьеру?
Как устроена работа в департаментах по реагированию на инциденты, и почему здесь важна скорость реакции и аналитический склад ума?
Какие навыки и знания необходимы новичку для успешного старта в индустрии?

Обо всём этом в эту субботу расскажет Борис Степанов, руководитель направления по анализу безопасности в «Криптоните», вместе с представителями других ИБ-компаний!

Где: в Музее криптографии (Москва, улица Ботаническая, дом 25, строение 4)
Когда: 21 марта, суббота, начало в 15:00
Как попасть: посещение встречи бесплатное. Нужно только зарегистрироваться по ссылке

Встреча проходит в рамках профориентационного проекта «Ключ к профессии», которые проводит Музей криптографии. Эти встречи полезны для старшеклассников и студентов младших курсов, планирующих связать жизнь с наукой и инженерией.

Статья

Sminex 16 мар в 14:05

Как мы автоматизировали сбор бизнес-идей

7 мин

Блог компании SminexУправление персоналом * 1С-Битрикс * ДизайнИскусственный интеллект

Кейс

Продолжаем серию статей о нашем функциональном и удобном корпоративном портале.

Открытость — часть культуры Sminex. Своё мнение принято высказывать, устаревшие бизнес-процессы — совершенствовать и менять. Любой сотрудник может предложить идею, изменить устаревшие и неэффективные правила и технологии. И не только предложить, но и заработать, если идея соответствует определённым критериям и выгодна компании. Это отличная мотивация для команды. Для реализации на практике работает корпоративный сервис «Идеи». Раньше технической базы для него не было. Всё сводилось к отдельному почтовому ящику и группе сотрудников, координировавших процесс. Единого подхода к подаче идей тоже не было: предложения поступали в свободной форме, не всегда содержали нужную информацию и часто повторялись.

Статья

DandyDan 16 мар в 14:01

Считаем логарифмы в уме

Простой

10 мин

20K

Блог компании SelectelМатематика * Алгоритмы * Лайфхаки для гиков

Туториал

В 1957 году писатель-фантаст Роберт Хайнлайн так представлял себе людей XXI века: «Делала перерасчет прочности гидропонических оранжерей, но выходило с ошибками. Дважды забывала логарифмы, так что пришлось лезть в таблицу».

Однако наша цивилизация выбрала другую ветку развития — и в нашей версии XXI века все за человека делают машины: от сложения двузначных чисел до написания статей на Хабре. Считать в уме, а уж тем более помнить наизусть логарифмы — звучит, как не самая востребованная сверхспособность.

Зато, чтобы обрести эту сверхспособность, не требуются укусы радиоактивных пауков — достаточно просто прочитать эту статью, а уж пригодится ли в жизни — решайте сами. Может быть в нужный момент калькулятора под рукой не окажется, а может быть просто захочется произвести впечатление на коллег небрежно брошенной фразой: «Корень седьмой степени из пяти это примерно 1,25». Хотите научится быстро считать? Тогда добро пожаловать под кат!

+170

Новость

Travis_Macrif 16 мар в 13:52

MSI объявила о росте цен на свою продукцию до 30% из-за дефицита компонентов

2 мин

Компьютерное железоНастольные компьютерыНоутбукиВидеокартыУправление продажами *

Тайваньская MSI прогнозирует подорожание своей продукции на 15-30% из-за стремительного роста цен на твердотельные накопители и оперативную память. Объёмы продаж могут снизиться, но компания оптимистично оценивает перспективы роста выручки за текущий финансовый год благодаря повышению цен. У MSI есть запасы оперативной памяти на 1-2 месяца.

Статья

spring_aio 16 мар в 13:43

Изменения в G1/Parallel/Serial GC в JDK 26

Простой

8 мин

6.6K

Блог компании Spring АйОПрограммирование * Java * Kotlin *

Обзор

Перевод

JDK 26 выходит уже совсем скоро. Тем временем в GC закрыли около 380 задач (почти в 2 раза больше, чем в прошлом релизе), но в этот раз акцент сместился с больших фич в пользу практичных доработок.

Главное для всех сборщиков: нормальный учет CPU GC. Теперь считают не только stop-the-world паузы, но и конкурентную работу и дедупликацию строк. Можно посмотреть через лог cpu=info при завершении VM, обновили Hsperf-счетчики, есть доступ из кода. Плюс новый JFR-ивент с деталями по string dedup.

JEP 516: Aot Cache стал независим от выбранного GC и опций VM. Включение через опцию -XX:+AOTStreamableObjects.

G1 получил самые заметные улучшения: JEP 522 уменьшает синхронизацию между GC и приложением (цель - увеличить throughput). Еще: целевое использование CPU G1 по умолчанию снижено с 8% до 4%, добавили важнейший флаг UseGCOverheadLimit.

Статья

ph_piter 16 мар в 13:40

Прогнозирование цен на Airbnb в Нью-Йорке

13 мин

7.1K

Блог компании Издательский дом «Питер»Профессиональная литература * Машинное обучение * Python * Искусственный интеллект

Привет, Хаброжители! Мы открыли предзаказ на книгу «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ» Марка Райана и Луки Массарона. Предлагаем ознакомиться с главой 3 «Машинное и глубокое обучение».

Чтобы сравнить машинное и глубокое обучение с точки зрения простоты, сопоставим два решения для конкретной задачи классификации табличных данных: прогнозирование того, будет ли объект недвижимости, предлагаемый в аренду на платформе Airbnb в Нью-Йорке (NYC), иметь цену больше или меньше средней цены в объявлениях Airbnb на этом рынке.

Статья

Nickmob 16 мар в 13:37

Автоматические TLS-сертификаты в Angie с модулем ACME

Простой

9 мин

6.9K

Nginx * Информационная безопасность * *nix *

Туториал

В этой статье посмотрим на модуль ACME веб‑сервера Angie. Модуль позволяет с минимальными усилиями получить TLS‑сертификаты и автоматически их обновлять. Наверняка вы уже работали с бесплатными сертификатами от Let«s Encrypt и можете задать закономерный вопрос: зачем это делать веб‑сервером, когда есть утилиты вроде certbot, acme.sh и acmebot? Для ответа нужно хотя бы один раз попробовать модуль ACME и удобство конфигурации станет очевидным.»

Начнём с краткого введения в тему ACME.

Новость

runaway_llm 16 мар в 13:32

Стартап Percepta встроил «компьютер» внутрь ИИ — он выдает 30 тыс. токенов в секунду

2 мин

12K

Машинное обучение * Искусственный интеллект

Исследователи стартапа Percepta научили нейросеть выполнять программы на C самостоятельно — без вызова внешних инструментов. Модель на обычной архитектуре трансформера выдает более 30 000 токенов в секунду на CPU и безошибочно выполняет миллионы вычислительных шагов подряд.

+14

Новость

xtraroman 16 мар в 13:30

Дни ЭРЕМЕКС в промышленных центрах Поволжья – встречаемся в Чебоксарах и Казани

3 мин

4.7K

Блог компании ЭРЕМЕКСПроизводство и разработка электроники *

В этом году мы продолжаем серию мероприятий в городах, где сконцентрирован потенциал отечественной электронной отрасли. В марте мы проведем две встречи в Чебоксарах и Казани, ставя перед собой цель – сделать наши мероприятия эффективной площадкой не только для детальной демонстрации предлагаемых программных пакетов, но прежде всего для диалога с заказчиками, обсуждения актуальных вопросов по внедрению, решения конкретных технических задач, в т.ч. по интеграции САПР ЭРЕМЕКС в существующую ИТ-инфраструктуру предприятия.

Новость

nastyakopi 16 мар в 13:28

Новая конфигурация AI-тренинга и другие улучшения в продуктах Selectel

2 мин

4.9K

Блог компании SelectelИскусственный интеллектKubernetes * Серверная оптимизация * Серверное администрирование *

Привет, Хабр! Самый короткий месяц года запомнился большими обновлениями. Пополнили линейку конфигураций мощными флагманскими серверами для AI-тренинга и кластерных задач, добавили поддержку ephemeralStorage в Cluster Autoscaler и Karpenter и добавили новые образы в AI-маркетплейс. Под катом делимся главными улучшениями, а больше деталей ищите в Академии Selectel.

Статья

Filterdata 16 мар в 13:15

Почему нормализация контактных данных сложнее, чем кажется: опыт разработки движка очистки CRM-баз на Python

Простой

4 мин

7.4K

SaaS / S+S * Веб-разработка * CRM-системы * Проектирование API *

Обзор

Из песочницы

Грязные данные в CRM — это всегда дубли, ошибки в рассылках и «кривая» аналитика. В статье рассказываю, как я реализовал API для автоматической нормализации телефонов, email и имен на FastAPI, и почему простая проверка регулярками не заменяет систему оценки качества данных (QC).

Попробовать Demo API

Статья

Artem_leadl 16 мар в 13:15

Как мы отсеиваем 95% мусора из Telegram-чатов до того, как сообщение попадёт в LLM

Средний

6 мин

5.6K

CSS *

Обзор

Привет, Хабр!
Меня зовут Артём, я фаундер Leadl.ai. Мы строим AI-агента для поиска b2b-клиентов, и одна из его ключевых задач это мониторинг чатов и различных источников.
Звучит просто, пока не сталкиваешься с масштабом.

У нас в пуле 20000+ чатов в 15 источниках. Суммарно около 1000 000 000 сообщений в сутки. Из них реально полезных (запросы на услуги, поиск подрядчиков, вакансии) от силы 3-5%. Остальное: флуд, криптоспам, «доброе утро», мемы и бесконечные стикеры.

Задача: вытащить эти 3-5% качественных сообщений. Первой мыслью было отдать всё на откуп большой LLM типа GPT-4o. Посчитали. Среднее сообщение 50 токенов. 100 000 сообщений 50 токенов/сообщение ($10 / 1M токенов) = $50 в день только на input. Добавьте сюда output и prompt — и счёт легко перевалит за $100-150/день или $3000-4500/месяц. Для стартапа это путь в никуда.

Нам нужен был pipeline, который бы отсеивал мусор на ранних этапах, чтобы до дорогого LLM-скоринга доходило не более 5-10% от всего потока. Вот как мы его построили, через какие грабли прошли и что из этого вышло.

-1

Статья

interpres 16 мар в 13:01

Temporal: долгий процесс решения проблемы времени в JavaScript

Простой

15 мин

7.7K

Блог компании RUVDS.comJavaScript * Веб-разработка *

Обзор

Перевод

Как меняется JavaScript?

JavaScript уникален тем, что работает во всех браузерах. У него нет какого-то одного «владельца», поэтому нельзя внести изолированное изменение и ждать, что оно будет применено везде. Эволюция происходит через TC39 — Технический комитет, отвечающий за ECMAScript.

Предложения должны пройти последовательность этапов развития:

• Этап 0: идея.

• Этап 1: принято пространство задач.

• Этап 2: выбрана архитектура драфта, но работа продолжится.

• Этап 2.7: предложение одобрено в принципе; ожидает тестирования и обратной связи.

• Этап 3: реализация и обратная связь.

• Этап 4: предложение стандартизовано.

В 2018 году, когда я впервые изучал Temporal, он находился на Этапе 1. Комитет TC39 был убеждён, что проблема реальна. Это было радикальное предложение по добавлению в JavaScript новой библиотеки дат и времени. Она должна была:

• Стать заменой Date.

• Добавить новые типы DateTime (вместо единого API).

• Стать неизменяемой.

• Добавить поддержку часовых поясов и календаря.

Но как мы к этому пришли? Почему Date вызывает столько проблем? Чтобы ответить на эти вопросы, нужно вернуться назад.

+32

Статья

kmoseenk 16 мар в 13:01

Как писать изолированные интеграционные тесты с Testcontainers

Средний

9 мин

7.3K

Блог компании OTUSТестирование IT-систем * Тестирование веб-сервисов * PostgreSQL * .NET *

Туториал

Перевод

Интеграционные тесты любят все на словах, пока не доходит до окружения, зависимостей и плясок с подготовкой стенда. В статье разберем более практичный подход: как писать изолированные интеграционные тесты с Testcontainers, не превращая их в хрупкую конструкцию из моков и костылей. На примере PostgreSQL и .NET посмотрим, как собрать тестовую среду, которая ведет себя достаточно близко к реальности, но при этом остается воспроизводимой и управляемой. Тема не новая, а боль до сих пор вполне живая — так что давайте разбираться.

Разобрать подход

Статья

k0mar0v 16 мар в 13:00

Как недорогой MacBook Neo за $600 меняет рынок ноутбуков на Windows

4 мин

12K

Блог компании МТСIT-компанииИсследования и прогнозы в IT * Ноутбуки

Apple неожиданно выкатилa MacBook Neo — ноутбук всего за шесть сотен долларов. Само по себе устройство не выглядит чем-то экзотическим: компактный корпус, фирменный чип, обычный набор возможностей. Но именно цена сразу привлекла внимание. Макбуков за такие деньги раньше просто не было, поэтому новинка быстро стала одной из самых обсуждаемых тем в индустрии. Последствия для рынка могут быть весьма неожиданными. Попробуем разобраться, почему эта модель вызвала столько внимания и что она способна изменить.

+15

Пост

Информационная безопасность * Реверс-инжиниринг * Компьютерное железоФототехникаЭлектроника для начинающих

С моей точки зрения, программно‑аппаратный хакинг — это понимание того, как устроен объект исследования на самом низком уровне. Плата, компоненты, соединения и защитные механизмы — это первое, что мы изучаем, получив в руки новую «игрушку» для исследований.

И одна из задач специалистов в этой области — реверс‑инжиниринг. Мы разбираем устройство не ради разборки, а для чтобы понять его архитектуру, логику работы и способы защиты. И одним из инструментов, который для этого используется, является рентгеновское просвечивание.

Главная задача рентгена — это помочь нам разобраться в том, как разведена плата, где расположены ключевые компоненты и как они соединены между собой.
Кроме того, с учетом развития этого направления и роста ИБ‑зрелости вендоров‑разработчиков IoT, многие устройства специально проектируются для того, чтобы затруднить исследование: с ловушками, скрытыми дорожками, экранами, защитными слоями и другими элементами, которые не видны снаружи. Особенно это актуально в случаях, когда устройство или его отдельные узлы намеренно залиты компаундом. В таких обстоятельствах обычный визуальный анализ почти бесполезен, и на помощь приходит рентген, который позволяет понять, что именно скрыто внутри, без разрушения объекта на первом этапе.

Для нашей команды это не экзотика и не разовая практика, а стандартный рабочий инструмент. Мы располагаем необходимым оборудованием для выполнения таких исследований и регулярно используем рентгеновское просвечивание как часть базового процесса анализа устройств. Это позволяет нам быстрее получать представление о внутренней архитектуре изделия, заранее выявлять потенциальные антитамперные механизмы и аккуратнее планировать дальнейшие этапы реверс‑инжиниринга.

Возвращаясь к фото на превью: сможете ли вы сказать, какие компоненты присутствуют на плате, их предназначение и, в принципе, что это за устройство?

🧠 Обязательно поделись с теми, кому это может быть полезно:
💬 Телеграм | 💬 Max | 📝 Хабр | 💙 ВКонтакте

-3

Статья

aleontyev 16 мар в 12:50

Что больнее OT или CRDT в совместном редактировании? И почему до сих пор нет идеала?

Средний

26 мин

9.1K

Блог компании МойОфисC++ * Текстовые редакторы и IDE * Программирование * Научно-популярное

Обзор

Привет, Хабр!

Меня зовут Антон Леонтьев, я старший разработчик в команде ядра редакторов МойОфис. Мы создаём офисные приложения, которыми ежедневно пользуются более 12 500 организаций, и совместное редактирование — одна из ключевых возможностей наших продуктов.

И знаете, что самое обидное в этой теме? За 35 лет исследований были опубликованы сотни научных работ. Google Docs работает с 2006 года. У Figma, Notion и Linear свои реализации. Казалось бы, задача давно решена, но стоит копнуть глубже, и становится понятно: универсального решения нет.

В Google Drive и Dropbox до сих пор всплывают баги с одновременным перемещением папок. В Notion при параллельном редактировании одного и того же абзаца можно потерять часть изменений. Даже Yjs — самая популярная CRDT-библиотека — не хранит полную историю документа в привычном для нас виде.

В этой статье разберём теорию, узнаем, какие проблемы решают Operational Transformation (OT) и Conflict-free Replicated Data Types (CRDT), на каких математических идеях они основаны, чем отличаются архитектурно и какие компромиссы неизбежно возникают в каждом подходе.

Интересно узнать, почему даже Google не смог сделать идеальное решение? Детали под катом.

+33

1 2 ...

31 32

34 35 ...

49 50