Инструмент Depixelization PoC вытаскивает текст из скриншотов и фото, убирает пиксельный хаос и делает буквы читаемыми. Починит даже самые безнадёжные блоки текста. Использует метод De Bruijn sequence для точного восстановления букв. Подходит для документов, конспектов, рефератов и всего учебного.
Представлен ресурс Uchinoko, который восстанавливает справедливость между пушистыми питомцами и людьми. Можно детально воссоздать своего кота/собакена в цифровом формате. Результат выгружается в SNS-иконку.
Пользователи жалуются, что новые иконки Microsoft плохо различимы в «стеклянном» интерфейсе iOS 26. Со временем подключается память, но в первое время не всегда получается быстро найти нужное приложение. Больше всего похожи друг на друга иконки Excel, Word и OneNote. Самое яркая их отличительная черта — цвет, которого в «стеклянном» интерфейсе нет.
Это мобильный инструмент для руководителей среднего бизнеса. Идея была амбициозной: дать руководителям мобильный инструмент, в котором они могли бы за пару минут понять, что происходит с их бизнесом и банком. Дизайнеры и исследователи прошли путь от первых прототипов до зрелого продукта с retention 75%, и вместе с ним выросли сами.
Статья будет полезна исследователям, которые хотят развивать свои навыки на реальных кейсах, продуктовым командам, которые ищут баланс между гипотезами, данными и интуицией и всем, кто интересуется UX-исследованиями, сложными аудиториями и развитием продуктов с нуля.
Привет, Хабр! Наверное, я занимаюсь какой-то ерундой, но любопытство взяло верх. Однажды я нашёл интересную статью и очень захотел повторить эксперимент самостоятельно, ну и, конечно, написать статью по результатам. В качестве подопытного была выбрана отечественная оперативная память К565РУ5Г.
TL;DR Автор успешно использует старую микросхему памяти в качестве фотодатчика получает несколько Ч/Б изображений.
Сложностей с тем, чтобы писать и читать в память не возникло, но возникли проблемы другого толка. Во-первых, из засвеченного кристалла читается странный паттерн, при этом в темноте память отдаёт ровно то, что в неё записывали, кристалл не повреждён при вскрытии.
Паттерн
Вторая проблема - самый душный этап этого квеста. Нужно сопоставить логический адрес каждой ячейки памяти с её физическим расположением. Всё, что у меня получилось извлечь из полученной каши - засветку/затенение блоков 64 на 64 точки. Т.е. кристалл реагирует на свет, но получить что-то внятное не получается.
Заранее с благодарностью призываю коллективный разум на помощь. С меня интересный материал.
Открытый проект AI Video Transcriber помогает транскрибировать видеоролики в сжатый и отлично написанный текст. Работает просто, вытаскивает текст из любых видео за секунды, а потом корректирует и делает подробное саммари. Решение поддерживает более 30 самых популярных площадок, в том числе YouTube, TikTok, Bilibili и прочие. Проект не просто вытаскивает текст из видео, но делает настоящее эссе: дополняет фразы и реплики, корректирует факты и мысли, редактирует текст и доводит до идеала. Основа — Fast Whisper (лучшая нейронка для транскрибации видео). Может смотреть видео и сразу же выдавать текстовые материалы и уточнения. Сегментирует видео на 20-минутные отрывки и делит их на разделы, чтобы проще было изучать материал.
В своё время моё отношение к аудиокнигам изменилось благодаря легендарному проекту «Модель для сборки» с Владом Коппом. Именно благодаря МДС я понял, что книги можно не только читать, но и прекрасно воспринимать в формате аудио. Аудиоформат даёт возможность знакомиться с произведениями в дороге или во время прогулок. Прекрасно помню времена, как загружал в свой MP3-плеер на 512 МБ выпуски МДС и, вместо того чтобы ехать с работы в тесной маршрутке, устраивал себе полуторачасовые прогулки в компании очередного фантастического рассказа.
Эпоха аудиоизобилия
Сегодня выбор аудиокниг несравним с тем, что было пятнадцать лет назад. В интернете можно найти огромное количество как профессионально озвученных произведений, так и любительских версий. Однако даже при всём этом богатстве выбора нередко встречаются книги, которые до сих пор никто не озвучил.
Например, один из моих любимых циклов — «Зоны мысли» Вернора Винджа. «Пламя над бездной», «Глубина в небе» и «Болтушка» легко найти в сети. А вот заключительную часть — «Дети неба» — увы, никто не озвучил.
Поскольку мы живём в эпоху искусственного интеллекта, решение приходит само собой: если нужной аудиокниги нет — сделай её сам. Требования у меня простые, без претензий:
Качество должно быть приемлемым;
Платить не хочется, поэтому все должно быть полностью бесплатным.
Голос
Вспомнил я про сайт OpenAI FM — демо-площадку голосовой модели gpt-4o-mini-tts . Она звучит естественно и хорошо справляется с русским языком. Выбор из 11 разных дикторов. А так же есть классная фитча - промт инструкции для стиля речи, благодаря чему можно управлять «подачей» — делать её более спокойной, вдохновлённой или нейтральной . Поигравшись с промтами и выбрав голос, переходим к следующему этапу. На сайте можно бесплатно генерировать небольшие аудиофрагменты длиной до 999 символов. Ограничение не стало проблемой. Берем Python + Selenium WebDriver, и получаем программу, которая:
делит текст книги на чанки нужной длины,
отправляет их на сайт,
сохраняет аудиофайлы,
затем объединяет всё в одно произведение с помощью FFmpeg.
Результат получился неожиданно достойным. Да, между фрагментами иногда чувствуется разница в тембре, особенно в первые секунды. А ударения не всегда точны и изредка проскакивает лёгкий акцент. Но в целом — получилась полноценная озвученная аудиокнига.
Музыкальная подложка
После того как книга была готова, захотелось добавить фоновую музыку. Можно было просто подобрать подходящий трек, но ради спортивного интереса я решил сгенерировать музыку самостоятельно.
Платные сервисы вроде Suno или Udio я сразу отбросил. Зато вспомнил про Google AI Studio, где в разделе Build есть приложение PromptDJ MIDI. Оно позволяет создавать музыку прямо в браузере — достаточно задать стиль и параметры.
Скопировал прямо в Studio приложение, в промпте указал стиль space ambient и добавил возможность скачивания получившегося трека. Поигравшись с настройками в полученном приложении, получил именно то, что меня устроило.
Оставалось объединить музыкальную дорожку с голосом — снова помог FFmpeg.
Инструменты:
OpenAI FM — генерация речи;
Google AI Studio (PromptDJ MIDI) — генерация фоновой музыки;
Python + Selenium + FFmpeg — автоматизация и сборка.
Затраты: 0 долларов и несколько часов времени.
Итог: Получилась аудиокнига приличного качества с музыкальным сопровождением. Конечно, это не уровень профессиональных дикторов , но для личного использования — IMHO более чем достойно. Плюс абсолютно бесплатно.
По информации СМИ, OpenAI хочет показывать в ChatGPT таргетированную рекламу прямо в чат-боте на основе переписок с ИИ. Например, если пользователи говорят о спорте, им предложат спортивную форму или добавки. Контекст ИИ будут юзать, чтобы показывать больше рекламы. Если пользователи отключат рекламу, то лишатся всей памяти чат-бота. Контекста больше не будет, всю работу придётся организовать снова.
17 открытых репозитариев, чтобы выучить Python с нуля:
30-Days-Of-Python — пошаговый курс на 30 дней: синтаксис, типы, функции, ООП, файлы, модули, мини-проекты и задания с решениями;
Python Basics — вся база и примеры по основам для новичков;
Learn Python — конспект тем с наглядными примерами и ссылками; удобно как быстрый справочник и повторение;
Python Guide — лучшие практики: окружение, управление пакетами, стиль, тестирование, деплой, инструменты;
Learn Python 3 — понятные ноутбуки и упражнения по Python 3. Лучший репо для самостоятельной практики;
Python Programming Exercises — 100+ задачек по базовым темам с решениями; Coding Problems — алгоритмические задачи, разбитые по темам и сложности. Идеально для подготовки к собеседованиям;
Блогер показа самый иммерсивный рабочий стол по Minecraft. Ярлыки программ и игр красивенько размещены в слотах персонажа — можно даже открывать «инвентарь» персонажа. Для такого модного сетапа понадобятся три вещи — Windows 11, Rainmeter Skins и Wallpaper Engine. Последние две программы позволяют создать обои на любую тематику.
Всем привет! Меня зовут Владимир, я мобильный разработчик в «Финам». В одном из недавних проектов нужно было добавить в интерфейс Jetpack Compose визуальные эффекты поверх контента, например размытый хедер или движущуюся «лупу».
Обычно такие приемы встречаются в играх, где весь экран — это фактически полотно для рисования OpenGL. В классической XML-разметке UI я с таким не сталкивался, поэтому пришлось довольно глубоко погрузиться во внутреннюю кухню Compose. Этот разбор может быть полезен тем, кто решает похожие задачи.
Сначала на Stack Overflow я нашел неплохой пример создания эффекта размытия на определенном участке экрана — к сожалению, это решение не было универсальным и зависело от верстки. Однако мое внимание привлекли два класса из фреймворка: RenderNode и GraphicsLayer.
Если коротко, можно захватить часть экрана через GraphicsLayer, а в RenderNode записать контент. Но перед этим его можно обработать. После обработки метод drawWithContent() выводит результат в canvas.
Сначала я попытался модифицировать эффект размытия из ответа на Stack Overflow, затем сделал размытие в форме круга, который движется вслед за пальцем, и постепенно пришел к окончательному варианту с движущейся прозрачной линзой. Код для отрисовки эффекта я показал в статье.
В результате можно получить эффект линзы, которая будет перемещаться за пальцем, если водить им по экрану.
Какие выводу я могу сделать:
в Compose можно делать крутые визуальные эффекты, если покопаться в RenderNode;
это неочевидный, но мощный инструмент, он дает простор для кастомизации.
Мой пример не самый изобретательный, но способ, который я показал, открывает почти безграничные возможности для реализации визуальных эффектов в Android-разработке, чем мы в «Финам» и пользуемся очень активно в наших финтех-проектах. Итоговый результат оформил в GitHub-репозитории — берите и пробуйте в своих проектах.
На Hugging Face вышел новый инструмент для вайбкодеров. Это среда для создания мощнейших ИИ-агентов openEnv, где можно собирать, подключать, интегрировать, тестировать и масштабировать агентов под свои задачи. Там же можно обучить с подкреплением собственную нейронку. Есть полный комплект для работы: плагины, инструменты, API, контекст и прочее. Результат — автоматизация задач и проектов, целые приложения и сервисы под контролем ИИ, а также системы из связанных ИИ-агентов.
На канале AlphaPhoenix вышло видео, в котором инженер Брайан Хайдет показал камеру собственной разработки, способную снимать 2 млрд кадров в секунду.
«Я обновил оборудование! На это ушел почти год, но сегодня я наконец‑то могу показать вам камеру, снимающую со скоростью ДВА миллиарда кадров в секунду! Я очень хочу записывать с помощью этой камеры преломление, интерференцию и другие удивительные явления, но сегодня я исследую очень странную особенность скорости света. В каком‑то смысле, понимание этого необычного явления является своего рода необходимым условием для всего остального, что я хочу делать с этой камерой — надеюсь, вам это покажется таким же интересным, как и мне!», — пояснил Хайдет.
Токсичная продуктивность: чит-код или верный путь к выгоранию?
Что делать, если результат стал важнее процесса, но получать удовольствие от работы по-прежнему хочется? Как быть, если сотрудники не поспевают за вашим темпом? И где эта грань между «эффективностью» и «токсичной продуктивностью»?
Гость нового выпуска «Свободного слота» — Максим Ульянов, Head of Client Development в RUTUBE, автор ULYANOV.LIFE и ведущий подкаста «Куда расти?». Вместе с ведущими Сашей Прокшиной, Пашей Федотовым и Сашей Афёновым разбираемся:
как оставаться собой в погоне за результатом?
действительно ли токсичная продуктивность — двигатель карьеры?
Подписывайтесь на канал AvitoTech в Telegram, там мы рассказываем больше о профессиональном опыте наших инженеров, проектах и работе в Авито, а также анонсируем митапы и статьи.
Как Dodo Brands развернула 1С в облаке Cloud.ru и ускорила выгрузку отчетов в два раза 📙☁️
Что за компания
Dodo Brands — компания, которая развивает бренды быстрого питания через франчайзинг и открыла более 1 500 точек в 26 странах мира. Сейчас у Dodo Brands есть популярные сети: пиццерии «Додо Пицца» и кофейни «Дринкит».
У компании есть своя IT-команда Dodo Engineering и технологическая платформа Dodo IS. Dodo Brands разработала сайты и приложения для своих сетей, умную выдачу в кофейнях и систему управления ресторанами, где можно планировать все бизнес-процессы: назначать смены, отслеживать заказы, анализировать продажи в реальном времени.
Какая была задача
В Dodo Brands «1С:Бухгалтерия» — важная система, которая влияет на все процессы в компании. От стабильной работы 1С напрямую зависит прибыль и удовлетворенность клиентов. К примеру, если что-то даст сбой, тесто или кофейные зерна приедут позже. Посетители останутся без пепперони или капучино, а точка недополучит денег.
Сначала Dodo Brands арендовала ПО. Чтобы все работало стабильнее, компания решила закупить лицензии и перейти в частное облако для хостинга всех своих сервисов. Dodo Brands начала сотрудничать с популярным облачным провайдером, но возникла проблема: работа бухгалтеров в 1С стала занимать в два раза больше времени, а работа самой системы замедлилась втрое.
Бухгалтерия не хотела тратить пять часов на закрытие месяца, а еще такой расклад не устраивал IT-команду, поэтому Dodo Brands решила сменить поставщика облачных услуг.
Как ее решили
Изначально рабочая база данных Dodo Brands размещалась на IT-ресурсах предыдущего провайдера, но с БД начались непредвиденные проблемы. Важно было быстро восстановить работу: от 1С зависят поставки продуктов, и сбой мог бы повлечь приостановку всех бизнес-процессов.
Во время неполадок с БД Dodo Brands уже тестировала сервисы Cloud.ru, они выигрывали по сравнению с предыдущим поставщиком облачных услуг. По итогам теста команде понравился результат, и компания решила перенести IT-инфраструктуру в облако Cloud.ru.
Сначала команда Dodo Brands использовала мощности Cloud.ru, чтобы восстановить работу БД. А еще удалось сократить время отладки процессов. После этого развернула копию 1С-инфраструктуры — виртуальные машины с определенным количеством процессоров и оперативной памяти.
При миграции развернули восемь ВМ для приложений, баз данных и веб-сервера. Тестирование длилось три недели, а миграция заняла всего один день. Мы всегда были на связи с менеджером компании и подключали круглосуточную техподдержку.
Что в результате
Время выгрузки отчетов из «1С:Бухгалтерии» сократилось в два раза: с 5 до 2,5 часов благодаря миграции в Advanced Elastic Cloud Server.
Перенесли в облако рабочую БД прямо во время теста сервисов Cloud.ru. Как итог — работа БД быстро восстановилась, а еще сократилось время на отладку.
Обеспечили стабильную работу 1С в облаке. Это позволило Dodo Brands четко планировать бизнес-процессы и не тратить время на устранение неполадок.
Читайте полный кейс, чтобы узнать больше о ходе работы и полученных результатах 🚀
Молния Маккуин теперь в реальном мире за $300 — Sphero выпустили интерактивного робота, который ездит, дрифтит и откликается на голосовые команды. Маккуин управляется через приложение на смартфоне и выглядит почти как живой: на лобовом стекле появляются эмоции, загораются фары, а мотор рычит по-настоящему. Из динамиков звучат легендарные фразы — «Кчау!» и «Я — скорость!» прямо из мультфильма. Заряжается через порт в «бензобаке».
Из чего состоит хороший промпт для генерации картинок
Промпт — это текстовая инструкция для нейронки, от его качества напрямую зависит конечный результат. Искусственный интеллект не умеет читать мысли или угадывать ваши предпочтения, а потому задачу ему надо ставить детально, конкретно и точно. Попробуем разобраться, как именно.
Предположим, мы хотим изобразить кота-самурая. Первым делом создаем черновой промпт — тот самый, с которого всё начнется. Не стоит думать, что достаточно будет сформулировать одно подробное техзадание для нейронки — их абсолютно точно будет несколько. И может быть, даже много.
В базовом промпте мы описываем идею в целом. Делаем это прямо, просто и с минимумом деталей. Наша цель — задать субъект и обстановку. Например, так: кот-самурай под цветущим деревом сакуры. Смотрим, что сгенерировала модель, и оцениваем, что нам нравится, а что нет. Изображение доработаем позже.
Советы по формированию базового промпта:
Пишите как для машины, а не как для человека. Лучше использовать английский язык, четко задавать субъект, избегать опечаток и ошибок, отделять части промпта друг от друга запятыми. Модели вроде Stable Diffusion 1.5 и 2.1 вообще лучше работают с тегоподобными описаниями.
Важно не сколько слов мы используем, а какие это слова. Вообще в разных моделях разные ограничения по количеству символов. У Midjourney это 60 слов, а у Stable Diffusion — примерно 75. Но базовый промтп не стоит превращать в книгу: лучше задать ему образ четко и по делу, а доработать позже.
Проверяйте ключевые слова. Если вы задаете стиль какого-то художника, но ИИ его игнорирует, вероятно, модель просто его не знает. Если сомневаетесь в промпте или каком-то его составном элементе, вбейте этот элемент отдельно и посмотрите, как модель с ним работает в целом.
Некоторые атрибуты тянут за собой другие. Нейронка понимает смыслы не так, как человек. У нее есть ассоциации, и она подтягивает одни атрибуты к другим. Например, голубые глаза могут подтянуть европейские черты лица. Если описывается атрибут, который может нести ассоциации (а они не нужны), лучше дописать, что именно вы хотите видеть.
ИИ хорошо понимает, как общаться с ИИ. Не знаете, как составить базовый промпт — просто попросите об этом ChatGPT. Он справится с этой задачей на отлично. Также есть специальные сайты: PromptHero, PromptBase и др.
Сегодня — тот самый день, когда решительность имеет цену.
Скидка 15% на все IT-курсы, стартующие в октябре, действует до конца суток. Завтра она снизится до 10%. Ещё через несколько дней — до 5%. А потом и вовсе исчезнет.