Pull to refresh
-1
0.1
Send message

Как научить LLM понимать видео? Обзор подходов

Level of difficultyMedium
Reading time9 min
Views2.7K

Всем привет! Сегодня поговорим про задачу понимания видео и эволюцию подходов к обучению мультимодальных больших языковых моделей для этой задачи.

Video Understanding — направление на стыке компьютерного зрения (CV) и обработки естественного языка (NLP), включающее в себя множество разнообразных задач на восприятие и интерпретацию видео. От базового распознавания предметов и объектов в видеоряде, локализации объектов в пространстве или во времени, подсчета предметов и людей, до генерации кратких или развернутых описаний видео и задач на рассуждения о причинах происходящего на видео, требующих глубокого понимания мира — от человеческой психологии до физических свойств объектов. 

Читать далее
Total votes 21: ↑21 and ↓0+30
Comments0

Почему GitHub на самом деле победил: история глазами сооснователя

Level of difficultyEasy
Reading time17 min
Views9.6K

Недавно мы опубликовали в блоге перевод статьи о том, как GitHub заменил SourceForge в роли доминирующей платформы для хостинга кода. Но, как справедливо отметил автор оригинала, его мнение основано на открытых источниках и интервью с коллегами. А потом своим ви́дением поделился один из сооснователей GitHub, Скотт Чакон, который «действительно был там». Под катом — перевод его ответной статьи о реальных причинах победы GitHub. 

Читать далее
Total votes 42: ↑39 and ↓3+45
Comments6

«Умная дача» реального человека, без рекламных интеграций

Reading time17 min
Views33K

Начитавшись рекламных статей из цикла «умная дача», и испытав достаточно сильную фрустрацию от качества контента и «адекватности» предлагаемых технических решений, решил поделиться своим опытом автоматизации загородного дома.

Зайти в Изнакурнож:
Total votes 60: ↑60 and ↓0+60
Comments44

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Level of difficultyEasy
Reading time27 min
Views90K

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Давайте выясним →
Total votes 229: ↑223 and ↓6+252
Comments351

Как за один день сделать месячный объем работы и перестать тревожиться — пошаговая инструкция

Level of difficultyEasy
Reading time3 min
Views52K

Меня зовут Слава Усов. В 20 лет я уехал в экспедицию в Антарктиду и с тех пор пожил и поработал практически на всех континентах. От ученого до операционного менеджера в Африке и на Ближнем Востоке. Очень разный опыт. Самоорганизацией я увлекся лет восемь назад — триста писем в день, пару сотен сотрудников, мне было на чем практиковаться.

Читать далее
Total votes 69: ↑60 and ↓9+62
Comments115

LSTM – сети долгой краткосрочной памяти

Reading time8 min
Views228K

Рекуррентные нейронные сети


Люди не начинают думать с чистого листа каждую секунду. Читая этот пост, вы понимаете каждое слово, основываясь на понимании предыдущего слова. Мы не выбрасываем из головы все и не начинаем думать с нуля. Наши мысли обладают постоянством.

Традиционные нейронные сети не обладают этим свойством, и в этом их главный недостаток. Представим, например, что мы хотим классифицировать события, происходящие в фильме. Непонятно, как традиционная нейронная сеть могла бы использовать рассуждения о предыдущих событиях фильма, чтобы получить информацию о последующих.

Решить эту проблемы помогают рекуррентые нейронные сети (Recurrent Neural Networks, RNN). Это сети, содержащие обратные связи и позволяющие сохранять информацию.
Читать дальше →
Total votes 41: ↑39 and ↓2+37
Comments4

Мозг придумает отмазки почему вам не надо заниматься спортом

Reading time8 min
Views24K

В предыдущих статьях мы все разбирали пользу физической активности и ее влияние на организм на разных уровнях. Все и так понятно, мы созданы как двигательные механизмы, без движения организм «ржавеет».  Но что ж все мы так до сих пор придумываем отмазки, чтобы не идти на тренировку или пробежку, а полежать на диване?

За последние годы появились многочисленные гаджеты и девайсы, которые призваны помогать заниматься спортом, считать калории, физическую активность в шагах и интенсивность выполненных нагрузок, состояние здоровья, пульс, учитывать вес и процент жира. Приложения для фитнеса пытаются вовлечь в игру, мотивировать заниматься, обещая призы, баллы и значки за выполненные тренировки. Но в большинстве случаев это не работает, ИТ-решения слабо помогают, так как за годы эволюции наша внутренняя биохимия и нейропроцессы не поменялись так сильно, как поменялся окружающий мир.

Мы все те же первобытные люди с теми же инстинктами и тягой к углеводам, управляемые гормонами, живущие в стрессе, а дешевая и доступная доставка еды с быстрыми углеводами и жирами хорошо успокаивает. Мозг призван защитить нас в неблагоприятных условиях окружающей среды, а миллионы лет эволюции проходили только в условиях недостатка пищевых ресурсов. Наш мозг все еще по-древнему пытается экономить силы и энергию и стремится при первой возможности запасти жировые запасы на случай голодных времен. Он не понимает, что их нет, так как не сталкивался с такими условиями за все миллионы лет эволюции, поэтому у нас и нет ограничения по верхней планке запасов жира, некоторые люди весят 500–600 кг.

Читать далее
Total votes 32: ↑22 and ↓10+19
Comments156

Что будет, если выйти из IT?

Level of difficultyEasy
Reading time3 min
Views85K

Размышляя на тему минусов IT, я вспомнил историю моего знакомого Сергея, который работал на позиции Senior Java Developer в одном российском банке. В какой-то момент его настолько припекло, что он решил выйти из IT. «Прощай, немытое айти! Страна рабов, страна господ!», — браво повторял он, когда увольнялся. Как думаете, что из этого вышло?

Читать далее
Total votes 159: ↑100 and ↓59+66
Comments469

Вы точно хотите быть Data Scientist-ом?

Level of difficultyEasy
Reading time8 min
Views20K

Прочитав замечательную статью от @dalerank, я подумал, а чем собственно мы хуже: моя любимая индустрия тоже полна мифов и разочарований, особенно учитывая недавние "прорывы в AI" и хайп вокруг больших языковых моделей по типу ChatGPT.

Создается ощущение, что теперь каждая компания считает, что у ей непременно нужно прикрутить волшебную вундер-вафлю на машинном обучении к каждому своему продукту, добавить AI в рекламную кампанию, и дела пойдут в гору. Шутка ли, этот ваш пресловутый AI теперь даже в холодильниках есть.

Ну а если на рынке растет спрос, значит должно расти и предложение, в следствие чего я вижу все больше людей, которые приходят к нам в болото с горящими глазами и готовностью перевернуть этот мир, а в итоге разбиваются о скалу реальности.

Нет, скорее всего вы не будете создавать state of the art (SOTA) системы, которые будут рисовать, искать информацию и писать код лучше, чем эти бесполезные кожаные мешки. А даже если будете - это будет только 20% вашей работы. Так ли это грустно? - я постараюсь рассказать под катом.

Читать далее
Total votes 15: ↑14 and ↓1+15
Comments3

4 миллиарда операторов if

Level of difficultyMedium
Reading time7 min
Views114K

Просматривая недавно соцсети, я наткнулся на этот скриншот. Разумеется, его сопровождало множество злобных комментариев, критикующих попытку этого новичка в программировании решить классическую задачу computer science: операцию деления с остатком.

В современном мире, где ИИ постепенно заменяет программистов, отнимая у них работу и совершая переворот в том, как мы подходим к рассуждениям о коде, нам, возможно, следует быть более открытыми к мыслям людей, недавно пришедших в нашу отрасль? На самом деле, показанный выше код — идеальный пример компромисса между временем и задействованной памятью. Мы жертвуем временем и в то же время памятью и временем компьютера! Поистине чудесный алгоритм!

Поэтому я решил изучить эту идею проверки чётности числа при помощи одних сравнений, чтобы понять, насколько хорошо она работает в реальных ситуациях. Я сторонник высокопроизводительного кода, поэтому решил реализовать это на языке программирования C, потому что он и сегодня остаётся самым быстрым языком в мире с большим отрывом от других (благодаря гению Денниса Ричи).

Читать далее
Total votes 312: ↑295 and ↓17+342
Comments153

Построение графиков в LaTeX/PGFPlots

Reading time13 min
Views99K
image

Данная статья посвящена описанию работы с пакетом PGFPlots, разработанного для популярной настольной издательской системы LaTeX. Однако, если вы даже не знакомы с последней, это не повод расстраиваться и бросать чтение этой статьи, ведь, возможно, те замечательные примеры, которые будут далее приведены, и необычайная мощность и удобство PGFPlots вдохновят вас на изучение LaTeX.
Читать дальше →
Total votes 53: ↑53 and ↓0+53
Comments20

Как проклятие невидимой стены ждало меня 20 лет

Reading time5 min
Views40K


Когда на меня накатывает хандра, я бросаю всё и пилю свой игровой движок. Это неблагодарное занятие, но меня прёт.


В самом начале у меня были такие планы: вжух-вжух, щас возьму ведро, накидаю туда всяких библиотек для графики, физики и звуков, добавлю сетевую библиотеку по вкусу, перемешаю всё с какой-нибудь системой сообщений, и готово. Приключение на 15 минут.


И вот я тут спустя 5 лет.

Читать дальше →
Total votes 130: ↑127 and ↓3+165
Comments47

Мы не на 50% мама и на 50% папа, как думали раньше

Level of difficultyMedium
Reading time8 min
Views92K


Я был в шоке, когда недавно узнал, что на самом деле я не наполовину мама и наполовину папа, как думал всегда. И вы тоже, кстати. Но это и к лучшему: если бы мы получили равные дозы генетических инструкций от своих родителей, то вероятно, не прожили бы и нескольких недель, или родились с большими отклонениями.

Читать дальше →
Total votes 115: ↑94 and ↓21+99
Comments133

Бардак в идеальном мире. Часть 1

Level of difficultyMedium
Reading time14 min
Views28K

Откуда берëтся динамический хаос в простейших механических системах? Как его изучать? А это настоящий хаос или просто что-то очень сложное?

Я начинаю мини-серию статей, в которой мы будем понемногу знакомиться с элементами теории хаоса. За последние полвека сформировался набор классических примеров, кочующих из одного популярного введения в другое: аттрактор Лоренца, логистическое уравнение, двойной маятник, подкова Смэйла и т.п. Я, конечно, их упомяну, но мне бы хотелось показать что, кроме классики, есть хаотические системы, обойдённые вниманием, но, тем не менее, имеющие малую размерность и вполне ясные физические модели, при этом способные порождать красивые и сложные, примеры хаотического поведения, поддающиеся объяснению.

Это пример небольшого исследования, доступного студентам младших курсов, поэтому я позволю себе привести некоторые подробности анализа, которые искушённому читателю могут показаться излишними. Моя задача показать, что даже очень простые системы могут быть очень интересными, красивыми и доступными для глубокого анализа. И, конечно же, это повод показать симпатичные картинки, как правило, фрактальные. Ведь все же любят фракталы, верно? Ну, поехали!

Читать далее
Total votes 153: ↑153 and ↓0+153
Comments60

10 первых ошибок в карьере ML-инженера

Level of difficultyEasy
Reading time12 min
Views27K

Работа ML-инженера заключается не только в обучении моделей — хороший специалист погружается в бизнес-контекст, умеет доносить мысли до коллег без ML-бэкграунда, а также не забывает про тесты, дизайн-документы и документацию. 

Богдан Печёнкин, автор Симулятора ML, собрал 10 ошибок специалистов, которые зачастую встречаются в первые годы карьеры.

Узнать больше
Total votes 39: ↑39 and ↓0+39
Comments23

Математическая продлёнка. Математика кривого пропеллера

Level of difficultyEasy
Reading time3 min
Views15K

Вы, наверняка, знаете отчего "гнётся и рвётся" пропеллер на цифровых фото и видео. А какую именно форму принимают лопасти винта? Как зависит их видимая форма от скорости вращения? И причём здесь гиперболы?

Приглашаю любопытных любителей самолётов на небольшое занятие математического кружка.

Читать далее
Total votes 125: ↑125 and ↓0+125
Comments22

Джефф Дин из компании Google — это Чак Норрис нашего времени

Reading time4 min
Views224K
«Джефф Дин компилирует и запускает свой код перед коммитом, но только чтобы проверить на баги компилятор и CPU», — вот один из множества шуточных фактов о Джеффе Дине.

Джефф Дин считается кем-то вроде Чака Норриса. Отличие только в том, что он вовсе не герой боевиков, а инженер-программист компании Google.

Шутки о нём впервые появились на 1 апреля шесть лет назад. Один из коллег Дина по имени Кентон Варда открыл страничку, куда каждый мог добавлять факты о Джеффе Дине. Идею с энтузиазмом подхватили другие разработчики — и вскоре наполнили страничку множеством таких «фактов».
Читать дальше →
Total votes 395: ↑364 and ↓31+333
Comments123

Название имеет значение: как получить оптимизацию, переименовав браузер

Reading time4 min
Views37K

Всем привет! Меня зовут Максим Смирнов, я руковожу командой, которая работает над производительностью Яндекс Браузера и отвечает за его графическую подсистему. В этой статье я расскажу об одном неочевидном улучшении, которое наша команда внедрила в Браузер для Windows. Если описать его в двух словах, то нам удалось улучшить стабильность и производительность браузера, убедив драйверы видеокарт, что наше приложение — это Google Chrome.

Читать далее
Total votes 137: ↑136 and ↓1+172
Comments78

Почему я советую писать статьи именно сейчас

Reading time9 min
Views4.6K

Привет, я редактор блога Максилект на Хабре. Сегодня я впервые буду высказываться от своего имени. Расскажу, как выглядит история с нашим блогом в ракурсе событий последнего года и почему ИТ-специалистам все еще стоит тратить время на написание статей.

2022 год был непростым для тех, кто занимается контентом. И блог на Хабре, несмотря на свою аполитичность, не исключение. Пришлось наблюдать за происходящим и подстраиваться. Зато по итогам есть интересные цифры, которые лично в моей голове впервые превратили абстрактные графики в статистике публикаций в реальные человеческие истории.

Но обо всем по порядку.

Читать далее
Total votes 15: ↑11 and ↓4+15
Comments11

Осознанная ходьба для удаленщика

Reading time7 min
Views29K

Я работаю на полной удаленке уже 10 лет. Стоит ли говорить, что проблема сидячего образа жизни все эти годы стоит ребром? Мой пример немного не типичен тем, что какое-то движение в жизни было всегда - сидячей работе сопутствовали эпизодические высокие нагрузки пару раз в месяц (выезды в условный лес). Но этого определенно недостаточно. Нужна именно регулярность.

Сегодня расскажу про самую простую физическую активность из тех, которые можно практиковать каждый день - обычную (не спортивную) ходьбу. Под катом о том, почему она отлично подходит в том числе для удаленки и насколько масштабными могут быть результаты от банальных прогулок.

Читать далее
Total votes 56: ↑55 and ↓1+66
Comments187
1
23 ...

Information

Rating
3,437-th
Registered
Activity