Как стать автором
Обновить

Как узнать количество видеороликов на Youtube

Время на прочтение2 мин
Количество просмотров53K
Автор оригинала: Artem Russakovskii
Если верить Википедии, в апреле 2006 года, число видеороликов на Youtube было около 83.4 миллиона. Но если перейти по ссылке в примечании, сейчас отображается "“*” video results 1 — 20 of millions" ("“*” видео результатов 1 — 20 из миллионов").

Вот таким способом я нашел примерное количество видеороликов на Youtube. Идея проста. Взять этот фид: gdata.youtube.com/feeds/api/videos/-* и определить количество строк внутри тэга <opensearch:totalresults>.
И так: количество видеороликов на Youtube колеблется примерно между 141 и 144 миллионами. Это чиcло периодически растет и снижается, что показывает что число примерно соответствует истине.
Это огромная куча видео :) Что бы определить, сколько примерно занимают места эти все видео ролики, посчитаем его по такой формуле:
142,500,000 * (a + b + c + d), где
  • a = средний размер FLV видео, пусть будет 4 МБ, но наверно это далеко от истины. На Youtube много коротких видеороликов, и у Youtube есть ограничение на длину — 10 минут. Все же, это приблизительная цифра.
  • b = средний размер MP4 видео, пусть так же будет 4 МБ. Есть много факторов, которые влияют на эту цифру, один из которых это то что я не знаю когда Youtube начали генерировать MP4, и генерировали ли они их для всех роликов, или нет.
  • c = примерный размер всех изображений который прикреплены к роликам. Пусть будет, скажем 50 КБ.Маленькие превьюшки и большие скриншоты не занимают много места.
  • d = средний размер оригинальных видео роликов, закачанных на Youtube. Они могут удаляться сразу после кодирования в FLV, или скорее всего Youtube хранит их несколько месяцев, или если они действительно безумны, то они хранят ВСЕ оригинальные ролики. Возьмем примерное случайное число — 50 МБ.

Итак, просто FLV и MP4 файлы, а так же картинки занимают примерно ((4 МБ) + (4 МБ) + (50 КБ)) * 142 500 000 = 1.06818788 петабайт.
А если Youtube хранит ВСЕ оригинальные ролики с самого начала существования, то наше число вырастает до ((4 МБ) + (4 МБ) + (50 МБ) + (50 КБ)) * 142 500 000 = 7.70386123 петабайт.
Так же не считая видео, мне интересно насколько большая база у Youtube. В зависимости от того как данные архивируются со временем, я бы добавил еще 1-2 ТБ, и такая цифра ничтожна с занимаемым пространством под видео. Я уверен что база данных это mysql, разбитая на много кусков для лучшей работы, и наверное «приправленная» различными Гугловскими патчами. Посмотрите презентацию о расширяемости Youtube и взгляните на эту статью, если желаете знать больше.
P.S. Я так же забыл, что Youtube генерирует 3gp, так что я бы добавил бы еще немного места :)

От переводчика: Прошу сильно не пинать, это в принципе мой первый перевод, и некоторые фразы и обороты я или опустил, или немного переиначил.
Ссылка на оригинал поста.
Ссылка на оригинал перевода в моем блоге
Теги:
Хабы:
Всего голосов 98: ↑79 и ↓19+60
Комментарии88

Публикации

Истории

Ближайшие события

Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область