Жаль, конечно — но ничего не поделаешь: англоязычное сообщество объективно больше русскоязычного, там больше рабочих рук. Так что можно ответить только одно: правьте смело! :) Скажем, мне сейчас очень приятно осозновать, что среди этого полумиллиона статей есть несколько моих.
85542 статьи или 85542 поста, включая посты-ссылки, посты-опросы, посты-картинки и прочая-прочая? Интересно как раз узнать про количество именно статей.
Пресс-релиз официальный ещё не вышел, а вы уж тут как тут.
Ну раз так, то добавьте для широких народных масс ссылочку: ru.wikipedia.org/wiki/Википедия: Пресс-релиз/500K
Отличная цифра! Жаль только, что много материала попросту переводят с английской википедии, слово в слово, еще и сильно урезают. Относительно мало оригинальных статей. Но это лучше, чем ничего, я не спорю.
Подскажите, пожалуйста, где можно скачать свежий полный дамп английской википедии с историей правок? С некоторых пор для английского языка они публикуют только дампы без истории ((
Я имею в виду файл с именем типа такого: enwiki-2010XXXX-pages-meta-history.xml.7z
Ну и архивы картинок, конечно же, интересуют. Извиняюсь за оффтопик и за маньяцкие наклонности )
Откуда данные?
В английской вики 3 205 340 статей (статистика). Возьмем среднюю величину в 10 000 символов/статья. 3 205 340*10 000*8=256427200000 байт = примерно 239 гигабайт. Это определенно не много — поместится почти на любом винчестере.
Для русской вики данные скромнее. 500 328 статей (статистика). Возьмем те же 10 000 (хотя статьи в русской вики меньше обычно, но все же). 500 328*10 000*8*2 (UTF-8 двухбайтный же для русского языка) = 80052480000 байт = примерно 75 гигабайт.
Все это без истории правок и изображений. Историю правок считать не буду, так как нету данных.
Изображения можно посчитать. Только я возьму Викисклад. Там 6 180 341 файлов (всех, включая звук и видео, но их довольно мало, поэтому оставим эту цифру). Средняя картинка пусть будет весить 300 килобайт. 6 180 341 *300 = 1854102300 килобайт = примерно 1.7 терабайт.
Вывод: копию вики без картинок можно спокойно хранить на домашнем компе, хотя и 2 терабайта дома уже не редкость.
а вообще частично статистику можно найти на stats.wikimedia.org/RU/Sitemap.htm
оттуда, например, можно узнать, что средний размер статьи в руВики 3182 байта, а не 20 000
по идее в будущем нам по силам опередить голландскую, польскую, итальянскую и японскую википедии, т.к русскоязычных людей в мире больше, чем носителей этих языков.
Ну если считать тех, для кого язык родной, то японцев ненамного меньше, да и с интернетизацией (уж простите за термин) у них получше, так что битва за статьи будет что надо))
Полмиллиона статей в русской Википедии!