Хорошо бы указать источники данных, а так же их актуальность (в каком году составлялись таблицы), ну и совершенно непонятен вопрос легальности этой информации. Информация может быть самой замечательной, но если она добыта нелегально, то ни в одном серьезном проекте использовать ее нельзя и хорошо бы знать об этом заранее. Причем информация может содержать скрытые метки, которые позволят в будущем легальным владельцам засудить всех пользователей этих данных.
Пополнение базы классификаторов