неа, на данный момент компиляторы оптимизируют код намного лучше человека, они ведь учитывают размер кэша, количество регистров и т.п. Так что разворачивать циклы и расчитывать, чтобы то что надо попало в кэш когда надо - единственное что остается делать программисту. Остальное сделает gcc
http://blog.lexa.ru/2007/10/16/umnozheni…
вот тут про это есть, и про сабж тоже есть, правда в другом ключе
Писал так: <table cellspacing=3 cellpadding=3 border=1>