doom369 Nov 11 2011 at 16:53

Маленькие хитрости Java. Часть 2

5 min

108K

Java*

+75

Comments 91

mark_ablov Nov 11 2011 at 16:58

oneByte размером с int это круто!

-5

vajadhava Nov 11 2011 at 17:23

java.io.InputStream



public abstract int read() throws IOException



Reads the next byte of data from the input stream. The value byte is returned as an int in the range 0 to 255. If no byte is available because the end of the stream has been reached, the value -1 is returned. This method blocks until input data is available, the end of the stream is detected, or an exception is thrown.

java.lang.Byte



MAX_VALUE A constant holding the maximum value a byte can have, 2^7-1

MIN_VALUE A constant holding the minimum value a byte can have, -2^7.

mark_ablov Nov 11 2011 at 17:25

Я знаю, в C getchar() тоже int возвращает дабы была возможность детектировать ошибку.
Но всё равно выглядит очень странно такое название переменной и тип int.

-1

vajadhava Nov 11 2011 at 17:32

int odin = 2; — как один тут товарищ писал, это странно, да :)

0lympian Nov 12 2011 at 02:17

В С — как раз ничего странного. Где это возможно, используется тип int, т.к. он привязан к архитектуре процессора, под которую собран код — и обычно это максимально быстрая единица памяти, к которой имеет доступ процессор. Другими словами, экономия при объявлении переменной может обернуться либо тем же расходом памяти (в случае если компилятор их выровняет по границам, кратным размеру int), либо медленным доступом.

vajadhava Nov 11 2011 at 17:16

крошка сын к отцу пришел, и спросила кроха… :)

Colwin May 10 2012 at 09:01

… Что такое singleton,
И что такое mockup?

:-)

CheatEx Nov 11 2011 at 17:20

> В случае явного указания значений для полей класса — они будут проинициализированы до вызова конструктора, что влечет дополнительные расходы.

Какие расходы? На что?

UFO just landed and posted this here

doom369 Nov 11 2011 at 17:43

Интересный вариант, но стаття как раз про то как не нужно делать. Поэтому preconditions в конструкторе не очень хороший вариант =).

UFO just landed and posted this here

doom369 Nov 11 2011 at 18:04

Если исходить из Ваших условий — приватный конструктор и статический метод в классе, который осуществит нужные проверки и вернет корректный обьект или ошибку.

UFO just landed and posted this here

licvidator Nov 11 2011 at 19:44

Шаблон «фабрика» спешит на помощь.

doom369 Nov 11 2011 at 19:48

Я знал, что обязательно кто-то это подметит. Шаблоны тем не менее не всегда уместны. На хабре была стаття по этому поводу.

licvidator Nov 11 2011 at 19:50

Шаблоны уместны там, где они… уместны.
И проверка всяких условий перед фактическим созданием объекта — как раз одно из мест, где применение шаблона «фабрика» просто напрашивается.

doom369 Nov 11 2011 at 19:53

Тоесть для этого примера я должен был бы создать шаблон «фабрика»?

licvidator Nov 11 2011 at 20:01

Боюсь вам разочаровать, но шаблон «абстрактная фабрика» был создан и описан умными бородатыми дядьками в умной тонкой книжке почти двадцать лет назад…

pyatigil Nov 11 2011 at 20:29

Что характерно, doom369 собственно фабрику и предлагает использовать: habrahabr.ru/blogs/java/132374/#comment_4396258

leventov Nov 11 2011 at 22:27

Вы трижды одинаково опечатались в слове «статья». Это настораживает

doom369 Nov 12 2011 at 11:41

Я думаю на украинском. Извиняюсь, буду исправляться

UFO just landed and posted this here

doom369 Nov 11 2011 at 17:42

В случае если вы создаете обьект с пустым конструктором и инициализация полей Вам не нужна. А в пределах приложения это может быть существенно. В любом случае Вы правы, этот момент нужно подправить.

Regis Nov 14 2011 at 04:56

Например на

private List zzz = new ArrayList();

CheatEx Nov 14 2011 at 13:24

А разница с тем, что он создастся в констукторе?

Regis Nov 15 2011 at 03:15

Например в конструкторе может быть дополнительная логика, которая будет менять/отменять инициализацию либо выполнять инициализацию полей более эффективным способом.

Пример: конструктор принимает список элементов, эффективней будет сделать zzz = new ArrayList(providedValues), чем вначале просто проинициализировать список, а потом добавить в него элементы.

UFO just landed and posted this here

netslow Nov 11 2011 at 17:44

Быть может повторюсь, но тем не менее.
Есть еще полезный прием:

"true".equals(str)

Позволяет избежать NPE при сравнении строк с константами.

doom369 Nov 11 2011 at 17:54

В принципе — да… Тем не менее 90% случаев сравнения строк — это

label.equals(str)

Этот случай больно уж редкий.

-7

SVlad Nov 11 2011 at 23:14

Не очень удачный пример, конкретно в данном случае лучше Boolean.valueOf(str);
Но для других, нестандартных строк, действительно хороший вариант.

-2

dmmm Nov 12 2011 at 01:19

Так же очень удобно использовать null-safe

Objects.equal(str, "true") из Guava

или

StringUtils.equals(str, "true") из commons lang

netslow Nov 12 2011 at 10:26

поддерживаю!

-2

ice9 Nov 15 2011 at 04:54

>Objects.equal(str, «true») из Guava

В 7ке появился java.util.Objects. Не 1 в 1 с тем, что в Guava, но для equals/compare годится.

isden Nov 11 2011 at 17:57

> Код с анонимными классами читается гораздо трудней и сложен для восприятия.

Ну я бы поспорил, это очень субъективно, и еще зависит от конкретного кода. Часто такие решения достаточно универсальны и красивы.

> String status = plan.getStatus();
> if (status.equals(«draft»)) {

Еще можно добавить, что это не только медленно, но и небезопасно, т.к. plan.getStatus() теоретически может вернуть null, и тогда огребем NPE при вызове equals().
Лучше сравнивать строки так:

«draft».equals(status)

doom369 Nov 11 2011 at 18:02

>>Ну я бы поспорил
Я ведь написал — в некоторых ситуациях очень применимы.
Здесь предполагалось что часть модели Plan.status не может быть null. В виду constraint БД.

UFO just landed and posted this here

doom369 Nov 18 2011 at 12:46

Потому что это не 7-я Java. Старые проекты врятли уже когда-нибудь перейдут на 7-ю.

UFO just landed and posted this here

doom369 Nov 18 2011 at 13:00

В проекте так и сделано, это просто для примера.

spiff Nov 11 2011 at 18:04

Вот тут отличная подборка по подобным советам: www.odi.ch/prog/design/newbies.php

К слову. Автор кажется туда заглядывал.

spiff Nov 11 2011 at 18:06

Есть даже целые сайты javaantipatterns.wordpress.com/. Надо гуглить по запросу «java anti-patterns».

isden Nov 11 2011 at 18:25

> Надо гуглить по запросу «java anti-patterns».

Категорически плюсую, очень интересные и неочевидные вещи попадаются. Еще добавлю в копилку слов для гугления полезных советов — «java exceptions anti-patterns».

Nevil Nov 11 2011 at 18:27

По поводу name.isEmpty() — это появилось только в JDK 1.6. Безопасней будет либо сравнить с константой "", либо по аналогии name.lenght() == 0. Хотя второй вариант встречался реже

andrewsch Nov 11 2011 at 20:14

А так как в 90% случаев надо среагировать и на null, и на "", то еще лучше использовать org.apache.commons.lang.StringUtils.isEmpty( s )

Nevil Nov 12 2011 at 00:36

Да, полностью с вами согласен. Обычно используем либо StringUtils.isEmpty либо StringUtils.isBlank в зависимости от ситуации. Я привел пример без использования внешних библиотек.

UFO just landed and posted this here

GabrielG Nov 11 2011 at 19:21

>>Object[] vs custom Class
О боги, неужели вариант «плохо» ещё кто-то пишет? Это вообще диковинка какая-то)
За цикл статей — спасибо, уже пару полезных для себя мелочей заметил!

doom369 Nov 11 2011 at 19:43

Да, я и сам иногда грешу =), но только когда очень спешу и проще и быстрей написать так. Когда например делается выборка 2-х колонок из разных таблиц.

alexeyrom Nov 11 2011 at 19:53

Даже если спешить, в любой IDE класс с public полями сделать не намного медленнее, чем Object[]. А читать на порядок проще.

SVlad Nov 11 2011 at 23:16

Наверно, это последствия детской травмы, полученной программистом при изучении конструкторов С++

-2

bachin Nov 12 2011 at 00:35

Я пишу. Плачу, но пишу. Потому что в среде j2me приходится экономить память, а создание классов под то, что можно реализовать массивами — непозволительная роскошь.
Вернее, позволить-то можно себе. Но тогда проблемы вылезут в другом месте.

Jabberwok Nov 11 2011 at 21:00

С первым пунктом я не согласен. Есть какой-то бенчмарк в подтверждение?

-4

doom369 Nov 11 2011 at 21:42

public static void main(String args[]) throws IOException {
		//~5mb
		File file = new File("D:\\P1010387.jpg");
			
		readFile(new BufferedInputStream(new FileInputStream(file)), "Buffered");
		readFile(new FileInputStream(file), "Not buffered");
	}
	
	private static void readFile(InputStream is, String type) throws IOException {
		System.out.println(type);
		System.out.println("Start : " + new Date());
		int val = 0;
		while ((val = is.read()) != -1) {
			val = val + 1;
		}
		System.out.println("End : " + new Date());
	}

spiff Nov 11 2011 at 21:52

Ужас. new Date()?

Есть же System.currentTimeMillis();

doom369 Nov 11 2011 at 22:01

Время — деньги

-5

SVlad Nov 11 2011 at 23:20

Хм, теоретически, ОС и сама может закешировать файл, и чтение всё-равно будет из памяти, но это будет зависит от конкретной джавамашины, ОС, настроек и фазы луны.

Jabberwok Nov 11 2011 at 23:22

Я поэтому и усомнился. ОС сама кеширует чтение из диска. Мне показалось сомнительным пытаться оптимизировать такие вещи на уровне Java.

Sap_ru Nov 13 2011 at 00:33

Вот только на каждое чтение может происходить переключение контекста, поиск и проверка на допустимость хэнделера файла, поиск в кэше, вызов драйверов и т.п. Кроме того, ОС не знает будет ли произвольный или последовательный доступ к файлу и потому упреждающее чтение будет использоваться очень осторожно. Кроме того упреждающее чтение как правило работает только для нефрагметированных данных (гонять головки диска, чтобы прочитать данные без уверенности, что они могут понадобиться — дорогое удовольствие). В общем можно считать, что упреждающего чтения в ОС нет.

Jabberwok Nov 16 2011 at 21:17

Для меня полное откровение, уверен был, что на упреждающее чтение можно смело наедятся. Где можно про это поподробнее узнать?

Oblitus Nov 11 2011 at 21:17

isEmpty() касается и коллекций, поскольку далеко не все они хранят информацию о своем размере, а это ведет к необходимости полного перебора.

SVlad Nov 11 2011 at 23:19

А какие — не хранят?

UFO just landed and posted this here

Walrus Nov 12 2011 at 22:03

Size дорого, но isEmpty уже не так дорого.

Oblitus Nov 15 2011 at 16:07

Для isEmpty достаточно проверить, есть ли хоть один элемент. Это практически в любом случае делается за фиксированное время.

leventov Nov 11 2011 at 22:40

Что касается файлового IO, правильно использовать java.nio.*, а не вникать в неудачные места устаревшего API.

-1

philpirj Nov 12 2011 at 14:16

Очень зависит от окружения. Советую просмотреть вот эту штуку, а также вспомнить, какой шаг вперёд сделал Linux в многопоточности от 2.4 к 2.6.

philpirj Nov 12 2011 at 14:19

Бонус с интересными комментариями.

SVlad Nov 11 2011 at 23:23

Правда, в этом случае есть один большой минус — стоимость поддержки приложения увеличивается, особенно это становится заметным, когда нужно добавить, удалить или изменить одно из существующих состояний.

Перечисления же модифицировать, наоборот, проще. Изменил в объявлении, и оно поменялось везде. А вот со строками придётся вручную искать все упоминания в коде и разбираться, нужно здесь менять, или это просто совпадение имён.

SVlad Nov 11 2011 at 23:38

В дополнение — постоянно при добавлении вычисляется хеш, который для сложных обьектов может стоить дороговато.

По умолчанию джава использует в качестве хеша что-то вроде адреса объекта в памяти, поэтому обычно генерироваться он будет быстро.

srez Nov 12 2011 at 01:03

Для сложных объектов скорее всего будет сложный хеш. Причем, он еще в подавляющем большинстве случаев еще и не кэшируется и будет честно считаться каждый раз при работе с хешсетом.

philpirj Nov 12 2011 at 14:22

+1-1
Сложный хэш будет. Но считаться по канонам Java он должен лишь раз. В противном случае вы свой объект в том же Set'е никогда не найдёте.

srez Nov 12 2011 at 18:54

Это не так. Попробуйте добавить объект в HashSet 2 раза и проверьте, сколько раз будет вызван метод hashCode. Ответ — 2 раза. Более того, если после добавления элемента в HashSet вы поменяете его состояние и этим измените hashCode, то получите шикарный баг. Итерируясь по коллекции вы сможете найти объект, но тем не менее contains вернет false (как раз таки объект вы не действительно найдете в HashSet) и добавить его можно будет еще раз, уже в другое место массива. Я собственно это в свое время и словил, ибо не понимал что HashMultimap слово Hash от HashSet, а не как я думал от HashMap. ArrayMultimap решил ту проблему.

HashSet[Object] q = new HashSet[Object]();
Object o = new Object() {
@Override
public int hashCode() {
System.err.println(«hashCode»);
return super.hashCode();
}
};
q.add(o);
q.add(o);

Тем не менее, кэшировать хэшкод это очень правильная идея в плане перформанса, но поддержка этого кэширования в коде слишком трудоемко для сложных случаев, где от кэша собственно и будет эффект, ибо кэш надо будет сбрасывать на любую мутацию объекта, в итоге не встречал, чтобы ктото хэш кэшировал на практике.

-1

Walrus Nov 12 2011 at 22:05

> в итоге не встречал, чтобы ктото хэш кэшировал на практике.
Все встречали.
java.lang.String. :)

srez Nov 13 2011 at 01:45

Immutable это нечестно, такое встречал конечно и не раз. :)

-1

philpirj Nov 14 2011 at 11:15

Во-первых, вам стоит научится пользоваться дебаггером, это избавит от необходимости каждый раз вставлять System.out и перекомпилироваться.

Во-вторых, читать документацию. Стоит изучить так называемый «Общий контракт работы с хэш кодами» (The general contract of hashCode) из JDK.

Стоит также почитать всякие заметки, чтобы понять, что это делается не только для перформанса.

И в конце концов, читайте то, что вам собеседники пишут. Я описал то же самое, ожидая, что коллеги по цеху меня поймут.
>>В противном случае вы свой объект в том же Set'е никогда не найдёте.
>тем не менее contains вернет false

Ко всему прочему, изучите имплементацию HashSet, она построена не на массиве, и в комментариях тут это уже даже упоминалось.

Если не умеете перегружать хэш коды самостоятельно, воспользуйтесь Apache HashCodeUtil, построенной, как помню, на простых числах.

srez Nov 14 2011 at 13:11

1. По контракту хешкод обязан сохранять свое значение при условии, что информация используемая в equals не была обновлена. С-но, если же эта информация была обновлена, то хэш код изменится, и это не нарушает контракт хэш кода. Посмотрите javadoc к методу hashCode.

method must consistently return the same integer, provided no information used in equals comparisons on the object is modified.

2. HashSet построен на основе HashMap, который в свою очередь построен на основе массива.
/**
* The table, resized as necessary. Length MUST Always be a power of two.
*/
transient Entry[] table;

3. HashCodeUtil или любой другой аналог, не поможет вам кэшировать хэш в мутабл объекте. Потому что этот кэш придется сбрасывать на любое изменение объекта. И вообще рекомендовать Apache Commons это неразумно, он застрял на уровне семантики явы 1.4 и его развитие неудовлетворительное. Есть отличный форк от него под названием Guava, в которой есть аналогичные метода, но уже с семантикой 6й явы, например, Objects.hashCode(...).

4. Вы написали, что хэш будет считаться по канонам явы один раз на объект. Это очевидно неправда.

HashMap:
public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
В самом начале метода put у HashMap у ключа тупо вызывается hashCode, на каждый put/add/contains итп будет вызван этот метод.

srez Nov 12 2011 at 01:00

У нас на проекте принято использовать для логгера
private Logger logger = Logger.getLogger(getClass());
опять же, несмотря на некоторую неэффективность данного подхода, зато очень удобно копипастить и нет глупых ошибок при этом.

И я бы наоборот советовал, везде где это возможно, инициализировать поля, там же где они объявлены. Код все еще чистый, и на одну строчку короче. Для того и предзначена эта возможность, чтобы не засорять этим конструктор.

srez Nov 12 2011 at 01:34

Про сериализацию. Я бы не советовал, без крайней нужды использовать стандартную ява сериализацию. Protobuf как правило намного более удобное решение. В принципе, вообще сильная связность объекта с его сериализацией, его компаратором или с его реализацией методов hashCode/equals как правило это плохая идея. Впрочем, по последнему пункту красивых решения я не встречал, поэтому все упирается во wrapper-декоратор объекты, которые просто перегружают методы hashCode/equals.
На самом деле это все большая проблема, потому что написать адекватный контейнер класс, который содержит 2 банальных стринг поля и по сути обычный pojo bean занимает у меня уже до 3х экранов кода, что конечно ужас. И, что печально, код везде повторяется, а вот без рефлекшена его вынести куда-то не выходит, а рефлекшен слабое решение с позиции перформанса, а вот для таких контейнеров как раз перформанс важен, ибо они обычно пролетают всю систему и несколько потоков меняют при этом.

Regis Nov 12 2011 at 19:37

Толковая IDE может сама обновлять имя класса при копировании такой строчки.

srez Nov 13 2011 at 01:44

Intellij Idea/Eclipse не умеют.

Regis Nov 14 2011 at 04:54

Как раз-таки Idea умеет. Насчет Eclipse не знаю.

srez Nov 14 2011 at 13:12

И как этим пользоваться? Если просто скопировать, то 10.5.2 Idea не правит название класса. Тут есть какой-то хинт?

yplakosh Nov 12 2011 at 02:28

По теме данной статьи можно почитать очень хорошую книгу Effective Java, автор Joshua Bloch. Там целая книга примеров правельного написания кода на Java.

Даже сам

yplakosh Nov 12 2011 at 02:31

Даже сам James Gosling (fellow and vice president, Sun Microsystems, Inc., and inventor of the Java programming language) писал об этой книге:
“I sure wish I had this book ten years ago. Some might think that I don’t need any Java books, but I need this one.”

cursed Nov 12 2011 at 14:02

Почему еще никто не сказал про интернацию.

doom369 Nov 12 2011 at 14:10

Тут очень интересный ответ, поэтому не добавлял.

-1

cursed Nov 12 2011 at 20:24

Деградация после 25к элементов — не новость.
Если Вам нужно запихнуть столько строк в пул — где-то что-то делаете не так. Для констант и сравнения интернация весьма полезна.

vovkab Nov 13 2011 at 02:09

если бы один раз, но целых 3 раза, поэтому:

//плохо
стаття
//хорошо
статья

-1

fotozoom Nov 13 2011 at 19:42

www.odi.ch/prog/design/newbies.php — в копилку. анти-паттерны :)

dime Nov 14 2011 at 12:49

>И еще — считывайте данные порциями, а не по байтам, это тоже позволит прилично сэкономить.

Считывание данных порциями (java.io.InputStream.read(byte b[], int off, int len)) реализовано как вызов побайтного считывания в цикле (java.io.InputStream.read()). :) 1.6.0_29

Так что морочиться этим не обязательно.

Show the best of all time