ArtemDP19 авг 2014 в 09:09

Сравнение скорости работы ArrayList и LinkedList на практике

3 мин

77K

Java *

Из песочницы

-13

Комментарии 55

agent10 19 авг 2014 в 09:17

---Set elements at end ( 3kk )
LinkedList: 40 ms
ArrayList: 267 ms
ArrayList is faster

Все таки LinkedList…

ArtemDP 19 авг 2014 в 09:31

Благодарю. Исправил.

Losted 19 авг 2014 в 09:25

Ну, по хорошему, для микробенчмарков стоит использовать что-нибудь вроде jhm. А так вы намеряли заодно кучу лишнего.

ArtemDP 19 авг 2014 в 09:36

Согласен, но для цели — определить что в какой ситуации быстрее, то решил пренебречь этой кучей. Т.к. она была +-одинакова для обоих списков и всех замеров. Вместе с замером 1080p не пережимал. Замеры делал раз 5, результаты были +-2-10ms
Но в любом случае за наводку спасибо. По мере свободного времени — попробую разобраться с ссылкой, что Вы дали.

НЛО прилетело и опубликовало эту надпись здесь

leventov 19 авг 2014 в 13:22

Ну не знаю, с точностью до «array или linked?» результаты-то правильные, хотя и очевидные в основном. Вопрос скорее в том, что ни одна система не занимается тем, что добавляет элементы в list в определенное место с утра до вечера. А еще в постановке вопроса, я считаю, что LinkedList должен быть deprecated и муссирование его даже лишь как потенциальной альтернативы ArrayList все равно подталкивает людей к его использованию:
github.com/search?l=java&q=arraydeque&ref=searchresults&type=Code
github.com/search?l=java&q=linkedlist&ref=searchresults&type=Code
— печальное соотношение.

23derevo 19 авг 2014 в 15:22

jmh-фетишизм детектед :)

anmipo 19 авг 2014 в 09:34

Чем отличается «add» от «insert to end», кроме диаметрально противоположных результатов по скорости?

Add elements ( 6kk )
ArrayList is faster

Insert elements to end( 1kk )
LinkedList is faster

ArtemDP 19 авг 2014 в 09:37

Если вопрос мне — то я надеялся, что кто-то из людей с опытом как раз на этот вопрос ответит…
Я объяснить, к сожалению, не могу. То что написано в статье про работу ArrayList — то по логике процедура одинакова…

agent10 19 авг 2014 в 09:39

А покажите код, который использовался в обоих случаях, для обоих типов листов…

ArtemDP 19 авг 2014 в 09:47

Пожалуйста.
.add


LinkedList<Integer> linkedList = new LinkedList<Integer>();
        ArrayList<Integer> arrayList = new ArrayList<Integer>();
        int value = 123456;
        System.out.println("---Add elements ( 6kk )");
        Date startAddLinkedTime = new Date();
        for(int i = 0; i < 6000000; i++) {
            linkedList.add(value);
        }
        Date finishAddLinkedTime = new Date();
        long addLinkedTime = finishAddLinkedTime.getTime() - startAddLinkedTime.getTime();

        Date startAddArrayTime = new Date();
        for(int i = 0; i < 6000000; i++) {
            arrayList.add(value);
        }
        Date finishAddArrayTime = new Date();
        long addArrayTime = finishAddArrayTime.getTime() - startAddArrayTime.getTime();

.add(index.value)

        LinkedList<Integer> linkedList = new LinkedList<Integer>();
        linkedList.add(0);
        ArrayList<Integer> arrayList = new ArrayList<Integer>();
        arrayList.add(0);
        int value = 123456;
        System.out.println("---Insert elements to end( 1kk )");
        Date startLinked = new Date();
        for(int i = 0; i < 1000000; i++) {
            linkedList.add(linkedList.size()-1, value);
        }
        Date finishLinked = new Date();
        long linkedTime = finishLinked.getTime() - startLinked.getTime();

        Date startArray = new Date();
        for(int i = 0; i < 1000000; i++) {
            arrayList.add(arrayList.size()-1, value);
        }
        Date finishArray = new Date();

Googolplex 19 авг 2014 в 09:50

Пожалуйста, пользуйтесь тегом <source>:

LinkedList<Integer> linkedList = new LinkedList<Integer>();
// и т.д.

ArtemDP 19 авг 2014 в 09:57

Извиняюсь, совсем недавно… Еще и думаю: «странно, что код так криво форматируется».

nile1 19 авг 2014 в 09:42

Выложите тестовый код здесь или на github.
«add» — добавляет в конец
«insert to end» — добавляет в конец
в чем разница в вашем тестовом коде для этих двух операций?

Oblitus 19 авг 2014 в 09:44

ArrayList имеет внутри собственно array, который имеет ограниченный размер. Если не влезает — приходится пересоздавать массив и копировать содержимое. А добавление в начало или конец LinkedList делается за фиксированне время. Подозреваю, отсюда и разница. Если создавать ArrayList с запасом он будет побыстрее, потому что не нужна обёртка.

anmipo 19 авг 2014 в 09:51

.add(list.size() - 1, value) вставляет элемент предпоследним. В ArrayList это вызывает копирование всего массива:

// from java.util.ArrayList
public void add(int index, E e) {
	checkBoundInclusive(index);
	modCount++;
	if (size == data.length)
		ensureCapacity(size + 1);
	if (index != size)
		System.arraycopy(data, index, data, index + 1, size - index);
	data[index] = e;
	size++;
}

private void checkBoundInclusive(int index) {
	if (index > size)
		throw new IndexOutOfBoundsException("Index: " + index + ", Size: " + size);
}

ArtemDP 19 авг 2014 в 09:55

Сейчас займусь. Спасибо!
p.s. т.к. через index,value вставить в конец списка мы не можем — данный пункт убираю.

Googolplex 19 авг 2014 в 09:59

Можно. list.add(list.size(), item).

ArtemDP 19 авг 2014 в 10:07

Результат по скорости тот же, что и для .add

---Add elements ( 6kk )
LinkedList: 2363 ms
ArrayList: 495 ms
ArrayList is faster

---Insert elements to end( 1kk )
LinkedList: 149 ms
ArrayList: 34 ms
ArrayListis faster

Oblitus 19 авг 2014 в 10:13

Неудивительно, потому что по умолчанию там и есть вставка в конец.

nile1 19 авг 2014 в 09:56

Только в том случае, если capacity недостаточно, и нужно увеличить размер массива.
В противном случае копируется только часть справа от вставляемого элемента (фактически сдвиг вправо на 1 элемент) — в случае последнего элемента копировать нечего, в случае предпоследнего — копируется 1 последний элемент.

anmipo 19 авг 2014 в 10:00

Действительно. Но всё же arraycopy даже для одного элемента — лишние накладные расходы.

Oblitus 19 авг 2014 в 09:39

tl;dr:

LinkedList представляет собой неиндексированную цепочку, которая быстро работает при операциях с концами цепочки. Оптимальное использование — очередь, на что намекает имплементация интерфейса Deque.

ArrayList представляет собой массив в обёртке, поэтому лучше при необходимости произвольного доступа.

BasicWolf 19 авг 2014 в 10:15

+1.

Я поставил минус статье и вот почему: Вы сравниваете слона с китом. Априори известна О-сложность операций для контейнеров типа «Элементы размещены в памяти последовательно» и «Связной список». Поэтому и нет никакого смысла сравнивать скорость их работы.

Вот кстати отличный пост на эту тему: habrahabr.ru/post/188010/

ArtemDP 19 авг 2014 в 10:23

Судя по всему, вы программируете уже давно, так понимаю на Питоне, поэтому для Вас данная статья покажется «детской», оно так и есть, но для начинающих — будет полезной. Я до сего теста считал, что LinkedList при добавлении в конец списка(.add(value)) — вне конкуренции, или как минимум на ровне с ArrayList(судя по материалам, что я читал). Оказалось, что ArrayList с этим справляется быстрее.

Всем спасибо за замечания. Постарался их все учесть и подкорректировать статью.

BasicWolf 19 авг 2014 в 11:40

Я сам когда-то так считал :) ArrayList и ему подобные контейнеры захватывает кучу памяти наперёд, оттуда и скорость добавления в конец. Кстати, вот неплохой синтетический случай: в цикле создаётся большой ArrayList, к которому добавляют один элемент. Что-то вроде:

for (...) {
    N = 1024*1024*1024; 
    ArrayList<int> arr = new ArrayList<int>(N);
    arr.add(0);  
}

И вот после этой операции, размер arr в памяти увеличиться в полтора раза! LinkedList был бы чуточку экономнее.
См. grow() в hg.openjdk.java.net/jdk7/jdk7/jdk/file/00cd9dc3c2b5/src/share/classes/java/util/ArrayList.java

Mikhail_dev 20 авг 2014 в 05:52

Я не очень понял причину, почему размер увеличивается в полтора раза? Почему в полтора, это понятно, у нас срабатывает функция увеличения размера внутреннего массива, но почему увеличивается? Мы ведь создали пустой лист, и добавляем туда единственный объект Integer.

BasicWolf 20 авг 2014 в 09:01

Гм… Прошу прощения, не дописал строку с гипотетическим заполнением массива. Да, я имелл ввиду что после объявления массив заполняется включительно до N-1 го элемента. И уже потом вызывается add()

Mikhail_dev 20 авг 2014 в 10:43

ИМХО, если мы достигли такого размера ArrayList, то захват половины памяти от заполненной своей, вполне оправдано.
Хотя было бы неплохо позволять юзеру подсовывать свой алгоритм расширения массива.

Oblitus 20 авг 2014 в 07:51

А grow тут не вызовется. Если использовать конструктор с указанием размера, то память занимается сразу (при дефолтном конструкторе — при добавлении первого объекта). Расти ему незачем — места хватает. И даже arraycopy будет вызван только на реально занятом диапазоне (то есть на нулевом).

Mikhail_dev 20 авг 2014 в 08:23

Ваш ответ не совсем верный. При дефолтном конструкторе создается массив в 10 элементов

/**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this(10);
    }

msd 20 авг 2014 в 09:12

При таких ответах стоит указать версию java на которой это было подсмотрено.

Mikhail_dev 20 авг 2014 в 10:37

Так я скопировал с той ссылки, что в данной ветке. ( hg.openjdk.java.net/jdk7/jdk7/jdk/file/00cd9dc3c2b5/src/share/classes/java/util/ArrayList.java )
Однако спасибо, я понял о чем вы. Посмотрел исходники, в JDK до 7 версии (посмотрел правда 6 и 7 только, но думаю ниже по версии тоже самое) стоит 10 элементов по дефолту, а вот в 8 версии, сначала 0, а после добавления первого элемента, становится DEFAULT_CAPACITY, которая равна 10.

leventov 19 авг 2014 в 11:47

Для очереди лучше ArrayDeque.

Sap_ru 19 авг 2014 в 10:30

Косяк LinkedList'а в Java в том, что нет итератора, допускающего хотя бы частичное изменение списка. Т.е. нельзя кэшировать позицию в списке. С другой стороны. Кэшировать позицию на чтение можно запросто, только при изменении нужно кэш сбрасывать.
В общем, уметь нужно с этим работать. А так — да, если в середину списка каждый раз по индексу бездумно вставлять, то будет медленнее чем даже ArrayList, да ещё и скорость от индекса зависеть будет.

Oblitus 19 авг 2014 в 10:44

У итератора LinkedList вообще-то есть add, remove и set. Другой вопрос что нет потокобезопасности, но это совсем другой вопрос.

Sap_ru 20 авг 2014 в 07:17

Add, remove, set одного итератора делают недействительными все остальные итераторы. Дело не в потокобезопасности. Допустим, Вы закэшировали позицию (или набор позиций) в списке (для частого обращения). В случае, если список будет изменён иным способом (а не через кэшированый итератор), кэш станет бесполезен. Даже если всё в одном потоке. Это сильно ограничивает возможности по быстрому поиску в списке. Т.е. если есть кэш позиции в списке, то его нужно сбрасывать/обновлять после каждого изменения списка, если оно было выполнено не через кэшированый итератор. Вне зависимости от потоков.

Oblitus 20 авг 2014 в 07:44

Это довольно опасный подход, и его не зря не допускает стандартный механизм. Если очень надо — можно сделать свою реализацию путем банального копипаста и вырезания проверки на комодификацию.

culvert 19 авг 2014 в 11:11

1) ничего не сказано про разогрев JVM или бенчмарки
2) не протестирован последоветльный перебор в коллекциях (предполагаю, что за счет большого количества cache miss линкед лист просядет)
3) почему используется Date() а не System.currentTimeMillis() или System.nanoTime()? первый раз такое вишу в тестах.

Nagg 19 авг 2014 в 11:28

Не знаю как в JAVA, но в .NET LinkedList по сравнению с листом имеет ещё и такое преимущество (хотя скорее особенность): он никогда не попадет целеком с элементами в LOH (Large Object Heap) из-за количества объектов, в то время как лист очень даже может, что может привести к фрагментации и т.п.

ArtemDP 19 авг 2014 в 11:29

1) в свободное время попробую сделать…
2) имеете ввиду get(0), get(1), get(2)...? Если да:

Date startLinked = new Date();
        for(int i = 0; i < k; i++) {
            linkedList.get(i);
        }
        Date finishLinked = new Date();
        long linkedTime = finishLinked.getTime() - startLinked.getTime();

        Date startArray = new Date();
        for(int i = 0; i < k; i++) {
            arrayList.get(i);
        }

---Get elements line ( 100k )
LinkedList: 11096 ms
ArrayList: 0 ms

3) Это мой первый тест. Почитал про System.currentTimeMillis(). Может его было и правильно использовать, но в данном случае на результат оно не повлияло.

sekrasoft 19 авг 2014 в 12:40

get(0), get(1), get(2) — отличная демонстрация того, как списки не надо использовать. Обязательно отметьте это в статье, тогда она действительно поможет новичкам не обходить списки за квадратичное время.

Ведь get работает за линейное время

public E More ...get(int index) {
    return entry(index).element;
}

private Entry<E> More ...entry(int index) {
  if (index < 0 || index >= size)
      throw new IndexOutOfBoundsException("Index: "+index+
                                          ", Size: "+size);
  Entry<E> e = header;
  if (index < (size >> 1)) { // из-за этого условия работать с концом списка в режиме произвольного доступа можно так же быстро, как и с началом.
      for (int i = 0; i <= index; i++)
          e = e.next;
  } else {
      for (int i = size; i > index; i--)
          e = e.previous;
  }
  return e;
}

Крайне полезно было бы извлечь из комментариев Sap_ru, Oblitus и culvert пользу и добавить в статью:
1. Перебор с get (который Вы упомянули в комментарии, на который я отвечаю)
2. Перебор с итераторами
3. Для каждого случая с серединой списка получить итератор, указывающий на середину списка и провести k операций, используя итератор.

Oblitus 19 авг 2014 в 18:51

Надо отметить, что get(i) в ArrayList будет работать даже быстрее итератора, там из накладных расходов всего одна проверка на выход за границы массива. А вот в LinkedList всё плохо, каждый раз надо идти по цепочке.

cypok 19 авг 2014 в 11:29

Нельзя же так. :(

leventov 19 авг 2014 в 11:49

Когда использовать LinkedList:
1. Необходимо много данных добавлять в начало списка
2. Удалять с начала (index = 0) списка, т.е. элементы, которые были добавлены первыми.
3. .set в конце списка

Плохая рекомендация. Во всех этих случаях лучшую скорость и потребление памяти покажет ArrayDeque.

Siper 19 авг 2014 в 12:51

Скорость операций вставки в ArrayList очень сильно завязана на соотношения размера кэша(ей) и расстояния точки вставки от конца.

leventov 19 авг 2014 в 12:59

Почему?

Siper 20 авг 2014 в 00:56

Из-за System.arrayCopy() которая сдвигает отрезок массива с сылками. Если он помещается в кеш то завершение метода не упирается в запись в память. А на последовательных вставках (как я полагаю сделаны тесты автора) — и в чтение тоже.

leventov 20 авг 2014 в 02:44

Первый раз слышу, чтобы скорость memcpy зависела от размера кеша. И интуиция мне говорит об обратном. Можно ссылку на пруфы какие-нибудь?

Sap_ru 20 авг 2014 в 07:20

Как раз звучит логично. Если данные помещаются в кэш, то скорость доступа будет ограничивать скоростью кэша, а не памяти. Вы никогда не видели график скорости линейного чтения/записи от размера блока? Там чётко видны уровни всех кэшей. Во приличных бенчмарках есть. А график копирования будет средним между чтением/записью.

leventov 20 авг 2014 в 13:19

Ссылку-то можно? Хоть на один такой бенч?

НЛО прилетело и опубликовало эту надпись здесь

23derevo 20 авг 2014 в 08:29

Вы так говорите, как будто открыли Америку. У вас были какие-то сомнения насчет того, что перенаправить несколько ссылок будет на порядки быстрее, чем копировать массивы с десятками тысяч элементов?

Вы еще возьмите не сто тысяч элементов а миллион, миллиард… Уверяю Вас, там разница будет еще сильнее :)

НЛО прилетело и опубликовало эту надпись здесь

ArtemDP 20 авг 2014 в 17:09

arrayList.add без итератора на 100к элементов показал результат

ArrayList: 23 ms

Удаление с начала списка LinkedList вне конкуренции даже без итератора

Зарегистрируйтесь на Хабре, чтобы оставить комментарий