Vayun Jul 3 2009 at 16:19

6 способов слияния списка списков

4 min

126K

Python*

+35

Comments 74

Coder Jul 3 2009 at 16:27

Вариант 3 не только самый быстрый, но и самый понятный и простой.

Лямбда-выражения это, конечно, типа круто, но смысл использования в данном конкретном случае под вопросом. Экономия строк?

Vayun Jul 3 2009 at 16:35

Разминка для мозгов.

К тому же я предлагаю вам решить задачку в конце, способом аналогичным Варинту 3. И мы сравним с моим, аналогичным Варианту 6.

Coder Jul 3 2009 at 21:00

Разминка для мозгов людям, которым понадобится разбираться в вашем коде?

Nakilon Jul 3 2009 at 21:10

Да, вы же тоже разобрались ..)

Dreammaker Jul 3 2009 at 19:00

Судя по всему попытка ностальгия за перл-прошлым у автора :)

Vayun Jul 4 2009 at 00:25

Скорее это ностальгия за Хаскель-будущим автора)

Nakilon Jul 4 2009 at 00:41

как люди ограничены…

PZagvazdin Jul 6 2009 at 02:30

Писать на perl можно на любом языке программирования

Vayun Jul 6 2009 at 08:18

Можно, но тут это не в тему. Чистые функции повышают читабельность и понятность кода. Но у них естественно есть некий порог вхождения, до которого ничего не понятно.

Если вас смущает, что в программировании есть вещи сложнее мануала к PHP, то кто виноват?

PZagvazdin Jul 6 2009 at 10:55

меня не смущают лямбды, просто при отладке чудого кода, допустим при поиске какойнибудь трудноуловимой ошибки мне было бы приятнее встретить 3тий вариант, а не 5тый.

SPlyer Jul 3 2009 at 17:12

Для вложенных списков, самый очевидный вариант с рекурсией:

def listmerge(lst):
    res = []
    for el in lst:
        res += listmerge(el) if isinstance(el, list) else [el]
    return res

SPlyer Jul 3 2009 at 18:02

Вариант 7:

import itertools
listmerge = lambda lst: list(itertools.chain(*(el for el in lst)))

bolk Jul 3 2009 at 18:38

Как-то у вас сложно всё вышло.

import itertools
listmerge = lambda lst: list(itertools.chain(*lst))

SPlyer Jul 3 2009 at 18:46

Да, действительно, что-то я перемудрил :)

piratus Jul 3 2009 at 19:30

А если добавить волшебную звёздочку — можно будет передавать сколько угодно параметров.

from itertools import chain
listmerge = lambda *lst: list(chain(*lst))

Я вот только не знаю хорошо это или плохо.

bolk Jul 3 2009 at 19:32

Это никак. Функция перестаёт делать то, что требуется в задаче.

piratus Jul 3 2009 at 19:44

>>> l1 = [1,2,3]
>>> l2 = [4,5,6]
>>> l3 = [7,8,9]
>>> listmerge(l1, l2, l3)
[1, 2, 3, 4, 5, 6, 7, 8, 9]

Ничего функция не перестаёт. Прикол в том, что можно передавать сколько угодно списков, а на выходе получить один. Список списков можно передать так: listmerge(*lstlst)

Но вот, судя по этому ответу, код перестаёт быть понятным всем.

bolk Jul 3 2009 at 19:56

Я прекрасно понимаю как работает звёздочка.

Функция не выполняет то, что задано в задаче. В задаче сказано: склеить список списков. Ваша функция этого не делает.

piratus Jul 3 2009 at 19:59

>>> listmerge(*[[1,2], [3,4], [5,6,7], [8]])
[1, 2, 3, 4, 5, 6, 7, 8, 9]

почему не делает?

bolk Jul 3 2009 at 20:08

Вот конкретно это можно написать проще:

import itertools
listmerge = lambda lst: list(itertools.chain(*lst))

listmerge([[1,2], [3,4]])

а не вводить лишнюю звёздочку, чтобы потом от неё избавляться.

Vayun Jul 4 2009 at 00:28

Подозреваю, что по скорости это будет на уровне с List comprehensions вариантом (№5)

alTus Jul 3 2009 at 19:10

По-простому

def merge(lst, res=[]):
  for el in lst:
    merge(el) if isinstance(el, list) else res.append(el)
  return res

С извратом ;)

merge = lambda lst: reduce(lambda a, b: a.extend(merge(b)) or a if isinstance(b, list) else a.append(b) or a, lst, [])

alTus Jul 3 2009 at 19:18

Только вот хотел узнать — не нашел — переменных а-ля static в php в чистом виде нельзя создавать в питоньих функциях? Ну кроме «моего» способа через значение по умолчанию.

bolk Jul 3 2009 at 19:40

Нельзя. Способ через связывание с анонимным изменяемым объектов вполне себе нормальный и питонячий.

Vayun Jul 4 2009 at 00:38

Ага, хотя я бы не назвал второй вариант большим извратом, тк рекурсивные алгоритмы в форме лямбд записываются более элегантно. Вот чисто итеративный вариант будет извратом.

единственный комментарий: можно убрать «or» из цикла:
mergeto = lambda dst,lst: reduce(lambda a,b: a.extend(b) if type(b) is list else a.append(b), lst, dst) or dst
merge = lambda lst: mergeto([], lst)

Vayun Jul 4 2009 at 11:20

опечатался
mergeto = lambda dst,lst: reduce(lambda none,b: dst.extend(b) if type(b) is list else dst.append(b), lst, dst) or dst
merge = lambda lst: mergeto([], lst)

alTus Jul 4 2009 at 19:29

но это уже 2 строчки :)

Vayun Jul 4 2009 at 20:43

Вторую можно выкинуть) Или обернуть первую еще одной лямбдой. Все из-за того, что питоновские in-place методы возвращают None вместо объекта…

neithere Jul 23 2009 at 00:06

mutables в определении функции — зло

Vayun Jul 23 2009 at 08:08

Еслм быть точнее, то они зло в определении умолчальных аргументов.

Ktulhy Jan 7 2014 at 16:59

А вот подобную штуку вряд ли удастся раскрыть:
a = [1]
a.append(a)

Nakilon Jul 3 2009 at 19:15

Чисто из любопытства: в питоне нет рубишного .flatten?

bolk Jul 3 2009 at 19:15

Вы расскажите что это.

Fandorin Jul 3 2009 at 19:56

В ruby:

a = [1, [2,3], [4,5]]
a.flatten
p a

В результате: [1, 2, 3, 4, 5]

bolk Jul 3 2009 at 19:59

В Python ближайший эквивалент — chain из пакета itertools:

from itertools import chain
a = [1, [2,3], [4,5]]

a = list(chain(*a))

print a

Поскольку chain вернёт итератор, мы из него делаем список, передав итератор в качестве аргумента конструктора list.

Nakilon Jul 3 2009 at 20:35

Fandorin забыл восклицательный знак после flatten, иначе вызывается метод, который результат не сохраняет в массив, и пропадает он по концу вычисления.

bolk, кстати, если интересно, стандартный метод flatten в руби 1.9 имеет еще и параметр глубины, на какую «уплощать»:

irb(main):001:0> [1,[2,3],[4,[5,6]]]
=> [1, [2, 3], [4, [5, 6]]]
irb(main):002:0> [1,[2,3],[4,[5,6]]].flatten
=> [1, 2, 3, 4, 5, 6]
irb(main):003:0> [1,[2,3],[4,[5,6]]].flatten 0
=> [1, [2, 3], [4, [5, 6]]]
irb(main):004:0> [1,[2,3],[4,[5,6]]].flatten 1
=> [1, 2, 3, 4, [5, 6]]
irb(main):005:0> [1,[2,3],[4,[5,6]]].flatten 2
=> [1, 2, 3, 4, 5, 6]

bolk Jul 4 2009 at 16:03

Забавно :) В Python это придётся делать рекурсией.

bolk Jul 4 2009 at 16:07

Забавно :) В Python это придётся делать рекурсией.

kronos Jul 3 2009 at 19:21

ruby: a = [1,2,3]; b = [3,4,5]; c = a+b # => [1,2,3,3,4,5]

bolk Jul 3 2009 at 19:26

python: a=[1,2,3]; b = [3,4,5]; c=a+b # => [1,2,3,4,5]

задача из a=[[1,2,3], [3,4,5], [6]] сделать [1,2,3,4,5,6]

kronos Jul 3 2009 at 21:25

Фигня, ща разрулим.
a=[[1,2,3], [3,4,5], [6]]; a.flatten #=> [1,2,3,4,5,6]

bolk Jul 4 2009 at 16:09

В Python только немного сложнее получается (chain импортируется из itertools):

a = list(chain(*a))

pleax Jul 3 2009 at 19:27

python: a = [1,2,3]; b = [3,4,5]; c = a+b # => [1,2,3,3,4,5]

ваш код делает явно не то что подразумевалось автором топика.

pleax Jul 3 2009 at 19:25

>>> a = [[1,2,3], [4,5,6], [7,8,9]]
>>> l = [x for lst in a for x in lst]
>>> l
[1, 2, 3, 4, 5, 6, 7, 8, 9]

или я неправильно понял что надо сделать?

bolk Jul 3 2009 at 19:27

Нет, всё правильно.

pleax Jul 3 2009 at 19:31

а, пардон. это и есть способ 5 =))

0leGG Jul 3 2009 at 19:30

На лиспе это делать надо, на лиспе =)

Deepwalker Jul 3 2009 at 19:45

Вот конкретно это нафиг делать не надо ни на чем: ) То есть если это и есть собственно цель.
Ну и хотя бы по примеру любителя ruby написали бы мега шустрый пример что ли.

0leGG Jul 4 2009 at 10:56

(defun listmerge (list)

(if (null list)

nil

(append (car list) (listmerge (cdr list)))

)

)



(listmerge '((1 2) (3) (5) (4 6)))

(1 2 3 5 4 6)

0leGG Jul 4 2009 at 12:24

Вот ещё на хаскелле, там точно проще.

merge = foldr [] (++)



main = print ( merge [ [1, 2], [3, 4], [5, 6] ] )

>[1,2,3,4,5,6]

Vayun Jul 4 2009 at 14:22

в чем разница? Кроме того Хаскелль статически типизированный язык и для списков произвольной вложенности надо будет изобретать тип наподобие деревьев, и это будет уже далеко не 1 строчка.

narma Jul 3 2009 at 19:46

Решение задачки:

def iter_flatten(iterable):
  it = iter(iterable)
  for e in it:
    if isinstance(e, (list, tuple)):
      for f in iter_flatten(e):
        yield f
    else:
      yield e

Вернется конечно генератор, а не список, но так даже практичнее.

А вот в руби насколько я помню есть нативный метод для этой задачи.

Vayun Jul 4 2009 at 00:41

Я бы поостерегся возвращать генератор, зависящий от мутируемых объектов. Можно получить ерунду если программа продолжит изменять данные.

m4spam Jul 4 2009 at 06:11

Для чего вводится переменная it?

kurokikaze Jul 3 2009 at 19:54

Code Golf? :)

EXSlim Jul 3 2009 at 21:30

На питоне быстрее всего будет с lambda, map или filter
Оффтоп. Когда я начал изучать Erlang, я был поражен, как просто и быстро там делаются подобные вещи. Вот сейчас, мне стало интересно, как быстро эрланг смержит большие списки. Накидал небольшой бенч

L1 = [random:uniform(1000) || N <- lists:seq(1, 1000000)].

Это список из миллиона чисел < 1000
L2, L3, L4 генерируются подобным образом(да, ощутимо по времени)

timer:tc(lists, flatten, [L1, [L2, L3], L4]).
>{250000,
 [93,444,724,946,502,312,598,916,667,478,597,143,210,698,160,
  559,215,458,422,6,563,476,401,310,59,579,990|...]}

4 списка по 1000000 элементов сливались четверть секунды на среднем ноуте. Я бы побоялся запустить такое на питоне или руби, хотя сам питоновод. Жду unladen swallow.

habracut Jul 4 2009 at 02:40

0.15 сек. (Отсутствие рандомных чисел сути не меняет)

Код list.py:

def listmerge(lstlst):
    all=[]
    for lst in lstlst:
      all.extend(lst)
    return all	

list_over_9000 = listmerge([list(xrange(1000))*1000, list(xrange(1000))*1000, list(xrange(1000))*1000, list(xrange(1000))*1000])

print "len = %s" % len(list_over_9000)

Что сказал профайлер:

C:\Users\user\Desktop\pff>python -m cProfile list.py
len = 4000000
         10 function calls in 0.155 CPU seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.155    0.155 <string>:1(<module>)
        1    0.081    0.081    0.155    0.155 list.py:1(<module>)
        1    0.000    0.000    0.073    0.073 list.py:1(listmerge)
        1    0.001    0.001    0.155    0.155 {execfile}
        1    0.000    0.000    0.000    0.000 {len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
        4    0.073    0.018    0.073    0.018 {method 'extend' of 'list' objects}

Я бы еще написал пару слов про disco (реализация MapReduce на языке Erlang для параллельных вычислений на больших наборах данных с интерфейсом для Питона), но похоже уже в другой раз, ибо очень хочется спать.

EXSlim Jul 4 2009 at 08:56

Извините, но Ваш пример некорректен. Во-первых, ваш listmerge не мержит вложенные списки; во-вторых, Вы сгенерировали кучу мусора: 4 списка, в каждом по 1000 нормальных элементов из 1000000. Остальные 999000 элементов — 999 копий первой тысячи

>>>a = list(xrange(1000))*1000
>>>a[999] is a[1999]
True

или

>>>a = list(xrange(1000))*1000
>>>id(a[999]) == id(a[1999) == id(2999) == ...
True

EXSlim Jul 4 2009 at 08:58

упс, опечатка последнем примере, но смысл, я думаю, понятен

habracut Jul 4 2009 at 09:14

Да это правда — объекты идентичны. Но для списков с числами до 1 млн ситуация меняется не критично: 0.291 s

def test(l1, l2, l3, l4):	
	list_over_9000 = listmerge([l1, l2, l3, l4])

	print "len = %s" % len(list_over_9000)
	
l1, l2, l3, l4 = list(xrange(1000000)), list(xrange(1000000)), list(xrange(1000000)), list(xrange(1000000))
test(l1, l2, l3, l4)

darkk Jul 7 2009 at 07:40

«В два раза» это «не критично»?

Vayun Jul 7 2009 at 08:58

Во-первых они сравнивают на разных машинах, так что это ничего не значит. Во-вторых зависит от задачи, если список из 10 элементов, то не критично)

darkk Jul 7 2009 at 09:07

Я говорил про разницу в двух вышеуказанных примерах хабраюзера habrcut.

habracut Jul 4 2009 at 09:25

Что касается не вложенности списков тут пример с функцией варианта №7, время чуть больше чем показал Erlang — 0.342 сек.

Vayun Jul 4 2009 at 11:24

Этот habrahabr.ru/blogs/python/63539/#comment_1765404 вариант примерно на 20% быстрее itertools. На счет Эрланга не знаю, не установлен.

Coder Jul 4 2009 at 13:56

Вы забыли помериться своими компьютерами. :-)

crash Jul 4 2009 at 05:42

ну это ж не перл чтобы однострочки тут выписывать, третий самый быстрый и самый простой, в чем проблема.

lig Jul 6 2009 at 08:06

всё равно, руки за «ll» на до отрывать!

Vayun Jul 6 2009 at 08:11

Если оно встречается два раза в короткой строке, которую можно охватить взглядом, почему нет?)
Тем более, что с нормальными шрифтами (какие должны использоваться в программировании) все выглядит не так ужасно.

lig Jul 6 2009 at 08:16

вы идиот?

потому что так делать нельзя! есть правила хорошего тона в обзывании переменных. нарушать их нельзя, потому что их нельзя нарушать никогда!

Vayun Jul 6 2009 at 08:23

Фанатичное следование Code Conventions полезный скилл для рядового кодера, с чем вас и поздравляю.

lig Jul 6 2009 at 08:26

а отступление от них в публичных публикациях — явный признак неуважения к аудитории и тяги к самолюбованию, с чем поздравляю вас

достаточно было использовать общепринятые foo, bar, etc, чтобы избежать обвинений в ламерстве и отвращения со стороны людей, которые видят каждый день тысячи строк хорошего кода.

Vayun Jul 6 2009 at 08:40

Задачи «избежать обвинений в ламерстве» от аудитории, которой не понятна строка «lambda ll: sum(ll, [])» у меня не было и никогда не будет. Рекомендую впредь мои посты пропускать, заменяя просмотром «тысяч строк хорошего кода». Тема закрыта.

lig Jul 6 2009 at 10:01

вообще я ваши посты и не собирался читать, тема была интересна, а внутри обычное говно оказалось