Переместить строку в конец файла

Первое, что приходит в голову:

Два списка head и tail.
Если условие выполнилось, пушишь в tail, иначе в head.
Складываешь списки, объединяешь в строку ('\n'.join(head + tail)) и готово.

Kilte ★★★★★
(22.10.15 22:57:15 MSK)

Ссылка

Что за задача? Если что-то сложнее выбора из списка фильма на вечер, возможно, имеет смысл пересмотреть концепцию.

mix_mix ★★★★★
(22.10.15 23:26:36 MSK)

Ссылка

больше на сортировку по неизвестному условию похоже

anonymous
(22.10.15 23:50:36 MSK)

Ссылка

Kilte дело говорит.

f = open('file', 'r+')
lines = f.readlines()
f.seek(0)

temp = []

for l in lines:
    if len(l) > 25:
        temp.append(l)
    else:
        f.write(l)

f.writelines(temp)

f.truncate()
f.close()

anonymous
(23.10.15 00:31:36 MSK)

Ответ на: комментарий от anonymous 23.10.15 00:31:36 MSK

Наркоманы, чтоли, всё в памяти хранить?

grep -v PATTERN file > ._tmp
grep PATTERN file >> ._tmp
mv ._tmp file

Тут с практической точки зрения очень важна последняя операция, f.truncate() делать не стоит.

~~mashina~~ ★★★★★
(23.10.15 00:37:39 MSK)

Ответ на: комментарий от mashina 23.10.15 00:37:39 MSK

в памяти хранить

А тебе памяти жалко, что ли? А дорогого SSD не жалко?

f.truncate() делать не стоит

Стоит, если человек вдруг не захочет писать какую-то строку в файл.

anonymous
(23.10.15 00:42:14 MSK)

Ответ на: комментарий от mashina 23.10.15 00:37:39 MSK

он же пишет

для какой-то строки line выполнилось какое-то условие

это не обязательно должен быть матчинг строк

например (пример на JS, так как пистон не знаю)


condition = function(str){return eval(str) === 10}

txt = fs.readFileSync("file.txt", "utf8")
txt = txt.replace(/.*/g, function(str){
  if(condition(str)) {lastString = str; return "XXXXX"}
  return str
})

txt = txt.replace(/XXXXX\r?\n/, "")
if(global.lastString) txt = txt.replace(/$/, lastString)

fs.writeFileSync("file.txt", txt)

Что то такое должно быть, наверное.

~~newquestion~~
(23.10.15 00:55:29 MSK)

Ответ на: комментарий от newquestion 23.10.15 00:55:29 MSK

это не обязательно должен быть матчинг строк

А ещё это не должен быть grep, да? Смотреть в трёх строчках нужно было на то, что нельзя писать в файл из которого же и читаешь. А твой пример вообще ахтунговый, он жрёт больше всех памяти и при этом ещё медленнее всех.

~~mashina~~ ★★★★★
(23.10.15 01:18:00 MSK)

Ответ на: комментарий от mashina 23.10.15 01:18:00 MSK

А твой пример вообще ахтунговый, он жрёт больше всех памяти и при этом ещё медленнее всех.

какой бред, для одноразовой замены. Вообще, удобная позиция, не умеешь ничего толкового, болтай про оптимизацию все время, авось за умного проконаешь. BTW, где ты там жер памяти нашел? В том что файл в память грузишь, или че? Ты на каком компе то сидишь, что загрузка файла для тебя оверхед?

~~newquestion~~
(23.10.15 01:26:35 MSK)

Ответ на: комментарий от mashina 23.10.15 00:37:39 MSK

А зачем ты файлы ._tmp скрытыми делаешь? Ты же все равно их удаляешь.

~~newquestion~~
(23.10.15 01:40:15 MSK)

Ссылка

Ответ на: комментарий от newquestion 23.10.15 01:26:35 MSK

Кхм, не удержался :)

В том что файл в память грузишь, или че?

Скажи это wireshark'у например. Скачай только перед этим пару 4k киношек, лучше, через торрент. А потом, сравни с tshark'om.

Вообще, товарищь с грепом на пальцах предложил самое нормальное решение. Не вдаваясь в подробности - оно самое шустрое из вышепредложенных и единственное, которое отработает в общем случае(с ограничениями только по диску и то линейными).

pon4ik ★★★★★
(23.10.15 03:16:18 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.10.15 00:42:14 MSK

А в общем случае твоё решение имеет больший шанс упасть с неконсистентными данными на выходе:)

А автор не указал ограничений ни на размер ни на железо.

pon4ik ★★★★★
(23.10.15 03:38:53 MSK)

Ответ на: комментарий от pon4ik 23.10.15 03:38:53 MSK

твоё решение

А где твоё решение, максимально приближенное к условиям ТСа, которое можно было бы вот так же легко обсудить?

anonymous
(23.10.15 03:46:48 MSK)

Ответ на: комментарий от mashina 23.10.15 00:37:39 MSK

Наркоманы, чтоли, всё в памяти хранить?

Я, например, не могу знать, насколько большой объём данных нужно перелопатить, потому предложил, так сказать, решение в лоб.

Kilte ★★★★★
(23.10.15 08:48:41 MSK)

Ссылка

По мере чтения file1 пиши в file2, потом mv file2 file1.

true_admin ★★★★★
(23.10.15 11:35:48 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.10.15 03:46:48 MSK

Ну, я за уменьшение энтропии вселенной, поэтому моё решение это таки grep.

Ну, максимум можно тот код к однострочнику свести:

p=pattern grep -v "$p" file > .tmp; grep "$p" >> .tmp; mv .tmp file #Key to search in history

Хотя, тут есть свои минусы, с одной стороны такую команду можно тупо в истории потом искать, с другой стороны менее читабельно.

Тут уже зависит от юзекейса надо ли его пихать в скрипт или лучше так.

pon4ik ★★★★★
(23.10.15 12:20:59 MSK)
Последнее исправление: pon4ik 23.10.15 12:23:07 MSK (всего исправлений: 1)

Ответ на: комментарий от pon4ik 23.10.15 12:20:59 MSK

я за уменьшение энтропии

Тогда тебе лучше было бы избежать постить камент. Во-вторых, мог бы чего-нибудь своего привнести.

(f=file; p=pat; grep -v $p $f; grep $p $f) > f

anonymous
(23.10.15 13:34:03 MSK)

Ссылка

Ответ на: комментарий от newquestion 23.10.15 01:26:35 MSK

BTW, где ты там жер памяти нашел?

.replace, дебила кусок.

Вообще, удобная позиция, ничего не соображая можно писать всякое говно, оправдывая что у тебя никогда не будет реальной задачи, как например нарисовать круг. Остается только передавать zip через ajax.

anonymous
(23.10.15 23:32:43 MSK)

Ответ на: комментарий от anonymous 23.10.15 23:32:43 MSK

replace, дебила кусок.

А теперь поясни, тупое педрило, как по-твоему replace отжирает память.

~~newquestion~~
(24.10.15 00:14:37 MSK)

Ответ на: комментарий от newquestion 24.10.15 00:14:37 MSK

Строка — иммутабельный объект, поэтому каждый .replace порождает новую строку.

Virtuos86 ★★★★★
(24.10.15 03:56:10 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 03:56:10 MSK

А старый куда девается?

~~newquestion~~
(24.10.15 08:20:02 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 03:56:10 MSK

BTW, иммутабельность тут не причем. Допустим, к массиву примеряем map, там тоже порождается новый массив , хотя массивы муттабельны. От операции зависит.

~~newquestion~~
(24.10.15 08:24:04 MSK)

Ответ на: комментарий от newquestion 24.10.15 08:20:02 MSK

А старый куда девается?

Ты серьезно задаешь этот вопрос? Я думаю, он собирается сборщиком мусора во время следующего «остановки мира».

Virtuos86 ★★★★★
(24.10.15 08:27:41 MSK)

Ответ на: комментарий от newquestion 24.10.15 08:24:04 MSK

У массивов в Питоне есть методы, которые меняют исходный массив, и есть методы, которые создают новый массив. Вот из-за вторых массивы в Питоне являются мутабельными, если же использовать первые, массивы вполне можно рассматривать как неизменяемые объекты.

Virtuos86 ★★★★★
(24.10.15 08:31:15 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:27:41 MSK

А про какой расход памяти тогда речь идет?

~~newquestion~~
(24.10.15 08:35:19 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:31:15 MSK

массивы вполне можно рассматривать как неизменяемые объекты

В том смысле, что не порождается новых объектов, и, соответственно, не тратится память.

Virtuos86 ★★★★★
(24.10.15 08:35:42 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:35:42 MSK

что ты несешь? наоборот, неизменяемые будут расходовать память, так как создается копия, и уже над ней совершается операция. Если на оригинал будут ссылки, в памяти будут висеть оба экземпляра.

~~newquestion~~
(24.10.15 08:39:28 MSK)

Ответ на: комментарий от newquestion 24.10.15 08:35:19 MSK

На практике, между появлением неиспользуемых объектов, которые потеряли ссылки на себя, и запуском GC может пройти неопределенное время, за которое количество таких объектов может принять ощутимое значение, это раз. Во-вторых, зачем создавать лишнюю работу сборщику мусора, увеличивая «тормоза» виртуальной машины? А в общем случае, всё зависит, от исходных условий: ограничения по процессорному времени, по памяти и т.д. В ОП задача может подразумевать очень большой файл, и тогда массовое создание строк может выжрать доступную память, например.

Virtuos86 ★★★★★
(24.10.15 08:43:02 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:43:02 MSK

Короче, спасибо кэп, за несколько детсадовских постов ниочем.

~~newquestion~~
(24.10.15 08:46:27 MSK)

Ответ на: комментарий от newquestion 24.10.15 08:39:28 MSK

наоборот, неизменяемые будут расходовать память, так как создается копия, и уже над ней совершается операция

А зачем тогда ты задавал этот вопрос, если тебе ясен ответ:

А теперь поясни, тупое педрило, как по-твоему replace отжирает память.

Virtuos86 ★★★★★
(24.10.15 08:47:24 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:47:24 MSK

Это был риторический вопрос. Нет там расхода памяти. Этот лошок берега попутал. Расходы на GC к расходу памяти не относится.

~~newquestion~~
(24.10.15 08:49:28 MSK)

Ссылка

Ответ на: комментарий от newquestion 24.10.15 08:46:27 MSK

Не за что. С дурачками так и работают: долго и терпеливо объясняют прописные истины. Правда, всё-равно не всегда помогает.

Virtuos86 ★★★★★
(24.10.15 08:49:45 MSK)

Ответ на: комментарий от Virtuos86 24.10.15 08:49:45 MSK

Да не, ты строчишь тут прописные истины потому что знанием нетривиальных истин ты похвастаться не можешь, а похвастаться чем то хочется.

~~newquestion~~
(24.10.15 08:52:01 MSK)

Ссылка

Ответ на: комментарий от mashina 23.10.15 01:18:00 MSK

он жрёт больше всех памяти

Кстати

grep -v PATTERN file > ._tmp # записали в файл и бросили на него ссылку tmp
grep PATTERN file >> ._tmp # дописали в файл
mv ._tmp file # удалили ссылку ._tmp установили ссылку file

Вопрос на засыпку. Куда делся оригинал файла file? Ответ: остался висеть в памяти.

В твоем *кошерном примере* ровно такие же накладные расходы, как и в моем.

~~newquestion~~
(24.10.15 09:18:24 MSK)

Ответ на: комментарий от newquestion 24.10.15 09:18:24 MSK

Если файл у тебя размером больше трети доступной памяти, или сколько у тебя реплейсов, то ты отсосешь, впрочем как и всегда. GC работает не так как ты себе представляешь в своих влажных электрических фантазиях.

anonymous
(24.10.15 09:41:21 MSK)

Ответ на: комментарий от newquestion 24.10.15 09:18:24 MSK

Где он остался висеть? А если он несколько террабайтов размером?

anonymous
(24.10.15 09:43:21 MSK)

Ответ на: комментарий от anonymous 24.10.15 09:43:21 MSK

В памяти он останется висеть.

~~newquestion~~
(24.10.15 09:44:03 MSK)

Ответ на: комментарий от newquestion 24.10.15 09:44:03 MSK

Несколько террабайт? Повторюсь.

anonymous
(24.10.15 09:45:01 MSK)

Ответ на: комментарий от anonymous 24.10.15 09:41:21 MSK

Если мы применим этот алгоритм к пачке файлов в цикле, будет тот же самый расход. А если учесть, что в оси сборщик примитивен, расход будет еще больше. По-принципу новые файлы записываются, а старые остаются. Разница только в том, что файлы тут не считываются целиком в буфер.

~~newquestion~~
(24.10.15 09:47:30 MSK)

Ответ на: комментарий от anonymous 24.10.15 09:45:01 MSK

Не знаю, по объему есть ли там ограничения, но суть, по идее такая, несколько терабайт будут так же висеть, если нет дополнительных механизмов на уровне оси для отдельного контроля за большими файлами. Этого я не знаю.

~~newquestion~~
(24.10.15 09:49:51 MSK)

Ответ на: комментарий от newquestion 24.10.15 09:47:30 MSK

Какой цикл родной, у тебя уже на первой итерации oops случится. Посоны, мне кажется у нас тут новое пробитие дна анонiмусом намечается.

anonymous
(24.10.15 09:50:20 MSK)

Ответ на: комментарий от anonymous 24.10.15 09:50:20 MSK

Ты похоже, не понимаешь о чем я говорю. Есть разница, одно дело, построчная обработка, и совсем другое — построчная обработка с промежуточной записью в файл.

~~newquestion~~
(24.10.15 09:52:29 MSK)

Ссылка

Ответ на: комментарий от newquestion 24.10.15 09:49:51 MSK

Сука, это надо в рамку и постить в каждый твой тред, дно торжественно пробито! Вопросов больше не имею.

anonymous
(24.10.15 09:53:15 MSK)

Ответ на: комментарий от anonymous 24.10.15 09:53:15 MSK

Анологично. Ты туп, что и требовалось доказать.

~~newquestion~~
(24.10.15 09:54:13 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.10.15 09:50:20 MSK

В том что памяти в этом случае не хватит (точней может не хвтить) в любом случае, так как просто не хватит памяти для записи нового файла, тут ты, допустим прав, это, как-бы, самоочевидно. Но какое это имеет отношение к теме? Это только косвенно подтверждает мою правоту. Поциэнт ведь *думает*, что в его алгоритме память не расходуется.

~~newquestion~~
(24.10.15 10:11:31 MSK)

Ссылка

Ответ на: комментарий от newquestion 24.10.15 09:18:24 MSK

Куда делся оригинал файла file? Ответ: остался висеть в памяти.

Прочитал твои бредни от этого идалее, не думал что такие клинически сказочные личности на ЛОРе существуют. Несколько удивительно что на такой простой вопрос в треде дали столько некорректных решений и речь даже не про память.

В твоем *кошерном примере* ровно такие же накладные расходы, как и в моем.

Нет, не такие же. Тебе вообще стоило бы заткнуться и перейти в режим ro лет на десять, ведь твой пример даже не делает того, что просили изначально - т.е. не переносит некоторые строчки выборочно в конец файла.

~~mashina~~ ★★★★★
(24.10.15 13:58:03 MSK)

Ответ на: комментарий от mashina 24.10.15 13:58:03 MSK

Какие именно?

~~newquestion~~
(24.10.15 14:05:27 MSK)

Ссылка

Ответ на: комментарий от mashina 24.10.15 13:58:03 MSK

Пример был заточен под строго определенные строки, поскольку используется предикат. Если ты даже этот код не смог осилить, говорить не о чем. В игнор за экстремальную тупость.

~~newquestion~~
(24.10.15 14:25:04 MSK)

Ответ на: комментарий от newquestion 24.10.15 14:25:04 MSK

Если ты даже этот код не смог осилить, говорить не о чем.

Не тупи. У тебя в коде сначала строки совпадающие с условием заменяются на «XXXXX», запоминается последняя совпавшая.

Затем убираются все строки, оканчивающиеся на «XXXXX» и запомненная строка дописывается в конец.

В общем случае, если больше одной строки совпадает с условием, то все кроме последней удалятся, но не добавятся в конец. Также, если уже есть строки, заканчивающиеся на «XXXXX», то они удалятся.

Очень плохой алгоритм.

monk ★★★★★
(24.10.15 16:36:33 MSK)

Ответ на: комментарий от monk 24.10.15 16:36:33 MSK

Ну так ты же не будешь на форум выкладывать готовую прекрасную программу. Показан принцип, остальное — это частности, которые допиливаются по ходу. Основное отличие его — это то, что строка фильтруется по произвольному предикату. В остальных же примерах показан только матчинг строк.

~~newquestion~~
(24.10.15 17:02:57 MSK)

Похожие темы