Распарарелить команду в баше

2

2

Есть у меня вот такой незасмыловатый скрипт

find "$SOURCEDIR" -type f -name "*2015_0[1-3]_[0-3][0-9].txt.tar.gz" | while read file
do
	glacier-cmd upload $GLACIER_VAULT "$file" --description \""$(basename "${file}")"\" >> "$LOGFILE"
	COUNTER=$((COUNTER+1)) && echo $COUNTER > "$COUNTER_FILE"_1
done

Всё прекрасно работает, но только ооооооочень медленно. Он за полдня роботы загрузил 45000 файлов, а всего их 3,7млн.

Вот сижу и думаю, можноли как-то одновременно запускать несколько(или много) экземпляров glacier-cmd, но что бы оно не грузило одни и теже файлы.

Может подкинете идею?

Ссылка

←	поврежденный pv в vg

Squid transparent proxy не показывает один сайт

→

gnu parallel

~~Psych218~~ ★★★★★
(16.05.15 13:08:23 MSK)

Ссылка

Пускай в фоне и контролируй число фоновых процессов.

http://linuxoid.in/Нарезка_дампа_c_mysql-базами_на_отдельные_базы_или_таблицы - как пример, внизу.

YAR ★★★★★
(16.05.15 13:08:25 MSK)

Ссылка

https://github.com/vsespb/mt-aws-glacier

zolden ★★★★★
(16.05.15 13:22:16 MSK)

Ответ на: комментарий от zolden 16.05.15 13:22:16 MSK

здесь такое не котируется, там не используются square wheels

anonymous
(16.05.15 13:26:17 MSK)

Ответ на: комментарий от anonymous 16.05.15 13:26:17 MSK

square wheels у меня в скрипте или ...? ;)

GoNaX ★★★
(16.05.15 13:34:32 MSK) автор топика

Ссылка

~~Psych218~~, YAR, zolden спасибо за наводку, сейчас что-то выберу.

GoNaX ★★★
(16.05.15 13:51:44 MSK) автор топика

Ссылка

при паралеллизме со счётчиком будет труднее. если отбросить этот ньюанс то
складываешь закачку скрипт script.sh, который принимает аргумент:

#!/bin/bash
file=$@
glacier-cmd upload $GLACIER_VAULT "$file" --description \""$(basename "${file}")"\" >> "$LOGFILE"

find "$SOURCEDIR" -type f -name "*2015_0[1-3]_[0-3][0-9].txt.tar.gz" | xargs -n1 -P10 script.sh

-n1 - берет 1 строчку как единственный аргумент, передает его в script.sh
-P10 -10потоков

bl ★★★
(16.05.15 19:02:20 MSK)

Ответ на: комментарий от bl 16.05.15 19:02:20 MSK

Твой вариант сработал. Сначала делал с gnu parallel, но у заказчиков параноя, а parallel нет в репах Centos. В общем остановился на xargs, ведь доустанавливать ничего не нужно.

В логе была каша, но я сделал отдельный лог на каждый процесс, а потом собрал в один нормальный. Счетчик тоже сделал по кол-ву этих логов.

GoNaX ★★★
(18.05.15 21:02:25 MSK) автор топика