[Perl] Разбивка длинной строки

0

0

Доброго времени суток!

Имеется длинная строка (240 символов), в которой зашифрованы показания кучи датчиков. Строку эту нужно разбить на подстроки разной (заранее известной) длины, каждую подстроку преобразовать и таким образом получить эти показания. С преобразованием проблем нет, но я подозреваю, что для каждого преобразования отдельно получать свою подстроку довольно накладно. Есть ли возможность сразу разбить исходную строку на подстроки заданной длины, и уже потом каждую обрабатывать по отдельности?

Ссылка

← Профилирование параллельных программ

ARM interrupt →

например /^(\w{2])(\w{10})(\w{5})$/

name_no ★★
(14.05.10 09:43:34 MSK)

Ответ на: комментарий от name_no 14.05.10 09:43:34 MSK

Спасибо, интересная мысль. Только вот два вопроса.

1. Регэксп будет довольно длинный — в строке зашифрованы показания около 40 датчиков. Не окажется ли обработка строки по регэкспу медленнее, чем явные вызовы substr?

2. (нубский вопрос) Можно пример использования регэкспов подобного рода? Я так понимаю, что результат преобразования должен присваиваться массиву. Я не перл-хакер, я только учусь :-)

decadent ★
(14.05.10 09:52:24 MSK) автор топика

Ответ на: комментарий от decadent 14.05.10 09:52:24 MSK

substr будет быстрее

или аналог сишной функции scan

use String::Scanf;

($temp, $speed, $size) = sscanf('%4s %3s %5s','1234 123 12345');

ligverd ★
(14.05.10 09:58:09 MSK)

Ссылка

Ответ на: комментарий от decadent 14.05.10 09:52:24 MSK

Сорок вызовов substr или один вызов регексп - я не уверен, что будет быстрее, если честно.

Использовать регексп можно, например, так:

my $str = 'long_string';
$str =~ m/^(\w{2})(\w{10})(\w{5})$/;
printf "temp: %i; date: %s; pressure: %s", $1, $2, $3;

как можно догадаться, $1, $2, $3 соответствуют скобочкам в регекспе.

Другой вариант:

my $str = 'long_string';
my @arr = $str =~ m/^(\w{2})(\w{10})(\w{5})$/;
printf "temp: %i; date: %s; pressure: %s", @arr;

name_no ★★
(14.05.10 10:17:51 MSK)

Ответ на: комментарий от name_no 14.05.10 10:17:51 MSK

Большое спасибо, теперь все понятно! Попробую оба варианта — и с sscanf, и с регэкспом.

decadent ★
(14.05.10 10:23:30 MSK) автор топика

Ссылка

Если заранее известны длины строк, регэксп не нужен. Используйте unpack.

anonymous
(14.05.10 12:58:11 MSK)

Ссылка

perldoc -f split

wlan ★★
(14.05.10 13:05:17 MSK)

Ответ на: комментарий от wlan 14.05.10 13:05:17 MSK

Интересно, как вы будете делать split следующей строки: «test1testtest255», длина первой части 5, второй 4, третьей 6, четвертой 1.

anonymous
(14.05.10 18:41:28 MSK)

Ответ на: комментарий от anonymous 14.05.10 18:41:28 MSK

#!/usr/bin/perl

use strict;
use warnings;

my @array = "test1testtest255";

my $part1 = shift split /\w{5}/, @array;

my $part2 = shift split /\w{4}/, @array;

my $part3 = shift split /\w{6}/, @array; 

my $part4 = shift split /\w{1}/, @array;

код вбивал прям тут и не отлаживал, примерно так.

wlan ★★
(14.05.10 21:40:20 MSK)

Ответ на: комментарий от wlan 14.05.10 21:40:20 MSK

вы удачно подобрали себе аватарку :-)

ddt
(14.05.10 21:56:00 MSK)

Ответ на: комментарий от wlan 14.05.10 21:40:20 MSK

Да уж...

Lego_12239 ★★
(14.05.10 22:00:13 MSK)

Ссылка

Ответ на: комментарий от ddt 14.05.10 21:56:00 MSK

идите нахер я спросонья

wlan ★★
(14.05.10 22:00:57 MSK)

Ответ на: комментарий от wlan 14.05.10 22:00:57 MSK

#!/usr/bin/perl

use strict;
split(/ */, 'test1testtest255');

my @part1 = @_[0..4];
my @part2 = @_[5..8];
my @part3 = @_[9..14];
my @part4 = @_[15];

print "@part1\n@part2\n@part3\n@part4\n";

hawaii-2% ./test.pl
t e s t 1
t e s t
t e s t 2 5
5

да согласен, через сплит велосипедно получается, красивее было бы через регекспы

wlan ★★
(14.05.10 22:48:28 MSK)

Ответ на: комментарий от wlan 14.05.10 22:48:28 MSK

Да, аватарка зачетная =)

@parts = unpack(«A5 A4 A6 A1», «test1testtest255»);

anonymous
(15.05.10 00:33:11 MSK)

Ответ на: комментарий от anonymous 15.05.10 00:33:11 MSK

чо вы прикопались, я вообще вендузятнек

wlan ★★
(15.05.10 00:42:30 MSK)

Ссылка

Ответ на: комментарий от anonymous 15.05.10 00:33:11 MSK

> @parts = unpack(«A5 A4 A6 A1», «test1testtest255»);

Спасибо, действительно there is mote than one way to do it :-) Я уже через регэксп сделал — работает вроде бы нормально.

decadent ★
(15.05.10 21:58:42 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Профилирование параллельных программ

Development

ARM interrupt →

Похожие темы