Perl, split

csv, perl

Нужно широкий (170 колонок) csv-файл разделить на поля и записать в базу, при этом все колонки должны прочитаться. Ерунда получается при разделении через split. Решил сделать вручную, так как через Text::CSV_XS еще больше проблем.

#!/usr/bin/perl
use strict;
use Data::Dumper;

my $str = 'a;b;;d;e;;;;';
my @col = split (/;/, $str);

print $str,"\n";
print Dumper @col,"\n";

a;b;;d;e;;;;
$VAR1 = 'a';
$VAR2 = 'b';
$VAR3 = '';
$VAR4 = 'd';
$VAR5 = 'e';
$VAR6 = '
';

Ссылка

← Помогите поправить скрипт

Нюансы запуска процессов через system/exec →

csv-файл записать в базу

пиши в Blob поле, распарсишь после чтения из базы

bvn13 ★★★★★
(05.06.20 19:23:07 MSK)

Ответ на: комментарий от bvn13 05.06.20 19:23:07 MSK

Почему split пропускает повторяющиеся пустые поля ';;;;'?
Файл нужно сразу делить по колонкам.

WinLin2 ★★
(05.06.20 19:27:53 MSK) автор топика
Последнее исправление: WinLin2 05.06.20 19:32:29 MSK (всего исправлений: 1)

Ответ на: комментарий от WinLin2 05.06.20 19:27:53 MSK

слушай, когда я писал подобное на 1С, я читал построчно, а потом для каждой строки заменял символ-разделитель на перевод строки и опять читал построчно. так точно работало.

bvn13 ★★★★★
(05.06.20 19:55:17 MSK)

Ответ на: комментарий от bvn13 05.06.20 19:55:17 MSK

#!/usr/bin/perl

use strict;
use utf8;
use Data::Dumper;

my $str = 'a1;b2;;d4;e5;;;;';
$str =~ s/;/ ;/g;

my @col = map { substr ($_, 0, -1) }  split( /;/, $str);

print $str,"\n";
print Dumper @col,"\n";

a1 ;b2 ; ;d4 ;e5 ; ; ; ;
$VAR1 = 'a1';
$VAR2 = 'b2';
$VAR3 = '';
$VAR4 = 'd4';
$VAR5 = 'e5';
$VAR6 = '';
$VAR7 = '';
$VAR8 = '';
$VAR9 = '
';

Добавил в каждую колонку пробел, потом его удалил.

WinLin2 ★★
(05.06.20 20:18:44 MSK) автор топика

Ссылка

Ответ на: комментарий от bvn13 05.06.20 19:55:17 MSK

Спасибо за помощь.

WinLin2 ★★
(05.06.20 20:20:10 MSK) автор топика

Ссылка

perldoc -f split:

If LIMIT is omitted (or, equivalently, zero), then it is usually treated as if it were instead negative but with the exception that trailing empty fields are stripped (empty leading fields are always preserved); if all fields are empty, then all fields are considered to be trailing (and are thus stripped in this case). Thus, the following:
           print join(':', split(/,/, 'a,b,c,,,')), "\n";
produces the output «a:b:c», but the following:
           print join(':', split(/,/, 'a,b,c,,,', -1)), "\n";
produces the output «a:b:c:::».

anonymous
(05.06.20 21:18:25 MSK)

Ответ на: комментарий от bvn13 05.06.20 19:55:17 MSK

костыли и велосипеды!

deep-purple ★★★★★
(05.06.20 21:23:05 MSK)

Ссылка

Text::CSV

В чём у вас с ним проблема? Учтите что то что вы разделяете split’ом — не соответствует стандарту CSV https://tools.ietf.org/html/rfc4180

anonymous
(06.06.20 00:22:06 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.06.20 21:18:25 MSK

Спасибо, удалил велосипед.

Не нашел в Text::CSV, как разделить строку файла по полям
и одновременно хранить в ее первоначальном виде.

WinLin2 ★★
(06.06.20 01:09:32 MSK) автор топика

Ответ на: комментарий от WinLin2 06.06.20 01:09:32 MSK

https://metacpan.org/pod/Text::CSV#parse

https://metacpan.org/pod/Text::CSV#fields

А со своим split ты однажды нарвешься на нечто типа a;b;"c;s";l.

Olegymous ★★★
(06.06.20 17:14:15 MSK)

Сложности-то какие, и не лень вам?

>>> 'a;b;;d;e;;;;'.split(';')
['a', 'b', '', 'd', 'e', '', '', '', '']

>>> import re
>>> re.split(';', 'a;b;;d;e;;;;')
['a', 'b', '', 'd', 'e', '', '', '', '']

>>> import csv
>>> next(csv.reader(['a;b;;d;e;;;;'], delimiter=';'))
['a', 'b', '', 'd', 'e', '', '', '', '']

slovazap ★★★★★
(06.06.20 18:33:19 MSK)
Последнее исправление: slovazap 06.06.20 18:36:13 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Olegymous 06.06.20 17:14:15 MSK

my @cols = @{$csv->getline ($fh)};
$csv->column_names (@cols);
while (my $row = $csv->getline_hr ($fh)) {
    print $row->{price};
}

В таком варианте можно увидеть строку до разбиения на поля?

WinLin2 ★★
(07.06.20 02:14:53 MSK) автор топика
Последнее исправление: WinLin2 07.06.20 02:15:42 MSK (всего исправлений: 1)

Неужели на CPAN нет подходящего модуля? Одно из правил инженера: вместо изобретения велосипеда поищи готовое решение, скорее всего оно будет работать лучше.

dvetutnev ★
(07.06.20 17:55:59 MSK)