LINUX.ORG.RU

Про CSV формат

 , ,


0

3

Читал я спеку по цсв недавно. Да, писал парсер. Да, написал. Да, с нуля. Там все понятно вобщем. Я в курсе что есть всякие *.csv, *.tsv и прочие, это просто потому, что токены разделителей строк, полей и энклозуры полей могут быть любыми.

Вобщем вчера на SO какое-то тело ляпнуло что делимитер полей в строке может быть разным. Тело сказало что имелось ввиду, не разным в разных файлах, а разным в одном файле. Например "," и ";".

Я ему написал, мол, дядя, ткни меня носом в спеку где такое написано. Но тело так и не ответило.

А меня теперь мучает этот вопрос. Может я спеки читал не внимательно или еще что? Успокойте меня что такого не бывает, или ткните носом в спеку, где об этом написано.

Ответ на: комментарий от mix_mix

Нет, там в 4180 есть пук-пук про то, о чем я написал в самом первом абзаце треда. Т.е. правила заданные один раз действуют на весь файл данных.

deep-purple ★★★★★ ()
Последнее исправление: deep-purple (всего исправлений: 1)

Тело было немного упорото, в каждом файле один разделитель (по RFC ЕМНИП вообще только запятая, в реальности разные разделители используются, но не смешиваются в одном файле).

tiandrey ★★★★★ ()

Вот «на всякий случай» я свой парсер аргументов командной строки сделал так, что параметры можно разделять либо запятой, либо двоеточием. При желании можно еще точку с запятой добавить — strtok все съест.

Eddy_Em ☆☆☆☆☆ ()
Ответ на: комментарий от Eddy_Em

Ну у тебя свои самопальные правила, а тут спеки.

Кстати как твой стрток справляется с утф-8? Это я тебя не тролю, это реальный вопрос.

deep-purple ★★★★★ ()
Ответ на: комментарий от deep-purple

Кстати как твой стрток справляется с утф-8?

Никак. Мне это не нужно.

Eddy_Em ☆☆☆☆☆ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.