LINUX.ORG.RU
ФорумTalks

fias.nalog.ru

 , , , ,


0

1

Есть тут кто там работает?
Что за недопогроммистов туда понабирали?

$ sqlite3-dbf NORDOC16.DBF | iconv -f cp866 -t utf8 | grep 38b6e884-fda8-41a4-a155-015824968a09
INSERT INTO nordoc16 VALUES('38b6e884-fda8-41a4-a155-015824968a09','Об утверждении Перечня адресов объектов адресации, необходимых изменений и дополнений для внесения сведений в Федеральную информационную адресную систему по результатам инвентаризации объектов адресации, расположенных на территории Зеленорощинского с','2019-08-01','44','8','');

$ cat AS_NORMDOC_20190805_8414c6f1-d8d2-4a28-bd17-09054235185e.XML | tr '\>' '\n' | grep 38b6e884-fda8-41a4-a155-015824968a09
<NormativeDocument NORMDOCID="38b6e884-fda8-41a4-a155-015824968a09" DOCNAME="Об утверждении Перечня адресов объектов адресации, необходимых изменений и дополнений для внесения сведений в Федеральную информационную адресную систему по результатам инвентаризации объектов адресации, расположенных на территории Зеленорощинского сельского поселения Бугульминского муниципального района Республики Татарстан" DOCDATE="2019-08-01" DOCNUM="44" DOCTYPE="8" /

★★★★★

Последнее исправление: superuser (всего исправлений: 5)

Ответ на: ! от Deleted

В поле таблицы DBF текст умещается, кодировка там CP866, но текст обрезан ! И это они распространяют на весь РФ !

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 1)
Ответ на: комментарий от superuser

Если я правильно заюзал wc, то 250 байт там именно однобайтовой кодировкой. 250 байт - выглядит как некое разумное ограничение, выставленное вручную. Может для совместимости с каким-нибудь старым софтом так делают.

Deleted
()

Передайте им пламенный превед! Полно спецов без работы, а там таких балбесов держат.

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 1)

Что за недопограммистов туда понабирали?

cat AS_NORMDOC_20190805_8414c6f1-d8d2-4a28-bd17-09054235185e.XML | tr '\>' '\n'

Ты тоже не гений.

dexpl ★★★★★
()
Ответ на: комментарий от Deleted

Похоже так и есть. Распространяют порченные данные. Лавров.jpg

superuser ★★★★★
() автор топика

Программистов, которые работают ровно столько, сколько они получают.

И это правильно, разве нет? Чего ты хочешь от бюджетных специалистов? То, что подобные сайты вообще имеются, работают и обслуживают клиентов уже чудо.

EXL ★★★★★
()
Ответ на: комментарий от superuser

чо не так?

Во-первых, cat /path/to/file | tr вместо tr < /path/to/file. Во-вторых (и это много существеннее), ты хотел сказать xpath -q -e 'string(//NormativeDocument/@DOCNAME)' AS_NORMDOC_20190805_8414c6f1-d8d2-4a28-bd17-09054235185e.XML, но почему-то не сказал. И в-третьих, ты хотел сказать «Что» вместо «чо», но опять-таки не сказал.

dexpl ★★★★★
()
Ответ на: комментарий от dexpl

так то так, но разгребать ихнюю структуру неохото было, поэтому tr

superuser ★★★★★
() автор топика

Передайте Путину, что fias.nalog.ru в файлах DBF распространяет порченные данные. точка. !

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 1)
Ответ на: комментарий от dexpl

И к стати, ты тут не выпендривайся особо, я специально так оформил для наиболее быстрого понимания
тут много чего не просто так
А твою магию они вообще не поймут наверно, бгггг

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 2)
Ответ на: комментарий от superuser

я специально так оформил для наиболее быстрого понимания

Я тебе конечно верю,
Разве могут быть сомненья?

dexpl ★★★★★
()
Ответ на: комментарий от Deleted

Если я правильно заюзал wc, то 250 байт там именно однобайтовой кодировкой. 250 байт - выглядит как некое разумное ограничение, выставленное вручную. Может для совместимости с каким-нибудь старым софтом так делают.

На самом деле да, но выгрузки в более современном формате где-нибудь сбоку тоже могли прикрутить.

Igron ★★★★★
()
Ответ на: комментарий от dexpl

Запуск лишнего процесса и неряшливая бессмысленность в целом

Только в глазах спуфинга поптимизаторов с /r/unixporn.

cat X | Y проще пишется, проще читается и проще редактируется (когда внезапно нужно вставить между X и Y ещё один шаг обработки). Prove me wrong.

intelfx ★★★★★
()
Последнее исправление: intelfx (всего исправлений: 3)
Ответ на: комментарий от superuser

Полно спецов без работы, а там таких балбесов держат.

Может они не спецы?

Или у вас снова «кризис»?

У нас нормального специалиста очень трудно найти :(

Или :) смотря с какой стороны смотреть.

grim ★★☆☆
()
Последнее исправление: grim (всего исправлений: 1)
Ответ на: комментарий от grim

Может они не спецы?

Но получают наверно хорошо и с премиями, хотя должны писать такие заявления МЦСТ Эльбрус x86_64, не работает сеть (комментарий)
да там всё начальство наверняка с премиями!

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 1)
Ответ на: комментарий от superuser

Полно спецов без работы, а там таких балбесов держат.

Может они не спецы?

Но получают наверно хорошо и с премиями

Если без работы, то уже не получают.

Может все-же не спецы?

grim ★★☆☆
()
Ответ на: комментарий от superuser

а! я понял что ты не понял,

Я не понял, что спецы без работы сидят?

Я же говорю, что если без работы сидят в такое время, то может они и не спецы и такие-же как те балбесы или хуже?

чото ава у тебя на когото похожа непойму

Джокер-же!

grim ★★☆☆
()
Последнее исправление: grim (всего исправлений: 1)
Ответ на: комментарий от intelfx

cat X | Y проще пишется, проще читается и проще редактируется

Ровно наоборот: < X Y проще и написать, и прочесть, и изменить

(когда внезапно нужно вставить между X и Y ещё один шаг обработки).

Особенно когда нужно вставить хоть один, хоть сто один шаг обработки: < X foo | bar | baz | Y.

Это даже не говоря о том, что в общем случае X умеет читать не только stdin, что упрощает конструкцию до Y X.

Твой черед опровергать.

dexpl ★★★★★
()
Ответ на: комментарий от intelfx

И да, я так и знал, что возражений против основного тезиса [1] не будет.

[1] Нефиг разводить «юниксвей» там, где надо взять нужный инструмент. В частности, xpath(1).

dexpl ★★★★★
()
Последнее исправление: dexpl (всего исправлений: 1)

Вот поэтрму мне и стремно пользовать всякие «личные кабинеты» и «говноуслуги», потому что пишут их студенты за еду, и качество там соответствующее.

Zhbert ★★★★★
()
Ответ на: комментарий от dexpl

С 1м то понятно, что всякие xmlstarlet или xpath лучше, хотя если наизусть не помнишь синтаксис, то tr явно проще.

А про cat я согласен с intelfx, мне тоже удобнее cat | tr, и пофиг что там 40К с диска прочитаются в худшем случае.

sergej ★★★★★
()
Ответ на: комментарий от Promusik

Думаю, что да, и в необоснованных премиях.

superuser ★★★★★
() автор топика
Ответ на: комментарий от theNamelessOne

Почему бы и нет? Только чтобы создать хорошую рабочую информационную систему придётся изучать много в ихней области законодательства, а законодательство запутано.

Подозреваю что законодательство запутано специально (возможно рептилоидами) с целью создания условий при которых очень трудно или невозможно защитить свои права.
Вот интересные документальные видео, которые укрепляют подозрения:
https://www.youtube.com/user/ame650001/playlists
Если чо, я не либераст и не навальнёнок ни разу.

superuser ★★★★★
() автор топика
Последнее исправление: superuser (всего исправлений: 2)
Ответ на: комментарий от Zhbert

Согласен, а то сами навключают опций на миллион, а ты плати как дурачок!

superuser ★★★★★
() автор топика
Ответ на: комментарий от dexpl

< X Y

Удар ниже пояса. Но это всё равно хуже читается: нет визуального разделителя между именем файла X и именем команды Y.

И да, я так и знал, что возражений против основного тезиса [1] не будет.

С этим тезисом я полностью согласен. Мой комментарий был сугубо про «котов в трубе».

intelfx ★★★★★
()
Последнее исправление: intelfx (всего исправлений: 1)
Ответ на: комментарий от superuser

Спецы, которые без работы, никогда не пойдут в такую шарагу, даже если придётся мыть сортиры. Потому что мыть толчки выгоднее и головняка меньше.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)
Ответ на: комментарий от gadfly

Похоже на то, но ему повезло и для такого вида xml оно всё равно отрабатывает как надо.

sergej ★★★★★
()
Ответ на: комментарий от Deleted

250 байт - выглядит как некое разумное ограничение, выставленное вручную. Может для совместимости с каким-нибудь старым софтом так делают.

Правдоподобно. У Turbo Pascal string — 255 байт, так как 0-й байт — длина. По-моему, этот тип был и в других борландовских продуктах того времени.

question4 ★★★★★
()

https://support.esri.com/en/technical-article/000007920

The maximum size of a string (or text) field in a .DBF file is 254.

А Википедия говорит, что чтобы обойти это ограничение, нужно хранить длинные строки в специальном дополнительном файле .DBT https://en.wikipedia.org/wiki/DBase#File_formats

Претензии к тем, кто делал экспорт в DBF и не подумал, что бюрократический-юридический-административный язык очень многословен.

question4 ★★★★★
()
Ответ на: комментарий от question4

в специальном дополнительном файле .DBT

Если я чего-то помню это мало кто поддерживает и старый софт точно нет. Так что 250 байт хватит, привет из 80тых.

vtVitus ★★★★★
()
Ответ на: комментарий от EXL

Вот стало тебе плохо, вызвал ты скорую, а они через три часа ели приехали к тебе по ужасным дорогам потому, что кто то плохо делает свою работу

это правильно, разве нет? Чего ты хочешь от бюджетных специалистов?

И поставила тебе бригада скорой горчичник от аппендицита, потому, что у них ничего другого нет и операционная закрыта, потом, что:

это правильно, разве нет? Чего ты хочешь от бюджетных специалистов?

Это маленький пример. Куда ты не пойди везде тебя достанет результат плохой работы людей, не важно бюджетных или частных.

burato ★★★★★
()
Ответ на: комментарий от vtVitus

А ты чо тут вводишь читающих в заблуждение?
Давно уже всё осилено в отличии от. Читай внимательнее.

superuser ★★★★★
() автор топика

Ну пипец, у них и xml схемам не соответствуют. Чо делать то, поцаны?

$ xmllint --schema AS_DEL_ADDROBJ_2_250_15_04_01_01.xsd AS_DEL_ADDROBJ_20190808_b05571f2-b51f-4052-bb18-8717df848222.XML --noout 
AS_DEL_ADDROBJ_20190808_b05571f2-b51f-4052-bb18-8717df848222.XML:1: element Object: Schemas validity error : Element 'Object', attribute 'DIVTYPE': The attribute 'DIVTYPE' is not allowed.
...

superuser ★★★★★
() автор топика
Ответ на: комментарий от vtVitus

в специальном дополнительном файле .DBT

Если я чего-то помню это мало кто поддерживает и старый софт точно нет.

Неправильно помнишь :) Возможно, никогда не сталкивался, но в стандарте это было. Специально, чтобы не делать поля в основном файле слишком большими и переменного размера, все блобы вынесли в отдельный файл.

Лично я работал только с досовским FoxPro, версией 1993 или 94 года, и программами на нём. Там все базы хранили ФИО, адреса, названия организаций и прочие непредсказуемые строки в отдельных файлах. Возможно, там было ограничение вроде 65536 байт, но мы в него не упирались.

question4 ★★★★★
()

Ура!!! Lazarus рулит! Ничо не справилось, ни sed, ни xpath, ни tr. Только Lazarus - только хардкор!
А все юниксовые утилиты оказались детскими поделками. Хе-хе!

superuser ★★★★★
() автор топика
Ответ на: комментарий от question4

хмм странно, даже в начале 2000-х мы всё резали по 250 байт. Возможно, были требования, что база в одном файле, а может просто рукожопие было в требованиях. Из-за этого был всегда уверен, что в DBT со строками полная беда; век живи, век учись, а всё равно дураком помирать :D.

vtVitus ★★★★★
()
Ответ на: комментарий от sergej

если наизусть не помнишь синтаксис

Вот для того я и отписался в этой теме, чтобы появилось еще одно место, где можно подсмотреть, принципиально отличающееся от прочих тем, что я его точно не потеряю — штатный LOR'овский поиск слова xpath в моих комментариях мне его найдет. Надеюсь, maxcom не станет возражать против эдаких «персональных букмарков» :)

// BTW, мы IRL не пересекались? Если ты — тот Сергей, о котором я думаю, то общие знакомые у нас точно есть.

dexpl ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.