LINUX.ORG.RU
ФорумTalks

Document Liberation Project — хорошо, но...


0

1

Document Foundation продолжает заниматься неведомой фигнёй по продвижению открытых форматов документов и созданием библиотек для перевода проприетарных форматов во что-то более адекватное.
Моё предложение.
Создать новый формат:) Ага, именно так. Слушайте чего я нафантазировал.

Основой нового формата служит обычный plain text текстовый файл в котором есть лишь буквы, знаки препинания, табуляции и переводы каретки.
Этот файл уже сам по себе способен покрыть бОльшую часть применений текстовых «документов».
Если же необходимо указывать шрифты, вставлять изображения и т.п.
то информацию для этого брать из отдельного файла. Формат этих данных предлагаю, чтобы не велосипедить, взять HTML.

В результате получаем ситуацию, когда пользователь имеет инструмент для просмотра этой дряни, то просмотрщик накладывает данные разметки на текст, получает HTML и рендерит его.
Если никакого инструмента нет, то у нас остаётся возможность увидеть аккуратный (без всякого разметочного мусора) текст хоть с помощью cat.

Давайте-ка чуток пофантазируем и поищем большие подводные камни.

★★☆

Ну, HTML как таковой предназначен для экранных текстов. Я не думаю, что он хорошо подойдёт для бумажных текстов с разбиением на страницы. Если сейчас и то у разных браузеров есть проблемы с отображением одних и тех же документов.

d1337r
()
Ответ на: комментарий от d1337r

На бумагу я предлагаю забить.
Впрочем когда я говорю HTML я подразумевал идею, а не конкретно HTML.
Нам ничего не мешает добавить тег <разрыв листа>.

Stahl ★★☆
() автор топика

Первая мысль - таблицы?

Вторая мысль - так по два файла и передавать? Ххее..

Третья мысль - как плейн структурно соотносить со схемой?

Avial ★★★★★
()
Ответ на: комментарий от Avial

Первая мысль - таблицы?

Таблицы легко делаются с помощью plain text.

Вторая мысль - так по два файла и передавать? Ххее..

Сложные документы с текстом, иллюстрациями и разметочной инфой упаковываем в tar

Третья мысль - как плейн структурно соотносить со схемой?

Развей мысль. Что за схема? Я не уловил идею...

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

Развей мысль. Что за схема? Я не уловил идею...

Как во втором файле(который с разметкой) ссылаться на текст из первого, если в первом только плеин текст без разметки?

Daeloce
()
Ответ на: комментарий от Daeloce

Я пока предлагаю с помощью смещений в словах.
Например тег <b> после 135 слова, а тег </b>после 138. Тем самым имея 3 слова внутри тегов.
Возможно (хотя, как мне кажется, не нужно) добавить дополнительные смещения в масштабе слова.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

Таблицы легко делаются с помощью plain text.

Чтоб ты всю жизнь такие таблицы заполнял.

Формулы как встраивать? Размер шрифта, отступы, расстояние между строками, выравнивание по разным краям ты пробелами предлагаешь делать?

Behem0th ★★★★★
()
Ответ на: комментарий от Stahl

Например тег <b> после 135 слова, а тег </b>после 138. Тем самым имея 3 слова внутри тегов.

Ад. Вставил одно слово напрямую в plaintext файл, и вся разметка уплыла к чертям!

Daeloce
()
Ответ на: комментарий от Stahl

Т.е. при каждом редактировании текста придётся редактировать схему?

theNamelessOne ★★★★★
()
Ответ на: комментарий от Behem0th

Размер шрифта, отступы, расстояние между строками, выравнивание по разным краям ты пробелами предлагаешь делать?

Это всё делается с помощью HTML-разметки.
Впрочем, что за расстояние между строками? Я предлагаю формат для хранения текста, а не формат для предпечатной подготовки в типографии.
Как в mcedit или cat изменить расстояние между строками?

Формулы как встраивать?

А как это делается в HTML?

ты пробелами предлагаешь делать?

В файле с текстом — да.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Daeloce

и вся разметка уплыла к чертям!

Да, задача обеспечить просмотр в любых условиях, но не редактирование.
Впрочем, если у тебя есть идеи — говори. Не думаю, что это невозможная задача.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Behem0th

Размер шрифта, отступы, расстояние между строками, выравнивание по разным краям ты пробелами предлагаешь делать?

Прошу прощения, не внимательно прочитай первый пост темы.

Если же необходимо указывать шрифты, вставлять изображения и т.п.

то информацию для этого брать из отдельного файла.

До этого я вообще считал идею глупой, сейчас я вообще это наркоманией считаю.

Behem0th ★★★★★
()

Если же необходимо указывать шрифты, вставлять изображения и т.п. то информацию для этого брать из отдельного файла. Формат этих данных предлагаю, чтобы не велосипедить, взять HTML.

HTML — это формат описания данных, тут больше CSS подходит.

theNamelessOne ★★★★★
()
Последнее исправление: theNamelessOne (всего исправлений: 1)
Ответ на: комментарий от Behem0th

И что ты считаешь нелепым?
Простой доступ к сути документа — тексту?
Без шрифтов и прочего документ останется документом.
А ты попробуй выколупать где-то статью в HTML вёрстке и попробуй почитать — неудобно.
Я предлагаю лишь отделить мёд от говна и держать их в разных бочках.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

Я предлагаю формат для хранения текста, а не формат для предпечатной подготовки в типографии.

Как я понял ты предлагаешь замену odf.

А как это делается в HTML?

Картинками?

В файле с текстом — да.

Ой спасибо, ненужно!

Единственное отличие твой идее от odf(в нутри которого тот же плейн текст но в хмл+ доп контент) в том что ты хочешь отделить контент от оформления, но ИМХО сделать это можно только с огромадными костылями.

И да в основном у меня бомбит от твоей идеи по поводу таблиц.

Behem0th ★★★★★
()
Ответ на: комментарий от Behem0th

А что у тебя с таблицами не сложилось?
Не вижу проблемы.
Ты боишься, что руками рисовать таблицу сложно?
Но ведь руками это делать и не надо. Ничего не мешает возложить эту задачу на редактор. Но при этом останется возможность это делать руками.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

А ты попробуй выколупать где-то статью в HTML вёрстке и попробуй почитать — неудобно.

Зачем? Открываешь в веб браузере и читаешь, если сильно надо пересохраняешь в тот формат что тебе нужен.

Behem0th ★★★★★
()
Ответ на: комментарий от Behem0th

Зачем?

Ох-х-х...
А при просмотре pdf запускаешь соответствующую программу и читаешь...
А при просмотре odf запускаешь соответствующую программу и читаешь...
А при просмотре doc запускаешь соответствующую программу и читаешь...

Уловил идею? Есть инструмент — хорошо. Нет инструмента — ничего страшного: у тебя всё равно остаётся возможность прочитать содержимое.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

Ты боишься,

останется возможность это делать руками

Нам на работу присылала одна гос контора форму отчета на заполнение в тексте. Это была большая таблица сделанная |-+ таким говном. Это был ад! Чтобы изменить размер столбца когда у тебя заполнена уже куча строк, нужно выравнивать все строки во всей таблице в ручную. Если у тебя таблица на 5 строк и 6 столбцов то в простом тексте ты можешь отредактировать вручную. Если значительно больше, это лишь иллюзия. После попытки редактирования такой таблицы ты будешь согласен работать в Ворде 2013 запущенном в вайне в линуксе в виртуалке на удаленной машине по рдп, лишь бы не проходить через этот ад опять.

А при просмотре doc запускаешь соответствующую программу и читаешь...

При просмотре твоего формата ты замечаешь что у тебя пропущена одна буква и ты запускаешь соответствующую программу и ... Или документ специфичный и непонятен без оформления и опять же тебе придется запускать соответствующую программу.

Behem0th ★★★★★
()
Ответ на: комментарий от Behem0th

Для создания/редактирования нужен редактор.
Это неизбежное (я пока не придумал как его обойти) зло.
Так создаются все современные документы.
Но для чтения можно будет обойтись без специального инструмента.

Почему эта мысль непонятна?

Stahl ★★☆
() автор топика

Не могу понять как это поможет моей бабушке?

Любой задрот вроде нас с тобой будет или легко читать HTML,LaTeX, или напишет текстовик и все тут

vertexua ★★★★★
()
Ответ на: комментарий от Stahl

Не то. Я не хочу видеть в тексте разметочный мусор.

Открой для себя .txt, потому как твоя идея

Например тег <b> после 135 слова, а тег </b>после 138. Тем самым имея 3 слова внутри тегов.

абсолютный бред. Вставка одного предложения в середину текста автоматически повлечёт трату кучи времени и сил на перелопачивание файла с стилями. Если хочется чистого текста, то проще тот же LaTeX + скрипт, который будет отчищать файл от тегов.

najlus ★★★★★
()
Ответ на: комментарий от najlus

скрипт, который будет отчищать файл от тегов.

Идея неплохая, но что ты будешь делать с этим скриптом на DOS-машине или на новой винде или на своей самописной ОС?
Я же предлагаю сразу иметь текстовый файл, готовый к чтению без дополнительной обработки.
Задача — обеспечить доступ к информации всегда и везде с помощью самых примитивных инструментов.

Stahl ★★☆
() автор топика
Ответ на: комментарий от feofan

Нечто вроде makefile с оформление, а содержимое в отдельных файлах

Ну я в принципе, что-то такое и предлагаю.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

Почему эта мысль непонятна?

«ты хочешь отделить контент от оформления, но ИМХО сделать это можно только с огромадными костылями.» Это я уже писал выше.

Но для чтения можно будет обойтись без специального инструмента.

Но зачем? Мне понятна идея такой вещи как okular из состава KDE, достаточно простая утилита для чтения большого колличества форматов. И для удобства создания программ такого типа был и придуман Document Liberation Project.

И как я уже писал выше «Или документ специфичный и непонятен без оформления и опять же тебе придется запускать соответствующую программу.»

Behem0th ★★★★★
()
Ответ на: комментарий от Stahl

Идея неплохая, но что ты будешь делать с этим скриптом на DOS-машине или на новой винде или на своей самописной ОС?

А что делать если кодировка не совпадёт? А что делать с разными концами строк?

Твоя идея невозможна - ты пытаешься осуществить два разных подхода (простой текст и текст с форматированием) в одном и в итоге либо один, либо оба получаются кастрированными и неюзабельными. В случае твоего предложения работа с форматированием превращается в ад и погибель, в случае с LaTeX приходится жертвовать удобством чтения самого текста. Тут надо просто определить насколько важно форматирование и пользоваться одним из подходов, т.к. при совмещении мы получаем банально больше геморроя, чем при использовании только одного.

najlus ★★★★★
()
Ответ на: комментарий от najlus

Хорошо.
А есть ли у тебя идеи как заставить/убедить людей использовать текстовые файлы везде, где это возможно?
Я пытаюсь дать компромиссное решение для тех, кто искренне считает, что кому-то важны их многообразие шрифтов и прочая лабуда в обычном тексте.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

А есть ли у тебя идеи как заставить/убедить людей использовать текстовые файлы везде, где это возможно?

No way. Открой для себя catdoc. Мир не изменить.

feofan ★★★★★
()
Ответ на: комментарий от Stahl

А есть ли у тебя идеи как заставить/убедить людей использовать текстовые файлы везде, где это возможно?

Купить маркетинговый отдел Apple, устроить международную истерику про то, что не текстовыми файлами пользуются только террористы-педофилы, протолкнуть во всех странах идею официальной установки зондов на любую вычислительную машину с расстрелом в случае отказа и обеспечить полный контроль за от, кто и чем пользуется. Иначе никак.

Я пытаюсь дать компромиссное решение для тех, кто искренне считает, что кому-то важны их многообразие шрифтов и прочая лабуда в обычном тексте.

Те, кто искренне считают, что их многообразие шрифтов важно при взгляде на твой способ форматирования убегут в ужасе истошно вопя и призывая мамочку.

najlus ★★★★★
()

Велосипедостроители.
ODT вам чем не угодил, ироды? Он даже по ГОСТу давно стандарт. От продукции мелкомягких избавляться надо, и будет всем шшшастье.

teamfighter
()
Ответ на: комментарий от teamfighter

От продукции мелкомягких избавляться надо, и будет всем шшшастье.

Невозможно без повышения эффективности борьбы с нелицензионным распространением информации. Все привыкли качать MSO с ближайшего трекера.

feofan ★★★★★
()

Формат на основе XML и каскадных таблиц стилей с фичами латеха (автонумерации, разбиение блоков по страницам, индексы, сноски и т.п.) и скриптовым языком для расширения стандартной функциональности был бы весьма годен.

static_lab ★★★★★
()
Ответ на: комментарий от static_lab

А odf разве не удовлетворяет твоим требованиям?

Behem0th ★★★★★
()

Моё предложение.
Создать новый формат

Разрешаю, создавай. Только ни одна моя программа использовать его не будет ни при каких обстоятельствах.

redgremlin ★★★★★
()
Ответ на: комментарий от Stahl

Задача — обеспечить доступ к информации всегда и везде с помощью самых примитивных инструментов.

Наивный чукотский вьюноша считает, что текст выводится с использованием примитивных инструментов.

redgremlin ★★★★★
()
Ответ на: комментарий от feofan

Да да, mso 2099 скачать бесплатно без смс без регистрации на семерочку максимальную.

teamfighter
()
Ответ на: комментарий от redgremlin

Разрешаю, создавай.

Я предлагаю, а не спрашиваю разрешения.

моя программа использовать его не будет

Ну всё, мой мир рухнул. Пойду скушаю асбеста и прыгну с моста...

текст выводится с использованием примитивных инструментов

Базовых... примитивных... Ты действительно не умеешь подбирать смысл слова исходя из контекста?

Откуда столько желчи? Велосипедоненавистник? Фу таким быть. Стыдно, молодой человек:)

Stahl ★★☆
() автор топика

Давайте-ка чуток пофантазируем и поищем большие подводные камни.

открой для себя Latex

MikeDM ★★★★★
()
Ответ на: комментарий от redgremlin

Тут скорее проблема в том что ТС считает что текст сам по себе центральный пункт

pylin ★★★★★
()

Основой нового формата служит обычный plain text текстовый файл в котором есть лишь буквы, знаки препинания, табуляции и переводы каретки. Этот файл уже сам по себе способен покрыть бОльшую часть применений текстовых «документов». Если же необходимо указывать шрифты, вставлять изображения и т.п. то информацию для этого брать из отдельного файла.

Примерно так устроен формат Microsoft Publisher: там форматирование текста хранится в совершенно другом дереве одного и того же бинарного документа.

Теперь понятно, кто конкретно тебя укусил :)

AP ★★★★★
()
Ответ на: комментарий от AP

Теперь понятно

Давай я не буду спрашивать откуда ты знаешь устройство формата Microsoft Publisher?:)

Stahl ★★☆
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.