LINUX.ORG.RU

Как объединить значения для стандартных полей Recoll?

 


0

1

Мне понадобилось добавить к стандартным полям Recoll значения, не заданные в метаданных документа. Допустим, есть такой документ:

  <html>
    <head>
      <meta name="author" content="Kosenko" />
      <meta name="m:author" content="Maverik" />
      <title>An Example</title>
     </head>
    <body>
      Example
    </body>
  </html>

Здесь поле author является стандартным, а m:author --- пользовательским. Чтобы задать это поле, в fields указывается:

  [prefixes]
  m:author=XYMA

  [stored]
  m:author=

Предположим также, что это результат обработки, например, pdf-файла, исправлять который я не хочу или не могу. Мне нужно добавить значение Constructor к полю author и значение Eugine к полю m:author. Для этого в recoll.conf помещается объявление вида:

  [~/study/recoll/metadata/trial]
  metadatacmds = ; author = echo "Constructor"; m:author = echo "Eugine";

Логично ожидать, что теперь после индексации приведенного документа в поле author будет записано «Kosenko - Constructor». а в поле m:author --- значение «Maverik - Eugine». Однако оказывается, что поле «m:author» приняло ожидаемое значение, а поле author --- нет. В нем прописывается только внутреннее значение Kosenko, полученное в результате обработки самого документа. Внешнее значение, заданное командой metadatacmds, не добавляется.

Интересно, что если добавить в документ еще один метатэг, например, так:

  <meta name="author" content="Constructor" />

то это значение добавляется к полю, но без дефиса-разделителя: «Kosenko Constructor». Это поведение одинаково как для стандартных, так и для пользовательских полей. А вот если к полю m:author добавить еще одно внешнее значение, скажем, так:

  [~/study/recoll/metadata/trial]
  metadatacmds = ; m:author = echo "Eugine"; m:author = echo "Creator";

то последнее значение в последовательности просто перекрывает все предыдущие.

Пока что я спасаюсь тем, что использую только поле m:author (собственно, по описанной причине и потребовалось еще одно поле для автора), а поле author объявляю его синонимом. Наоборот не получается --- при индексации синоним m:author вначале приводится к каноническому имени author, а затем все происходит так же, как и раньше. В результате все значения объединяются как надо, но: во-первых, поле author в таком случае вообще не заполняется, а во-вторых, искусственное имя для стандартного атрибута --- это некрасиво.

Непонятно, в чем тут принципиальное отличие в значениях стандартных и пользовательских полей, и можно ли его преодолеть, не ковыряясь в исходниках?

Ответ на: Случаем там: ; m: от anonymous

Вроде бы, нет. Вообще, префикс «m:» непринципиален. Можно обойтись и без двоеточия, например, завести поле mauthor и дальше по тексту. Главное, что имя не совпадает со стандартным. Кстати, поле title ведет себя правильно.

eugine_kosenko ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.