LINUX.ORG.RU

latex2html 2018

 ,


1

2

Вышел новый релиз latex2html, созданного для преобразования исходных кодов LaTeX в html.

Для русскоязычного сообщества наиболее интересное изменение связано с добавлением поддержки русской локали, включая KOI8-R, CP1251 и UTF-8, реализованное Георгием Сальниковым.

>>> CTAN

★★★★★

Проверено: jollheef ()
Последнее исправление: Deleted (всего исправлений: 3)

Можно ли им пользоваться для оптимизации размеров ячеек таблиц? То есть на входе — сгенерированный моей программой файл TeX в котором прописано только содержимое каждой ячейки и ширина таблиц, а на выходе — HTML с красивыми таблицами. Где оптимизируется перенос текста, и нет проблем наподобие, чтобы один столбец на 110% ширины, а остальные шириной 1 символ.

Или не умеет?

question4 ★★★★★
()
Ответ на: комментарий от question4

Я давно им не пользовался. Надо смотреть. Скорее всего придётся под свою задачу править. Проблема latex2html в том, что он умеет почти всё, но какое-то подмножество этого всего и мыслей читать не умеет.

Evgueni ★★★★★
() автор топика

Интересный проект. Он умеет что-нибудь, чего не может pandoc?

Насколько я помню, pandoc оба названных формата поддерживает (но не факт, что идеально, конечно).

EternalNewbie
()
Ответ на: комментарий от Evgueni

Правильно ли я понял, что целевая аудитория — люди способные править код на перле?

Задача с таблицами нетривиальная, самостоятельно реализовать сложно. Надеялся, что в ТеХе это уже пройденный этап.

question4 ★★★★★
()
Ответ на: комментарий от question4

Да нет. Просто я его правил, чтобы koi8-r понимал ;)

Чудес ждать не нужно, так как уж очень разные задачи. Из всех используемых LaTeX-html конвертеров он был на тот момент наиболее адекватным.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от question4

И да, не нужно путать TeX, LaTeX и конвертер LaTeX в html.

Сложность существования конвертера в том, что нужно как-то реализовать соответствие 1000+ пакетов силами гораздо более маленькой комьюнити.

Таблицы же в LaTeX это отдельная тема и их вёрстка при разумном подходе близка к идеально возможной. Лучше не будет, так как идеальная таблица — это её отсутствие.

Evgueni ★★★★★
() автор топика
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от einhander

Формально для html этого не нужно, так как можно вставить гиперлинк. Нумерация в печатной продукции возникла не от хорошей жизни.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от EternalNewbie

LaTeX — это не язык разметки, это полноценный язык программирования TeX с 1000+ библиотеками на этом языке. Причём разные люди используют разные библиотеки для очень разных целей. В pandoc, если я правильно понял, реализовано очень небольшое подмножество команд LaTeX. Конвертацией в LaTeX занимаются все кому не лень ибо для почти любой проблемы вёрстки там есть решение. Проблема в обратной задаче.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от Evgueni

Ага, спасибо! (Можно было бы, наверное, не удалять совсем упоминание про язык разработки, а просто переформулировать его более лаконично и менее... э... юмористически.)

EternalNewbie
()
Ответ на: комментарий от EternalNewbie

Да какой там юмор? Это кристально чистая по пронзительности правда, какая она есть...

Evgueni ★★★★★
() автор топика

html ненужен

Deleted
()
Ответ на: комментарий от Vudod

Ээээ, это конвертер LaTeX в html.

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от AlexVR

ЧЯДНТ

А теперь с этого места по подробнее.

Т.к. из этого

\documentclass{article}
\begin{document}
\section{First section}
\subsection{First subsection}
\subsubsection{First subsubsection}
\end{document}
Получаю это

pandoc -s test.tex -o test.docx
einhander ★★★★★
()
Ответ на: комментарий от einhander

На правах гипотезы: Возможно ему требуются файлы aux для извлечения информации по нумерации?

Evgueni ★★★★★
() автор топика
Ответ на: комментарий от EternalNewbie

Pandoc очень ограничен по сравнению с LaTeX, хоть и проще сам по себе. LaTeX умеет практически всё.

Quasar ★★★★★
()
Ответ на: комментарий от einhander

Нумерацией заголовков в docx, odt занимаются стили

Создаём odt файл с именем style/reference.odt. Создаём примеры нужных стилей и настраиваем их. за нумерацию разделов отвечает «Сервис->Структура нумерации...»

1. H1
1.1. h2
1.1.1. h3
pandoc -f latex --data-dir style test.tex -o test.odt

Итог:

1. First section
1.1. First subsection
1.1.1. First subsubsection

Для html есть ключ -N

pandoc -N test.tex -o test.html

Для прочих извращений есть флаг --filter

AlexVR ★★★★★
()
Ответ на: комментарий от AlexVR

Нумерацией заголовков в docx, odt занимаются стили

Большое спасибо, был близок к этому решению, но не догадался.

Для прочих извращений есть флаг --filter

Может знаете какой из фильтров дает нумерацию рисунков, таблиц и уравнений?

einhander ★★★★★
()

даешь Latex всем интернетам

Deleted
()

изменение связано с добавлением поддержки русской локали, включая KOI8-R, CP1251 и UTF-8

Шел 2018 год...

Sociopsih ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.