LINUX.ORG.RU

Есть ли альтернатива HTML Tidy, но более тупая? Просто переформатировать HTML.

 , tidy,


0

1

Нужна софтинка для переформатирования HTML, но не такая умная, как HTML Tidy. Не нужно парсить HTML и параметры, нужно тупо на каждом открывающемся теге делать новую строку и добавлять отступ, на каждом закрывающемся — отступ убирать.

Понятно, что такое навелосипедить на Perl'е не особенно проблематично, но велосипедить не хочется. Нет ли готового решения?

★★★★★

https://github.com/yosssi/gohtml

package main

import (
        "fmt"
        "io/ioutil"
        "os"

        "github.com/yosssi/gohtml"
)

func main() {
        body, err := ioutil.ReadAll(os.Stdin)
        if err != nil {
                panic(err)
        }
        fmt.Println(gohtml.Format(string(body)))
}
beastie ★★★★★
()
Ответ на: комментарий от filequest

Таки посложнее: комментарии, пустые теги как <br> и как <br />, закрытые и не закрытые <p> etc. И это только для валидного html без вложенного javascript.

JaneDoe
()
Ответ на: комментарий от JaneDoe

комментарии, пустые теги как <br> и как <br />

почему они не должны попадать туда?

не закрытые <p>

ты че упоролся чтоли? ты где такое видел?

filequest
()
Ответ на: комментарий от JaneDoe

Как твой код отформатирует это?

да должен, я не проверял правда.

filequest
()

Не встречал, для html в принципе кот наплакал, даже разработка/обновление/фиксы tidy ожило буквально полгода назад, спустя 5 лет простоя.

Есть также html-beautify входящий в комплект js-beautify.

kep
()
Ответ на: комментарий от filequest

мда, маразм крепчает

Маразм крепчает, на секундочку, по крайней мере, с 95-го года и RFC1866. Что было до HTML 2 — лень искать. Так что в моем интернете </p> всегда был опционален.

JaneDoe
()
Ответ на: комментарий от anonymous

чем конкурент доси не угодил?

Это кто?

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от JaneDoe

комментарии ... без вложенного javascript.

К счастью, задача не требует учёта комментариев и JS.

Но вот одиночные теги — да. Именно они и затрудняют наколеночную реализацию на регекспах.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

потому что это anonimous и маразм крепчает у него

Debasher ★★★★★
()
Ответ на: QueryPath? от murmur

Не нужно парсить HTML и параметры

QueryPath?

Не нужно парсить HTML и параметры. Нужно, чтобы всё кривое говно (или хотя бы просто непонятное парсеру) оставалось таким же, а не выбрасывалось и не выдавало ошибок. Только чтобы форматировался HTML-код.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от filequest

Это называется легаси. Добро пожаловать. XML это слишком сложно, поэтому у нас будет МАГИЯ.

anonymous
()
Ответ на: комментарий от KRoN73

А придётся. Супопарсер возьми какой-нибудь.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.