LINUX.ORG.RU

mediawiki pdf utf8


0

0

Добрый день.

Subj.

На ru.wikipedia.org оно есть и экспортирует статьи очень хорошо! Даже книги делает.

Текущие расширения: срамота...

Не могут UTF-8 потому как используют htmldoc 8, а он не может UTF8. Не могут вставлять картинки... В PDF файл... Это вообще фейл.

В общем подскажите убогонькому решение. Куда копать? В гугл ходил, там старые какие-то костыльные полускриптовые решения, с которыми не разобраться в силу их старости.

★★★★★

В пустоту.

Ткну пальцем в пустоту, мне такой вопрос пару раз помогал: «В какой локали работает сервер?»

Camel ★★★★★
()
Ответ на: комментарий от stevejobs

Это была последняя капля...

Собственно прочитав этот тред, и увидев, что оно без ответа, я и из отчаянья написал сюда...

Но ведь работает же в wikipedia всё корректно... Может можно как-то узнать как оно там сделанно? Оно ведь открыто? - Хотя врядли конечно...

В общем я в шоке, 21 век, а такие проблемы...

В общем буду рад любой вменяемой помощи.

DALDON ★★★★★
() автор топика
Ответ на: комментарий от nnz

Видел я и это расширение. Однако сейчас решил почитать talk про это, и нашёл вот такой вопрос:

http://www.mediawiki.org/wiki/Extension_talk:PdfBook#.22.3F.3F.3F.3F.3F.3F.22_instead_of_russian_letters

Сделал п1.

А вот п2. не асиливаю. В коде вот чего:

$html   .= utf8_decode("$h1$text\n");

Чего с этим делать не очень понимаю. Дайте пинка кто-нибудь небольшого.

DALDON ★★★★★
() автор топика
Ответ на: В UTF-8. от Camel

Чуть подробнее пожалуйста!

Не понял, какого PID нужен environments?

administrator@mediawiki:/proc$ echo $PID

administrator@mediawiki:/proc$ cat /proc/$PID/environments cat: /proc//environments: No such file or directory

DALDON ★★★★★
() автор топика
Ответ на: комментарий от DALDON
administrator@mediawiki:/usr/share/mediawiki/extensions/PdfBook$ less PdfBook.php |grep '$h1'
					$h1      = $notitle ? '' : "<center><h1>$ttext</h1></center>";
					$html   .= utf8_decode("$h1$text\n");
administrator@mediawiki:/usr/share/mediawiki/extensions/PdfBook$ less PdfBook.php |grep '$text' 
					$text = $article->fetchContent();
					$text = $wgParser->preprocess($text, $title, $opt);
					if (preg_match_all('/^\\*\\s*\\[{2}\\s*([^\\|\\]]+)\\s*.*?\\]{2}/m', $text, $links))
					$text    = $article->fetchContent();
					$text    = preg_replace('/<!--([^@]+?)-->/s', '@@'.'@@$1@@'.'@@', $text); # preserve HTML comments
					if ($format != 'single') $text .= '__NOTOC__';
					$out     = $wgParser->parse($text, $title, $opt, true, true);
					$text    = $out->getText();
					$text    = preg_replace('|(<img[^>]+?src=")(/.+?>)|', "$1$wgServer$2", $text);       # make image urls absolute
					$text    = preg_replace('|<div\s*class=[\'"]?noprint["\']?>.+?</div>|s', '', $text); # non-printable areas
					$text    = preg_replace('|@{4}([^@]+?)@{4}|s', '<!--$1-->', $text);                  # HTML comments hack
					#$text    = preg_replace('|<table|', '<table border borderwidth=2 cellpadding=3 cellspacing=0', $text);
					$html   .= utf8_decode("$h1$text\n"); 

Вот я погрепал эти переменные???? В общем не асиливаю я чего с этим надо делать. :) И какую функцию перекодировки требуется поменять...

DALDON ★★★★★
() автор топика
Ответ на: Образно. от Camel

Я понимаю.

Вопрос только лишь в том, переменные окружения какого процесса то Вы хотели бы? apache?

Если не трудно подскажите.

Хотя проблемы с PDF благодаря этим и другим ссылкам я решил.

Есть мелкие нюансы, но в целом работает всё очень хорошо!

DALDON ★★★★★
() автор топика
Ответ на: Apache от Camel

Завтра буду на работе посмотрю и скину чего там :)

DALDON ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.