Мне как то вопрос странным показался. Не понятно в какой XML перекинуть. С html все понятно - это разметка, но XML это способ представления данных. Что значит некий?
Да любой. Нужно получить информацию из PDF в максимально полном объеме, прежде всего - касатательно структуры документы и его содержимого (ну и само содержимое тоже, естесственно).