Насколько я знаю по vBulletin и ipb, борды хранят сообщения в базе в виде ббкода. Решение спорное, та как для быстрой отдачи требует кеша. Мне видится более правильным такой вариант - простые теги парсить в html напрямую, а сложные парсить в div, но при этом сохранять метаданные в data-*, чтобы не потерять исходный синтаксис.
Из профитов - очень шустрая отдача. Лишнее из data можно почикать простыми регулярками. Еще можно часть парсинга на клиенте «доводить». Например, менять ссылки на ютюб на подходящий видеоплеер, определяя возможности клиента по месту.
Дискас. Какие могут быть проблемы? Список валидных тегов и их параметров лимитировать вроде не сложно. Если знаете - приведите примеры форумов или чего-то похожего, которые имеют богатую разметку, но при этом хранят данные сразу в html.