Оптимизация INSERT-запросов в PostgreSQL

hibernate, java, postgresql, оптимизация

День добрый сообществу.

Имеется база данных PostgreSQL и код на Java, который пишет в большом количестве INSERTы в таблицу. В данный момент работа с БД выполняется напрямую через JDBC. То есть, я формирую строку-запроса и отправляю ее на драйвер, обрабатываю результат и ошибки. Когда много запросов, я объединяю их в длинную строку и затем отправляю. Проблема в том, что данная работа со строками сжирает жутко много времени и в итоге я получаю дикие тормоза при работе с такими INSERTами.

При объединении 30-50 запросов в одну строку действительно получилось ускорить процесс, однако все равно занимает слишком много времени. Я подозреваю, что можно существенно ускорить процесс.

Поможет ли мне Hibernate? Сумеет ли он гораздо быстрее выполнять такие запросы? Могу ли я только некоторые задачи перенести на него, а все остальное оставить работающим напрямую через драйвер?

Быть может мне попробовать формировать дампы и их затем выливать в БД?

Индексы в данной ситуации мне не помогут.

Лоровец, как еще максимально быстро я могу записать много информации в БД? Спасибо.

Ссылка

← sed работает не так, как надо

Имеет ли смысл использовать Rust для написания библиотеки? →

А в транзакцию обернуть?

Индексы в данной ситуации мне не помогут.

Они только тормозят INSERT.

crowbar ★
(27.07.14 18:53:53 MSK)

Ответ на: комментарий от crowbar 27.07.14 18:53:53 MSK

А в транзакцию обернуть?

Сконкатенировать строки запросов в одну? Я так делаю, мало эффекта.

Или ты о чем-то другом?

observer ★★★
(27.07.14 18:55:20 MSK) автор топика

Ответ на: комментарий от observer 27.07.14 18:55:20 MSK

http://www.postgresql.org/docs/9.2/static/populate.html

crowbar ★
(27.07.14 18:58:19 MSK)

Ответ на: комментарий от crowbar 27.07.14 18:58:19 MSK

Классная дока, спасибо.

observer ★★★
(27.07.14 19:02:05 MSK) автор топика

Ссылка

COPY ускоряет в сотни раз при вставке нескольких тысяч записей. Текстовые дампы в pg_dump так и делаются

disarmer ★★★
(27.07.14 19:12:23 MSK)

Ссылка

Маленькое улучшение, которое тебе даст большую прибавку в скорости - prepared statements + batch updates. Если очень много данных заливаешь - разбивай на несколько транзакций. С потолка цифры - шли батчи по 100 insert-ов каждый и оборачивай в транзакцию по 1000 insert-ов каждая.

Самый быстрый способ для заливки данных это подготовить файл с данными в специальном формате (например CSV), залить его на сервер с БД и специальной командой залить его в БД. Понятно, что переписывать придётся вообще всё и способ довольно неудобный для использования.

Hibernate тебе не поможет никак.

Ещё может помочь отключение индексов и прочих проверок на используемые таблицы перед заливкой (и включение после заливки, естественно).

~~Legioner~~ ★★★★★
(27.07.14 19:15:45 MSK)