Пару днів тому була задачка порівняти швидкодію PostgreSQL та Oracle при завантаженні великих обсягів даних в базу, мета була побачити чи не набагато повільніше відкрита СКБД, і чи буде варто поміняти Oracle на неї (щоб зекономити купу грошей).
Результат виявився цікавим: при завантаженні 16млн рядків з CSV-файлу PostgreSQL виявився на 10% швидше. Також перед залиттям індекси стираються, тож після завантаження йде процедура їх відновлення, і тут PostgreSQL впорався аж на 20% спритнішим. Навантаження на систему приблизно однакове.
Використовувався PostgreSQL 8.4.3 на RHEL 5.4 практично з коробки.
В робочому варіанті заливається десь 300 млн рядків, але є всі підстави вірити, що там (на відповідних апаратних засобах) малюнок зміниться мало.