Подсистема хранения данных (или ядро СУБД) — это программный компонент СУБД, отвечающий за хранение, извлечение и управление данными в памяти и на диске, предназначенный для работы с постоянной, долговременной памятью каждого узла [REED78].
Индексные файлы обычно меньше файлов данных. Файлы разбиваются на страницы, которые обычно имеют размер одного или нескольких дисковых блоков. Страницы могут быть организованы как последовательности записей или как слоттированные страницы (slotted page) (см. раздел «Слоттированные страницы», с. 70).
В системах баз данных обычно разделяются файлы данных и индексныефайлы: файлы данных хранят записи данных, а индексные файлы хранят метаданные записей, которые используются для поиска записей в файлах данных.
Колоночные базы данных не следует путать с хранилищами с широкими столбцами, такими как BigTable (https://databass.dev/links/117) или HBase (https://databass.dev/links/118), где данные представлены в виде многомерной карты, столбцы сгруппированы в семейства столбцов (обычно хранящие данные одного типа), а внутри каждого семейства столбцов данные сохраняются построчно. Такая структура лучше всего подходит для хранения данных, извлекаемых с помощью ключа или последовательности ключей.
появилось много новых колоночных форматов файлов, таких как Apache Parquet (https://databass.dev/links/112), Apache ORC (https://databass.dev/links/113), RCFile (https://databass.dev/links/114), а также много колоночных хранилищ, таких как Apache Kudu (https://databass.dev/links/115), ClickHouse (https://databass.dev/links/116) и многие другие [ROY12].
Резидентные СУБД (или СУБД в оперативной памяти) хранят данные главным образом в оперативной памяти, а диск используют для восстановления и ведения журнала. Дисковые СУБД хранят бˆольшую часть данных на диске и используют память для кэширования содержимого диска или в качестве временного хранилища
Гибридная транзакционно-аналитическая обработка (hybrid transactional and analytical processing, HTAP)
Базы данных для аналитической обработки данных в реальном времени (online analytical processing, OLAP)
Базы данных для обработки транзакций в реальном времени (online transaction processing, OLTP)