使用 PostgreSQL 掌握数据库

核心概念

从本质上讲，数据库是一个旨在跨不同会话保留信息的系统。持久性确保数据即使在创建数据的程序或进程终止后也能继续存在。

现代后端系统通过利用不同的存储介质来平衡速度和成本：

DBMS 是一个软件层，其唯一职责是高效地向客户端提供 CRUD 操作：

1）数据的组织——
DBMS 定义了数据的结构方式（通常为表、行和列），以确保数据以逻辑方式存储并可以有效地检索。它管理磁盘上的物理存储，因此开发人员不必担心原始文件管理。

2）访问——CRUD操作
该系统提供标准化接口（如 SQL）来创建、读取、更新和删除数据。这允许多个用户或应用程序同时与同一数据集交互，而不会导致数据冲突。

1）解析：
解析文本文件需要将数据加载到内存中并手动拆分字符串，这对于大型数据集来说非常慢且占用资源。相比之下，DBMS 使用高度优化的二进制格式和索引来在几毫秒内检索特定数据，而无需读取整个文件。

2）结构：
文本文件是“非结构化”或“松散结构”，因此很难强制执行不同信息集之间的数据类型或关系。 DBMS 使用严格的模式来确保每条数据都遵循预定义的格式，从而防止保存“损坏”的数据（例如出现在电话号码字段中的姓名）。

3）并发：
如果两个用户尝试在同一时刻写入同一个文本文件，则该文件可能会损坏，或者一个用户的更改将被覆盖。 DBMS 通过使用锁定机制和事务来处理并发控制，允许数千个用户同时读写而不会丢失数据。

特色	关系型 (SQL)	非关系型 (NoSQL)
数据模型	表格（行和列）	文档、键值、图表或宽列
架构	修正：在添加数据之前必须定义架构。	动态：架构可以动态更改（无架构）。
关系	使用外键和联接来链接表。	数据通常嵌套或非规范化在一条记录中。
缩放	垂直：增加单个服务器上的 CPU/RAM。	水平：将更多服务器添加到分布式集群。
交易	遵循ACID（原子性、一致性、隔离性、持久性）。	遵循BASE（基本可用、软状态、最终一致性）。
最适合	复杂的查询、财务系统和结构化数据。	海量数据、实时分析、快速开发。
示例	PostgreSQL、MySQL、Oracle、SQL Server	MongoDB、Redis、Cassandra、DynamoDB

Postgres 通常是稳健 SAS 应用程序的行业标准，因为：