面试高频|数据库 vs 数据仓库 核心区别 + 常用技术栈
一、核心区别
维度 | 数据库(DB) | 数据仓库(DW) |
全称 | Database | Data Warehouse |
定位 | 业务交易处理 | 数据分析决策 |
面向场景 | OLTP(联机事务处理) | OLAP(联机分析处理) |
操作类型 | 增删改查频繁,小批量 | 大批量查询、聚合、统计 |
数据特点 | 实时、最新、明细 | 历史、归档、多源整合 |
设计范式 | 严格遵循三范式(3NF) | 星型模型、雪花模型 |
性能关注点 | 高并发、低延迟、事务 | 海量数据聚合速度、吞吐量 |
典型业务 | 订单、用户、支付 | 报表、大屏、用户画像、经营分析 |
二、简单一句话理解
- 数据库:支撑业务跑起来的 “收银台”
- 数据仓库:帮老板做决策的 “财务室”
三、平常工作中用到的核心技术
1. 数据库(OLTP)常用技术
- 关系型:MySQL、PostgreSQL、Oracle、SQL Server
- 缓存:Redis、Memcached
- 分库分表:Sharding-JDBC、MyCat
- 高可用:主从、MGR、哨兵、集群
2. 数据仓库(OLAP)常用技术
- 离线数仓:Hive、Spark SQL
- MPP 架构:ClickHouse、Doris、StarRocks
- 实时数仓:Flink、Kafka、Kudu
- 建模工具:DataWorks、DolphinScheduler
- 可视化:Superset、DataEase、FineBI
四、面试标准答案背诵版
数据库面向 OLTP,负责业务实时交易,遵循三范式,高并发低延迟;

数据仓库面向 OLAP,负责历史数据分析,用星型 / 雪花模型,擅长海量聚合。
常用技术:数据库以 MySQL 为主,搭配分库分表;数仓常用 Hive、ClickHouse、Flink 等。
那些在寂静里沉淀的思考与积累,终会在时光深处绽放成属于你的光芒。
文章版权声明:除非注明,否则均为边学边练网络文章,版权归原作者所有