![]() |
Image credit: Joy Dachapratumvan |
āļāļāļāļ§āļēāļĄāļี้āđāļ็āļ Part II āļāļāļ āļุāļ Data Lakehouse for Small & Midsize Business (SMB) āđāļāļĒāđāļ Part I āđāļĢāļēāđāļ้āđāļāļ°āļāļģāđāļāļ§āļāļēāļāļāļēāļĢāđāļĨืāļāļāđāļ้āđāļāļāđāļāđāļĨāļĒีāļ้āļēāļāļ้āļāļĄูāļĨāļŠāļĄัāļĒāđāļŦāļĄ่ āđāļāļĒāđāļĨืāļāļāđāļ้āđāļ่āļēāļี่āļāļģāđāļ็āļāļี่āđāļĢีāļĒāļāļ§่āļē Lakehouse Lite āđāļāļĒāđāļ Part II āđāļĢāļēāļāļ°āļĄāļēāļูāđāļāļĢāļēāļĒāļĨāļ°āđāļีāļĒāļāđāļĨāļ°āđāļŦāļุāļāļĨāđāļāļāļēāļāđāļāļāļิāļ āđāļāļĒāđāļ้ Microsoft Azure Synapse Analytics (ASA) āđāļ็āļāļ้āļāđāļāļ āđāļื่āļāļāļāļēāļāđāļāļ§āļิāļāļāļāļ Azure āļี่ āļĄัāļāļĢāļ§āļĄāđāļāļĢื่āļāļāļĄืāļāļ่āļēāļāđ āđāļ่āļāļāļĨุ่āļĄāļāļēāļĄāļั้āļāļāļāļāļāļēāļĢāļāļģāļāļēāļāļัāļāļ้āļāļĄูāļĨ (Data Life Cycle) āļāļģāđāļŦ้āļ่āļēāļĒāļ่āļāļāļēāļĢāđāļĨืāļāļāđāļ้āļāļēāļĄāļāļ§āļēāļĄāđāļŦāļĄāļēāļ°āļŠāļĄ āļั้āļāđāļ่ data integration, data discovery, data transformation āđāļāļāļāļึāļāļāļēāļĢāļāļāļāļĢāļēāļĒāļāļēāļ āđāļ่āļāļĒ่āļēāļāđāļĢāļ็āļี āļŠāļēāļĄāļēāļĢāļāļāļģāđāļāļ§āļāļēāļāđāļāļāļĢāļ°āļĒุāļāļ์āđāļ้āđāļ Cloud Service āļื่āļāđ āđāļ้ āļāļึ่āļāļāļĢāļ°āļู้... āļāļāļāļ§āļēāļĄāļี้āđāļ็āļ CR - Consumer Review āļ่āļēāļĒāđāļิāļāļื้āļāđāļāļ āđāļĄ่āđāļ้āļĢัāļāļ่āļēāļ้āļēāļāđāļĨāļ°āļāļĨāļāļĢāļ°āđāļĒāļāļ์āđāļāđ
āļัāļāļัāļĒāļŠāļģāļัāļāļŠāļģāļŦāļĢัāļ SMB āļี่āļĄีāļāļĢัāļāļĒāļēāļāļĢāļāļģāļัāļ āļ้āļāļāļāļēāļĢāđāļŦ็āļāļāļĨāļĨัāļāļ์āđāļĢ็āļ§ āļี่āļāļģāđāļŦ้āđāļĢāļēāđāļĨืāļāļāđāļ้ solution āļี่āļ่āļ§āļĒāđāļŦ้āđāļĢāļēāļāļĢāļ°āļŦāļĒัāļāļ่āļēāđāļ้āļ่āļēāļĒāļāļāļāļāļēāļĢāđāļ็āļāļ้āļāļĄูāļĨāđāļĨāļ°āļāļēāļĢāļāļĢāļ°āļĄāļ§āļĨāļāļĨ āļีāļāļั้āļāđāļāđāļ่āļุāļĢāļิāļāļĒัāļāļĄุ่āļāļāļ§āļēāļĄāļŠāļāđāļāđāļāļี่ āļāļ§āļēāļĄāļุ้āļĄāļ่āļēāđāļĨāļ°āļāļĨāļĨัāļāļ์āđāļāļĢāļ°āļĒāļ°āļŠั้āļāļŦāļĢืāļāļĢāļ°āļĒāļ°āļāļĨāļēāļ āđāļ่āļĒัāļāļ้āļāļāļĢāļāļāļĢัāļāļāļēāļĢāđāļิāļāđāļāđāļāļ้āļēāļāļāļēāļĢāļัāļāļāļēāļĢāļ้āļāļĄูāļĨāđāļāļĢāļ°āļĒāļ°āļĒāļēāļ§ āļāļāļāļāļēāļāļี้āļĒัāļāļ้āļāļāļ่āļēāļĒāļ่āļāļāļēāļĢāļัāļāļāļē āđāļĨāļ°āļูāđāļĨāļีāļāļ้āļ§āļĒ
āđāļื้āļāļŦāļēāļāļĢāļ°āļāļāļāļ้āļ§āļĒ
- Architecture
- Components
- Setting
- Tips
1. Architecture
Cloud Service Provide āļāļēāļāļĢāļēāļĒāļĄีāļāļģāđāļŠāļāļāļāļēāļāđāļĨืāļāļāļŠāļģāļŦāļĢัāļ SMB āđāļ่āļāļāļāļ Microsoft āļึ่āļāļĨāļāļāļāļāļāļ§āļēāļĄāļัāļāļ้āļāļāļĨāļāļĄāļēāļĢāļ°āļัāļāļึāļ
![]() |
Image credit: Modern data warehouse for small and medium business |
āđāļ่āļāļĒ่āļēāļāđāļĢāļ็āļี āđāļĢāļēāļāļ°āļĨāļāļāļāļāļĨāļāļĄāļēāļีāļ āđāļāļĒāđāļĢิ่āļĄāļāļēāļāđāļāļāļēāļ°āļี่āļāļģāđāļ็āļāđāļ่āļēāļั้āļ āđāļŦāļĄืāļāļāđāļĢāļēāļŦāļēāļุāļāđāļĢิ่āļĄāļ้āļ Starter Kit āļŠāļģāļŦāļĢัāļāļāļēāļāļ้āļēāļāļ้āļāļĄูāļĨāļĄāļēāđāļ้āļāļēāļ āđāļāļĒāđāļ solution āļี้ āđāļĄ่āļāļģāđāļ็āļāļ้āļāļāđāļ้ traditional database āļŦāļĢืāļ MPP database āđāļ่āļāļĒ่āļēāļāđāļĢ
![]() |
Data Lakehouse Lite Solution |
2. Components
āđāļ Azure Synapse Analytics āļั้āļāđāļĢāļēāļŠāļēāļĄāļēāļĢāļāđāļĨืāļāļāđāļ้āđāļāļĢื่āļāļāļĄืāļāđāļ Azure Synapse Studio āļŠāļģāļŦāļĢัāļāļāļēāļĢāļัāļāļāļēāļĢ āđāļĨāļ°āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨāđāļāļĨัāļāļĐāļāļ°āļี่āđāļ็āļ single unifying service āđāļāļĒāđāļĨืāļāļāđāļ้āļŦāļĨัāļāđ āļัāļāļี้
- Azure Data Lake Storage (ADLS) Gen 2 āļŠāļģāļŦāļĢัāļāļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāļั้āļāđāļāļ āļĄีāđāļāļĢāļāļŠāļĢ้āļēāļ (structured data) āđāļĨāļ°āļึ่āļāđāļāļĢāļāļŠāļĢ้āļēāļ (semi structured data) āđāļāļāļāļēāļĢāđāļ้ Blob Storage āļāļāļāļāļēāļāļัāļāļัāļĒāđāļĢื่āļāļāļĢāļēāļāļē storage āļี่āļ่āļģāđāļĨ้āļ§ āļāļēāļāļุāļāļŠāļĄāļัāļิāļี่āļŠāļģāļัāļāļāļāļ hierachical namespace (HNS) āļŦāļĢืāļāļĄāļāļāļ่āļēāļĒāđ āļ็āļืāļāđāļŦāļĄืāļāļāđāļĢāļēāđāļ้ folder āļāļ MS Windows āļึ่āļāļāļ§āļēāļĄāļŠāļ°āļāļ§āļāđāļāđāļ่āļāļēāļĢāļัāļāļāļēāļĢāļŠิāļāļิ์āļāļēāļĢāđāļ้āļēāđāļ้āđāļāļĨ์āļ้āļāļĄูāļĨāđāļ subfolder āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāļāļģ file partition scans āđāļ data lake āļึ่āļāļ่āļ§āļĒāļ้āļēāļāļāļ§āļēāļĄāđāļĢ็āļ§āđāļāļāļēāļĢāđāļ้āļēāļึāļāđāļāļĨ์āđāļ folder āđāļĨāļ° subfolder āļāļēāļĢāļัāļāļāļēāļĢāđāļāļĢāļ°āļัāļ metadata āļāļģāļāļēāļĢāļĒ้āļēāļĒāđāļāļĨ์āļāļāļēāļāđāļŦāļ่āļāļģāđāļ้āļāļĒ่āļēāļāļĢāļ§āļāđāļĢ็āļ§ āļึ่āļāļĄีāļāļĨāļāļĒ่āļēāļāļĄāļēāļāđāļāđāļ่āļ่āļēāđāļ้āļ่āļēāļĒ āđāļื่āļāļāļāļēāļ cloud service āļิāļāļ่āļēāđāļ้āļ่āļēāļĒāļāļēāļĄāļāļēāļĢāđāļ้āļāļēāļ āđāļĄ่āļ§่āļēāļāļ°āđāļāđāļ่āļĢāļ°āļĒāļ°āđāļ§āļĨāļē āļŦāļĢืāļāļāļĢัāļāļĒāļēāļāļĢāļี่āļ้āļāļāđāļ้
- Open File Format (e.g. csv, JSON, parquet, delta ) āđāļāļāļี่āļāļēāļĢāđāļ็āļāđāļāļĨ์āđāļāļĒāđāļ้ traditional databases āļŦāļĢืāļ MPP database āļึ่āļāđāļ็āļ proprietary data format āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļāļĒāđāļ้āđāļāļĨ์āļี่āđāļ็āļ open format āļāļĒ่āļēāļ parquet āļŦāļĢืāļ delta āļึ่āļāļĄีāļāļāļēāļāđāļāļĨ์āđāļีāļĒāļ 25% āļāļāļāđāļāļĨ์ CSV āļ้āļāļāļัāļāđāļ่āļēāļั้āļ āļ่āļ§āļĒāļāļĢāļ°āļŦāļĒัāļāļั้āļāļ่āļēāđāļ้āļ่āļēāļĒāļāļāļāļื้āļāļี่āđāļāļāļēāļĢāđāļ็āļāđāļĨāļ°āļāļĢāļ°āļĄāļ§āļĨāļāļĨ āļีāļāļั้āļāļĒัāļāļŠāļēāļĄāļēāļĢāļāđāļ้āļāļēāļāļัāļ SQL āđāļ้āļ่āļēāļĒāļีāļāļ้āļ§āļĒ
- Serverless SQL Pool āļึ่āļāđāļ็āļ on demand ecosystem āļāļ Azure āļĨāļāļ āļēāļĢāļ°āđāļāļāļēāļĢāļัāļāļāļēāļĢāđāļāļĢāļāļŠāļĢ้āļēāļāļื้āļāļāļēāļāļŦāļĢืāļāļัāļāļŠāļĢāļĢ cluster āļŠāļģāļŦāļĢัāļāđāļ้āļāļēāļ āļึ่āļāđāļŦāļĄāļēāļ°āļŠāļģāļŦāļĢัāļāļāļēāļāļี่āļĄีāļĨัāļāļĐāļāļ°āđāļ็āļ on-demand āļŦāļĢืāļāļāļēāļĢāļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨāļŠāļģāļŦāļĢัāļ data analyst, data scientist āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāļŠāļĢ้āļēāļ database, external table āļŦāļĢืāļ view āđāļāļĒāļี้āđāļāļี่āđāļāļĨ์āļ้āļāļĄูāļĨāđāļ ADLS Gen 2 āđāļื่āļāđāļŦ้āļŠāļ°āļāļ§āļāđāļāļāļēāļĢāđāļ้āļāļēāļ āļāļĒ่āļēāļāđāļĢāļ็āļี āđāļื่āļāļāļāļēāļāđāļāļāđāļāđāļĨāļĒีāđāļŦāļĨ่āļēāļี้āđāļ็āļāļĨัāļāļĐāļāļ°āļāļēāļĢāđāļ้āļāļĢัāļāļĒāļēāļāļĢāļĢ่āļ§āļĄāļัāļāļัāļāļู้āđāļ้āļāļēāļāļื่āļāđ (shared resource) āļāļĢāļีāļี่āđāļĢāļēāļĄีāļ้āļāļĄูāļĨāļāļģāļāļ§āļāļĄāļēāļ (Microsoft āđāļāļ°āļāļģāļี่āļĄāļēāļāļāļ§่āļē 1TB āļŦāļĢืāļāļāļēāļ consultant āđāļāļ°āļāļģ āļี่ 4TB) āđāļĨāļ°āļ้āļāļāļāļēāļĢāļāļĢāļ°āļŠิāļāļิāļ āļēāļāļŠูāļāļāļĒ่āļēāļāļŠāļĄ่āļģāđāļŠāļĄāļ āļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļ traditional database āļŦāļĢืāļāļāļĨุ่āļĄāļี่āđāļ็āļ dedicated resource āļāļĒ่āļēāļ Dedicated SQL pool āļŦāļĢืāļ spark pool āļāļ°āļĄีāļāļ§āļēāļĄāđāļŦāļĄāļēāļ°āļŠāļĄāļāļ§่āļē
- Serverless Apache Spark Pool āļ่āļ§āļĒāđāļŦ้āđāļĢāļēāļāļģāļāļēāļāļัāļāļ้āļāļĄูāļĨāđāļ data lake āļŦāļĢืāļ lakehouse āđāļāļĒāđāļ้ Spark āđāļāļāđāļāđāļĨāļĒี āļ่āļēāļāļ āļēāļĐāļē Spark SQL, PySpark āļāļ notebook āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāļŠāļĢ้āļēāļ database, tables āļāļ spark pool āļāļģāđāļŦ้āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāđāļ้āļāļģāļŠั่āļāđāļāļāļĨุ่āļĄ DML (Data Manipulation Language) āļัāļ delta table āļึ่āļāļŠāļēāļĄāļēāļĢāļ update, delete āļ้āļāļĄูāļĨāđāļāđāļāļĨ์ āļāļģāđāļŦ้ spark pool āđāļŦāļĄāļēāļ°āļŠāļĄāļŠāļģāļŦāļĢัāļāļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļāļĢูāļāđāļāļāļāļāļ data warehouse āļĄāļēāļāļāļ§่āļē serverless pool
- Power BI āļŠ่āļ§āļāļāļāļāļāļēāļĢāļ§ิāđāļāļĢāļēāļ°āļŦ์ āļāļģāļĢāļēāļĒāļāļēāļāđāļĨāļ°āđāļŠāļāļāļāļĨāļ้āļāļĄูāļĨ āļ่āļēāļ dashboard āļŦāļĢืāļāļāļēāļĢ visualize āļ้āļāļĄูāļĨ āļĢāļ§āļĄāļึāļāļŠāļēāļĄāļēāļĢāļāđāļ่āļāļัāļāđāļŦ้āđāļ่āļู้āđāļ้āļāļāļื่āļāđ āđāļ็āļāđāļāļĢื่āļāļāļĄืāļāļี่āļĄีāđāļŦ้āļāļ Synapse Analytics āđāļāļĒāđāļĢāļēāļŠāļēāļĄāļēāļĢāļāđāļ้ Power BI āļัāļāļ้āļāļĄูāļĨāđāļ ADLS Gen 2 āļ่āļēāļ Serverless SQL Pool āļŦāļĢืāļ Spark Pool āđāļ้āđāļāļĒāļāļĢāļ
- Synape pipelines āļŠāļģāļŦāļĢัāļāļŠ่āļ§āļāļāļāļ data ingestion āđāļĨāļ°āļูāļāļāļĢāļ°āļāļ§āļāļāļēāļĢāļāļģāļāļēāļāļāļēāļĄāļĨāļģāļัāļāļั้āļāļāļāļ āđāļ็āļ batch āļŦāļĢืāļ near real time āļŠāļēāļĄāļēāļĢāļāļั้āļāđāļ§āļĨāļēāļŦāļĢืāļ trigger āļŠāļģāļŦāļĢัāļāđāļĢิ่āļĄāļāļēāļĢāļāļģāļāļēāļ āđāļĢีāļĒāļāđāļ้āļ§่āļē pipelines āđāļ็āļāļĨูāļāļี่āļĨูāļāļ้āļāļāļัāļ Azure Data Factory āļั่āļāđāļāļ
- Optional āđāļĢāļēāļāļēāļāđāļ้ SQL database āđāļ่āļ Dedicated SQL pool āļŦāļĢืāļ SQL server, mySQL āđāļāļāļĢāļีāļี่āļāļģāđāļ็āļ āđāļāļĒāļŠāļēāļĄāļēāļĢāļāđāļ้āđāļāļĨัāļāļĐāļāļ°āļี่āđāļ็āļ serving layer āđāļāļĒāļึāļāđāļāļāļēāļ°āļ้āļāļĄูāļĨāļŠ่āļ§āļāļี่āļāļģāđāļ็āļāđāļ้āļēāđāļ database āđāļŦāļĨ่āļēāļั้āļ āļŦāļĢืāļāļŠāļĢ้āļēāļāđāļ็āļ external table āđāļāļĒāļี่āļ้āļāļĄูāļĨāļŠ่āļ§āļāđāļŦāļ่āļŦāļĢืāļāļั้āļāļŦāļĄāļāļĒัāļāļāļāļูāļāļัāļāđāļ็āļāļāļĒู่āļāļ ADLS Gen 2
āļāļēāļāļี่ Microsoft āļĢāļ§āļĄāļั้āļāļŦāļĄāļāļี้āđāļ้āļēāđāļ็āļ one development studio āļึāļāđāļ็āļāđāļŦāļุāļāļĨāļŦāļĨัāļāļี่āđāļĨืāļāļāđāļ้ Azure Synapse Analytics āđāļื่āļāđāļŠāļāļāđāļāļ§āļิāļāļāļāļ lakehouse lite āļĨāļāļāļ§āļēāļĄāļัāļāļ้āļāļāļāļāļāļāļēāļĢāđāļ้āļāļēāļ services āđāļĨāļ° tools āļāļģāļāļ§āļāļĄāļēāļ āļāļģāđāļŦ้āļāļēāļĢ monitor āđāļĨāļ°āļāļĢāļ§āļāļŠāļāļāđāļāļั้āļāļāļāļāļ่āļēāļāđ āļāļģāđāļ้āļ่āļēāļĒ āļĨāļāļ āļēāļĢāļ°āļ้āļēāļāļāļēāļĢāļัāļāļāļēāļĢāđāļĨāļ°āļูāđāļĨāļāļ§āļēāļĄāļāļĨāļāļāļ ัāļĒāļāļāļāļ้āļāļĄูāļĨāđāļĨāļ°āļĢāļ°āļāļ
āļั้āļāļี้āđāļื่āļāļāļāļēāļāļู้āđāļŦ้āļāļĢิāļāļēāļĢāļāļĨāļēāļ§āļ์āđāļ่āļĨāļ°āļĢāļēāļĒāļĄีāļāļēāļĢāļāļĢัāļāļāļĢุāļ āļัāļāļāļēāđāļāļĢื่āļāļāļĄืāļāļ่āļēāļāđ āļāļāļāļāļāđāļāļāļāļĒู่āļāļĒ่āļēāļāļŠāļĄ่āļģāđāļŠāļĄāļ āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāļāļĢัāļāđāļāļĨี่āļĒāļāđāļĨืāļāļāđāļ้āļāļēāļĄāļāļ§āļēāļĄāđāļŦāļĄāļēāļ°āļŠāļĄ
3. Setting
āđāļāļี่āļี้āđāļĢāļēāļāļāđāļĄ่āļĨāļāļĢāļēāļĒāļĨāļ°āđāļีāļĒāļāđāļāļāļēāļĢāļŠāļĢ้āļēāļ components āļ่āļēāļāđ āļāļ Azure āđāļ่āļ āļāļēāļĢāļŠāļĢ้āļēāļ Azure Account, subscription āļ่āļēāļāđ āļึ่āļāļŠāļēāļĄāļēāļĢāļāļĻึāļāļĐāļēāļāļēāļ Microsoft āđāļ้āđāļāļĒāļāļĢāļ
3.1 Synapse Analytics Workspace āđāļāļāļēāļĢāļŠāļĢ้āļēāļ workspace āļāļ°āļĄีāđāļŦ้āļāļģāļŦāļāļ primary ADLS Gen 2 Storage Account āđāļĨāļ° container āđāļāļĒ Serverless SQL Pool āļāļ°āļูāļāļŠāļĢ้āļēāļāļึ้āļāļĄāļēāđāļāļั้āļāļāļāļāļāļēāļĢāļŠāļĢ้āļēāļ workspace āļึ่āļāļāļ°āđāļŦ้āđāļĢāļēāļāļģāļŦāļāļ username āđāļĨāļ° password āļŠāļģāļŦāļĢัāļ SQL Pool āļ้āļ§āļĒ āļŠāļģāļŦāļĢัāļāļāļēāļĢāļŠāļĢ้āļēāļ Synapse Workspace āļĻึāļāļĐāļēāđāļ้āļāļēāļ Creating a Synapse Workspace āđāļāļัāļ§āļāļĒ่āļēāļāļี้āđāļĢāļēāļĒึāļāđāļāļ§āļāļēāļ multiple-workspaces-single-lake āļี่āļāļģāđāļŠāļāļāđāļāļĒ Jovan Popovic
![]() |
Multiple-workspaces-single-lake topology (image credit Jovan Popovic) |
āđāļāļĒāļŠāļĢ้āļēāļ workspace (lh-synapse-ws), storage account (lhdatalakestorage), container (lhdatalakecontainer) āļāļĒ่āļēāļāļĨāļ°āļŦāļึ่āļ āđāļื่āļāļāļ§āļēāļĄāļŠāļ°āļāļ§āļāđāļāļāļēāļĢāđāļ้āļāļēāļāđāļĨāļ°āļāļĢิāļŦāļēāļĢāļัāļāļāļēāļĢ
![]() |
Storage Account, Container āđāļĨāļ° Lakehouse folder āđāļ Container |
3.2 Apache Spark Pool āđāļĢāļēāđāļ้āđāļื่āļāļāļēāļĢāļŠāļĢ้āļēāļ database, table āđāļ่āļ delta lake, delta table āļŠ่āļ§āļāļāļēāļĢāļŠāļĢ้āļēāļ Apache Spark Pool āļĻึāļāļĐāļēāđāļ้āļāļēāļ Quickstart: Create a serverless Apache Spark pool using Synapse Studio
![]() |
Apache Spark pools |
3.3 Lakehouse folders āļ āļēāļĒāđāļ้ container āļāļāļ lakehouse āļāļēāļĄ data life cycle āđāļ็āļ zone āļāļēāļĄ industry practice āļืāļ
- Bronze āļŦāļĢืāļ raw āļŠāļģāļŦāļĢัāļāđāļ็āļāļ้āļāļĄูāļĨāļี่āļĄāļēāļāļēāļāļĢāļ°āļāļāļāļēāļāļ่āļēāļāđ āđāļāļĒāđāļ็āļāđāļāļĨ์ āđāļāļĢูāļāđāļāļ CSV, parquet, JSON āđāļāļŠ่āļ§āļāļี้āļāļ§āļĢāļĄีāļāļēāļĢāļัāļ folder āđāļĨāļ° subfolder āđāļื่āļāđāļŦ้āļ่āļēāļĒāļ่āļāļāļēāļĢāđāļ้āļāļēāļ
- Silver āļŦāļĢืāļ enriched āļŠāļģāļŦāļĢัāļāđāļ็āļāđāļāļĨ์āļี่āļูāļāļāļĢัāļāļāļĢุāļāļ้āļāļĄูāļĨāđāļŦ้āđāļŦāļĄāļēāļ°āļŠāļĄāđāļื้āļāļāļ้āļāļŠāļģāļŦāļĢัāļāļāļēāļĢāđāļ้āļāļēāļ āđāļ่āļāļāļēāļĢāđāļāļĨāļāļĢูāļāđāļāļāļāļēāļ semistructure āđāļ็āļ structure, data cleansing, āļัāļāļāļģ partition āļŦāļĢืāļ join āļ้āļāļĄูāļĨāļāļēāļāđāļāļĨ์āļ่āļēāļāđāđāļ้āļēāļ้āļ§āļĒāļัāļ āļĄัāļāđāļ็āļāđāļāļĨ์āđāļāļĢูāļāđāļāļ parquet āļŦāļĢืāļ delta āđāļ่āļ็āļĒัāļāļŠāļēāļĄāļēāļĢāļāđāļ็āļāđāļāļĢูāļāđāļāļ CSV āđāļ้āđāļ่āļāļัāļ
- Gold āļŦāļĢืāļ curated āļŠāļģāļŦāļĢัāļāđāļ็āļāđāļāļĨ์āļี่āļูāļāļัāļāđāļāļĢีāļĒāļĄāđāļื่āļāļāļēāļĢāđāļ้āļāļēāļ āļŦāļĢืāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨ āđāļĨāļ°āđāļĢāļēāļĒัāļāļŠāļēāļĄāļēāļĢāļāļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļāļ Fact, Dimension, Slowly Changing Dimensions (SCDs) āļāļēāļĄāđāļāļ§āļāļēāļāļāļāļ data warehouse āđāļ้āđāļ่āļāļัāļ āļึ่āļāļŠāļēāļĄāļēāļĢāļāļāļģāđāļ้āļั้āļāļ้āļ§āļĒāđāļāļĨ์ parquet āļāļĢāļีāļāļāļēāļāđāļāļĨ์āđāļĄ่āđāļŦāļ่āļĄāļēāļ āļŦāļĢืāļ delta āļāļĢāļีāļี่āļāļēāļĢ update āđāļāļĨ์āđāļิāļĄāļĄีāļāļ§āļēāļĄāđāļŦāļĄāļēāļ°āļŠāļĄāļāļ§่āļē
āļั้āļāļี้āļāļēāļĢāļัāļāđāļ่āļāđāļĨāļ°āļั้āļāļื่āļāļāļēāļĄ industry practice āđāļ่āļ data life cycle āļĒัāļāļāļēāļāļāļĢัāļāđāļāļĨี่āļĒāļāđāļื่āļāđāļŦ้āđāļ้āļēāđāļāļ่āļēāļĒāļŠāļģāļŦāļĢัāļāļāļēāļĢāđāļ้āļāļēāļāļāļāļāđāļĢāļē āļŠāļ°āļāļ§āļāļ่āļāļāļēāļĢāļัāļāļāļēāļĢāđāļĨāļ°āđāļ้āļāļēāļāđāļāļĨ์āļ่āļēāļāđ āđāļāļĒāļŠ่āļ§āļāļัāļ§āđāļĄ่āļ่āļāļĒāļิāļĒāļĄāļัāļāļāļēāļĢāđāļĢีāļĒāļāđāļāļ bronze, silver āđāļĨāļ° gold āđāļื่āļāļāļāļēāļāđāļĄ่āđāļ้āļŠื่āļāļึāļ data life cycle āđāļĨāļĒāļัāļāļāļ°āļิāļ
3.4 Database āļāļ Serverless SQL pool āđāļĨāļ°āđāļ่āļ database schema āđāļāļĒāđāļ่āļāļāļēāļĄāļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļ container āđāļ่āļ bronze āļŦāļĢืāļ raw, silver āļŦāļĢืāļ , gold āļŦāļĢืāļ āđāļื่āļāđāļŦ้āļัāļāļāļēāļĢāļĢูāļāđāļāļāļāļēāļĢāđāļ้āļāļēāļāđāļ้āđāļŦāļĄāļēāļ°āļŠāļĄ āđāļāļĒāđāļāļัāļ§āļāļĒ่āļēāļāđāļĢāļēāļŠāļĢ้āļēāļ database āļื่āļ lakehouse_lite
![]() |
Database, Schema āđāļĨāļ° External Tables āđāļ Serverless SQL pool |
3.5 External table āļŦāļĢืāļ view āļŠāļģāļŦāļĢัāļāđāļāļĨ์āđāļ bronze/raw āđāļื่āļāđāļŦ้āļŠāļēāļĄāļēāļĢāļāđāļ้āļ่āļēāļĒāđāļāļĒ SQL āļĄี 2 āļ§ิāļีāđāļāļāļēāļĢāļŠāļĢ้āļēāļ external table āļืāļ Create External Table āļึ่āļāđāļ็āļāļāļēāļĢāļŠāļĢ้āļēāļ table āļึ้āļāļĄāļēāļāļāđāļāļĨ์ āđāļĨāļ° Create External Table As Select (CETAS) āļึ่āļāļāļģ 2 āļั้āļāļāļāļ āļืāļ āļŠāļĢ้āļēāļāđāļāļĨ์āđāļŦāļĄ่āļึ้āļāļĄāļē āđāļĨāļ°āļŠāļĢ้āļēāļ external table āđāļ Serverless SQL pool āđāļāļĒāđāļāļั้āļāļāļāļāļี้āļ้āļāļāļĄีāļāļēāļĢāļāļģāļŦāļāļ external data source āđāļĨāļ° external file format āļ้āļ§āļĒ āļึ่āļ external table āđāļŦāļĨ่āļēāļี้āļŠāļēāļĄāļēāļĢāļāđāļ้āļāļēāļāđāļŦāļĄืāļāļ table āļāļēāļ traditional relational database āđāļ่āļ āđāļ้āļāļēāļāļัāļ PowerBI, tableau āđāļ้āđāļāļĒāļāļĢāļ āđāļ่āļĄีāļ้āļāļāļģāļัāļāļี่ external table āđāļĄ่āļĢāļāļāļĢัāļāđāļāļĨ์āļāļĢāļ°āđāļ āļ JSON
3.6 Data transformation āđāļ้āđāļื่āļāļāļģāļั้āļāļāļāļāļ่āļēāļāđ āđāļ่āļ āļāļēāļĢāđāļāļĨāļāļāļĢāļ°āđāļ āļāđāļāļĨ์ feature engineering āļัāļāđāļāļĢีāļĒāļĄāļ้āļāļĄูāļĨ āđāļāļāļāļึāļāļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļāļĢูāļāđāļāļāļāļāļ data warehouse āļึ่āļāđāļ็āļāļāļĢāļ°āļāļ§āļāļāļēāļĢāļี่āļāļģāđāļŦ้āļ้āļāļĄูāļĨāđāļŦāļĨāļāļēāļ zone āļŦāļึ่āļāđāļāļĒัāļāļีāļ zone āļŦāļี่āļ āđāļ่āļāļāļēāļ raw/bronze āđāļ enriched/silver āđāļ ASA āļāļģāđāļ้āļŦāļĨāļēāļĒāļ§ิāļี
āđāļ่āļ
- CETAS āđāļ็āļ SQL script āļāļēāļāđāļĢีāļĒāļāđāļ้āđāļāļĒāļāļĢāļ āļŦāļĢืāļāđāļāļĨāļāđāļ็āļ stored procedure āđāļื่āļāļāļĢāļ°āđāļĒāļāļ์āļ้āļēāļ code reuse āđāļāļāļี่āļāļ°āđāļีāļĒāļ SQL script āļŠāļģāļŦāļĢัāļāđāļ่āļĨāļ° table āļŠāļēāļĄāļēāļĢāļāļĻึāļāļĐāļēāđāļ้āļāļēāļ CETAS with Synapse SQL āļāļĒ่āļēāļāđāļĢāļ็āļี āđāļื่āļāļāļāļēāļ external table āđāļĄ่āļĢāļāļāļĢัāļ partition āđāļĢāļēāļŠāļēāļĄāļēāļĢāļāđāļ้āļัāļāļŦāļēāļāļēāļāļ้āļāļĄāđāļāļĒāđāļ้ pipeline āđāļĢีāļĒāļ stored procedure āļ§āļ loop āđāļื่āļāļŠāļĢ้āļēāļ partition āđāļĨ้āļ§āļึāļāļŠāļĢ้āļēāļ view āļึ้āļāļĄāļēāļāļĢāļāļāļีāļāļั้āļāļŦāļึ่āļ āļāļēāļĢāđāļ้ Spark pool āļึāļāđāļŦāļĄāļēāļ°āļŠāļĄāđāļĨāļ°āļ่āļēāļĒāļāļ§่āļēāļāļĢāļีāļี่āđāļĢāļēāļ้āļāļāļāļēāļĢāđāļ้ partition
- SparkSQL āļŦāļĢืāļ pySpark āđāļāļĒāđāļ้ notebook āļāļ Spark pool
- Data Flow āļึ่āļāđāļ็āļ low code GUI
- SparkSQL āļŦāļĢืāļ pySpark āđāļāļĒāđāļ้ notebook āļāļ Spark pool
- Data Flow āļึ่āļāđāļ็āļ low code GUI
![]() |
Data transformation āđāļāļĒāđāļ้ stored procedure |
3.7 Synapse Pipelines āđāļ้āđāļāļāļēāļĢāļูāļāļāļēāļĢāļāļģāļāļēāļāļāļēāļĄāļĨāļģāļัāļāļั้āļāļāļāļ āļāļēāļĢāđāļĢีāļĒāļāđāļ้ dataflow, stored procedure, notebook āđāļĨāļ° script āļĢāļ§āļĄāļึāļ āļāļēāļĢāļัāļāļāļēāļĢāļ่āļē parameters, file operation, looping āļ่āļēāļāđ āļāļĨāļāļāļāļāļāļēāļĢāļāļģ scheduling āđāļĨāļ° trigger
![]() |
Pipeline āļูāļāļั้āļāļāļāļāļ่āļēāļāđ āđāļ้āļēāļ้āļ§āļĒāļัāļāđāļ็āļ process āđāļĨāļ°āļŠั่āļāļāļēāļĢāļāļģāļāļēāļ |
4. Tips
āļŠāļģāļŦāļĢัāļāļāļēāļĢāļāļģāļāļēāļāļัāļāļ้āļāļĄูāļĨ āļŦāļĢืāļāđāļāļĢāļāļāļēāļĢāļี่āļĄีāļāļāļēāļāļ่āļāļāļ้āļēāļāđāļŦāļ่ āļีāļĄāļāļēāļāļŦāļĨāļēāļĒāļāļ āļāļēāļĢāļāļāļāđāļāļ āđāļĨāļ°āļāļģāļŦāļāļāļ่āļēāļ่āļēāļāđ āļāļ°āļ่āļ§āļĒāđāļŦ้āļāļēāļĢāļāļģāļāļēāļāđāļ็āļāļĢāļ°āđāļีāļĒāļāđāļĨāļ°āļัāļāļāļēāļĢāđāļ้āļ่āļēāļĒāļึ้āļ āļāļĢāļ°āļĄāļ§āļĨāļāļĨāđāļ้āđāļĢ็āļ§ āļāļ§āļāļุāļĄāļ่āļēāđāļ้āļ่āļēāļĒāđāļ้āļี āļึāļāđāļ้āļĢāļ§āļāļĢāļ§āļĄāļāļģāđāļāļ°āļāļģāļāļēāļāļู้āļĄีāļāļĢāļ°āļŠāļāļāļēāļĢāļ์āļāļēāļāđāļŦāļĨ่āļāļ่āļēāļāđ āļĢāļ§āļĄāļึāļāļāļāļ Microsoft āđāļāļāđāļ§้āđāļŦ้āđāļĨืāļāļāļāļģāđāļāđāļ้ āđāļāļĒāđāļ่āļāđāļ็āļāļŠ่āļ§āļāļัāļāļี้
Store
- āđāļĢāļēāļāļēāļāļัāļāđāļ่āļ storage account, container āđāļĨāļ° lakehouse folder āļŦāļĨāļēāļĒāđāļāļāļāļēāļĄāļĨัāļāļĐāļāļ°āļāļēāļĢāđāļ้āļāļēāļ āđāļ่āļ āļāļēāļĄ data life cycle: /raw, /enriched āļŦāļĢืāļāđāļĒāļāļāļēāļĄāđāļāļŠāļāļēāļĢāļัāļāļāļē develop, test and production: /dev, /sit āļāļēāļĄāļĢāļ°āļāļāļāļēāļ: /application01 āļŦāļĢืāļ āļāļēāļĄāđāļĢื่āļāļāļุāļĢāļิāļ (business area): /sales, /accounting āđāļ็āļāļ้āļ āđāļĨāļ°āļĒัāļāļŠāļēāļĄāļēāļĢāļāļāļģāļāļŠāļĄāļัāļāđāļ้āļีāļāļ้āļ§āļĒ āļั้āļāļี้āļ็āļัāļāđāļ่āļāļĢูāļāđāļāļāļāļēāļĢāđāļ็āļāļāļĒ่āļēāļāđāļŦāļĄāļēāļ°āļŠāļĄ āļึ้āļāļัāļāļŦāļĨāļēāļĒāļัāļāļัāļĒ
- āļāļĒāļēāļĒāļēāļĄāļĒึāļāđāļāļ§āļāļēāļ multiple-workspaces-single-lake āļŦāļēāļāļāļģāđāļ้ āļึ่āļāļĄีāđāļีāļĒāļ 1 datalake storage account āđāļื่āļāļāļĢāļ°āđāļĒāļāļ์āđāļāļāļēāļĢāđāļāļĢ์āļ้āļāļĄูāļĨ āļāļēāļĢāļุāļĄāļāļēāļĢāđāļ้āļ้āļāļĄูāļĨāļāļēāļĄ containers āđāļĨāļ°āļāļ§āļĢāļั้āļāļื่āļ workspace āđāļŦ้āļŠāļāļāļāļĨ้āļāļāļัāļ container āđāļāļĒāđāļāļāļēāļ°āļāļĢāļีāđāļ้āļŦāļĨāļēāļĒ workspaces
- āļāļĢāļีāļี่āđāļāļĨ์āļĄีāļāļģāļāļ§āļāļĄāļēāļ āđāļĨāļ°āļāļāļēāļāđāļŦāļ่ āļāļ§āļĢāļัāļāđāļ่āļ partition (āļŦāļĢืāļāļŠāļĢ้āļēāļ sub folder) āļāļāļāđāļāļĨ์āđāļ ADLS Gen 2 āđāļื่āļāđāļŦ้āđāļ้āļāļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļāļāļāļ file metadata function āđāļ Serverless SQL pool āļ่āļ§āļĒāđāļāļāļēāļĢāļĢāļ°āļุ partition āđāļ้āļ่āļēāļĒ āļāļģāđāļŦ้āđāļĢāļēāđāļ้āļ้āļāļĄูāļĨāđāļ่āļēāļี่āļāļģāđāļ็āļāđāļāđāļ่āļĨāļ° partition āļึ่āļāļĄีāļāļĨāļัāļāļāļ§āļēāļĄāđāļĢ็āļ§āđāļāļāļēāļĢāļāļģāļāļēāļ āđāļĨāļ°āļ่āļēāđāļ้āļ่āļēāļĒ
- āļāļēāļĢāđāļ่āļ partition āļŦāļĢืāļ subfolder āļāļāļāļ้āļāļĄูāļĨāđāļ container āļāļ§āļĢāļิāļāļēāļĢāļāļēāļāļēāļāļāļēāļĢāļัāļāđāļ็āļāđāļĨāļ°āđāļ้āļ้āļāļĄูāļĨāđāļ็āļāļŠāļģāļัāļ āđāļ่āļ āļŦāļēāļāđāļĢāļēāđāļ้āđāļ็āļāļĢāļēāļĒāđāļืāļāļ āļĢāļēāļĒāļี āđāļĢāļēāļāļ§āļĢāļัāļāđāļ็āļ /year/month āđāļ็āļāļ้āļ
- āļัāļāļุāļัāļ external table āđāļ serverless SQL pool āđāļĄ่āļĢāļāļāļĢัāļāļāļēāļĢāļāļģ partition pruning āļึāļāļ้āļāļāļŠāļĢ้āļēāļāđāļ็āļ view āđāļĨ้āļ§āđāļ้ filepath function āđāļ view āļึāļāļŠāļēāļĄāļēāļĢāļāđāļ้āļāļĢāļ°āđāļĒāļāļ์āļāļēāļāļāļēāļĢāļāļģ partition āđāļ้
- āđāļĨืāļāļāđāļ้ view āđāļāļāļāļēāļĢāđāļ้ external table āļāļĢāļีāļี่āļ้āļāļāļāļēāļĢāļāļģāļัāļāđāļŦ้āđāļŦ็āļāļ้āļāļĄูāļĨāđāļ่āļāļēāļ column āļŦāļĢืāļāļāļģāļŦāļāļāđāļื่āļāļāđāļāđāļāļāļēāļĢāļูāļ้āļāļĄูāļĨ
Process
- āđāļāļāļēāļĢāļŠāļĢ้āļēāļ external table, table āļāļ§āļĢāļāļģāļŦāļāļ data type āđāļĨāļ° data length āđāļŦ้āđāļŦāļĄāļēāļ°āļŠāļĄ āđāļāļāļāļēāļĢāđāļ้āļ่āļē default āļāļēāļāļĢāļ°āļāļ āđāļื่āļāđāļ็āļāļāļēāļĢāļāļāļāļĢāļ°āļāļāđāļŦ้āļัāļāļŠāļĢāļĢāļāļĢัāļāļĒāļēāļāļĢāđāļĨāļ°āļāļģāđāļิāļāļāļēāļĢāļัāļāļ้āļāļĄูāļĨāļั้āļāļāļĒ่āļēāļāđāļŦāļĄāļēāļ°āļŠāļĄ āļัāļ§āļāļĒ่āļēāļāđāļ่āļ string data type āđāļāđāļāļĨ์ āđāļĄื่āļāđāļĢāļēāļŠāļĢ้āļēāļ external table āļŦāļĢืāļ table āļĢāļ°āļāļāļāļ°āļāļģāļŦāļāļāļ่āļēāļั้āļāļ้āļāđāļ็āļ varchar(8000) āļŦāļĢืāļ nvarchar(4000) āļึ่āļāđāļ้āļื้āļāļี่āđāļĨāļ°āļāļĢัāļāļĒāļēāļāļĢāļĢāļ°āļāļāļĄāļēāļāđāļิāļāļāļģāđāļ็āļ āļāļēāļĢāļāļģāļŦāļāļāđāļŦ้āđāļŦāļĄāļēāļ°āļŠāļĄāļāļ°āļ่āļ§āļĒāļ้āļēāļāļāļ§āļēāļĄāđāļĢ็āļ§āđāļāļāļēāļĢāļāļĢāļ°āļĄāļ§āļĨāļāļĨ āļĨāļāļāļēāļĢāđāļ้āļāļĢัāļāļĒāļēāļāļĢāļāļāļāļĢāļ°āļāļ āđāļĨāļ°āļ่āļēāđāļ้āļ่āļēāļĒ
- āļāļĢāļีāļี่āđāļĢāļēāđāļีāļĒāļāđāļāļĢāđāļāļĢāļĄāļŠāļģāļŦāļĢัāļ data transformation āđāļāļĒāđāļ้ notebook āđāļāļ°āļāļģāđāļŦ้āđāļีāļĒāļāđāļ็āļāļุāļāļัāļāļ์āļั่āļāļŠั้āļāđ āļāļģāļāļēāļāđāļāļāļēāļ°āđāļĢื่āļāļ āđāļāđāļ่āļĨāļ° notebook āđāļื่āļāļĨāļāļāļ§āļēāļĄāļัāļāļ้āļāļāļāļāļāļāļēāļĢāđāļีāļĒāļāđāļāļĢāđāļāļĢāļĄ āļāļēāļĢ debug āļ§ิāđāļāļĢāļēāļ°āļŦ์āļัāļāļŦāļē āđāļĨāļ°āļāļēāļĢāļูāđāļĨāđāļāļ āļēāļĒāļŦāļĨัāļ āđāļื่āļāļāļāļēāļāđāļĢāļēāļŠāļēāļĄāļēāļĢāļāđāļĢีāļĒāļāđāļ้ notebook āļŦāļĨāļēāļĒāđ āļุāļ āđāļŦ้āļāļģāļāļēāļāļ่āļāđāļื่āļāļāļัāļāđāļ้ āđāļāļĒāđāļ้ pipelines āļāļģāđāļŦ้āļ่āļēāļĒāļ่āļāļāļēāļĢ monitor āđāļāļั้āļāļāļāļāļ่āļēāļāđ āļ่āļēāļĒāļ่āļāļูāđāļĨ āļĄāļēāļāļāļ§่āļēāļāļēāļĢāđāļีāļĒāļāđāļ็āļāđāļāļĢāđāļāļĢāļĄāļĒāļēāļ§āđ āđāļŦāļĄืāļāļāļāļēāļĢāđāļีāļĒāļāđāļāļĢāđāļāļĢāļĄāļั่āļ§āđāļ
- āļั้āļāļ่āļē Cost Control āđāļ SQL pool āđāļŠāļĄāļ
Others
- āđāļื่āļāļŦāļĨีāļāđāļĨี่āļĒāļ data swamp āļŦāļĢืāļāļŠāļ āļēāļ§āļ°āļ้āļāļĄูāļĨāļĒุ่āļāđāļŦāļĒิāļāļāļāļāđāļัāļāļ้āļāļāļัāļāđāļ data lake āļāļāđāļĄ่āļĄีāđāļāļĢāļĢู้āļ§่āļēāļĄีāļāļ°āđāļĢāļāļĒู่āļี่āđāļŦāļ āļĄีāļึāļāļāļ§āļĢāļĄีāļั้āļāļāļāļāļัāļāđāļĨืāļāļāļ้āļāļĄูāļĨāđāļ้āļēāđāļāđāļ็āļāđāļ lakehouse āđāļĨāļ°āļāļģ data catalog āđāļื่āļāđāļ็āļāļāļēāļĢāļĨāļāļāļ°āđāļีāļĒāļāļุāļāļ้āļāļĄูāļĨāļี่āļĄีāļāļēāļĢāļัāļāđāļ็āļ āđāļāļĒāļĢāļ°āļุāđāļีāļĒāļāđāļื้āļāļŦāļēāļี่āļāļģāđāļ็āļ āđāļĨāļ°āđāļีāļĒāļāļāļāļŠāļģāļŦāļĢัāļāļāļēāļĢāđāļ้āļāļēāļāļāļāļāđāļĢāļē āđāļĄ่āļ§่āļēāļāļ°āđāļ็āļāļื่āļāđāļāļĨ์ āļāļ§āļēāļĄāļŦāļĄāļēāļĒāļāļāļāļ้āļāļĄูāļĨ āđāļāļĢāđāļ็āļāđāļ้āļēāļāļāļ āļ้āļāļāđāļ็āļāđāļ§้āļāļēāļāđāļ่āđāļŦāļ āļึ่āļāļŠāļēāļĄāļēāļĢāļāļāļģāđāļāļāļ่āļēāļĒāđ āđāļ็āļ excel āļŦāļĢืāļ csv āđāļĨ้āļ§āđāļāļĢ์āđāļŦ้āļāļāļื่āļāđāļ้āļēāļĄāļēāļู āļŦāļĢืāļ upload āđāļ้āļē lakehouse āđāļ็āļāđāļŠāļĄืāļāļāļีāļ 1 āļุāļāļ้āļāļĄูāļĨāļ็āđāļ้
āđāļĢāļēāļāļēāļāļิāļāļ§่āļēāļŠāļģāļŦāļĢัāļ SMB āļึ่āļāļĄีāļ้āļāļĄูāļĨāđāļĄ่āļĄāļēāļāļัāļ āļĄีāļู้āđāļ้āļāļģāļัāļ āļึāļāđāļĄ่āļāļģāđāļ็āļāļ้āļāļāđāļ้āđāļāļ§āļāļēāļāđāļŦāļĨ่āļēāļี้āļ็āđāļ้ āđāļāļĢāļēāļ°āđāļŦāļĄāļēāļ°āļŠāļģāļŦāļĢัāļāļāļĢāļีāļĄีāļ้āļāļĄูāļĨāļāļģāļāļ§āļāļĄāļēāļ āđāļ่āļāļēāļĢāļี่āđāļĢāļēāđāļĨืāļāļāđāļ้āđāļāļ§āļāļēāļāļี่āđāļ็āļ industry practice āļāļĒ่āļēāļāđāļŦāļĄāļēāļ°āļŠāļĄ (āļึ่āļāđāļĄ่āļāļģāđāļ็āļāļ้āļāļāļāļģāđāļāđāļ้āļุāļāļ้āļ) āļāļ°āļ่āļ§āļĒāđāļŦ้āļāļģāļāļēāļāđāļ้āļ่āļēāļĒ āļŠāļ°āļāļ§āļāļ่āļāļāļēāļĢāļูāđāļĨ āļāļĒāļēāļĒāļŠāđāļāļĨāļāļēāļ āļĢāļāļāļĢัāļāļāļēāļĢāļāļģāļāļēāļāļี่āđāļŦāļ่āđāļĨāļ°āļัāļāļ้āļāļāđāļāļāļāļēāļāļāđāļ้
āđāļāđāļื้āļāļāļ้āļāđāļĢāļēāļĒัāļāđāļĄ่āđāļ้āđāļ้āļāļึāļāļāļēāļĢāļัāļāļāļēāļĢāļ้āļāļĄูāļĨāļĢูāļāđāļāļāļ่āļēāļāđ āđāļāļāļēāļ data warehouse āđāļ่āļ āļāļēāļĢāļัāļāļāļēāļĢ data inconsistency, late arrival, missing key, history maintenance āđāļāļāļāļึāļ āļāļēāļĢāļัāļāđāļ็āļāļ้āļāļĄูāļĨāđāļāļĨัāļāļĐāļāļ°āļ่āļēāļāđ āļึ่āļāđāļ็āļāļื้āļāļāļēāļāļāļēāļĢāļัāļāļāļēāļĢāļ้āļāļĄูāļĨāđāļ data warehouse āđāļ่āļŠāļēāļĄāļēāļĢāļāđāļĨืāļāļāļāļģāđāļāļัāļāļāļēāđāļิ่āļĄāđāļิāļĄāļāļēāļĄāļāļ§āļēāļĄāļāļģāđāļ็āļāđāļāļāļēāļĢāđāļ้āļāļēāļ
Conclusion
āļ่āļēāļĄāļāļĨāļēāļāļāļēāļāđāļĨืāļāļāļี่āļŦāļĨāļēāļāļŦāļĨāļēāļĒāđāļĨāļ°āļัāļāļ้āļāļāļŠāļģāļŦāļĢัāļāļัāļāļāļē Data Lakehouse, Data Lake āļāļ cloud āđāļĢāļēāļĒัāļāļĄีāļāļēāļāđāļĨืāļāļāđāļāļāļ่āļēāļĒāđ āđāļāļĒāļĨāļāļุāļāđāļĄ่āļŠูāļāļัāļāđāļŦ้āđāļĢāļēāđāļ้āđāļĨืāļāļāđāļ้ āđāļื่āļāđāļĢิ่āļĄāļ้āļāļัāļāļāļēāđāļĨāļ°āđāļĢีāļĒāļāļĢู้ āđāļāļĒāđāļāļāļēāļ°āļŠāļģāļŦāļĢัāļ SMB āļี่āļĄีāļāļĢัāļāļĒāļēāļāļĢāļāļģāļัāļ āđāļ่āļāļāļāļ§่āļēāđāļĄ่āļĄีāļāļēāļāđāļĨืāļāļāļี่āđāļ็āļ one-size-fits-all āļี่āļāļāļāđāļāļāļĒ์āļุāļāđāđāļĢื่āļāļāļāļāļāļุāļāđāļāļ āđāļĢāļēāļĒัāļāļ้āļāļāļĻึāļāļĐāļēāļāļģāļāļ§āļēāļĄāđāļ้āļēāđāļāļ้āļāļี āļ้āļāļāļģāļัāļ āļĢāļ§āļĄāļึāļāļāļ§āļēāļĄāļ้āļāļāļāļēāļĢāļ้āļēāļāļื่āļāđ āđāļื่āļāļāļēāļĢāđāļĨืāļāļāđāļ้āļāļĒ่āļēāļāđāļŦāļĄāļēāļ°āļŠāļĄ āđāļ่āļ āļĢูāļāđāļāļāļāļēāļĢāđāļ้āļāļēāļ āļāļēāļĢāļ่āļāļĒāļāļāđāļ้ AI āļ§ัāļāļāļāļĢāļĢāļĄāļāļāļ์āļāļĢ āļāļēāļĢāļูāđāļĨāļāļ§āļēāļĄāļāļĨāļāļāļ ัāļĒāļ้āļāļĄูāļĨāļี่āđāļŦāļĄāļēāļ°āļŠāļĄāđāļีāļĒāļāļāļ āđāļĄื่āļāđāļĢāļēāđāļ้āļēāđāļāļāļĒ่āļēāļāđāļีāļĒāļāļāļāđāļĨ้āļ§ āļāļēāļĢāļัāļāļāļēāļāļĒ่āļēāļāļ่āļāđāļื่āļāļāļāļāļāđāļāļāđāļāđāļĨāļĒีāļ้āļēāļāļ้āļāļĄูāļĨāđāļĨāļ°āļāļēāļĢāđāļ่āļāļัāļāļัāļāļāļĒ่āļēāļāđāļ้āļĄāļ้āļāļĢāļ°āļŦāļ§่āļēāļāļู้āđāļŦ้āļāļĢิāļāļēāļĢāļึāļāđāļ็āļāđāļŦāļĄืāļāļāļāļĨื่āļāļี่āļ่āļ§āļĒāļāļĨัāļāļัāļ āđāļิāļāđāļāļāļēāļŠāđāļŦāļĄ่āđ āđāļŦ้āļัāļāđāļĢāļēāđāļĨืāļāļāđāļ้āļŠิ่āļāļี่āđāļŦāļĄāļēāļ°āļŠāļĄāļัāļāļāļēāļĢāđāļ้āļāļāļāđāļĢāļēāđāļ้āļāļĒ่āļēāļāļี่āđāļĄ่āđāļāļĒāļĄีāļĄāļēāļ่āļāļ
Data Lakehouse for Small & Midsize Business: Lakehouse Lite - Part II
Reviewed by aphidet
on
8:54 PM
Rating:

No comments: