Data Lakehouse for Small & Midsize Business: Lakehouse Lite - Part I

Image credit: www.traveloffpath.com
āļžāļ§āļāđ€āļĢāļēāļ­āļĒู่āđƒāļ™āļĒุāļ„āļ—ี่āļ‚้āļ­āļĄูāļĨāļĄีāļ­āļĒู่āļ—ั่āļ§āđ„āļ›āļĢāļ­āļšāļ•ัāļ§āđ€āļĢāļē āļ–ูāļāđƒāļŠ้āđ€āļžื่āļ­āļ—āļģāđƒāļŦ้āļŠีāļ§ิāļ•āđ€āļĢāļēāļ‡่āļēāļĒāļ‚ึ้āļ™āđ‚āļ”āļĒāļāļēāļĢāļ§ิāđ€āļ„āļĢāļēāļ°āļŦ์āļ—ี่āļĄีāļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļŠāļĨัāļšāļ‹ัāļšāļ‹้āļ­āļ™āđāļĨāļ°āļ›ัāļāļāļēāļ›āļĢāļ°āļ”ิāļĐāļ์ (AI: Aritificial Intelligence) āđ€āļĢāļēāļĄัāļāļ„ิāļ”āļ§่āļēāļāļēāļĢāļˆัāļ”āļāļēāļĢāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨ āļ§ิāđ€āļ„āļĢāļēāļ°āļŦ์āđāļĨāļ°āđƒāļŠ้ AI āļžāļ§āļāļ™ี้ āđ€āļ›็āļ™āđ€āļĢื่āļ­āļ‡āļ‚āļ­āļ‡āļ­āļ‡āļ„์āļāļĢāļ‚āļ™āļēāļ”āđƒāļŦāļ่ āđ€āļ™ื่āļ­āļ‡āļˆāļēāļāļĄีāļ‚้āļ­āļĄูāļĨāļĄāļēāļ āļĄีāļ—āļĢัāļžāļĒāļēāļāļĢāđāļĨāļ°āļšุāļ„āļ„āļĨāļēāļāļĢāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāļ—ี่āļŦāļēāļĒāļēāļāđāļĨāļ°āļ„่āļēāļ•ัāļ§āļŠูāļ‡ āļ•้āļ­āļ‡āđƒāļŠ้āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļŠั้āļ™āļŠูāļ‡ āļ‹ึ่āļ‡āļĄีāļ„āļ§āļēāļĄāļ‹ัāļšāļ‹้āļ­āļ™āđƒāļ™āļāļēāļĢāđƒāļŠ้āļ‡āļēāļ™ āļ āļēāļžāļ‚āļ­āļ‡āļŠāļ–āļēāļ›ัāļ•āļĒāļāļĢāļĢāļĄāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāđāļĨāļ°āļāļēāļĢāļ§ิāđ€āļ„āļĢāļēāļ°āļŦ์āļŠāļĄัāļĒāđƒāļŦāļĄ่āļ—ี่āļ”ูāđ€āļāļĢāļ‡āļ‚āļēāļĄ āļŠิ่āļ‡āđ€āļŦāļĨ่āļēāļ™ี้āļĨ้āļ§āļ™āđ€āļ›็āļ™āļ­ุāļ›āļŠāļĢāļĢāļ„āļŠāļģāļ„ัāļāļŠāļģāļŦāļĢัāļšāļ˜ุāļĢāļิāļˆāļ‚āļ™āļēāļ”āđ€āļĨ็āļāđāļĨāļ°āļ‚āļ™āļēāļ”āļāļĨāļēāļ‡ (SMB: Small and Medium Business) āļ—ี่āļĄีāļžāļ™ัāļāļ‡āļēāļ™āđ„āļĄ่āļĄāļēāļ āļ­āļēāļˆāļĄีāđ€āļžีāļĒāļ‡āļ—ีāļĄ IT āļ‚āļ™āļēāļ”āđ€āļĨ็āļ āļ—āļģāđƒāļŦ้āļĄีāļ‚้āļ­āļˆāļģāļัāļ”āđƒāļ™āļāļēāļĢāđƒāļŠ้āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ”้āļēāļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāđāļĨāļ°āļ§ิāđ€āļ„āļĢāļēāļ°āļŦ์āļ‚้āļ­āļĄูāļĨāļŦāļĢืāļ­ AI

āļ āļēāļžāļˆāļēāļāļ•ัāļ§āļ­āļĒ่āļēāļ‡āļŠāļ–āļēāļ›ัāļ•āļĒāļāļĢāļĢāļĄāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨ āļˆāļēāļ AWS āđāļĨāļ° Microsoft
āđƒāļ™āļ‚āļ“āļ°āļ—ี่āļ˜ุāļĢāļิāļˆāđ„āļĄ่āļ§่āļēāđ€āļĨ็āļāļŦāļĢืāļ­āđƒāļŦāļ่āļ•่āļēāļ‡āđ€āļŦ็āļ™āļ„āļ§āļēāļĄāļŠāļģāļ„ัāļāļ‚āļ­āļ‡āļāļēāļĢāđƒāļŠ้āļ‚้āļ­āļĄูāļĨāđāļĨāļ°āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āļˆāļēāļ AI āļัāļ™āļĄāļēāļāļ‚ึ้āļ™ āļ­ัāļ™āđ€āļ›็āļ™āļœāļĨāļˆāļēāļāļāļēāļĢāđ€āļ•ิāļšāđ‚āļ•āļ­āļĒ่āļēāļ‡āļ้āļēāļ§āļāļĢāļ°āđ‚āļ”āļ”āđƒāļ™āļĒุāļ„āļ”ิāļˆิāļ•้āļĨ āļ—āļģāđƒāļŦ้āđ€āļิāļ”āļ‚้āļ­āļĄูāļĨāđƒāļŦāļĄ่āđ† āļˆāļģāļ™āļ§āļ™āļĄāļēāļ āđ€āļิāļ”āļ„āļ§āļēāļĄāļ•้āļ­āļ‡āļāļēāļĢāđƒāļŠ้āļ‚้āļ­āļĄูāļĨāļ­āļĒ่āļēāļ‡āđ€āļ›็āļ™āļĢāļ°āļšāļš āđ‚āļ„āļĢāļ‡āļŠāļĢ้āļēāļ‡āļžื้āļ™āļāļēāļ™āļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāļ—ี่āļĢāļ­āļ‡āļĢัāļšāļāļēāļĢāđ€āļ•ิāļšāđ‚āļ•āļ­āļĒ่āļēāļ‡āļĢāļ§āļ”āđ€āļĢ็āļ§ āļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨāđ„āļ”้āļ‡่āļēāļĒ āđ‚āļ”āļĒāđƒāļŠ้āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āļˆāļēāļāđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāđƒāļŦāļĄ่āđ† āđ€āļžื่āļ­āļŠ่āļ§āļĒāđ€āļžิ่āļĄāđ‚āļ­āļāļēāļŠāļ—āļēāļ‡āļ˜ุāļĢāļิāļˆāđƒāļŦāļĄ่āđ† āđ€āļžิ่āļĄāļ›āļĢāļ°āļŠิāļ—āļ˜ิāļ āļēāļž āļŠāļĢ้āļēāļ‡āļ›āļĢāļ°āļŠāļšāļāļēāļĢāļ“์āļ—ี่āļ”ีāđƒāļŦ้āđāļ่āļĨูāļāļ„้āļē āđ€āļžิ่āļĄāļĢāļēāļĒāđ„āļ”้āđāļĨāļ°āļĨāļ”āļ„่āļēāđƒāļŠ้āļˆ่āļēāļĒ āđ‚āļ”āļĒāļ—ั้āļ‡āļŦāļĄāļ”āļ™ี้ āđ„āļĄ่āļˆāļģāđ€āļ›็āļ™āļ•้āļ­āļ‡āļĨāļ‡āļ—ุāļ™āļŠูāļ‡ āđ„āļĄ่āļ•้āļ­āļ‡āļāļēāļĢāļ”ูāđāļĨāļ—ี่āļ‹ัāļšāļ‹้āļ­āļ™ āđƒāļŠ้āļ„āļ™āļĄāļēāļ āļ­ีāļāļ—ั้āļ‡āļˆāļēāļāļœāļĨāļŠāļģāļĢāļ§āļˆāļžāļšāļ§่āļē SMB āđ€āļŦ็āļ™āļ–ึāļ‡āļ„āļ§āļēāļĄāļŠāļģāļ„ัāļāđƒāļ™āļāļēāļĢāļ™āļģ AI āļĄāļēāđƒāļŠ้āđƒāļ™āļ˜ุāļĢāļิāļˆāļ­āļĒ่āļēāļ‡āļĄāļēāļāđƒāļ™āļ›ัāļˆāļˆุāļšัāļ™ āļ‹ึ่āļ‡āđ€āļ™้āļ™āļĒ้āļģāļ–ึāļ‡āļ„āļ§āļēāļĄāļŠāļģāļ„ัāļāđƒāļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāđƒāļŦ้āļĄีāļ›āļĢāļ°āļŠิāļ—āļ˜ิāļ āļēāļž

āļˆāļĢิāļ‡āļ­āļĒู่āļ—ี่āļ§่āļēāđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ”้āļēāļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨ Machine Learning (ML) āđāļĨāļ° AI āđƒāļ™āļĒุāļ„āđƒāļŦāļĄ่āļĨ้āļ§āļ™āļ–ูāļāļžัāļ’āļ™āļēāļ‚ึ้āļ™āđ‚āļ”āļĒāļšāļĢิāļĐัāļ—āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒี āđ€āļžื่āļ­āļ˜ุāļĢāļิāļˆāļ‚āļ™āļēāļ”āđƒāļŦāļ่ āļ­ีāļāļ—ั้āļ‡ AI/ML āļ•้āļ­āļ‡āđƒāļŠ้āļ‚้āļ­āļĄูāļĨāļˆāļģāļ™āļ§āļ™āļĄāļēāļāđƒāļ™āļāļēāļĢāļžัāļ’āļ™āļēāđ€āļĢีāļĒāļ™āļĢู้ āđāļ•่āđƒāļ™āļ›ัāļˆāļˆุāļšัāļ™ āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ­āļĒ่āļēāļ‡ Cloud-Based Analytics Services āļŠ่āļ§āļĒāđƒāļŦ้ SMB āļŠāļēāļĄāļēāļĢāļ–āđ€āļ‚้āļēāļ–ึāļ‡āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāđ„āļ”้āļ‡่āļēāļĒāļ‚ึ้āļ™ āđƒāļŠ้āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āļĢāļ°āļ”ัāļšāđ€āļ”ีāļĒāļ§āļัāļšāļšāļĢิāļĐัāļ—āļ‚āļ™āļēāļ”āđƒāļŦāļ่ āđ‚āļ”āļĒāļŠāļēāļĄāļēāļĢāļ–āđ€āļĨืāļ­āļāđƒāļŠ้āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­ āļŦāļĢืāļ­āļšāļĢิāļāļēāļĢ (services) āļ—ี่āđ€āļŦāļĄāļēāļ°āļŠāļĄāļ•่āļ­āļāļēāļĢāđƒāļŠ้āļ‡āļēāļ™ āđ‚āļ”āļĒāđ„āļĄ่āļ•้āļ­āļ‡āļĨāļ‡āļ—ุāļ™āļŦāļ™ัāļāđƒāļ™āļĢāļ°āļšāļšāļŦāļĢืāļ­āļšุāļ„āļ„āļĨāļēāļāļĢ āļ­ีāļāļ—ั้āļ‡āļāļēāļĢāļžัāļ’āļ™āļēāļ‚āļ­āļ‡ AI āđƒāļ™āļ›ัāļˆāļˆุāļšัāļ™āļ—ี่āđƒāļŠ้āļ‡āļēāļ™āđ„āļ”้āļ‡่āļēāļĒāļ‚ึ้āļ™ āđƒāļŠ้āļ‚้āļ­āļĄูāļĨāļˆāļģāļ™āļ§āļ™āļ™้āļ­āļĒāļĨāļ‡ āļ—āļģāđƒāļŦ้āđ€āļĢāļēāđ€āļŦ็āļ™āļāļēāļĢāđ€āļ•ิāļšāđ‚āļ•āđƒāļ™āļāļēāļĢāđƒāļŠ้āļ‡āļēāļ™ Big Data āđāļĨāļ° AI āđƒāļ™āļāļĨุ่āļĄāļ˜ุāļĢāļิāļˆ SMB āļĄāļēāļāļ‚ึ้āļ™āđƒāļ™āļŠ่āļ§āļ‡āļ›ีāļ—ี่āļœ่āļēāļ™āļĄāļē āļĄีāļāļĢāļ“ีāļĻึāļāļĐāļēāļ—ี่āļ™่āļēāļŠāļ™āđƒāļˆāļĄāļēāļāļĄāļēāļĒ āļ­āļĒ่āļēāļ‡āļšāļĢิāļĐัāļ—āļĢāļ–āļĄืāļ­āļŠāļ­āļ‡āđ€āļĨ็āļāđ†āļ็āļŠāļēāļĄāļēāļĢāļ–āđƒāļŠ้ AI āļŠ่āļ§āļĒāļĨูāļāļ„้āļēāļ›āļĢāļ°āđ€āļĄิāļ™āļĄูāļĨāļ„่āļēāļĢāļ–āđ„āļ”้āļ”้āļ§āļĒāļ•ัāļ§āđ€āļ­āļ‡āļˆāļēāļāļ āļēāļžāļ–่āļēāļĒāđƒāļ™āļŠāļĄāļēāļĢ์āļ—āđ‚āļŸāļ™

āļšāļ—āļ„āļ§āļēāļĄāļ™ี้āļˆัāļ”āļ—āļģāļ‚ึ้āļ™āđ€āļžื่āļ­āđƒāļŦ้āđ€āļŦ็āļ™āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āđāļĨāļ°āđāļ™āļ§āļ—āļēāļ‡āļāļēāļĢāļˆัāļ”āļ—āļģ āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨāļŠāļĄัāļĒāđƒāļŦāļĄ่āļ­āļĒ่āļēāļ‡ Data Lakehouse āļšāļ™āļĢāļ°āļšāļšāļ„āļĨāļēāļ§āļ”์ (cloud platform) āļŠāļģāļŦāļĢัāļšāļ˜ุāļĢāļิāļˆ SMB āđ€āļžื่āļ­āļ•่āļ­āļĒāļ­āļ”āđ„āļ›āđƒāļŠ้ Data Analytics āđāļĨāļ° AI āđ‚āļ”āļĒāđāļš่āļ‡āđ€āļ›็āļ™ 2 āļŠ่āļ§āļ™  Part I: āļ™āļģāđ€āļŠāļ™āļ­āđāļ™āļ§āļ—āļēāļ‡ āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļšāļĢิāļŦāļēāļĢāļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨ āđ‚āļ”āļĒāđƒāļŠ้āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āđ€āļ—่āļēāļ—ี่āļˆāļģāđ€āļ›็āļ™ āđ„āļĄ่āļ•้āļ­āļ‡āđƒāļŠ้āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āđāļĨāļ°āļāļēāļ™āļ‚้āļ­āļĄูāļĨ āđƒāļ™āļŠāđ€āļāļĨāđ€āļ”ีāļĒāļ§āļัāļšāļ—ี่āđƒāļŠ้āđƒāļ™āļ­āļ‡āļ„์āļāļĢāļ‚āļ™āļēāļ”āđƒāļŦāļ่ āđ€āļĢีāļĒāļāļ§่āļē Lakehouse Lite āđāļĨāļ° Part II: āđ€āļ›็āļ™āļāļēāļĢāļˆัāļ”āđ€āļ•āļĢีāļĒāļĄāļžāļĢ้āļ­āļĄāđ€āļŦāļ•ุāļœāļĨāļ—āļēāļ‡āđ€āļ—āļ„āļ™ิāļ„ āļŠāļģāļŦāļĢัāļš Lakehouse Lite āđ‚āļ”āļĒāļˆāļ°āđƒāļŠ้ Microsoft Azure Synapse Analytics āđ€āļ›็āļ™āļ•้āļ™āđāļšāļš āđāļ•่āļ­āļĒ่āļēāļ‡āđ„āļĢāļ็āđ„āļ”้ āļŠāļēāļĄāļēāļĢāļ–āļ›āļĢāļ°āļĒุāļāļ•์āđƒāļŠ้āđƒāļ™ cloud āļĢāļēāļĒāļ­ื่āļ™āđ† āđ„āļ”้āđ€āļŠ่āļ™āļัāļ™

āļ„āļ§āļēāļĄāļˆāļģāđ€āļ›็āļ™āļ”้āļēāļ™āļāļēāļĢāđƒāļŠ้āļ‡āļēāļ™āļŠāļģāļŦāļĢัāļš SMB
āļ„āļ§āļēāļĄāļ•้āļ­āļ‡āļāļēāļĢāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāļŠāļģāļŦāļĢัāļš SMB āļĄีāļˆāļģāļ™āļ§āļ™āļœู้āđƒāļŠ้āļ‡āļēāļ™āđāļĨāļ°āļĢāļ°āļšāļšāļ‡āļēāļ™āđ„āļĄ่āļĄāļēāļ āļˆึāļ‡āđ„āļĄ่āļˆāļģāđ€āļ›็āļ™āļŠāļģāļŦāļĢัāļš data governance āļ—ี่āļ„āļĢāļ­āļšāļ„āļĨุāļĄāļ—ุāļāļ”้āļēāļ™ āļĄีāđ€āļžีāļĒāļ‡āđ€āļĢื่āļ­āļ‡ data catalog āļŠāļģāļŦāļĢัāļšāļāļēāļĢāļŦāļēāļ‚้āļ­āļĄูāļĨ āļāļēāļĢāļ”ูāđāļĨāļ„āļ§āļēāļĄāļ›āļĨāļ­āļ”āļ ัāļĒāđāļĨāļ°āļŠิāļ—āļ˜ิāļāļēāļĢāđ€āļ‚้āļēāļ–ึāļ‡āļ‚้āļ­āļĄูāļĨāļ—ี่āļˆāļģāđ€āļ›็āļ™āļ็āđ€āļžีāļĒāļ‡āļžāļ­ āļāļēāļĢāļ™āļģāđ€āļ‚้āļēāļ‚้āļ­āļĄูāļĨāđāļĨāļ°āļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāđ€āļ›็āļ™ batch āļĄāļēāļāļāļ§่āļē real time āļŦāļĢืāļ­āļ­āļēāļˆāđ€āļ›็āļ™āđāļ„่āđ€āļ›็āļ™ near real time āļ—ุāļāđ† 15-30 āļ™āļēāļ—ี āļŦāļĢืāļ­āļ—ุāļāļŠั่āļ§āđ‚āļĄāļ‡ āļ›āļĢิāļĄāļēāļ“āļ‚้āļ­āļĄูāļĨāļ—ี่āđ„āļĄ่āļĄāļēāļ āļ—āļģāđƒāļŦ้āđ„āļĄ่āļˆāļģāđ€āļ›็āļ™āļ•้āļ­āļ‡āđƒāļŠ้ MPP database āļ—ี่āđƒāļŠ้āļŠāļģāļŦāļĢัāļšāļ‚้āļ­āļĄูāļĨāļ‚āļ™āļēāļ”āđƒāļŦāļ่ āļ—āļģāđƒāļŦ้āđ€āļĢāļēāļĨāļ”āļ āļēāļĢāļ°āļ”้āļēāļ™āđ‚āļ„āļĢāļ‡āļŠāļĢ้āļēāļ‡āļžื้āļ™āļāļēāļ™āđ„āļ›āđ„āļ”้āļĄāļēāļ āļ­ีāļāļ—ั้āļ‡ SMB āļĄัāļāļĄีāļšุāļ„āļ„āļĨāļēāļāļĢāļ”้āļēāļ™ IT āļˆāļģāļ™āļ§āļ™āđ„āļĄ่āļĄāļēāļāļ™ัāļ āļĢāļ°āļšāļšāļˆึāļ‡āļˆāļģāđ€āļ›็āļ™āļ•้āļ­āļ‡āļžัāļ’āļ™āļēāđāļĨāļ°āļ”ูāđāļĨāļĢัāļāļĐāļēāđ„āļ”้āļ‡่āļēāļĒ

āļ—āļēāļ‡āđ€āļĨืāļ­āļāļ”้āļēāļ™ Solution
Data Lakehouse āļšāļ™ cloud āļ—āļģāđƒāļŦ้āđ€āļĢāļēāļŠāļēāļĄāļēāļĢāļ–āđ€āļĨืāļ­āļāđƒāļŦ้āđ€āļŦāļĄāļēāļ°āļัāļšāļāļēāļĢāđƒāļŠ้āļ‡āļēāļ™ āļ‡่āļēāļĒāļ•่āļ­āļāļēāļĢāļ”ูāđāļĨ āđ‚āļ”āļĒāđƒāļŠ้āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āļˆāļēāļāļžื้āļ™āļ—ี่āļˆัāļ”āđ€āļ็āļšāļ‚้āļ­āļĄูāļĨāļĢāļēāļ„āļēāļ›āļĢāļ°āļŦāļĒัāļ” āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāđƒāļŦāļĄ่āđ† āļ­āļĒ่āļēāļ‡ Serverless SQL āļ‹ึ่āļ‡āļ„āļĨ่āļ­āļ‡āļ•ัāļ§āđƒāļ™āļāļēāļĢāļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨ PolyBase āļŠ่āļ§āļĒāđƒāļŦ้āđƒāļŠ้āļ‚้āļ­āļĄูāļĨāđ‚āļ”āļĒāļ•āļĢāļ‡āļˆāļēāļāđ„āļŸāļĨ์āļ—ี่āļˆัāļ”āđ€āļ็āļšāđƒāļ™āļĢูāļ›āđāļšāļšāļ•่āļēāļ‡āđ† āđ„āļ”้āļ‡่āļēāļĒ āđ„āļĄ่āļ§่āļēāļˆāļ°āđ€āļ›็āļ™ csv, JSON, parquet āļŦāļĢืāļ­ delta āļ—ี่āļāļģāļĨัāļ‡āļĄāļēāđāļĢāļ‡ āđ€āļ™ื่āļ­āļ‡āļˆāļēāļāļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āļ”้āļēāļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāļัāļšāļ‚้āļ­āļĄูāļĨāđƒāļ™āđ„āļŸāļĨ์ āđƒāļŠ้ python āđƒāļ™āļāļēāļĢāļˆัāļ”āđ€āļ•āļĢีāļĒāļĄāđāļĨāļ°āļ§ิāđ€āļ„āļĢāļēāļ°āļŦ์ āļ—āļģ machine learning model āļˆāļēāļ spark notebooks āđ‚āļ”āļĒāļ„ุāļĄāļāļēāļĢāļ—āļģāļ‡āļēāļ™āļ—ั้่āļ‡āļŦāļĄāļ”āļ™ี้āļ”้āļ§āļĒ Azure Synapse Pipelines āļ—āļģāđƒāļŦ้āļ—ุāļāļ‚ั้āļ™āļ•āļ­āļ™āļ•ั้āļ‡āđāļ•่ āđ€āļĢิ่āļĄāļ•้āļ™ āļˆāļ™āļ–ึāļ‡āļĄืāļ­āļœู้āđƒāļŠ้āļ‚้āļ­āļĄูāļĨ āđ€āļ›็āļ™āđ„āļ›āļ­āļĒ่āļēāļ‡āļŠāļ°āļ”āļ§āļ āļ„่āļēāđƒāļŠ้āļˆ่āļēāļĒāļ—ี่āđ€āļŦāļĄāļēāļ°āļŠāļĄ
Lakehouse Lite Solution

āļ‚้āļ­āļ”ีāļ‚āļ­āļ‡āđāļ™āļ§āļ—āļēāļ‡āļāļēāļĢāđƒāļŠ้ Lakehouse Lite 
  • āļŠāļēāļĄāļēāļĢāļ–āđ€āļĢิ่āļĄāļ•้āļ™āđ„āļ”้āļ­āļĒ่āļēāļ‡āļĢāļ§āļ”āđ€āļĢ็āļ§ āđƒāļŠ้āļ„āļ™āļ™้āļ­āļĒ āđ€āļĢีāļĒāļ™āļĢู้āđ„āļ”้āļ‡่āļēāļĒ āļŠāļēāļĄāļēāļĢāļ–āļ•่āļ­āļĒāļ­āļ”āļ‚āļĒāļēāļĒāļ‚āļ­āļšāđ€āļ‚āļ•āļ•āļēāļĄāļāļēāļĢāđ€āļ•ิāļšāđ‚āļ• āđ‚āļ”āļĒāļ›āļĢัāļšāđ€āļ›āļĨี่āļĒāļ™āļŦāļĢืāļ­āđ€āļžิ่āļĄāđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­ āļŦāļĢืāļ­āļšāļĢิāļāļēāļĢāļ—ี่āđ€āļŦāļĄāļēāļ°āļŠāļĄāđ„āļ”้āđƒāļ™āļ­āļ™āļēāļ„āļ•
  • āļĨāļ”āļ‚ั้āļ™āļ•āļ­āļ™āļāļēāļĢāļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨāļ”้āļ§āļĒāđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āļ—ี่āļ‹ัāļšāļ‹้āļ­āļ™ āđ€āļ™้āļ™āļāļēāļĢāļ™āļģāļ‚้āļ­āļĄูāļĨāđ„āļ›āļ›āļĢāļ°āļĒุāļāļ•์āđƒāļŠ้āđƒāļŦ้āđ€āļิāļ”āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์
  • āļŠāļēāļĄāļēāļĢāļ–āđƒāļŠ้āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āļŠāļģāļŦāļĢัāļšāļšāļĢิāļŦāļēāļĢāļˆัāļ”āļāļēāļĢāļ‚้āļ­āļĄูāļĨ (data management) āđāļĨāļ°āļ„āļ§āļēāļĄāļ›āļĨāļ­āļ”āļ ัāļĒāļ‚้āļ­āļĄูāļĨ āļĢāļ°āļ”ัāļšāđ€āļ”ีāļĒāļ§āļัāļšāļ­āļ‡āļ„์āļāļĢāļ‚āļ™āļēāļ”āđƒāļŦāļ่
  • āļŠāļģāļŦāļĢัāļšāļ­āļ‡āļ„์āļāļĢāļŦāļĢืāļ­āļŠāļ•āļēāļĢ์āļ•āļ­ัāļž āļ—ี่āļĒัāļ‡āđ„āļĄ่āļ•้āļ­āļ‡āļāļēāļĢāļāļēāļĢāļĨāļ‡āļ—ุāļ™āđƒāļ™āđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ—ี่āļ‹ัāļšāļ‹้āļ­āļ™ āļŦāļĢืāļ­āļˆัāļ”āļŦāļē āļ§ิāļĻāļ§āļāļĢāļ‚้āļ­āļĄูāļĨ āļ›āļĢāļ°āļŠāļšāļāļēāļĢāļ“์āļŠูāļ‡ āļŦāļĢืāļ­āđāļĄ้āđāļ•่āļŠāļģāļŦāļĢัāļšāļ­āļ‡āļ„์āļāļĢāđƒāļŦāļ่āļ—ี่āļ•้āļ­āļ‡āļāļēāļĢāļ—āļģ data lake āļŦāļĢืāļ­ lakehouse āđ€āļĨ็āļāđ† āđ€āļžื่āļ­āđ€āļ›็āļ™āļāļēāļĢāļ—āļ”āļĨāļ­āļ‡ (Sandbox) āļŦāļĢืāļ­āđāļĄ้āđāļ•่āļ—āļģāđ€āļ›็āļ™ Data Mesh āļāļĢāļ“ีāļ—ี่āļĄีāļ‚้āļ­āļˆāļģāļัāļ”āđƒāļ™āļāļēāļĢāļĢāļ§āļĄāļ‚้āļ­āļĄูāļĨāđ€āļ‚้āļēāļĄāļēāđƒāļ™āļāļēāļ™āļ‚้āļ­āļĄูāļĨāđ€āļ”ีāļĒāļ§āļัāļ™ āđāļ•่āļĒัāļ‡āļ•้āļ­āļ‡āļāļēāļĢāđƒāļŠ้āļ‚้āļ­āļĄูāļĨāļĢ่āļ§āļĄāļัāļ™
  • āļĄีāļžื้āļ™āļāļēāļ™āļšāļ™ open standard āļ­āļĒ่āļēāļ‡ open data format (e.g. csv, parquet, delta )āđƒāļŠ้āļ āļēāļĐāļēāļ—ี่āđāļžāļĢ่āļŦāļĨāļēāļĒāļ­āļĒ่āļēāļ‡ SQL āđāļĨāļ° python āđƒāļ™āļāļēāļĢāļˆัāļ”āđ€āļ•āļĢีāļĒāļĄāđāļĨāļ°āļ›āļĢāļ°āļĄāļ§āļĨāļœāļĨāļ‚้āļ­āļĄูāļĨ āļ—āļģāđƒāļŦ้āļāļēāļĢāļˆัāļ”āļŦāļēāļŦāļĢืāļ­āļžัāļ’āļ™āļēāļšุāļ„āļ„āļĨāļēāļāļĢāļ—āļģāđ„āļ”้āļ‡่āļēāļĒ āļ­ีāļāļ—ั้āļ‡āļāļēāļĢāđ€āļ›āļĨี่āļĒāļ™āđ‚āļ›āļĢāļĒ้āļēāļĒāļ„่āļēāļĒāļœู้āđƒāļŦ้āļšāļĢิāļāļēāļĢ cloud service āļŦāļĢืāļ­āļŦāļēāđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āļĄāļēāđƒāļŠ้āļĢ่āļ§āļĄāļัāļ™ āļ—āļģāđ„āļ”้āļ‡่āļēāļĒ āļĨāļ”āļ­ุāļ›āļŠāļĢāļĢāļ„āļˆāļēāļ cloud vendor lock in

āđ€āļĢิ่āļĄāļ•้āļ™āļ­āļĒ่āļēāļ‡āđ„āļĢāļŠāļģāļŦāļĢัāļš SMB
  • āļ„āļ§āļĢāđ€āļĢิ่āļĄāļˆāļēāļ āļĄุ่āļ‡āđ€āļ™้āļ™āđ„āļ›āļ—ี่āļœāļĨāļĨัāļžāļ˜์ āđ€āļĢāļēāļ•้āļ­āļ‡āļāļēāļĢāļ—āļģāļ­āļ°āđ„āļĢ āđƒāļŠ้āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āļ­āļĒ่āļēāļ‡āđ„āļĢ āļ„ืāļ­āļ•้āļ­āļ‡āļĄี business use case(s) āļ—ี่āļŠัāļ”āđ€āļˆāļ™ āđāļĨāļ°āļ„āļ§āļēāļĄāđ€āļ‚้āļēāđƒāļˆāđƒāļ™āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļ”้āļēāļ™āļ‚้āļ­āļĄูāļĨāļ‚āļ­āļ‡āđ€āļĢāļē āļ­āļĒ่āļēāđ€āļĢิ่āļĄāđ‚āļ”āļĒāļ„ิāļ”āļ§่āļēāđ€āļĢāļēāļ•้āļ­āļ‡"āļĄี"āļ­āļ°āđ„āļĢ āļ•āļēāļĄ buzz word āđ€āļŠ่āļ™ āļ•้āļ­āļ‡āļĄีāđ€āļ—āļ„āđ‚āļ™āđ‚āļĨāļĒีāļ•ัāļ§āļ™ั้āļ™āļ•ัāļ§āļ™ี้ āļšāļēāļ‡āļ—ี solution āļ—ี่āđ€āļŦāļĄāļēāļ°āļัāļšāđ€āļĢāļē āļ­āļēāļˆāļˆāļ°āđ€āļĢีāļĒāļšāļ‡่āļēāļĒāļ‹āļ°āļˆāļ™āđ€āļĢāļēāļĄāļ­āļ‡āļ‚้āļēāļĄāđ„āļ›āļ็āđ„āļ”้
  • āđ€āļ™ื่āļ­āļ‡āļˆāļēāļāđ€āļĢāļēāđƒāļŠ้āļ›āļĢāļ°āđ‚āļĒāļŠāļ™์āļˆāļēāļ cloud-based analytics services āļ—āļģāđƒāļŦ้āđ€āļĢāļēāļŠāļēāļĄāļēāļĢāļ–āđ€āļĢิ่āļĄāļ•้āļ™āļˆāļēāļāļ‡āļēāļ™āđ€āļĨ็āļāđ† āļ‡่āļēāļĒāđ† āļ่āļ­āļ™ āđ€āļĄื่āļ­āļ—ีāļĄāļ‡āļēāļ™āđ€āļĢีāļĒāļ™āļĢู้āđāļĨāļ°āđ€āļ‚้āļēāđƒāļˆāļĄāļēāļāļ‚ึ้āļ™ āļˆึāļ‡āļ„่āļ­āļĒāđ€āļžิ่āļĄāđ€āļ•ิāļĄ āļ‚āļĒัāļšāđ„āļ›āļĒัāļ‡āļ—āļģāļ‡āļēāļ™āļ—ี่āļ‹ัāļšāļ‹้āļ­āļ™āļĄāļēāļāļ‚ึ้āļ™ āļĢāļ°āļŦāļ§่āļēāļ‡āļ™ี้āļ­āļēāļˆāļĄีāļ›āļĢัāļšāđ€āļ›āļĨี่āļĒāļ™āļ§ิāļ˜ีāļāļēāļĢāļŦāļĢืāļ­āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āļ•āļēāļĄāļ„āļ§āļēāļĄāđ€āļŦāļĄāļēāļ°āļŠāļĄ āļ­ัāļ™āđ„āļŦāļ™āđ„āļĄ่āđ€āļŦāļĄāļēāļ°āļ็āđ€āļĨิāļāđƒāļŠ้ āļ—āļ”āđāļ—āļ™āļ”้āļ§āļĒāļ§ิāļ˜ีāļāļēāļĢāļŦāļĢืāļ­āđ€āļ„āļĢื่āļ­āļ‡āļĄืāļ­āđƒāļŦāļĄ่ āļ•āļĢāļ‡āļ™ี้āļĄāļ­āļ‡āļ§่āļēāđ€āļ›็āļ™āļˆุāļ”āđ€āļ”่āļ™āļ­ีāļāļ”้āļēāļ™āļŦāļ™ึ่āļ‡ āļ—āļģāđƒāļŦ้āđ€āļĢāļēāđ„āļĄ่āļˆāļģāđ€āļ›็āļ™āļ•้āļ­āļ‡āđ€āļĢิ่āļĄāļˆāļēāļāļ‡āļēāļ™āļ—ี่āļĄีāļœāļĨāļāļĢāļ°āļ—āļšāļ—āļēāļ‡āļ˜ุāļĢāļิāļˆāļŠูāļ‡āļ่āļ­āļ™ āđ€āļ™ื่āļ­āļ‡āļˆāļēāļāļĄีāļāļēāļĢāļĨāļ‡āļ—ุāļ™āļ•ั้āļ‡āļ•้āļ™āļŠูāļ‡āđ€āļŦāļĄืāļ­āļ™āđ€āļŦāļĄืāļ­āļ™āđāļ•่āļ่āļ­āļ™
  • āļĢāļ°āļĨึāļāđ€āļŠāļĄāļ­āļ§่āļē āļĢāļ°āļšāļšāđ„āļĄ่āļŠāļēāļĄāļēāļĢāļ–āļ—āļ”āđāļ—āļ™āļāļĢāļ°āļšāļ§āļ™āļāļēāļĢāļ—āļģāļ‡āļēāļ™āļ—ี่āļ”ี āđāļĨāļ°āļ‚้āļ­āļĄูāļĨāļ—ี่āļĄีāļ„ุāļ“āļ āļēāļžāđ„āļ”้

āđƒāļ™ Part II āđ€āļĢāļēāļˆāļ°āļĄāļēāļ”ู āļāļēāļĢāļˆัāļ”āđ€āļ•āļĢีāļĒāļĄāļ—āļēāļ‡āđ€āļ—āļ„āļ™ิāļ„ āļŠāļģāļŦāļĢัāļš Lakehouse Lite āļัāļ™

“Even the smallest person can change the course of history.” -- Galadriel: The Lord of the Rings
Data Lakehouse for Small & Midsize Business: Lakehouse Lite - Part I Data Lakehouse for Small & Midsize Business: Lakehouse Lite - Part I Reviewed by aphidet on 7:32 PM Rating: 5

No comments:

Powered by Blogger.