![]() |
Norimaki Arale, Image credit: internet |
"As an AI language model" āļāļĢāļ°āđāļĒāļāļĒāļāļāļŪิāļāđāļāļ่āļ§āļāļี้ āļัāļāļāļĢāļ°āđāļŠ Generative AI āļี่āļāļ°āđāļ้āļēāļĄāļēāđāļāļĨี่āļĒāļāļĢูāļāđāļāļāļāļēāļĢāđāļ้āļāļēāļ āļ§ิāļีāļāļēāļĢāđāļ้ āđāļĨāļ°āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨāđāļāļāļāļēāļāļāļัāļāđāļāļĨ้ āļีāļāļั้āļ AI āļĒัāļāđāļ็āļāļีāļĄāļāļēāļĢāļĨāļāļุāļāļี่āđāļŦāļ่āļี่āļŠุāļāđāļāļ่āļ§āļāļีāļāđāļĄ่āļี่āļีāļ้āļēāļ āđāļĨāļ°āđāļāļāļāļ°āđāļĄ่āļĄีāļ āļēāļāļุāļĢāļิāļāđāļŦāļāļี่āđāļĄ่āļĄี AI āđāļ้āļēāđāļāđāļี่āļĒāļ§āļ้āļāļ [1]
āļāļēāļ§ data āļāļĒ่āļēāļāđāļĢāļēāļัāļāļāļĢāļ°āđāļŠ Generative AI āļึ่āļāļ่āļāļĒāļāļāļĄāļēāļāļēāļ Large Language Model (LLM) āļāļēāļĢāļāļĢāļ°āļĒุāļāļ์āđāļ้ Generative AI āđāļāļŠāļēāļĒāļāļēāļāļ้āļāļĄูāļĨāļĄีāļŦāļĨāļēāļāļŦāļĨāļēāļĒ āļั้āļāđāļ่ āļāļēāļĢāļ่āļ§āļĒāđāļีāļĒāļāđāļ้āļāļึāļāļ้āļāļĄูāļĨ āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļāļ§āļēāļĄ āļāļēāļĢāļŠัāļāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨāđāļื่āļāļāļēāļĢāļāļāļŠāļāļ āđāļāļĒāļŦāļึ่āļāđāļāļĢูāļāđāļāļāļāļēāļĢāđāļ้āļāļēāļāļี่āļāļģāļĨัāļāđāļ็āļāļี่āļŠāļāđāļ āļืāļāļāļēāļĢāđāļ้ AI āđāļ้āļēāļĄāļēāļ่āļ§āļĒāļัāļāđāļāļĢีāļĒāļĄāđāļĨāļ°āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨ āđāļĨāļ°āļĒัāļāļĢāļ§āļĄāđāļāļึāļāļāļēāļĢāļŠāļĢุāļāļāļĨāļāļēāļĢāļ§ิāđāļāļĢāļēāļ°āļŦ์āđāļŦ้āđāļĢāļēāđāļ้āļēāđāļāđāļ้āļ่āļēāļĒ āļีāļāļ้āļ§āļĒ āļāļēāļāļāļĨ่āļēāļ§āđāļ้āļ§่āļēāļัāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āļŦāļĢืāļāļัāļāļ§ิāļāļĒāļēāļĻāļēāļŠāļāļĢ์āļ้āļāļĄูāļĨāļāļāļ้āļāļāļāļģāļāļēāļāļĢ่āļ§āļĄāļัāļ AI āđāļāļāļāļēāļāļāļัāļāđāļāļĨ้āļี้
Gartner āļāļēāļāļāļēāļĢāļ§่āļēāļ āļēāļĒāđāļāļี 2025 āđāļĢāļēāļāļ°āđāļ้āļāļēāļāļ้āļāļĄูāļĨ āđāļāļĒāļ่āļēāļāļāļēāļĢāđāļĨ่āļēāļŦāļĢืāļāļāļĢāļĢāļĒāļēāļĒāļ้āļāļĄูāļĨ (data story telling) āļัāļāļāļĒ่āļēāļāđāļāļĢ่āļŦāļĨāļēāļĒ āđāļāļĒāļāļ°āđāļ็āļāļāļēāļĢāļāļģāļ้āļ§āļĒ AI āļึāļ 75% āđāļĨāļĒāļีāđāļีāļĒāļ§[2] āļāļĢāļ°āļāļ§āļāļāļēāļĢāļัāļāđāļāļĄัāļิāļี่ AI āđāļ้āļēāļĄāļēāļ่āļ§āļĒāļี้āđāļĢีāļĒāļāļ§่āļē Automated Analytics āļึ่āļāļ็āļืāļ āļ่āļāđāļāđāļĢāļēāļŠāļēāļĄāļēāļĢāļ āļāļēāļĄ AI āļ§่āļēāļĒāļāļāļāļēāļĒāđāļāđāļ่āļĨāļ°āļŠāļēāļāļēāđāļāđāļืāļāļāļี้āđāļĄื่āļāđāļีāļĒāļāļัāļāđāļืāļāļāļี่āđāļĨ้āļ§āđāļ็āļāļāļĒ่āļēāļāđāļĢ āļĢāļēāļĒāļื่āļāļŠāļēāļāļēāļี่āļāļēāļĒāļีāļี่āļŠุāļ 3 āļัāļāļัāļāđāļĢāļ āļŠิāļāļ้āļēāļāļ°āđāļĢāļี่āļāļēāļĒāļี āđāļ่āļāļāļĨุ่āļĄāļāļĨิāļāļ ัāļāļ์āļāļēāļĄāļ่āļāļāļāļēāļāļāļēāļĢāļāļēāļĒ āļāļēāļāļāļēāļĢāļ์āļĒāļāļāļāļēāļĒāđāļāļึāļāļŠิ้āļāļี āđāļāļāļāļึāļāļŦāļēāļ้āļāļĄูāļĨāđāļิāļāļĨึāļāđāļ่āļ āļāļ°āđāļĢāđāļ็āļāļัāļāļัāļĒāļี่āļĄีāļāļĨāļ่āļāļĒāļāļāļāļēāļĒ āđāļāļĒāļั้āļāļŦāļĄāļāļี้āđāļĢāļēāđāļĄ่āļ้āļāļāļĨāļāļĄืāļāđāļีāļĒāļāđāļ้āļāļŦāļĢืāļāđāļ้ excel āđāļĨāļĒāđāļĄ้āđāļ่āļ้āļāļĒ
Automated Analytics āđāļ็āļāļĢูāļāđāļāļāļāļēāļĢ āļัāļāđāļāļĢีāļĒāļĄāļ้āļāļĄูāļĨ āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨ āļŦāļēāļāļ§āļēāļĄāļŠัāļĄāļัāļāļ์ āđāļāļāļāļึāļāļāļิāļāļēāļĒāļāļ§āļēāļĄāļŠัāļĄāļัāļāļ์āđāļĨāļ°āļāļĨāļ§ิāđāļāļĢāļēāļ°āļŦ์āļāļāļāļĄāļēāđāļ็āļāļ āļēāļĐāļēāđāļŦ้āđāļ้āļēāđāļāđāļ้āļ่āļēāļĒ āļึ่āļāđāļ็āļāļŠ่āļ§āļāļŠāļģāļัāļāļāļāļāļāļēāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨ āđāļāļĒāļั้āļāļŦāļĄāļāļี้āđāļ้āđāļāļāđāļāđāļĨāļĒีāļี่āļāļģāļĨัāļāđāļāļĢ่āļŦāļĨāļēāļĒ āđāļ่āļ machine learning, artificial intelligence, natural language processing, large language model āļึ่āļāđāļ้āļēāļĄāļēāļ่āļ§āļĒāļĨāļāļ āļēāļĢāļ°āļāļēāļ āļāļāļāļัāļāļ§ิāđāļāļĢāļēāļ°āļŦ์ āļัāļāļ§ิāļāļĒāļēāļĻāļēāļŠāļāļĢ์āļ้āļāļĄูāļĨ āđāļĨāļ°āļĒัāļāļ่āļ§āļĒāđāļŦ้āđāļĢāļēāđāļ้āļēāļึāļāđāļĨāļ°āđāļ้āļ้āļāļĄูāļĨāđāļ้āļ่āļēāļĒāđāļĨāļ°āļĢāļ§āļāđāļĢ็āļ§āļึ้āļ āļ่āļēāđāļ้āļ่āļēāļĒāļ่āļģāļĨāļ āļāļģāđāļŦ้āđāļĄ่āļ้āļāļāđāļ้āļัāļāļ§ิāđāļāļĢāļēāļ°āļŦ์ āļŦāļĢืāļāļัāļāļ§ิāļāļĒāļēāļĻāļēāļŠāļāļĢ์āļ้āļāļĄูāļĨāļāļģāļāļ§āļāļĄāļēāļāļีāļāļ่āļāđāļ
āļāļēāļāļāļĨ่āļēāļ§āđāļ้āļ§่āļē Automated Analytics āļāļ°āđāļ็āļāļัāļ§āđāļāļĨี่āļĒāļāđāļāļĄāļŠ์āļี่āļŠāļģāļัāļ āļāļĢิāļĐัāļāļู้āļัāļāļāļēāđāļāļĢื่āļāļāļĄืāļāļŠāļģāļŦāļĢัāļāļāļģāļĢāļēāļĒāļāļēāļāđāļĨāļ°āļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨāļŦāļĨāļēāļĒāļĢāļēāļĒ āđāļĢิ่āļĄāļāļģāļĄāļēāļāļĢัāļāđāļ้āļัāļāļāļĨิāļāļ ัāļāļ์āļāļāļāļāļāđāļāļ āļึ่āļāļāļ°āļāļģāđāļŦ้ AI āđāļŠāļāļĢู้āđāļŦāļĨ่āļēāļี้ āļāļģāļĨัāļāļāļ°āļāļĨāļēāļĒāđāļ็āļāļāļĢāļ°āđāļŠāļŦāļĨัāļāđāļāļีāļāđāļĄ่āļี่āļีāļ้āļēāļāļŦāļ้āļē āļึ่āļāļั่āļāļŦāļĄāļēāļĒāļึāļāļ§่āļē āļāļ§āļāđāļĢāļēāļāļģāļĨัāļāļ้āļāļāđāļāļĢีāļĒāļĄāļัāļ§āđāļื่āļāļāļģāļāļēāļāļĢ่āļ§āļĄāļัāļāđāļื่āļāļāļĢ่āļ§āļĄāļāļēāļ AI
āļāļēāļāđāļิāļĄāļี่ data engineer āļŦāļĢืāļ data modeler āļ้āļāļāļāļāļāđāļāļ data model āļัāļāđāļāļĢีāļĒāļĄāļ้āļāļĄูāļĨāđāļื่āļāđāļŦ้āļัāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āļ้āļāļĄูāļĨ āļัāļāļ§ิāļāļĒāļēāļĻāļēāļŠāļāļĢ์āļ้āļāļĄูāļĨ āļŦāļĢืāļ BI specialist āđāļื่āļāđāļŦ้āļāļģāļāļēāļāđāļ้āļŠāļ°āļāļ§āļāđāļĨāļ°āļĄีāļāļĢāļ°āļŠิāļāļิāļ āļēāļ āđāļ่āļ่āļāđāļāđāļĢāļēāļ้āļāļāļิāļāļ§่āļē āļāļ°āđāļŦ้ AI āļāļģāļāļēāļāđāļ้āļŠāļ°āļāļ§āļāđāļĨāļ°āļูāļāļ้āļāļāļāļĒ่āļēāļāđāļĢ āđāļĢāļēāļāļ§āļĢāļĢู้ āđāļĨāļ°āđāļāļĢีāļĒāļĄāļāļ°āđāļĢāļ้āļēāļ
āļ่āļāļāļื่āļāđāļĢāļēāļĄāļēāļูāļัāļāļ§่āļē āđāļ้ Generative AI āđāļ้āđāļāļāļิāļāđāļĨāļ°āļĄีāļั้āļāļāļāļāļāļĒ่āļēāļāđāļĢāđāļāļāļēāļĢ āļāļģāļāļ§āļēāļĄāđāļ้āļēāđāļāđāļāļĢāļāļŠāļĢ้āļēāļāļāļāļāļ้āļāļĄูāļĨ āđāļĨืāļāļāđāļ้ table āđāļĨāļ° column āļāļāļŠāļēāļĄāļēāļĢāļāđāļีāļĒāļāđāļāļĢāđāļāļĢāļĄāļŦāļĢืāļ āđāļีāļĒāļ query āļี่āļูāļāļ้āļāļāđāļ้āļāļĒ่āļēāļāđāļĢ
1. Tokenization āļāļēāļĢāļāļĢāļ°āļāļ§āļāļāļēāļĢāļัāļāđāļ่āļāļāļĢāļ°āđāļĒāļāđāļŦ้āđāļ็āļ āļŦāļ่āļ§āļĒāļี่āđāļĨ็āļāļĨāļ āļึ่āļāļูāļāđāļāļāļี่āļ้āļ§āļĒāļุāļāļัāļ§āđāļĨāļāļี่āđāļĢāļēāđāļĢีāļĒāļāļ§่āļē token āđāļāļĒāļŦāļ่āļ§āļĒāļĒ่āļāļĒāļัāļāļāļĨ่āļēāļ§ āļัāļāđāļ็āļ 1 token āđāļāļĒāļāļēāļāđāļ็āļ 1 āļāļģ āļŦāļĢืāļāļāļēāļāļŠ่āļ§āļāļāļāļāļāļģ āļāļēāļāļ°āļĢāļ§āļĄ space āļŦāļĢืāļāļัāļāļĐāļĢāļ°āđāļāđ āļ็āđāļ้ āļึ่āļ token āđāļŦāļĨ่āļēāļี้āđāļ็āļāļื้āļāļāļēāļāļี่āđāļĄāđāļāļĨāđāļāļāļĢāļ°āļูāļĨāļāļĢāļ°āļĄāļ§āļĨāļāļĨāļ āļēāļĐāļēāļāļĢāļĢāļĄāļāļēāļิ Natural Language Processing (NLP) āđāļ้āđāļื่āļ āđāļĒāļāđāļĒāļ° āļŦāļēāļāļ§āļēāļĄāļŠัāļĄāļัāļāļ์ āļัāļāđāļĢีāļĒāļ āđāļāļāļāļึāļāļāļēāļĢāđāļ้āļāļāļ āđāļāļĒāļāļēāļĢāļĢ้āļāļĒāđāļĢีāļĒāļ token āļāļāļāļĄāļēāđāļ็āļāļāļĢāļ°āđāļĒāļ āļŦāļĢืāļ code āđāļŦ้āđāļĢāļēāđāļ้āļēāđāļāđāļ้
āđāļĢāļēāļĄāļēāļĨāļāļāļูāļāļēāļĢāļัāļāđāļ่āļ token āļāļēāļ tokenizer web site āļāļāļ Open AI āļัāļ
āđāļāļĒāļĨāļāļāđāļ้āļāļāļูāļāļāļāļāļุāļāļ่āļāđāļĨāļ°āļĨูāļāļŠāļēāļ§āđāļāļ āļēāļāļĒāļāļ์āļāļĨāļēāļŠāļŠิāļ
āđāļĢิ่āļĄāļāļēāļāļāļāļāļāļ Darth Vader, The Empire Strikes Back “No, I am your father.”
āļāļēāļāļāļĢāļ°āđāļĒāļāļ้āļēāļāļ้āļ 21 āļัāļ§āļัāļāļĐāļĢ āđāļ่āļāđāļ้ 7 token āđāļāļĒāđāļāļ่āļāļāļāļĨāļĨัāļāļ์ āļāļ°āļāļģāļāļēāļĢāđāļĒāļāļŠีāđāļ่āļ token āļāļ°āđāļŦ็āļāđāļ้āļ§่āļē 1 token āļāļ°āđāļ็āļ 1 āļāļģ āļี่āļĄีāļ่āļāļāļ§่āļēāļāļิāļāļĄāļēāļ้āļ§āļĒ āļŠ่āļ§āļ , āđāļĨāļ° . āļāļ°āļูāļāļัāļāđāļ็āļ 1 token āļ้āļ§āļĒ
āđāļĢāļēāļĄāļēāļĨāļāļāļāļĢāļ°āđāļĒāļāļี่āļĄีāļāļģāļัāļāļ้āļāļāļัāļāļ้āļēāļ āļāļēāļāļĨูāļāļŠāļēāļ§āđāļāđāļĢื่āļāļāđāļีāļĒāļ§āļัāļ Princess Leia, The Empire Strikes Back “Why, you stuck-up half-witted scruffy-looking nerf herder.”
āļāļ°āđāļŦ็āļāļ§่āļē āļĄีāļāļēāļĢāļัāļ token āļี่āđāļ็āļāļāļēāļāļŠ่āļ§āļāļāļāļāļāļģ āļŦāļĢืāļāđāļĄ้āđāļ่āļัāļ§āļัāļāļĐāļĢāđāļ่āļัāļ§āđāļีāļĒāļ§ āđāļĄ่āđāļ้āđāļ็āļāļāļģāļี่āļāļĢāļāļ้āļ§āļ āđāļāļĒāđāļāļĨี่āļĒāđāļĨ้āļ§ āđāļāļ āļēāļĐāļēāļัāļāļāļĪāļĐ 1 token āļāļ°āļĄีāļāļĢāļ°āļĄāļēāļ 4 āļัāļ§āļัāļāļĐāļĢ āļ§่āļēāđāļ่āđāļĨāļāļēāļูāļāđāļāļāļี้āļāļĢิāļāđ āļ้āļ§āļĒāđāļŦāļĢāļ?
āļāļēāļĢāļāļģ tokeninzation āļึāļāđāļ็āļāļื้āļāļāļēāļāļี่āļāļģāđāļŦ้ AI āļŠāļēāļĄāļēāļĢāļāļĄีāļāļิāļŠัāļĄāļัāļāļ์āļัāļāđāļĨāļāļ āļēāļĒāļāļāļāđāļ้ āļั้āļāļŠ่āļ§āļ input āđāļĨāļ° output āļāļēāļāļāļĨ่āļēāļ§āđāļ้āļ§่āļē LLM āļั้āļāđāļ็āļ multi-lable classification model āđāļāļĒāļāļēāļĢ predict āļŦāļē token āļัāļāđāļ āļāļāđāļĢีāļĒāļāļ่āļāļัāļāđāļ็āļāļāļĢāļ°āđāļĒāļ āļŦāļĢืāļ code āļี่āļูāļāļ้āļāļāļั่āļāđāļāļ āļāļēāļĢāļัāļāđāļĒāļ token āđāļŦāļĨ่āļēāļี้āđāļāļ āļี่āđāļĢāļēāļāļģāļĄāļēāđāļ้āđāļื่āļāļāļēāļĢāļั้āļāļื่āļ table āđāļĨāļ° column āđāļื่āļāđāļŦ้ AI āļ่āļēāļ āļāļģāļāļ§āļēāļĄāđāļ้āļēāđāļāđāļĨāļ°āđāļีāļĒāļ code āđāļ้āļูāļāļ้āļāļ
2. Chain-of-Thought (CoT) āđāļ็āļāđāļāļāļิāļāļัāļāļāļēāļāļāļĨāļēāļ āļึ่āļāļูāļāļัāļāļāļēāđāļāļĒ Google Research, brain team āđāļื่āļāđāļิ่āļĄāļāļĨāļĨัāļāļ์āļี่āļีāđāļāļāļēāļĢāđāļ้āļāļēāļ LLM āđāļāļĒāļāļēāļĢāđāļ่āļāļัāļāļŦāļēāļāļāļāđāļ็āļāļŠ่āļ§āļāđ āđāļ่āļāļĨāļģāļัāļāļั้āļāļāļāļāđāļāļāļēāļĢāļิāļ āđāļĨāļ°āļ่āļēāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āļāļĨāļĨัāļāļ์āļāļēāļāļั้āļāļāļāļāļ่āļāļāļŦāļ้āļē āļāļĢัāļāļāļĢุāļāđāļ้āđāļāļ้āļāļิāļāļāļĨāļēāļ āđāļื่āļāđāļŦ้āļāļĢāļĢāļĨุāļāļĨāļĨัāļāļ์āļี่āļ้āļāļāļāļēāļĢ āđāļ็āļāđāļāļāļิāļāļี่āđāļĨีāļĒāļāđāļāļāļĨāļģāļัāļāļ§ิāļีāļิāļāđāļĨāļ°āđāļ้āļัāļāļŦāļēāļāļāļāļĄāļุāļĐāļĒ์āđāļĢāļē [3]
CoT āļĄีāļุāļāđāļ่āļ 2 āļ้āļēāļāļืāļ 1. āļ่āļ§āļĒāđāļŦ้ LLM āļŠāļēāļĄāļēāļĢāļāđāļ้āļัāļāļŦāļēāļี่āļัāļāļ้āļāļāđāļāļĒāļāļēāļĢāđāļ่āļāđāļ็āļāļĨāļģāļัāļāļั้āļāļāļāļ āđāļĨāļ° 2. āļāļēāļāļāļēāļĢāļี่ AI āđāļāļāđāļāļāļĨāļģāļัāļāļั้āļāļāļāļ āđāļŠāļāļāļี่āļĄāļēāļี่āđāļāļāļāļāļāļēāļĢāļāļģāļāļēāļ āļāļģāđāļŦ้āđāļิāļāļāļ§āļēāļĄāđāļื่āļāļĄั่āļ āļāļĢāļ§āļāļŠāļāļāđāļ้ āļึ่āļāļืāļāđāļ็āļāļŦัāļ§āđāļāļŠāļģāļัāļāļāļāļāļāļēāļĢāđāļ้āļāļēāļ AI āđāļāļัāļāļุāļัāļ (Explainable AI)
āđāļāļāļĢāļีāļāļāļ Automated Analytics āđāļāļĒāļāļēāļĢāđāļŦ้ AI āļŠāļēāļĄāļēāļĢāļāļ§ิāđāļāļĢāļēāļ°āļŦ์āđāļĨāļ°āđāļŦ้āļāļģāļāļāļāđāļāļĒāļี่āļ้āļāļŦāļēāļ้āļāļĄูāļĨāļāļēāļāđāļāļāļēāļāļ้āļāļĄูāļĨāđāļ้āđāļāļāļั้āļ āđāļāļĒāļ้āļēāļāļิāļāļāļēāļ langchain version 0.0.249 āļึ่āļāļĄีāļāļēāļĢāļัāļāļāļē agent āļŠāļģāļŦāļĢัāļāļāļēāļāļ้āļāļĄูāļĨāļŦāļĨāļēāļāļŦāļĨāļēāļĒ āļāļ°āļĄีāļāļēāļĢāđāļ่āļ CoT āļัāļāļี้
1. āļāļģāļāļ§āļēāļĄāđāļ้āļēāđāļāļāļģāļāļēāļĄ
2. āļŦāļēāļื่āļ table āđāļāļāļēāļāļ้āļāļĄูāļĨ
3. āđāļĨืāļāļ table āļึ่āļāļāļēāļāļāļ°āļĄีāļĄāļēāļāļāļ§่āļē 1 table āļ็āđāļ้
4. āđāļĨืāļāļ column āļāļēāļ table āļี่āđāļĨืāļāļāļĄāļē
5. āđāļีāļĒāļ SQL statement āđāļāļĒāđāļĨืāļāļ table āđāļĨāļ° column āļี่āļ้āļāļāļāļēāļĢ āđāļĨāļ°āļŠั่āļāļāļģāļāļēāļ
6. āļāļģ output āļี่āļāļēāļāļ้āļāļĄูāļĨāļŠ่āļāļāļĨāļāļĨัāļāļĄāļē āļŠāļĢุāļāļāļĨ
7. āđāļŠāļāļāļāļĨāļĨัāļāļ์āļŠุāļāļ้āļēāļĒ āļāļēāļāļāļ°āđāļ็āļāļāļĢāļ°āđāļĒāļ āļัāļ§āđāļĨāļ āļŦāļĢืāļāļāļĢāļēāļ
![]() |
āļ āļēāļāđāļŠāļāļāļั้āļāļāļāļāļāļēāļĢāļāļģ Text-to-SQL |
āļĢāļ°āļŦāļ§่āļēāļāļāļēāļĢāļāļāļĨāļāļāđāļ้āļāļēāļāđāļāļ่āļ§āļāļŠั้āļāđ āđāļāļĒāđāļ้āļāļēāļāļ้āļāļĄูāļĨāđāļ็āļ sqlite āļ็āļāļāļัāļāļŦāļēāļāļĒู่āļ้āļēāļ āđāļ่āđāļĢāļēāļĄāļēāđāļ้āļāļูāļāļุāļĒ āđāļĢื่āļāļāļāļēāļĢāļāļāļāđāļāļāđāļŦ้āđāļŦāļĄāļēāļ°āļัāļāļāļēāļĢāđāļ้āļāļēāļ Automated Analytics āļึ่āļāļāļāļāļ°āļŠāļĢุāļāļāļēāļāļŠ่āļ§āļāđāļ้āļัāļāļี้
āđāļ็āļāļāļēāļĢāļĒึāļāļŦāļĨัāļāđāļāļ§āļิāļāđāļāļāļēāļĢāļāļāļāđāļāļāļี่āđāļ็āļ Clear and Specific
1. āļูāđāļĨ้āļ§āļĒัāļāđāļŦāļĄāļēāļ°āļัāļāļāļēāļāļ้āļāļĄูāļĨāļี่āļĄีāļāļģāļāļ§āļ table āđāļĄ่āļĄāļēāļ āđāļ่āļ āļŠ่āļ§āļ data mart āđāļื่āļāļāļāļēāļ AI āļ้āļāļāļ่āļēāļāļāļēāļāļื่āļ tables āļั้āļāļŦāļĄāļ āđāļĨ้āļ§āļĄāļēāđāļĨืāļāļāđāļ้āđāļāļĒāđāļีāļĒāļāļัāļāļāļģāļāļēāļĄ āļั้āļāļี้āđāļāļāļĢāļีāļāļēāļāļ้āļāļĄูāļĨāļāļāļēāļāđāļŦāļ่ āļāļēāļāđāļ้āļāļēāļĢāđāļ่āļāđāļŦ้āļŠิāļāļิ์āļัāļ AI āđāļāļĒāđāļ้āđāļāļāļิāļāļ่āļēāļāđ āļāļāļāļāļēāļāļ้āļāļĄูāļĨāļāļิāļāļั้āļāđ āđāļ่āļ āđāļ่āļ schema āļŠāļģāļŦāļĢัāļāđāļ้āļāļēāļāļัāļ AI āđāļื่āļāļāļģāļัāļāđāļāļāļēāļ° table āļี่āļāļģāļŦāļāļ
2. āļāļāļāđāļāļ table āđāļāđāļāļ§āļāļēāļ semi-normalize āļŦāļĢืāļ denomalize table design āđāļื่āļāļĨāļāļāļģāļāļ§āļ table āđāļĨāļ°āļĨāļāļāļ§āļēāļĄāļัāļāļ้āļāļāđāļāļāļēāļĢ join
3. āđāļ้āļŦāļĨัāļāļāļēāļĢāļั้āļāļื่āļāđāļāļ snake case āđāļāļāļēāļĢāđāļีāļĒāļāļื่āļ table āđāļĨāļ° column āļึ่āļāđāļ็āļāļāļēāļĢāđāļีāļĒāļāļื่āļāđāļāļĒāđāļ้āļัāļ§āļิāļĄāļ์āđāļĨ็āļāļŦāļĢืāļāļัāļ§āļิāļĄāļ์āđāļŦāļ่āļั้āļāļŦāļĄāļ āļั่āļāļĢāļ°āļŦāļ§่āļēāļāļāļģāļ้āļ§āļĒāđāļāļĢื่āļāļāļŦāļĄāļēāļĒ underscore "_" āđāļ่āļ snake_case āđāļื่āļāđāļŦ้āļ่āļēāļĒāļ่āļāļāļēāļĢāļāļģ tokenize āļ§ิāļีāļี้āļĒัāļāļāļģāđāļŦ้ underscore āļāļĨāļēāļĒāđāļ็āļ token āļŦāļĢืāļāļŠ่āļ§āļāļāļāļ token āļ่āļēāļĒāļ่āļāļāļēāļĢāļัāļāđāļ่āļāļāļģ
4. āļั้āļāļื่āļāļั้āļ table āđāļĨāļ° column āđāļ็āļ āđāļāļāļāļāļ์ āđāļื่āļāļĨāļāļ้āļāļิāļāļāļĨāļēāļāļĢāļ°āļŦāļ§่āļēāļāļี่ AI āļāļģāļāļēāļĢāļŠāļĢ้āļēāļ SQL statement āđāļ่āļ table_name.column_name āļāļ°āļĄีāđāļāļāļēāļĻāļิāļāļāļĨāļēāļāļ้āļāļĒāļāļ§่āļē table_names.column_names āļŦāļĢืāļ table_names.column_name
5. āļั้āļāļื่āļ column āđāļāļĒāļĢāļ°āļุāđāļŦ้āļัāļāđāļāļ āđāļื่āļāļĨāļāļัāļāļŦāļēāļื่āļ column āļ้āļģāļัāļāđāļāļŦāļĨāļēāļĒ table (ambiguous column) āđāļ่āļ āđāļ customer table āļัāļ product table āļึ่āļāļĄี column āļื่āļ name āļั้āļāļู่ āļึ่āļāļŦāļĄāļēāļĒāļึāļ customer name āđāļĨāļ° product name āļāļēāļĄāļĨāļģāļัāļ āļึ่āļ LLM āļāļēāļāļāļ°āđāļีāļĒāļ SQL code āļี่āđāļิāļ ambiguous error āđāļ้āļ่āļēāļĒ āļāļ§āļĢāļĢāļ°āļุāļื่āļāđāļ็āļ customer_name āđāļ customer table āđāļĨāļ° product_name āđāļ product table āđāļŦ้āđāļิāļāļāļ§āļēāļĄāļัāļāđāļāļ
6. āļั้āļāļื่āļ table āđāļĨāļ° column āđāļāļĒāđāļ้āļāļģāļื้āļāļāļēāļāđāļāļ āļēāļĐāļēāļัāļāļāļĪāļĐāđāļŦ้āđāļ้āļĄāļēāļāļี่āļŠุāļ āđāļื่āļāļāļāļēāļ dataset āļี่āđāļ้āļึāļ LLM āļĄāļēāļāļēāļāļ āļēāļĐāļēāļัāļāļāļĪāļĐāļึ่āļāļĢāļ§āļĄāļึāļ code āļ่āļēāļāđ āļ้āļ§āļĒ āļึ่āļāļāļēāļĢāļั้āļāļื่āļāđāļāļĒāđāļ้āļāļģāđāļāļ āļēāļĐāļēāļัāļāļāļĪāļĐāļ่āļēāļĒāđ āļึ่āļāļĄัāļāļāļāđāļ้āļ่āļāļĒāđāļ dataset āļี่āđāļ้āļึāļ LLM āđāļ็āļāļāļēāļĢāļ่āļ§āļĒāļĨāļāļ้āļāļิāļāļāļĨāļēāļāđāļāļั้āļāļāļāļāļ่āļēāļāđ āđāļ้āļĄāļēāļ
7. āļĢāļ°āļุ id āļŠāļģāļŦāļĢัāļ column āļี่āđāļ็āļ primary key āđāļ่āļ customer_id, product_id āđāļื่āļāđāļŦ้ AI āđāļĒāļāđāļĒāļ°āđāļ้āļ่āļēāļĒāļ§่āļēāđāļ็āļ column āļี่āđāļ้āđāļ็āļ key
8. āđāļ้āļื่āļ foreign keys column āđāļŦ้āļāļĢāļāļัāļāđāļāļุāļ table āļี่āđāļ้ foreign key column āđāļีāļĒāļ§āļัāļ
9. āđāļ้ booleans naming āļŠāļģāļŦāļĢัāļ column āļี่āđāļ็āļ single status āđāļ่āļ is_active (Y/N) āļŦāļĢืāļ has_fee (Y/N)
āđāļāļ§āļāļēāļāđāļŦāļĨ่āļēāļี้ āđāļ็āļāļื้āļāļāļēāļāđāļāļāļēāļĢāļāļāļāđāļāļ data model āļึ่āļāđāļ็āļāđāļāļ§āļāļิāļัāļิāļี่āļĄีāđāļ้āļัāļāļĄāļēāļāļēāļ āđāļ่āļāļēāļāđāļิāļĄāļี่āļĄีāļŦāļĨāļēāļĒāđāļāļ§āļāļēāļāđāļŦ้āđāļĨืāļāļāļāļēāļĄāļāļ§āļēāļĄāđāļŦāļĄāļēāļ°āļŠāļĄāļāļāļāļ āļēāļĐāļēāđāļĨāļ°āļāļēāļāļ้āļāļĄูāļĨāļี่āđāļ้ āđāļ่āđāļāđāļĨāļāļāļāļ LLM āļึ่āļ AI āļāļ°āļĄāļēāđāļ็āļāđāļื่āļāļāļĢ่āļ§āļĄāļāļēāļāļŦāļ้āļēāđāļŦāļĄ่āļāļāļāđāļŦāļืāļāļāļēāļ āļāļēāļĢāđāļĨืāļāļāđāļ้āđāļāļ§āļāļēāļāđāļāļāļēāļĢāļāļāļāđāļāļāđāļŦ้āđāļŦāļĄāļēāļ°āļŠāļĄāļัāļāļāļēāļĢāđāļ้āļāļēāļāļึāļāđāļ็āļāđāļĢื่āļāļāļี่āđāļĢāļēāļ้āļāļāļิāļāļēāļĢāļāļēāđāļิ่āļĄāđāļิāļĄ āļั้āļāļี้āđāļĄ่āđāļ้āļŦāļĄāļēāļĒāļึāļāļ§่āļēāļāļēāļĢāļāļāļāđāļāļāļĢูāļāđāļāļāļื่āļāđ āļāļ°āđāļ้āđāļĄ่āđāļ้ āļŦāļĢืāļāđāļ้āđāļĄ่āđāļ้ āđāļ่āļāļēāļĢāđāļĨืāļāļāđāļāļ§āļāļēāļāļāļēāļĢāļāļāļāđāļāļāļี่āđāļŦāļĄāļēāļ°āļŠāļĄ āļāļ°āđāļ็āļāļāļēāļĢāļĨāļāđāļāļāļēāļŠāļี่āļāļ°āđāļิāļāļ้āļāļิāļāļāļĨāļēāļāđāļ้
āļāļĒ่āļēāļāđāļĢāļ็āļีāđāļื่āļāļāļāļēāļ LLM āļāļĒู่āļĢāļ°āļŦāļ§่āļēāļāļāļēāļĢāļัāļāļāļēāļāļĒ่āļēāļāļĢāļ§āļāđāļĢ็āļ§ āļĄีāļัāļ§āđāļĨืāļāļāļĄāļēāļāļĄāļēāļĒ āļึ่āļāđāļĄāđāļāļĨāđāļŦāļĨ่āļēāļี้āļāļēāļāļĄีāļ้āļāđāļāļāļ่āļēāļāđāļāļĢāļēāļĒāļĨāļ°āđāļีāļĒāļāļāļĨีāļāļĒ่āļāļĒ āđāļĄ่āļ§่āļēāļāļ°āđāļ็āļāđāļāļāļิāļāļāļēāļĢāļัāļāđāļ่āļ token āļāļēāļĢāļŠāļĢ้āļēāļ code āļĢāļ§āļĄāļึāļāļ้āļāļāļģāļัāļāļ่āļēāļāđ āļี่āļĄีāđāļāļāļ่āļēāļāļัāļ āļāļēāļāļāļāļģāđāļŦ้āļāļĨāļĨัāļāļ์āļāļāļāļĄāļēāđāļāļāļ่āļēāļāļัāļ āđāļ่āļāļēāļĢāļāļāļāđāļāļāļี่āļี āđāļื้āļāļ่āļāļāļēāļĢāļāļģāļāļēāļāļāļāļ AI āļāļ°āļ่āļ§āļĒāđāļŦ้āđāļĢāļēāđāļ้āļāļĨāļĨัāļāļ์āļี่āļ่āļēāļāļāđāļ
References:
Road to Automated Analytics
Reviewed by aphidet
on
4:39 PM
Rating:

No comments: