1-1-1 rule
ทำ Pipeline แรกให้เล็กที่สุด (1-1-1 rule)
หลายคนเริ่มทำ Data Pipeline แล้ว "หลงทาง" ไม่ใช่เพราะไม่เก่ง
แต่เพราะเริ่มจากงานที่ใหญ่เกินไป
(หลายแหล่งข้อมูล / หลายขั้นตอน / หลายปลายทาง)
ผลที่มักตามมาคือโปรเจกต์ที่
- ไม่จบตามแผน
- ไม่ชัดว่าปัญหาเกิดที่จุดใด
- ต้องแก้ซ้ำ ๆ จนเสียเวลาและหมดแรง
หากต้องการใ ห้ Pipeline แรก "จบได้จริง" และ "เชื่อถือได้"
มีหลักคิดที่เรียบง่ายแต่ใช้ได้ผลในเชิงงานองค์กร: 1-1-1 rule
1-1-1 rule คืออะไร?
1) 1 Source
เริ่มจากข้อมูล "แหล่งเดียว" ก่อน
เช่น ตารางเดียวใน DB / ไฟล์ CSV เดียว / Google Sheet เดียว
2) 1 Transform
ทำ transformation "อย่างเดียว" หรือ "กฎหลัก 1 ข้อ"
เช่น dedupe / standardize เวลา / filter สถานะ / aggregate แบบเดียว
เหตุผล : เมื่อมีหลายขั้นตอนเกินไปตั้งแต่แรก ยากต่อการตรวจสอบความถูกต้อง ถ้าไม่มี การ บันทึก logs ที่ดีเป็นระบบตรวจสอบง่าย
3) 1 Output
ส่งไป "ปลายทางเดียว" ที่มีผู้ใช้งานจริง
เช่น 1 ตารางใน warehouse / 1 ไฟล์รายวัน / 1 metric บน dashboard
ทำไม 1-1-1 ถึงเวิร์ก?
เพราะช่วยให้ Pipeline แรกมี ขอบเขตที่ควบคุมได้ (controllable scope)
และ ตรวจสอบ/แก้ไขได้ง่าย ด้วยความชัดเจนใน 4 เรื่องสำคัญ:
ข้อมูลมาจากไหน → แปลงอะไร → ไปอยู่ที่ไหน → ใครเป็นผู้ใช้
Pipeline ไม่ได้เริ่มจาก "เครื่องมือ"
แต่เริ่มจาก ขอบเขตและความรับผิดชอบที่ชัดเจน แล้วค่อยขยายอย่างมีแบบแผน




















