Question 1

ฐานข้อมูล “Distributed SQL” คืออะไรโดยสรุป?

Accepted Answer

ฐานข้อมูล Distributed SQL ให้อินเทอร์เฟซเชิงสัมพันธ์และ SQL (ตาราง, join, คอนสเตรนท์, ทรานแซกชัน) แต่รันเป็นคลัสเตอร์ข้ามเครื่องหลายเครื่อง—บ่อยครั้งข้ามภูมิภาค—ในขณะที่ยังคงทำงานเป็น ฐานข้อมูลเชิงตรรกะเดียว

ในทางปฏิบัติ มันพยายามรวม:

พฤติกรรม SQL/ACID ที่คุ้นเคย
การขยายแนวนอน (เพิ่มโหนด)
ความพร้อมและความทนทานต่อความล้มเหลวโดยไม่ต้องแยกชาร์ดด้วยมือ

Question 2

Distributed SQL ต่างจาก PostgreSQL/MySQL แบบดั้งเดิมอย่างไร?

Accepted Answer

RDBMS แบบโหนดเดียวหรือแบบ primary/replica มักจะง่ายกว่า ถูกกว่า และเร็วกว่าในงาน OLTP ที่อยู่ในภูมิภาคเดียว

Distributed SQL น่าสนใจเมื่อทางเลือกอื่นคือ:

การชาร์ดที่จัดการโดยแอปพลิเคชัน
การสลับข้ามภูมิภาคที่ซับซ้อน
ความต้องการความสอดคล้องอย่างเข้มงวดข้ามโซน/ภูมิภาค
ความต้องการการเก็บข้อมูลตามภูมิศาสตร์ด้วยโมเดลการปฏิบัติการเดียว

Question 3

ทำไมระบบ Distributed SQL ต้องใช้โปรโตคอลคอนเซนซัสอย่าง Raft หรือ Paxos?

Accepted Answer

แนวคิดหลักสองอย่างคือ: - การจำลองข้อมูล : แต่ละชาร์ด/พาร์ติชันถูกเก็บซ้ำบนโหนดหลายตัว - คอนเซนซัส (เช่น Raft หรือ Paxos): รีพลิก้าตกลงลำดับของการเขียน; การคอมมิตมักต้องการ เสียงข้างมาก ยืนยัน นี่คือสิ่งที่ทำให้ได้ความสอดคล้องแบบเข้มงวดแม้โหนดล้ม—แต่เพิ่มค่าใช้จ่ายการประสานงานทางเครือข่าย

Question 4

ข้อมูลถูกแบ่งและวางบนโหนด/ภูมิภาคอย่างไร?

Accepted Answer

ตารางถูกแบ่งเป็นชิ้นเล็ก ๆ (มักเรียกว่าพาร์ติชัน/ชาร์ด หรือชื่อเฉพาะของผู้ขายเช่น ranges/tablets/splits) แต่ละพาร์ติชัน:

มีกลุ่มรีพลิก้าเป็นของตัวเอง
สามารถวางบนโหนด/ภูมิภาคที่เจาะจง
ย้ายได้เมื่อคลัสเตอร์บาลานซ์ใหม่

โดยปกติคุณจะกำหนดนโยบายการวางเพื่อให้ข้อมูล "ฮอต" และผู้เขียนหลักอยู่ใกล้ ลดการข้ามเครือข่าย

Question 5

ทำไมทรานแซกชันอาจช้าลงใน Distributed SQL โดยเฉพาะข้ามภูมิภาค?

Accepted Answer

ทรานแซกชันแบบกระจายมักจะสัมผัสพาร์ติชันหลายตัว ซึ่งอาจอยู่บนโหนด/ภูมิภาคต่างกัน การคอมมิตอย่างปลอดภัยอาจต้อง:

ล็อก/ตรวจสอบข้อมูลบนพาร์ติชันที่เกี่ยวข้อง
จำลองการเขียนผ่านคอนเซนซัส (การยืนยันของเสียงข้างมาก)
ตัดสินใจคอมมิตอย่างสอดคล้องกัน

รอบเดินทางของเครือข่ายเหล่านี้เป็นสาเหตุหลักที่ทำให้แล็ตเทนซีของการเขียนเพิ่มขึ้น—โดยเฉพาะเมื่อข้ามภูมิภาค

Question 6

สัญญาณที่บอกว่าฉันจำเป็นต้องใช้ Distributed SQL คืออะไร?

Accepted Answer

สัญญาณชัดเจนที่คุณต้องพิจารณา Distributed SQL: ตอบ "ใช่" อย่างน้อยสองข้อ: - คุณมีผู้ใช้ในหลายภูมิภาคและต้องการข้อมูลที่สอดคล้องกัน - ต้องการการสลับอัตโนมัติข้ามโซน/ภูมิภาค (RTO/RPO เข้มงวด) - การสเกลแนวตั้งไม่เพียงพอสำหรับการเขียน - ต้องการความสอดคล้องที่เข้มงวดสำหรับธุรกรรมหลัก (การเงิน สต็อก การจอง) - ข้อกำหนดด้าน compliance บังคับการวางข้อมูลตามภูมิศาสตร์ หากโหลดของคุณยังอยู่ในภูมิภาคเดียวพร้อม replica/caching ฐานข้อมูลเชิงสัมพันธ์แบบปกติมักเป็นค่าเริ่มต้นที่ดีกว่า

Question 7

ความสอดคล้องแบบเข้มงวดให้ประโยชน์อะไรและมีค่าใช้จ่ายอย่างไร?

Accepted Answer

ความสอดคล้องแบบเข้มงวดหมายความว่าเมื่อทรานแซกชันคอมมิต การอ่านถัดไปจะไม่เห็นข้อมูลเก่า

ในเชิงผลิตภัณฑ์ มันช่วยป้องกัน:

การใช้จ่ายซ้ำ / ยอดเงินผิดพลาด
การขายเกินสต็อกชิ้นสุดท้าย
สองผู้ใช้จองที่นั่งเดียวกัน

ต้นทุนคือเมื่อเกิด partition บางการดำเนินการอาจถูกบล็อกหรือล้มเหลว แทนที่จะยอมรับความจริงที่แตกต่างกันชั่วคราว

Question 8

ฉันควรจัดการการลองใหม่ (retries) อย่างไรให้ปลอดภัยกับ Distributed SQL?

Accepted Answer

ใช้ข้อจำกัดของฐานข้อมูลร่วมกับทรานแซกชันเพื่อจัดการการลองใหม่อย่างปลอดภัย:

เก็บ idempotency_key ต่อคำขอ/ความพยายาม
เพิ่ม unique constraint เช่น (account_id, idempotency_key)
ในทรานแซกชันเดียว ให้เขียนระเบียนธุรกิจและแถว ledger/outbox

วิธีนี้การลองใหม่จะกลายเป็น no-op แทนที่จะเป็นการกระทำซ้ำ—จำเป็นสำหรับการชำระเงิน, การ provision, และการประมวลผลงานเบื้องหลัง

Question 9

ฉันควรเลือกอย่างไรระหว่าง Spanner, CockroachDB และ YugabyteDB?

Accepted Answer

การแยกเชิงปฏิบัติ: - Spanner : มักใช้เป็นบริการแบบจัดการบน GCP; มีดีไซน์สำหรับ multi-region; ความเข้ากันได้ของ SQL ขึ้นกับข้อมูลเลือกไดอะล็อก - CockroachDB : ประสบการณ์ใกล้เคียง PostgreSQL และรองรับโปรโตคอลสาย PostgreSQL; มีทั้งบริการจัดการและ self-hosted; ไม่เข้ากัน 100% กับ Postgres ในทุกรายละเอียด - YugabyteDB : API SQL ที่เข้ากันได้กับ PostgreSQL (YSQL) และ API แบบ Cassandra (YCQL) เป็นตัวเลือก; มีทั้ง self-hosted และบริการจัดการ ก่อนตัดสินใจ ให้ทดสอบ ORM/migration และส่วนขยาย Postgres ที่คุณพึ่งพา—อย่าสันนิษฐานว่าจะเปลี่ยนแทนกันได้แบบตรงๆ

Question 10

แผน PoC ที่ดีควรประกอบด้วยอะไรบ้างก่อนตัดสินใจใช้ Distributed SQL?

Accepted Answer

เริ่มด้วย PoC ที่มุ่งไปยังงานสำคัญหนึ่งอย่าง (เช่น เช็คเอาต์, การจอง, การบันทึกบัญชี) และตรวจสอบ:

ความถูกต้อง: ไม่มีการจองซ้ำหรืออัพเดตหาย
p50/p95 latency สำหรับคิวรีหลัก (รวมเป้าข้ามภูมิภาคถ้าจำเป็น)
พฤติกรรมเมื่อพัง: โหนดหาย โซนหาย และถ้าจำเป็นภูมิภาคหาย
พื้นฐานการปฏิบัติการ: มอนิเตอร์, แบ็คอัพ, การทดสอบกู้คืน

ถ้าต้องการความช่วยเหลือในการคำนวณต้นทุน/ชั้นบริการ ให้ดูที่ /pricing. สำหรับบันทึกการใช้งานเชิงปฏิบัติ ให้เรียกดู /blog.

Distributed SQL: ควรใช้ Spanner, CockroachDB หรือ Yugabyte เมื่อใด?

ความหมายของ “Distributed SQL” (โดยไม่ต้องโม้)

ระหว่าง RDBMS แบบคลาสสิกและ NoSQL

ปัญหาที่พยายามแก้

ตั้งความคาดหวัง (มันไม่ใช่ค่าเริ่มต้น)

หลักการทำงานเบื้องหลังของ Distributed SQL

การจำลอง + คอนเซนซัส: โหนดตกลงกันอย่างไร

การชาร์ด/พาร์ติชัน: ข้อมูลอยู่ที่ไหน

ทรานแซกชันข้ามโหนด (และเหตุใดจึงเพิ่มแล็ตเทนซี)

พฤติกรรมข้ามภูมิภาค: การอ่าน/เขียนตามเขตพื้นที่

เมื่อใดที่คุณจำเป็นจริง ๆ (และเมื่อไม่จำเป็น)

ทริกเกอร์ชัดเจน: เมื่อ Distributed SQL คุ้มค่า

สิ่งที่มักไม่ควรทำ

เช็คลิสต์การตัดสินใจด่วน

ความสอดคล้อง ความพร้อมใช้งาน และแล็ตเทนซี: การแลกเปลี่ยนหลัก

CAP อธิบายสำหรับการตัดสินใจผลิตภัณฑ์

ความสอดคล้องแบบเข้มงวด (และทำไมเงินและสต็อกถึงสำคัญ)

อ่านแล้วเห็นการเขียนของตัวเองและการแยกการทำงานในแอปจริง

ค่าแล็ตเทนซีจากคอนเซนซัสข้ามภูมิภาค

Spanner vs CockroachDB vs YugabyteDB: ภาพรวมเชิงปฏิบัติ

บริการจัดการ vs โฮสต์เอง: อะไรเปลี่ยนไปบ้าง

คำถามที่พบบ่อย