Q: What does “generative AI at scale” actually mean in practice?

Search จะเรียกว่า “at scale” เมื่อระบบต้องจัดการ คำค้นนับล้าน ได้ด้วยความหน่วงต่ำ ความพร้อมใช้งานสูง และข้อมูลอัพเดตอย่างต่อเนื่อง Generative AI เรียกว่า “at scale” เมื่อมันต้องทำสิ่งเดียวกันขณะที่ยังต้องสร้างคำตอบเพิ่มขึ้น ซึ่งเพิ่มเงื่อนไขรอบๆ: - ต้นทุนการอนุมานที่คาดการณ์ได้ - คุณภาพคำตอบที่สม่ำเสมอ - การยึดข้อมูลและมาตรการความปลอดภัยท่ามกลางการจราจรหนาแน่น

Question 1

Why does Sergey Brin “still matter” when discussing AI and search today?

Accepted Answer

เขาเป็นเลนส์ที่มีประโยชน์สำหรับเชื่อมโยงปัญหา การค้นคืนข้อมูลแบบคลาสสิก (ความเกี่ยวข้อง การต้านทานสแปม การปรับขนาด) เข้ากับปัญหา Generative AI ในปัจจุบัน (การยึดข้อมูลเป็นหลัก ระยะหน่วง ความปลอดภัย ค่าใช้จ่าย) จุดประสงค์ไม่ใช่ประวัติส่วนตัว แต่องค์ความรู้คือว่า search และ AI สมัยใหม่มีข้อจำกัดร่วมกัน: ต้องทำงานในระดับขนาดใหญ่พร้อมรักษาความไว้วางใจ

Question 2

What does “generative AI at scale” actually mean in practice?

Accepted Answer

Search จะเรียกว่า “at scale” เมื่อระบบต้องจัดการ คำค้นนับล้าน ได้ด้วยความหน่วงต่ำ ความพร้อมใช้งานสูง และข้อมูลอัพเดตอย่างต่อเนื่อง

Generative AI เรียกว่า “at scale” เมื่อมันต้องทำสิ่งเดียวกันขณะที่ยังต้องสร้างคำตอบเพิ่มขึ้น ซึ่งเพิ่มเงื่อนไขรอบๆ:

ต้นทุนการอนุมานที่คาดการณ์ได้
คุณภาพคำตอบที่สม่ำเสมอ
การยึดข้อมูลและมาตรการความปลอดภัยท่ามกลางการจราจรหนาแน่น

Question 3

What was wrong with search engines in the late 1990s?

Accepted Answer

ในปลายทศวรรษ 1990 การค้นหาพึ่งพาการ จับคู่คีย์เวิร์ด และสัญญาณการจัดอันดับพื้นฐาน ซึ่งล้มเหลวเมื่อเว็บเติบโตขึ้นมาก ปัญหาทั่วไปได้แก่: - ผลลัพธ์ไม่ตรงประเด็นแม้มีคำที่ “ตรง” - หน้าเนื้อหาคุณภาพต่ำอยู่เหนือแหล่งข้อมูลที่ดีกว่า - กลยุทธ์สแปมอย่างการยัดคีย์เวิร์ด - ไม่สามารถไล่ตามการรวบรวมและจัดทำดัชนีได้ทัน

Question 4

What did PageRank change compared to keyword-based ranking?

Accepted Answer

PageRank มองโครงสร้างลิงก์ของเว็บเป็นการให้คะแนนหรือ “ลงคะแนนไว้วางใจ” โดยลิงก์จากหน้าที่มีความน่าเชื่อถือมากกว่าจะมีน้ำหนักมากกว่า

เชิงปฏิบัติ:

ปรับปรุงความเกี่ยวข้องด้วยการใช้โครงสร้างเว็บ ไม่ใช่แค่ข้อความบนเพจ
ทำให้การจัดอันดับยากต่อการถูกจัดแต่งกว่าการใช้คีย์เวิร์ดเพียงอย่างเดียว
ส่งผลให้การค้นหาพัฒนาเป็นการจัดอันดับจากหลายสัญญาณ แทนการจับคู่ปัจจัยเดียว

Question 5

Why is ranking “never solved” in search?

Accepted Answer

เพราะการจัดอันดับเกี่ยวข้องกับเงินและความสนใจ มันจึงกลายเป็นระบบ เชิงปฏิบัติการผสมผสานการต้านทาน เมื่อสัญญาณใดใช้ได้ ผู้คนก็พยายามเอาเปรียบ

นั่นทำให้ต้องปรับปรุงอย่างต่อเนื่อง:

ตรวจจับการบิดเบือน (ลิงก์สแปม, cloaking, ยัดคีย์เวิร์ด)
ปรับสัญญาณและโมเดล
ทดสอบใหม่ด้วยชุดทดสอบและการทดลองออนไลน์

Question 6

How do infrastructure and latency affect search quality?

Accepted Answer

เมื่ออยู่ในระดับเว็บ ระบบประสิทธิภาพคือส่วนหนึ่งของ “คุณภาพ” ผู้ใช้รับรู้คุณภาพเป็น:

ผลลัพธ์ที่โหลดเร็ว (latency)
ผลลัพธ์ที่พร้อมใช้งานตลอดเวลา (reliability)
ผลลัพธ์ที่สะท้อนการเปลี่ยนแปลงล่าสุด (freshness)

ผลลัพธ์ที่อาจแย่กว่าแต่ส่งได้ 200ms สม่ำเสมอ มักชนะผลลัพธ์ที่ดีขึ้นแต่ช้าหรือไม่แน่นอน

Question 7

What does “learning to rank” mean without the math?

Accepted Answer

การเรียนรู้การจัดอันดับเปลี่ยนจากกฎที่ปรับแต่งด้วยมือมาเป็น โมเดลที่ฝึกจากข้อมูล (พฤติกรรมการคลิก การตัดสินของมนุษย์ และสัญญาณอื่นๆ)

แทนที่จะกำหนดน้ำหนักของแต่ละสัญญาณด้วยมือ โมเดลเรียนรู้การรวมสัญญาณเหล่านั้นเพื่อทำนาย "ผลลัพธ์ที่เป็นประโยชน์" ได้ดีขึ้น

ผลลัพธ์ที่มองเห็นอาจไม่เปลี่ยน แต่ภายในระบบเปลี่ยนเป็น:

ขับเคลื่อนด้วยข้อมูลมากขึ้น
พึ่งพาการวัดผล
ปรับปรุงได้ผ่านการฝึกและทดสอบซ้ำ

Question 8

Why did deep learning improve language understanding in search?

Accepted Answer

Deep learning ช่วยให้ระบบสร้างตัวแทนความหมาย (representations) ที่ดีกว่า ทำให้:

เข้าใจเจตนามากกว่าคำตามตัวอักษร
จัดการคำพ้องความหมายและรูปแบบการพูดซ้ำได้ดีขึ้น
จับคู่คำค้นกับหน้าเพจที่ตอบความต้องการ ไม่ใช่แค่มีคีย์เวิร์ดซ้ำๆ

การแลกเปลี่ยนคือต้นทุนด้านคอมพิวต์ ความต้องการข้อมูล และการอธิบายผลที่ยากขึ้นเมื่อการจัดอันดับเปลี่ยน

Question 9

What’s fundamentally different about generative AI compared to classic search AI?

Accepted Answer

การค้นหาแบบคลาสสิกมุ่งที่การ จัดอันดับและการทำนาย — ให้คะแนนเอกสารที่มีอยู่แล้วและเรียงลำดับ Generative AI เปลี่ยนรูปแบบผลลัพธ์ไปเป็นการ สร้าง ข้อความ โค้ด สรุป และภาพ ความเสี่ยงใหม่รวมถึง: - ข้อผิดพลาดที่ฟังดูมั่นใจ (hallucinations) - ความไม่สอดคล้องระหว่างคำสั่งที่คล้ายกัน - ปัญหาด้านความปลอดภัยและอคติ คำถามจึงเปลี่ยนจาก “เราเลือกแหล่งที่ดีที่สุดหรือไม่?” เป็น “คำตอบที่สร้างขึ้นแม่นยำ ยึดแหล่ง และปลอดภัยหรือเปล่า?”

Question 10

How do search and chat blend together with retrieval-augmented generation (RAG)?

Accepted Answer

Retrieval-augmented generation (RAG) จะดึงแหล่งข้อมูลที่เชื่อถือได้มาก่อน แล้วจึงสร้างคำตอบโดยอิงจากสิ่งที่พบ

เมื่อต้องนำไปใช้ในผลิตภัณฑ์ ทีมมักเพิ่ม:

การอ้างอิง/คำยกข้อความเพื่อให้ผู้ใช้ตรวจสอบได้
มาตรการป้องกันการโจมตีจาก prompt injection และคำขอที่ไม่ปลอดภัย
การเฝ้าติดตามการไหลของคุณภาพและการถดถอย
การควบคุมค่าใช้จ่าย (การแคช การส่งคำขอไปยังโมเดลที่ถูกกว่าเมื่อเหมาะสม)

การเดินทางของ Sergey Brin: จากอัลกอริธึมการค้นหา สู่ปัญญาประดิษฐ์เชิงสร้างสรรค์ (Generative AI)

ทำไม Sergey Brin ยังคงมีความสำคัญต่อ AI และการค้นหา

บทความนี้คืออะไร (และไม่ใช่อะไร)

“Generative AI ในระดับสเกล” แบบเข้าใจง่าย

สิ่งที่คุณจะได้จากบทความนี้

รากฐานแรก: การเรียนรู้ งานวิจัย และปัญหาการค้นหา

รากฐานทางวิชาการและคำถามด้านข้อมูล

“การค้นหา” หมายถึงอะไรในปลายทศวรรษ 1990

แรงจูงใจเบื้องต้น: ความเกี่ยวข้อง ความเชื่อถือ และการจัดระเบียบ

จากลิงก์สู่ความเกี่ยวข้อง: PageRank เปลี่ยนอะไร

แนวคิด PageRank แบบเข้าใจง่าย

มากกว่าสัญญาณเดียว—และการต่อสู้ที่ไม่หยุดนิ่ง

ทำไมการจัดอันดับจึงไม่เคย “สำเร็จสมบูรณ์”

สร้างการค้นหาในระดับอินเทอร์เน็ต: ความท้าทายด้านระบบ

เมื่อต้องขยายขนาด ทุกอย่างเปลี่ยนไป

ความน่าเชื่อถือและความเร็วคือส่วนหนึ่งของ “คุณภาพ”

ท่อข้อมูลและการเปลี่ยนแปลงที่ปลอดภัย

อุปมาเรียบง่าย: บัญชีห้องสมุด vs เว็บที่มีชีวิต

จากกฎสู่การเรียนรู้ของเครื่อง: จุดเปลี่ยนเชิงเงียบ

“การเรียนรู้เพื่อจัดอันดับ” หมายถึงอะไร (ไม่ต้องใช้คณิตศาสตร์)

จากปุ่มปรับที่ตั้งด้วยมือสู่โมเดลที่ฝึกด้วยข้อมูล

การประเมินกลายเป็นพวงมาลัย

คำถามที่พบบ่อย