จากทฤษฎีของความน่าจะเป็นรวมที่ผ่านมากแล้วหากมองสิ่งที่กล่าวมาในข้างต้นในทางตรงกันข้ามจะเห็นได้ว่า ถ้าเราสมมติให้เหตุการณ์ A ได้เกิดขึ้นแล้ว และสนใจจะหาความน่าจะเป็นที่จะเกิดเหตุการณ์ Biเราจะหาค่าใดอย่างไร สิ่งที่เป็นปัญหาเหล่านี้ เราสามารถใช้ทฤษฎีเบย์
ทฤษฎีความน่าจะเป็นแบบเบย์ (แบบเบย์ๆ)
ความน่าจะเป็นแบบเบย์ เป็นทฤษฎีที่พูดถึงความน่าจะเป็นในการเกิดสิ่งหนึ่ง ก็ต่อเมื่ออีกสิ่งที่ได้เกิดขึ้น หรือที่เรียกกันว่า “Given” ซึ่งถ้าใครได้เรียนมา ลักษณะของการเขียนสัญลักษณ์ คือ P(A|B) อ่านว่า ความน่าจะเป็นของเหตุการณ์ A เมื่อเกิดเหตุการณ์ B แล้ว
สมมุติว่า เราได้ไปร่วมงานวันเกิดของเพื่อนเรา ซึ่งมีคนมาร่วมทั้งหมด 20 คน แล้วมีความจับฉลากแจกตั๋วล่องเรือสำราญ 5 ใบสำหรับแขกที่มาในงาน
ผู้จัดงานเลยทำฉลากใส่กล่อง 2 ใบ เราจะเรียกมันว่ากล่อง X และ Y ดังนั้นจะสรุปความน่าจะเป็นได้ดังนี้
- เหตุการณ์ A คือ การเลือกกล่อง ซึ่งมีสมาชิกคือ A = {กล่อง X, กล่อง Y}
- เหตุการณ์ B คือ การเลือกจับฉลาก ซึ่งมีสมาชิกคือ B = {ได้ตั๋วเรือ, ไม่ได้ตั๋วเรือ}
- ความน่าจะเป็นของการเลือกกล่อง X และกล่อง Y คือ 1/2 และ 1/2 ตามลำดับ
- ความน่าจะเป็นของการได้ตั๋วเรือ และไม่ได้ตั๋วเรือ คือ 5/20 และ 15/20 ตามลำดับ
- เขียนเป็นสัญลักษณ์ได้ เช่น P(A=กล่อง X) = 1/2 หรือ P(B=ไม่ได้ตั๋วเรือ) = 15/20 เป็นต้น
แต่ทีนี้ หลังจากที่เราได้จับฉลากแล้ว ผลปรากฎว่าไม่ได้ตั๋ว ตอนท้ายงานก็เลยไปคุยกับเพื่อนที่เป็นคนจัดงาน ทำให้รู้ว่ากล่อง X และกล่อง Y มีการใส่ตั๋วเรือเอาไว้ไม่เท่ากัน กล่อง X มีตั๋วอยู่ 3 ใบ จากฉลาก 10 ใบ และกล่อง Y มีตั๋ว 2 ใบจาก 10 ใบ ซึ่งจากข้อมูลนี้ จะสรุปได้ดังนี้
- ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง X คือ P(B=ได้ตั๋วเรือ|A=กล่อง X) = 3/10
- ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง X คือ P(B=ไม่ได้ตั๋วเรือ|A=กล่อง X) = 7/10
- ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง Y คือ P(B=ได้ตั๋วเรือ|A=กล่อง Y) = 2/10
- ความน่าจะเป็นของการได้ตั๋วเรือ เมื่อเลือกกล่อง Y คือ P(B=ไม่ได้ตั๋วเรือ|A=กล่อง Y) = 8/10
ถ้าเรามาสรุปความน่าจะเป็นในภาพรวมแล้ว เราจะสามารถแบ่งออกเป็นกรณีต่างๆ โดยใช้เงื่อนไขจากเหตุการณ์ A และ B พร้อมๆ กัน (Joint Probability) ได้ดังต่อไปนี้
- ได้ตั๋วเรือ และมาจากกล่อง X : P(B=ได้ตั๋วเรือ, A=กล่อง X) = 3/20
- ไม่ได้ตั๋วเรือ และมาจากกล่อง X : P(B=ไม่ได้ตั๋วเรือ, A=กล่อง X) = 7/20
- ได้ตั๋วเรือ และมาจากกล่อง Y : P(B=ได้ตั๋วเรือ, A=กล่อง Y) = 2/20
- ไม่ได้ตั๋วเรือ และมาจากกล่อง Y : P(B=ไม่ได้ตั๋วเรือ, A=กล่อง Y) = 8/20
จะเห็นว่า Joint Probability จะเขียนด้วยเครื่องหมาย “,” (comma) ซึ่งไม่เหมือนกับความน่าจะเป็นแบบมีเงื่อนไขที่ใช้ “|” (อ่านว่า Given)
ซึ่งจากเหตุการณ์ทั้งหมด เบย์ได้ทำการสรุปความสัมพันธ์เอาไว้ดังนี้
- P(A, B) = P(A|B) x P(B)
- P(B, A) = P(B|A) x P(A)
- เมื่อ P(A, B) = P(B, A) จะได้
P(A|B) x P(B) = P(A, B) = P(B|A) x P(A)
และเมื่อ P(A|B) x P(B) = P(B|A) x P(A) เมื่อย้ายข้างสมการ จะได้
P(A|B) = P(B|A) x P(A) / P(B)
ซึ่งเมื่ออ่านมาถึงตรงนี้ หลายคนอาจสงสัยว่า แล้วเราจะเอามันไปใช้ประโยชน์อะไรได้ล่ะ ทำไมเราถึงต้องรู้มันด้วย
กลับมาถึงเหตุการณ์ปาร์ตี้วันเกิดในตอนแรก หลังจากที่เราได้รู้ข่าวว่า มีเพื่อนคนหนึ่ง ชื่อบอล ไอ้บอลได้ตั๋วเรือไปจากการจับฉลาก ก็เลยสงสัยว่าไอ้บอลน่าจะเลือกหยิบฉลากจากกล่องไหนนะ เพื่อนเจ้าของวันเกิดเลยท้าให้เดา มีตั๋วอยู่อีกใบนึง ถ้าเราเดาถูกจะเอาตั๋วใบนี้ให้เรา
การเดาครั้งนี้ เราเลยมาตั้งใจคิดอย่างมีหลักการหน่อย เมื่อพิจารณาจากทฤษฎีความน่าจะเป็นแบบเบย์ สรุปความน่าจะเป็นได้ คือ
P(A=กล่อง X|B=ได้ตั๋วเรือ)
= P(B=ได้ตั๋วเรือ|A=กล่อง X) x P(A=กล่อง X) / P(B=ได้ตั๋วเรือ)
= (3/10 x 1/2) / 5/20 = 3/5
และ
P(A=กล่อง Y|B=ได้ตั๋วเรือ)
= P(B=ได้ตั๋วเรือ|A=กล่อง Y) x P(A=กล่อง X) / P(B=ได้ตั๋วเรือ)
= (2/10 x 1/2) / 5/20 = 2/5
ซึ่งจากตัวอย่างนี้ ที่จริงเราไม่จำเป็นต้องคำณวนความน่าจะเป็นก็น่าจะเลือกได้ไม่ยากครับ แต่ในโลกความเป็นจริงยังมีปัญหาอีกมากมายที่ซับซ้อนกว่านี้ ซึ่งไอ้เจ้าทฤษฎีของเบย์นั้นช่วยให้เราคำณวนเพื่อแก้ปัญหานั้นได้
ของแถมอีกนิดหน่อยครับ พวกทฤษฎีเกี่ยวกับความน่าจะเป็นทั่วไปที่ควรจะรู้ เพื่อเป็นพื้นฐานในการศึกษา Machine Learning มีดังนี้
Marginalization: สำหรับ Joint Probability ใดๆ P(X, Y) เมื่อเราสนใจแค่ X โดยไม่สนใจว่าเป็น Y เหตุการณ์ใดก็ตาม สามารถหาได้ดังนี้
P(A) = ∑ P(A, B) ; over B กล่าวคือ เราบวกรวมความน่าจะเป็นของ เหตุการณ์ A จากทุกเหตุการณ์ของ B (เพราะเราไม่สนว่าในเหตุการณ์ B ว่าเกิดอะไรขึ้น) เช่น P(B=ได้ตั๋วเรือ) = P(B=ได้ตั๋วเรือ, A=กล่อง X) + P(B=ได้ตั๋วเรือ, A=กล่อง Y) = 3/20 + 2/20 = 5/20