OPINION

ต้องไปถามคนแพ้ : เรื่องของ Survivorship Bias

สุรพร เกิดสว่าง
24 ก.พ. 2563
เป็นปกติอยู่แล้ว ที่เราจะให้ความสำคัญกับข้อมูลที่เห็น เพราะข้อมูลที่ไม่เห็นก็ไม่รู้จะทำอะไรกับมันได้ และที่สำคัญ บางทีก็ไม่รู้เสียด้วยซ้ำว่ามีอยู่ เป็น unknown-unknown คือ ไม่รู้ว่าคืออะไร เพราะไม่รู้ว่ามี
 
ทว่า ข้อมูลที่เราไม่รู้จักนี้เอง อาจมีความสำคัญอย่างมากต่อการตัดสินใจ  ดังนั้น การให้ความสนใจเฉพาะข้อมูลที่มีหรือที่มองเห็น โดยไม่เผื่อใจว่า ยังอาจมีข้อมูลที่ยังไม่ปรากฏ อาจนำความผิดพลาดมหาศาลมาสู่การตัดสินใจได้
 
แต่ว่า เราจะเผื่อใจกับสิ่งที่ไม่รู้ ไม่รู้จัก หรือแม้กระทั่งไม่รู้ว่ามันมีอยู่ได้อย่างไร?
 
ในสงครามโลกครั้งที่สอง เครื่องบินรบที่บินกลับมาจากภาระกิจมักมีรอยถูกยิงพรุน และตำแหน่งรอยกระสุนนี้มักซ้ำๆกันเป็นประจำ นั่นคือ ส่วนปลายของปีก โคนปีกและลำตัว และปีกหาง  ซึ่ง commonsense บอกว่า เนื่องจากเสริมเกราะทั้งลำย่อมไม่ได้ จะเพิ่มน้ำหนักเกินไป การป้องกันไม่ให้เครื่องบินรบเหล่านี้ถูกยิงจนตกก็คือ ตรงไหนถูกเล็งยิงบ่อย ก็เสริมความหนาของผิวเฉพาะตรงนั้น ซึ่งก็เป็นวิธีคิดที่ตรงไปตรงมา 
 
แต่วิธีนี้ ถูกค้านโดยนักคณิตศาสตร์ Abraham Wald แห่ง Columbia University โดย Wald บอกว่า วิธีนี้มาจากการเก็บข้อมูลจากเครื่องบินที่ถูกยิงแล้วรอดกลับมาได้ ซึ่งที่จริงแล้ว ต้องไปดูที่เครื่องบินที่ถูกยิงตกไปแล้วต่างหากว่าถูกยิงตรงไหนถึงร่วง ไม่ใช่มาดูเครื่องบินที่ถูกยิงแต่รอดกลับมาได้
 
แน่นอนว่า การไปหาซากเครื่องบินที่ถูกยิงตกมาศึกษาคงเป็นไปได้ยากในยามสงคราม Wald จึงแนะนำว่า ในเครื่องบินที่รอดกลับมานั้น ตำแหน่งไหนที่ไม่ถูกยิง ปราศจากรอยกระสุนต่างหาก คือบริเวณที่ควรเสริมเกราะ
 
คำแนะนำของ Wald ดูจะค้านกับความรู้สึกอย่างจังว่า บริเวณที่น่าป้องกันมากที่สุด กลายเป็นบริเวณที่ไม่เคยถูกเล็งยิง ส่วนบริเวณที่ถูกยิงจนพรุน ควรปล่อยให้ถูกยิงต่อไป !
 
แต่ปรากฏว่า บริเวณที่ไม่เคยถูกยิงนั้นก็คือแถวเครื่องยนตร์นั่นเอง ซึ่งถ้าคิดให้ดีก็เป็นตรรกะ เพราะ ถ้าเครื่องยนตร์ถูกยิงไหม้ เครื่องบินนั้นก็ต้องตกไปตั้งแต่แรกแล้ว ไม่บินกลับฐานมาให้เห็น และนั่นเป็นเหตุผลว่า ทำไมเครื่องบินที่รอดกลับมาได้ จึงไม่มีรอยกระสุนที่เครื่องยนตร์เลย
 
เคสอันโด่งดังนี้ (ดังจนบางคนเคยเจอในห้องเรียน) เป็นที่มาของคำว่า “survivorship bias” อันมาจากความหมายว่า เครื่องบินที่รอดกลับมาได้ ไม่ใช่แหล่งข้อมูลที่ถูกต้อง เพราะจริงๆแล้ว เราควรวิเคราะห์จากเครื่องบินที่ไม่รอดต่างหาก ไม่ใช่จากเครื่องบินที่รอด
 
หรืออีกนัยหนึ่งคือ เราต้องวิเคราะห์จากข้อมูลที่มองไม่เห็น เพราะข้อมูลที่มองเห็น หามาง่ายนั้น ทำให้เข้าใจผิด
 
และหากเรายังหา “ข้อมูลที่มองไม่เห็น” มาไม่ได้ ก็ต้องประมาณข้อมูลที่มองไม่เห็นนั้น จากข้อมูลที่มองเห็นหรือข้อมูลอยู่ในมือไปก่อน อย่างที่ Wald ดูจากบริเวณที่ไร้รอยกระสุนของเครื่องบินที่รอดกลับมา
 
แต่ถ้าหากไม่รู้จะประมาณอย่างไร ไม่รู้จะหาข้อมูลมาอย่างไร ซึ่งในหลายเคสก็คงทำไม่ได้ หรือไม่คุ้มที่จะทำ ก็ต้องตระหนักเสมอว่า จะฟันธงด้วยความเชื่อมั่น 100% ว่า ข้อสรุปจากภาพที่เห็นคือข้อสรุปที่ถูกต้อง 100% และตัดสินใจทุ่มสุดตัว ไม่ได้
 


ในชีวิตประจำวัน เราพบกับ survivorship bias แบบไม่รู้ตัวอยู่เสมอเพราะไม่รู้ว่านั่นคือการ bias เช่น life coach เล่าถึงเคล็ดลับของคนที่ประสบความสำเร็จที่ร่ำรวยได้มากมาย หรือ หนังสือ management ยกตัวอย่างบริษัทหรือนักบริหารที่ประสบความสำเร็จว่ามีเคล็ดลับอย่างไร หรือเห็นว่า ร้านกาแฟเปิดใหม่แถวนี้ มีลูกค้าเยอะในทันที ทำให้อยากเปิดร้านแถวนี้บ้าง หรือ ใครๆก็ว่าไปเที่ยวที่นี่สนุก ทำให้ต้องไปบ้าง ฯลฯ       
 
นั่นคือ เราวิเคราะห์จากข้อมูลที่เห็น ไม่ว่าจะเป็นเรื่องราวของคนหรือบริษัทที่ประสบความสำเร็จแล้ว หรือ ร้านกาแฟลูกค้าแน่นแล้ว กับสถานที่เที่ยวที่เพื่อนไปมาแล้วว่าดี  แต่เป็นไปได้ว่า ยังมีข้อมูลอีกมากที่มองไม่เห็น เช่น มีอีกหลายคนที่ทำอย่างเดียวกับ “เคล็ดลับ” ที่ guru บรรยายแต่ไม่ประสบความสำเร็จเอาเลย หรือ มีร้านกาแฟที่เคยเปิดมาแล้วเจ๊งเพราะคนจะแค่มาลองร้านเปิดที่ใหม่ หรือ มีหลายคนที่ไปเที่ยวมาแล้วไม่ชอบอย่างหนัก แต่เราไม่รู้จัก หรือไม่อยากพูดถึงมันอีก ไม่คิดจะเขียน review ลงเว็บ 
 
นักพฤติกรรมศาสตร์ Soyer และ Hogarth เขียนไว้ใน Harvard Business Review ว่า “เลิกอ่านเรื่องความสำเร็จของคนได้แล้ว” เพราะคนเหล่านั้นประสบความสำเร็จแล้ว จึงถูกเลือกมาเป็น case study ซึ่งแน่นอนว่าเรื่องราวต้องดูดีประทับใจ ไม่อย่างนั้นคงไม่ถูกเอามาเล่า แต่ยังมีคนอีกมากที่ทำเหมือนกันแต่ล้มเหลวที่ไม่มีใครพูดถึง  
 
Soyer และ Hograth บอกว่า ความสำเร็จเป็น ”เรื่องส่วนตัว ไม่สามารถลอกเลียนแบบกันได้” เป็นเรื่องเฉพาะบุคคล หรือ personal matter การเรียนรู้จากคนที่ประสบความสำเร็จให้แค่ข้อคิดเท่านั้น แต่ไม่ใช่เป็นตัวอย่างที่จะเอาไปทำตาม ดังจะเห็นได้ว่า management guru มักหน้าแตกให้เห็นอยู่เสมอ เช่น หนังสือดัง Insearch for Excellence (1982) ของ Tom Peters กับหนังสือ Good to Great (2001) ของ Jim Collins ที่ครั้งหนึ่งนักเรียน MBA ต้องอ่าน ตอนนี้กลายเป็นเรื่องขำขันไปเสียแล้ว เพราะบริษัทที่เคยว่าดีเลิศในหนังสือเจ๊งไปตามๆกัน จนในสมัยนี้หนังสือ “เปิดเผยเคล็ดลับ” แบบนี้ไม่ค่อยมีใครศรัทธา
 
ที่ถูกแล้ว เราจึงควรให้ความสนใจกับคนที่ล้มเหลวมากกว่า เช่นเดียวกับสนใจเครื่องบินรบที่ถูกยิงตก ว่ายิงตรงไหนทำให้เครื่องบินตก หรือ อะไรที่ทำให้เขาไม่ประสบความสำเร็จ  ถึงจะตรงประเด็น
 
David Mcraney เจ้าของ blog ดัง “You Are Not So Smart” แนะว่า หากต้องการประสบความสำเร็จ เราควรตั้งคำถามว่า “อะไรที่ทำให้ล้มเหลว?” มากกว่าถามว่า “อะไรที่ทำให้ประสบความสำเร็จ?” การหลงประเด็นไปพยายามเลียนแบบคนที่ประสบความสำเร็จนั้นเป็นเรื่องอันตราย เพราะถ้าเป็นเครื่องบินรบ นักบินก็จะเสียชีวิตต่อไปอีกหลายคน หรือ ถ้าเป็นเรื่องเกี่ยวกับตัวเรา เราก็จะล้มเหลวต่อไป    
 
Vanguard บริษัทกองทุนการเงินใหญ่ของโลก บอกว่า surivivorship bias เป็นปัญหาคลาสสิคของนักลงทุนอยู่เรื่อยมา เพราะในการวิเคราะห์ผลตอบแทนของกองทุนประเภทต่างๆ มักนับแค่กองทุนที่กำลังมีอยู่ในตลาด แต่ไม่นับกองทุนที่ขาดทุนจนปิดไปแล้ว ซึ่งถ้ารวมเอากองทุนที่ปิดไป ผลตอบแทนที่ว่าดี อาจไม่ดีเท่าไหร่ อย่างเช่น ตามสถิติบอกว่า มีกองทุนจำนวน 62% ที่ให้ผลตอบแทนสูงกว่าผลตอบแทนเฉลี่ยของตลาด แต่พอรวมเอากองทุนที่ปิดไปแล้ว ความจริงก็คือ มีเพียง 46% เท่านั้น ที่ถือว่า perform
 
Charles Wheelan เล่าไว้ในหนังสือ best seller ของเขา “Naked Statistics” ว่า มีโรงเรียนแห่งหนึ่ง ได้ชื่อว่าการสอนดีมาก เพราะในการเลื่อนชั้นแต่ละปี นักเรียนจะทำเกรดได้ดีขึ้นไปเรื่อยๆ แต่ความจริงมีอยู่ว่า ในแต่ละปีที่เลื่อนชั้นนั้น มีนักเรียนจำนวนไม่น้อยที่สอบตก ถูกคัดออกอยู่ทุกปี ทำให้เหลือแต่นักเรียนที่มีคะแนนดี จนเหลือแต่นักเรียนที่เป็นสุดยอดของ survivor จึงไม่น่าประหลาดใจที่คะแนนจะดีขึ้นทุกปี ซึ่งถ้าเอาจำนวนนักเรียนที่ตกมารวมด้วยแล้ว ผลการสอนไม่ได้น่าประทับใจอะไรเลย  
 
ในยุคของ artificial intelligence AI หรือ machine learning นั้น survivorship bias กลายเป็นประเด็นที่น่าเป็นห่วงพิเศษ เพราะ algorithm มักเอาใจ users โดยสรรหาเฉพาะสิ่งที่อยากเห็นมาให้ และละเลยสิ่งที่ไม่อยากเห็น ทั้งที่อาจเป็นสิ่งที่มีค่าในการวิเคราะห์ ผลคือ เรามีแต่ข้อมูลของ “survivor” หรือข้อมูลด้านเดียว
 
นอกจากนั้น ระบบย่อมจะ process เฉพาะข้อมูลที่มองเห็นได้เท่านั้น อย่างเช่น ในเรื่องของสร้าง model วิเคราะห์พฤติกรรมลูกค้า ข้อมูลที่มองเห็นก็คือจากลูกค้าที่ active เช่น ลูกค้าที่ตอบแบบสอบถาม ลูกค้าที่มีการซื้อขาย แต่ไม่รวมลูกค้าที่ไม่ active ซึ่งความไม่ active อาจมาจากความไม่พอใจในบริการก็ได้ 
 
เมื่อเป็นเช่นนี้ การวิเคราะห์ก็จะวนอยู่แค่คนที่ active หรือ survivor โดยไม่รู้เลยว่า คนที่ไม่พอใจบริการจนเลิกใช้ไปเลยนั้นคิดอะไรอยู่ ทั้งที่จุดอ่อนของธุรกิจน่าจะอยู่ตรงนั้น
 
และนั่นทำให้เกิดความกังวลว่าในยุคของ AI หรือ machine learning เราจะยิ่งหลงทาง ได้คำตอบที่ bias แทนที่จะได้คำตอบที่แท้จริงหรือไม่? เพราะ AI ทำงานบน data ที่มองเห็นเป็นหลัก และถ้าจะใช้ skill ของ AI ในการประมาณ data ที่มองไม่เห็นโดยอาศัย data ที่มองเห็นนั้น สามารถทำได้เพียงใด
 
ซึ่งดูเหมือนว่า บทบาทในการตระหนักถึง data ที่มองไม่เห็นนั้น ก็ยังตกกับมนุษย์อยู่ดี 
About the Author
background จากการศึกษาและทำงานด้าน การเงินการธนาคาร เศรษฐศาสตร์ และ IT เชื่อว่าคนเราสามารถหาความสุขได้ง่ายๆจากความอยากรู้อยากเห็นและความสงสัย นอกจากการอ่านและเขียนแล้ว เขาใช้ชีวิตกับกิจกรรม outdoor หลากหลายชนิด
เรื่องที่เกี่ยวข้อง
พอเข้าเลขสาม คนรอบข้างและสังคมที่อยู่ก็เปลี่ยนไปจากเดิม รวมถึงบทสนทนาในมื้ออาหาร แม้แต่มื้อธรรมดาก็เปลี่ยนไป ทำให้คนรอบข้างที่เคยเป็นเพื่อนหรือคนวัยเดียวกัน ถูกขยายวงกว้างให้เราได้พูดคุยกับคนที่โตกว่า ทั้งในบทบาทการทำงาน
เราจะรู้ได้ยังไงว่า คนไหนที่เป็นบ้านของเรา
คนๆนึงที่เราจะไม่ได้แค่อยากจะใช้เวลาให้ผ่านไปแค่แต่ละวัน หากแต่เฝ้ารอที่จะตื่นมาพบหน้าเขาในทุกๆเช้า