มหัศจรรย์เหรียญกับข้อมูล

เหรียญเป็นสิ่งที่มนุษย์สร้างขึ้นมา มันอยู่ในทุกๆ ที่เพื่อใช้ในการซื้อขายสินค้าและมันอาจจะอยู่ในกระเป๋าของใครหลายๆคนในตอนนี้ เมื่อเราหยิบมันขึ้นมาดูเราอาจจะเห็นมันด้านหัวหรือก้อยด้วยโอกาสเท่าๆ กัน 

โลกปัจจุบันนี้มนุษย์พยายามเก็บรวบรวมข้อมูลเพื่อตอบคำถามที่ตัวเองอยากรู้ เหรียญอาจจะเป็นเครื่องมือสำหรับใช้ในการอธิบายข้อมูล บทความนี้จะเปิดเผยความเชื่อมโยงระหว่างสองสิ่งนี้

จำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาหนึ่ง เช่น จำนวนระดับการเปลี่ยนแปลงของอัตราแลกเปลี่ยนเงินตรา จำนวนผู้ทำผิดกฎหมายยาเสพติด เป็นต้น อาจจะเทียบได้กับจำนวนหงายหัวเมื่อโยนเหรียญจำนวนมหาศาลครั้งในช่วงเวลาหนึ่ง เพราะฉะนั้นจำนวนเหตุการณ์ (หงายหัว) ในช่วงเวลาหนึ่งที่เป็นไปได้คือ 0, 1, 2, 3, … 

เพื่อความเข้าใจที่มากขึ้น เราจะทดลองโยนเหรียญที่มีโอกาสเกิดหัวน้อยกว่าเกิดก้อย ที่แตกต่างกัน 3 รูปแบบ การทดลองจะโยนเหรียญจำนวนมหาศาลครั้งในช่วงเวลาหนึ่งและทำซ้ำเป็นจำนวนมหาศาลครั้ง ผลลัพธ์แสดงดังภาพด้านล่าง

รูปที่ 1 สร้างจากการโยนเหรียญเพียงเหรียญเดียว หมายถึงการโยนเหรียญเพื่อให้เกิดหัวครั้งที่ 1, 2, 3 และครั้งอื่นๆ จะใช้เหรียญเดิม สิ่งที่เห็นได้จากการทดลองนี้จำนวนการเกิดหัวสองครั้งมีจำนวนมากที่สุด (แท่งเลขสองสูงสุดเมื่อเทียบกับแท่งอื่น) 

รูปที่ 2 สร้างจากการโยนเหรียญสองเหรียญที่แตกต่างกัน เหรียญแรกมีโอกาสเกิดหัวน้อยกว่าเหรียญที่สอง เหรียญที่สองจะถูกใช้เมื่อเกิดหัวแล้วหนึ่งครั้งและหลังจากเกิดหัวแล้วสองครั้งจะใช้เหรียญแรกตลอดไป การทดลองนี้จำนวนการเกิดหัวสองครั้งมากกว่าการทดลองแรก (แท่งเลขสองรูปนี้สูงกว่ารูปแรก)

รูปที่ 3 สร้างจากสองเหรียญเช่นเดียวกับรูปที่ 2 แต่เหรียญแรกมีโอกาสเกิดหัวมากกว่าเหรียญที่สอง เหรียญที่สองจะถูกใช้เมื่อเกิดหัวแล้วสองครั้งและหลังจากเกิดหัวแล้วสามครั้งจะใช้เหรียญแรกตลอดไป จะเห็นว่าการทดลองนี้จำนวนการเกิดหัวสองครั้งมีมากกว่ารูปที่ 2

อาจมีใครสักคนถามว่าจะมีข้อมูลจำนวนการเกิดเหตุการณ์ในโลกของความเป็นจริงที่มีรูปลักษณะที่เข้ากันได้กับรูปใดรูปหนึ่งในสามรูปนี้ไหม ข้อมูลด้านล่างอาจจะตอบคำถามนี้

รูปที่ 4 คือข้อมูลจำนวนบุตรของผู้หญิงกลุ่มหนึ่งในประเทศเยอรมัน (Winkelmann (1995), McShane et al. (2008), Skulpakdee and Hunkrajok (2022), Hunkrajok and Skulpakdee (2024)) เราจะสังเกตได้ว่ารูปนี้คล้ายกับรูปที่ 3 มาก ดังนั้นเราอาจจะอธิบายพฤติกรรมของผู้หญิงกลุ่มนี้ได้ว่า ทำไมจำนวนผู้หญิงที่มีลูก 2 คนมีมากที่สุด (แท่งเลขสองสูงอย่างมีนัย) เพราะว่าผู้หญิงกลุ่มนี้ไม่อยากมีลูกคนที่สาม (เหรียญที่ใช้ในการสร้างเหตุการณ์ที่สามมีความน่าจะเป็นในการเกิดหัวน้อยกว่าเหรียญแรก) เนื่องจากรูปที่ 4 เข้ากันได้ไม่ดีกับรูปที่ 2 ดังนั้นเราไม่ควรแปลความหมายข้อมูลจำนวนบุตรนี้ว่าแท่งเลขสองสูง เนื่องจากผู้หญิงกลุ่มนี้อยากมีลูกคนที่สองมากกว่าลูกคนอื่น 

เหรียญเป็นเครื่องมือที่อัศจรรย์มากในการวิเคราะห์ข้อมูลและมันก็คงถูกใช้ในงานด้านนี้ไปอีกนานแสนนาน

เอกสารอ้างอิง

  • Winkelmann R (1995) Duration dependence and dispersion in count-data models. J Bus Econ Stat 13(4):467–474. https://www.jstor.org/stable/1392392
  • McShane B, Adrian M, Bradlow ET et al (2008) Count models based on Weibull interarrival times. J Bus
  • Econ Stat 26(3):369–378. https://www.jstor.org/stable/27638995
  • Skulpakdee W, Hunkrajok M (2022) Unusual-event processes for count data. SORT Stat Oper Res Trans 46(1):39–66. https://doi.org/10.2436/20.8080.02.117
  • Hunkrajok M, Skulpakdee W (2024) A simple algorithm for computing the probabilities of count models based on pure birth processes. Comput Stat 1-24. https://doi.org/10.1007/s00180-024-01491-4

ผศ. ดร. วรรณฤดี สกุลภักดี
สาขาวิชาสถิติศาสตร์
สาขาวิชาพลเมืองวิทยาการข้อมูล
สาขาวิชาวิทยาการประกันภัยและการบริหารความเสี่ยง
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์