ฉันเห็นกองหน้าคนหนึ่งพลาดโอกาสถึงหกครั้งในการแข่งขัน และทุกคนก็บอกว่าเขาจบแล้ว ประตูที่เขาคาดหวัง (xG) กลับบอกเล่าเรื่องราวที่แตกต่างออกไป เขายิงประตูได้ดีกว่าใครๆ ในลีก สองสัปดาห์ต่อมา เขายิงได้ห้าประตูจากสามเกม
นั่นคือตอนที่ผมตระหนักถึงช่องว่างระหว่างสิ่งที่แฟนๆ ส่วนใหญ่เห็นกับสิ่งที่ตัวเลขแสดงออกมาจริง ๆ นี่คือวิธีที่แฟนๆ ที่ชาญฉลาดใช้คณิตศาสตร์เพื่อทำนายผลงานก่อนที่มันจะปรากฏบนกระดานคะแนน และเหตุผลที่การทดสอบสายตาแบบดั้งเดิมพลาดมากกว่าจับได้
ตัวเลขที่มีความสำคัญ
สถิติผู้เล่นในปัจจุบันนั้นลึกซึ้งกว่าประตูและแอสซิสต์เสียอีก คาดว่าประตูที่ทำได้ (xG) จะวัดคุณภาพการยิงโดยดูจากตำแหน่งที่ยิงและภายใต้แรงกดดัน นั่นหมายความว่ากองหน้าที่มีค่า xG สูงแต่ประตูจริงต่ำ มักจะโชคร้ายมากกว่าแย่
ทีมที่ใช้การวิเคราะห์ขั้นสูงพบว่าการบาดเจ็บร้ายแรง เช่น กล้ามเนื้อต้นขาด้านหลังฉีกขาดและเอ็นไขว้หน้าฉีกขาดลดลงประมาณ 30% การลงทุนด้านการวิเคราะห์มูลค่า 5 ล้านปอนด์ของสโมสรฟุตบอลลิเวอร์พูลสอดคล้องกับการเติบโตของรายได้ 200 ล้านปอนด์ระหว่างปี 2015 ถึง 2022 ซึ่งแสดงให้เห็นว่าการใช้จ่ายด้านข้อมูลสามารถสอดคล้องกับผลลัพธ์ทางธุรกิจได้อย่างไร
สถิติสำคัญที่แฟนพันธุ์แท้ติดตามมีดังต่อไปนี้:
- อัตราความสำเร็จในการผ่านโซนสนามที่แตกต่างกัน
- ความแข็งแรงในการกดวัดจากระยะทางที่เคลื่อนที่ด้วยความเร็วสูง
- การฟื้นตัวของแนวรับแสดงให้เห็นว่าทีมต่างๆ กลับมาอยู่ในสภาพเดิมได้เร็วเพียงใด
- คะแนนจากลูกตั้งเตะแบ่งตามประเภทการส่งลูก
ที่เกี่ยวข้อง อเกวโร่: แฟนบอลแอตเลติโก มาดริด ต้องเรียนรู้ที่จะชื่นชมอัลวาเรซ
การค้นหาขอบผ่านคณิตศาสตร์
เครื่องคำนวณการเก็งกำไร ให้นักพนันที่ชาญฉลาดล็อกกำไรที่รับประกันจากเจ้ามือรับพนันหลายเจ้าเมื่ออัตราต่อรองไม่ตรงกัน การคำนวณนี้ได้ผลเพราะเจ้ามือรับพนันแต่ละเจ้าอาจตั้งราคาการแข่งขันเดียวกันต่างกัน วิธีนี้ทำให้เกิดช่องว่างเล็กๆ ที่การครอบคลุมผลลัพธ์ทั้งหมดยังคงให้ผลกำไร
นั่นคือเหตุผลที่การเข้าใจวิธีคำนวณอัตราต่อรองฟุตบอลจะช่วยให้คุณสังเกตเห็นว่าเจ้ามือรับพนันตั้งราคาผิดพลาดเมื่อใด บางครั้งอัตราต่อรองอาจไม่ตรงกับข้อมูลที่แสดง และนั่นคือที่มาของมูลค่า
แบบจำลองเชิงทำนายพัฒนาไปอีกขั้นด้วยการใช้การเรียนรู้ของเครื่องเพื่อประมวลผลชุดข้อมูลขนาดใหญ่ได้เร็วกว่าที่มนุษย์เคยทำได้ แบบจำลองเหล่านี้วิเคราะห์ประสิทธิภาพในอดีต รายงานอาการบาดเจ็บ ข้อมูลสภาพอากาศ และแม้แต่การพูดคุยบนโซเชียลมีเดียเพื่อคาดการณ์ผลลัพธ์ การแข่งขัน Big Data Bowl ของ NFL ได้ผลักดันการคาดการณ์การเคลื่อนไหวไปข้างหน้าอย่างมาก ตัวชี้วัดก่อนหน้านี้มุ่งเน้นไปที่ผลลัพธ์ เช่น ระยะที่วิ่งได้และอัตราการทำสำเร็จ แต่การสร้างแบบจำลองเส้นทางการเล่นจริงของผู้เล่นได้เปิดมุมมองใหม่โดยสิ้นเชิง
จุดที่แฟนๆ ส่วนใหญ่ทำผิดพลาด
ผมเคยเห็นคนสร้างโมเดลเก๋ๆ ที่มองข้ามบริบทพื้นฐานไป สถิติเกมรับของทีมจะไม่มีความหมายอะไรเลยถ้าผู้เล่นตัวจริงสามคนได้รับบาดเจ็บเมื่อสัปดาห์ที่แล้ว แต่โมเดลกลับถือว่าข้อมูลในอดีตนั้นยังคงมีความสำคัญอยู่
ตัวเลขต้องอาศัยการอ่านอย่างชาญฉลาด ไม่ใช่การเชื่ออย่างงมงาย ปี 2014 เรดซอกซ์ ร่วงจากแชมป์เวิลด์ซีรีส์มาอยู่อันดับสุดท้าย ทั้งๆ ที่สถิติบนกระดาษแข็งแกร่ง โมเดลไม่ได้แสดงให้เห็นถึงเคมี แรงจูงใจ หรือวิธีที่ผู้เล่นรับมือกับแรงกดดันเมื่อถึงเวลาสำคัญ
การทำนายอย่างชาญฉลาดต้องผ่านการตรวจสอบสามขั้นตอน ได้แก่ การเปรียบเทียบกับข้อมูลในอดีต การทดสอบสถานการณ์จำลอง และการขอความเห็นจากผู้เชี่ยวชาญ แบบจำลองบาสเกตบอล NCAA เคยประเมินค่าผู้เชี่ยวชาญฝ่ายรับต่ำเกินไปถึง 21% เนื่องจากให้ความสำคัญกับตัวเลขเกมรุกจากการรวมทีมมากเกินไป นี่แสดงให้เห็นว่าการตรวจสอบความถูกต้องมีความสำคัญมากกว่าความซับซ้อนในแบบจำลองใดๆ ที่คุณสร้างขึ้น
วาง All Together
นักทำนายที่ดีที่สุดจะผสมผสานแบบจำลองทางสถิติเข้ากับการรับรู้ในโลกแห่งความเป็นจริง พวกเขารู้ว่าเมื่อใดควรเชื่อถือตัวเลข และเมื่อใดที่บริบทสำคัญกว่าข้อมูลอย่างสิ้นเชิง ทีมอาจมีสถิติการแข่งขันที่ย่ำแย่ แต่ถ้าพวกเขาไล่โค้ชออก ตัวเลขเก่าๆ เหล่านั้นก็บอกเล่าเรื่องราวที่ไม่สมบูรณ์ นี่คือเหตุผลที่การทำตามแบบจำลองอย่างงมงายโดยไม่เข้าใจสถานการณ์เบื้องหลังข้อมูลจึงนำไปสู่การคาดการณ์ที่ผิดพลาด
เครื่องมือสมัยใหม่อย่างแผนที่ความร้อนแบบเรียลไทม์และแผนภูมิการเคลื่อนไหว ช่วยให้เข้าใจข้อมูลที่ซับซ้อนได้ง่ายเพื่อการตัดสินใจที่รวดเร็ว ระบบของ Miami Heat ใช้การเปลี่ยนสีเพื่อแสดงประสิทธิภาพของผู้เล่นในรูปแบบที่โค้ชเข้าใจได้ทันทีระหว่างการแข่งขัน ความเร็วนี้มีความสำคัญเพราะคุณไม่สามารถหยุดการเล่นเพื่อคำนวณได้ ดังนั้นการแสดงภาพจึงเปลี่ยนตัวเลขดิบให้เป็นข้อมูลเชิงลึกที่ส่งผลต่อการตัดสินใจได้อย่างแท้จริง


