ผมนั่งอ่านงานวิจัยที่มีการแชร์ไว้ใน Research Gate โดยปกติแล้ว ถ้าหากมีงานวิจัยที่ตรงกับในสาขาที่เราสนใจ ทาง Research gate ก็มักจะ push มาให้เห็นในเวบ หรือในแอพเสมอ แต่ผมต้องมาสะดุด กับมีงานวิจัยชิ้นหนึ่งตีพิมพ์ในวารสาร Scientific Reports ปี 2025 ชื่อยาวเหยียดว่า “Investigating the increase in the specialized performance of athletes using artificial neural network (ANN) exercises” ฟังดูน่าตื่นเต้นใช่ไหมครับ เอา AI มาทำนายว่าถ้าเทรนคอร์ (core) ให้นักแบดมินตันระดับชาติแล้ว ความคล่องตัว แรงกระโดด และสุขภาพจิตจะดีขึ้นแค่ไหน แถมโมเดลยังบอกว่าทำนายได้ “แม่นยำคลาดเคลื่อนน้อยกว่า 1%”
ตัวเลขนี้สวยจนน่าอิจฉา ใครเห็นก็อยากแชร์ อยากเอาไปอ้างอิงในในบทความหรือข้อเสนอโครงการวิจัย
แต่พอผมเปิดอ่านจริง ๆ ตั้งแต่หน้าแรกถึงหน้าสุดท้าย กลับรู้สึกเหมือนกำลังดูหนังสืบสวนที่เรารู้ตั้งแต่ฉากเปิดว่าใครเป็นคนร้าย เพราะมีจุดที่น่าสนใจเยอะมาก งานชิ้นนี้เลยกลายเป็นกรณีศึกษาชั้นดีว่า ในยุคที่ “AI” กลายเป็นคำขลังที่แปะอะไรก็ดูน่าเชื่อถือ เราจะอ่านงานวิจัยกลุ่มนี้อย่างไรไม่ให้โดนหลอก และที่สำคัญกว่านั้น ถ้าเราอยากทำให้มันถูกต้องจริง ๆ ต้องทำอย่างไร จากนั้นลองเอาชื่อของผู้แต่งงานวิจัยนี้ไป Search ดูก็พบว่ามีงานวิจัยลักษณะเดียวกันอีก
แต่ชื่อเรื่องคนละเรื่อง ตีพิมพ์คนละวารสาร คนละปี ฟังดูเป็นสามเรื่องที่ไม่เกี่ยวกัน
แต่พอเปิดอ่าน คุณพบว่าทั้งสามแฟ้มมี Footprint เดียวกัน ตารางข้อมูลหน้าตาเหมือนกัน วิธีการเหมือนกัน แม้แต่ “หลักฐานปลอม” ก็ปลอมแบบเดียวกัน และที่น่าขนลุกที่สุด สองในสามแฟ้มถูกประทับตราสีแดงทับหน้าว่า RETRACTED (ถูกถอดถอน) นี่คือสิ่งที่เกิดขึ้นจริงกับงานวิจัยชุดหนึ่งที่อ้างว่าใช้ AI พัฒนานักแบดมินตัน ผมจะลองพาทุกท่านอ่านกันไปพร้อมๆกัน และระหว่างทาง เราจะได้เรียนรู้ว่า ANN (ปัญญาประดิษฐ์แบบโครงข่ายประสาทเทียม) จริง ๆ แล้วทำงานยังไง ทำไมมันถึงถูกใช้หลอกได้ง่าย และที่สำคัญที่สุด ถ้าเราอยากเอามันมาพัฒนานักกีฬาให้ถูกต้องจริง ๆ ต้องทำอย่างไร
ANN คืออะไร
ก่อนอื่นเราต้องรู้จักตัวละครเอกก่อน นั่นคือ ANN ย่อมาจาก Artificial Neural Network หรือ “โครงข่ายประสาทเทียม”
ลองนึกถึงเด็กฝึกงานคนหนึ่งที่ไม่รู้อะไรเลยเกี่ยวกับกีฬา หน้าที่ของเขาคือ “เดา” ว่าถ้านักกีฬาเทรนคอร์มากขึ้น ความคล่องตัวจะดีขึ้นแค่ไหน วันแรกเขาเดามั่ว ๆ ผิดบ้างถูกบ้าง แต่ทุกครั้งที่เดาผิด มีคนคอยบอกว่า “ผิดไปเท่าไหร่” เขาก็ค่อย ๆ ปรับวิธีเดาให้แม่นขึ้นเรื่อย ๆ ทำซ้ำเป็นพัน ๆ รอบ จนสุดท้ายเดาได้ใกล้เคียงความจริง
ANN ก็คือเด็กฝึกงานคนนั้น เพียงแต่เป็นโปรแกรมคอมพิวเตอร์ มันมีโครงสร้างเป็น “ชั้น” สามชั้น:
ชั้นรับข้อมูล (input) เปรียบเหมือนหูตาของเด็กฝึกงาน รับตัวเลขเข้ามา เช่น “ความแข็งแรงคอร์ = 80%”
ชั้นซ่อน (hidden layer) คือสมองที่ประมวลผล ตรงนี้คือที่ที่ “การเรียนรู้” เกิดขึ้น มันปรับค่าน้ำหนัก (weights) ของการเชื่อมต่อแต่ละเส้นไปเรื่อย ๆ เพื่อจับความสัมพันธ์ที่ซับซ้อน
ชั้นให้คำตอบ (output) คือปากที่พูดผลลัพธ์ออกมา เช่น “ความคล่องตัว = 85%”
กระบวนการ “ฝึก” เด็กคนนี้เรียกว่า training โดยป้อนข้อมูลที่เรารู้คำตอบอยู่แล้วให้มันดู แล้วให้มันปรับตัวจนเดาได้แม่น เทคนิคยอดนิยมที่ใช้บอกเด็กว่า “ผิดไปทางไหน” เรียกว่า backpropagation (การส่งสัญญาณความผิดพลาดย้อนกลับ)
จุดสำคัญที่ต้องจำให้ขึ้นใจ ANN เก่งเรื่องการจับ “ความสัมพันธ์ที่ซับซ้อนและไม่เป็นเส้นตรง” เช่น ความสัมพันธ์ที่ว่าเทรนน้อยไปก็ไม่ดี เทรนมากไปก็บาดเจ็บ มีจุดเหมาะสมตรงกลาง พวกนี้แหละที่ ANN เปล่งประกาย แต่มันต้องการ ข้อมูลจำนวนมาก เพื่อเรียนรู้ เหมือนเด็กฝึกงานต้องเห็นเคสเยอะ ๆ ถึงจะเก่ง ถ้าให้ดูแค่ไม่กี่เคส มันจะ “ท่องจำ” แทนที่จะ “เข้าใจ”
จำหลักการนี้ไว้ให้ดี เพราะมันคือกุญแจไขคดีทั้งหมด
เมื่อ “ข้อมูลทดลอง” ไม่มีนักกีฬาอยู่จริง
ทีนี้มาดูงานแรก งานตีพิมพ์ในวารสาร Scientific Reports ปี 2025 ชื่อ “Investigating the increase in the specialized performance of athletes using artificial neural network (ANN) exercises” อ้างว่าศึกษานักแบดมินตันระดับชาติ ใช้ ANN ทำนายว่าเทรนคอร์แล้วความคล่องตัว แรงกระโดด และสุขภาพจิตจะดีขึ้นแค่ไหน แม่นยำคลาดเคลื่อนน้อยกว่า 1%
หัวใจของงานคือ “ตารางที่ 1” ซึ่งหน้าตาแบบนี้:
| เคส | Core stability (%) | Core power (%) | Agility (%) | Jump height (%) | Mental well-being (%) |
|
1 |
12 | 15 | 11 | 14 | 13 |
|
2 |
16 | 19 | 15 | 18 |
17 |
|
3 |
20 | 23 | 19 | 22 |
21 |
|
4 |
24 | 27 | 23 | 26 |
25 |
| 5 | 28 | 31 | 27 | 30 |
29 |
จ้องสัก 10 วินาที จะเห็นความผิดปกติ ทุกตัวเลขเพิ่มทีละ 4 เป๊ะ ๆ เป็นเส้นตรงสมบูรณ์แบบ Linear ไม่มีนักกีฬาคนไหนทำได้ดีกว่าหรือแย่กว่าที่ “ควร” เลย ร่างกายมนุษย์จริง ๆ ไม่มีทางเรียงสวยขนาดนี้ มันต้องมีความผันผวน มีวันดีวันร้าย
และผู้เขียนก็ยอมรับเองในวิธีวิจัยว่า ตัวเลขเหล่านี้ “ได้มาจากการทบทวนวรรณกรรม” ไม่ใช่จากการวัดนักกีฬา แปลว่า ไม่มีนักแบดมินตันคนไหนถูกเทรน ถูกวัด หรือตอบแบบสอบถามจริง ทั้งที่บทคัดย่อเล่าราวกับมีโครงการเทรน 12 สัปดาห์เต็มรูปแบบ
จำได้ไหมว่า ANN ต้องการข้อมูลจำนวนมาก แต่งานนี้มีแค่ 5 จุด ที่อยู่บนเส้นตรง การเอา ANN มาเรียนรู้ 5 จุดบนเส้นตรง แล้วทดสอบกับ 5 จุดเดิม มันก็เหมือนให้เด็กฝึกงานท่องข้อสอบ 5 ข้อ แล้วเอาข้อสอบ 5 ข้อเดิมมาให้สอบ ได้เต็มแน่นอน แต่ไม่ได้พิสูจน์ว่ามันเข้าใจอะไรเลย “ความแม่น 99%” จึงไม่มีความหมาย เพราะมันแม่นกับสิ่งที่มันท่องจำมา ไม่ใช่กับนักกีฬาจริงคนใหม่
แถมในงานยังเขียนเองว่า คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ R² (ค่าที่บอกว่าโมเดลอธิบายข้อมูลได้ดีแค่ไหน) ไม่ได้ เพราะข้อมูลน้อยเกินไป ยอมรับเองว่าข้อมูลไม่พอ แต่ก็ยังเคลมว่าแม่น

#image_titleกราฟรูปที่ 15b ในงานแบดมินตัน อยู่ดี ๆ แกนตั้งเขียนว่า “Reduction in Education Costs” (การลดต้นทุนการศึกษา) และแกนนอนเขียนว่า “Virtual Reality (VR)” VR กับต้นทุนการศึกษามาทำอะไรในงานเทรนคอร์นักแบด? นี่คือกราฟจากงานคนละเรื่องที่หลุดติดมา
ย่อหน้ากลางส่วนผลการศึกษา จู่ ๆ ก็มีประโยคเรื่องระบบพลังงานร่วม CCHP, การสร้างกระดูกด้วยไบโอนาโนคอมโพสิต, โครงสร้างกระดูกพรุนไทเทเนียม 3 มิติ, เซรามิกเสริมอนุภาคนาโน เนื้อหาวัสดุศาสตร์ล้วน ๆ ที่ไม่เกี่ยวกับกีฬา

และตัวเลขประหลาดที่สุด: งานเขียนว่าวิธีที่เสนอ “แม่นยำ 97.6%” แต่ในประโยคเดียวกันบอกว่ามี “ค่าคลาดเคลื่อนสูงสุด 36.12%” สองตัวเลขนี้ขัดกันเอง และดันไปตรงกับงานอ้างอิงชิ้นที่ 52 พอดี เก็บปมนี้ไว้ก่อน เดี๋ยวเรากลับมา
เปเปอร์แฝด
ทีนี้คือจุดพลิกของคดี เมื่อเราเปิดแฟ้มที่สอง
งานตีพิมพ์ในวารสาร Heliyon ปี 2024 ชื่อ “Maximizing the performance of badminton athletes through core strength training: Unlocking their full potential using machine learning (ML) modeling” เขียนโดย Shuzhen Ma คนเดิม (อีเมลเดียวกันเป๊ะ: msz20210607@126.com)
มันคือ เรื่องเดียวกันเป๊ะ core training พัฒนานักแบดมินตันด้วย ANN เพียงเปลี่ยนคำว่า “ANN” เป็น “ML” ในชื่อเรื่อง และมี Table 1 หน้าตาแบบนี้:
| เคส | Core Strength Training | Performance | Stability | Agility | Power |
|
1 |
80% | 90% | 70% | 80% | 90% |
|
2 |
70% | 80% | 60% | 70% |
80% |
|
3 |
90% |
90% |
80% | 90% |
80% |
| 4 | 60% | 70% | 70% | 60% |
70% |
| 5 | 80% | 80% | 90% | 70% |
80% |
ตัวเลขกลม ๆ ลงท้ายด้วย 0 ทุกตัว มีแค่ 5 เคสเหมือนเดิม โครงสร้าง ANN เหมือนเดิม (hidden layer 5 neurons, 2 input, 3 output) วิธี validate ด้วย linear regression เหมือนเดิม และ เดาถูกไหมครับ ข้อมูล “มาจากการทบทวนวรรณกรรม” เหมือนเดิม ที่หนักไปกว่านั้นคือ งานนี้ประกาศว่าทำ “validation อย่างเข้มงวด” มีการแบ่งข้อมูล train/validation/test, ทำ k-fold cross-validation, คำนวณ R², RMSE, MAE ครบ แต่ทั้งหมดนี้ทำกับข้อมูลสังเคราะห์แค่ 5 จุด การแบ่ง 5 จุดเป็น train 80% test 20% หมายความว่าเหลือข้อมูลทดสอบ 1 จุด การทำ cross-validation กับข้อมูล 5 จุดเป็นเรื่องที่ไม่มีความหมายทางสถิติเลย เป็นการสวมเสื้อคลุมของกระบวนการที่ถูกต้องครอบบนความว่างเปล่า
แม้แต่กราฟ regression ในงานยังฟ้องตัวเอง ค่า R สำหรับ Power อยู่ที่ 0.65844 ซึ่งต่ำมาก (แปลว่าทำนายแทบไม่ได้) แต่บทสรุปกลับเขียนว่าโมเดล “แม่นยำสูง คลาดเคลื่อนน้อยกว่า 1-2%”
บันทึกของบรรณาธิการที่ตลกร้ายที่สุด
ทุกคดีต้องมีหลักฐานชิ้นที่ทำให้ทุกอย่างกระจ่าง และในคดีนี้คือ “Editorial Note” ที่วารสาร Heliyon ออกตามมาในเดือนพฤศจิกายน 2024
บรรณาธิการระบุว่าต้องแก้ “ข้อผิดพลาดเล็กน้อยสองจุด” ในงาน หนึ่งในนั้นคือ วิธีวิจัยเขียนว่า “ข้อมูลรวบรวมจากการทบทวนวรรณกรรมบทความที่ตีพิมพ์ระหว่างปี 2024 ถึง 2045”
ปี 2045 ครับ งานวิจัยที่อ้างอิงบทความจากอนาคตอีก 20 ข้างหน้า นี่ไม่ใช่ “ข้อผิดพลาดเล็กน้อย” แต่เป็นสัญญาณว่าไม่มีใคร ไม่ว่าผู้เขียน ผู้ตรวจ หรือบรรณาธิการ อ่านวิธีวิจัยอย่างจริงจังก่อนตีพิมพ์ บรรณาธิการจึงแก้เป็น “2019 ถึง 2023”
และจุดที่สอง บรรณาธิการพยายามแก้ชื่อผู้เขียนร่วมจาก “Shicheng Guo” เป็น “Shicheng Gu” โดยระบุว่า ติดต่อผู้เขียนเพื่อขอคำชี้แจงแล้วแต่ไม่ได้รับการตอบกลับ แก้ชื่อคนทั้งที่เจ้าตัวไม่ตอบ และสุดท้ายงานก็ถูก retract ทั้งฉบับอยู่ดี
เมื่อนำสองแฟ้มมาวางคู่กัน ภาพก็ชัด: นี่ไม่ใช่นักวิจัยที่พลาดโดยบังเอิญ แต่คือการ หมุนเวียนเนื้อหาเดิมข้ามวารสาร เปลี่ยนตัวเลขนิดหน่อย เปลี่ยนชื่อวารสาร แล้วส่งใหม่ พฤติกรรมที่วงการเรียกว่า “salami slicing” หรือการหั่นไส้กรอกชิ้นเดิมขายหลายรอบ
เมื่องานที่ตายแล้วยังหลอกหลอนงานเป็น
ยังจำปม “97.6% / 36.12%” ที่ผมให้เก็บไว้ได้ไหมครับ
ตัวเลขคู่นี้ในเปเปอร์ Scientific Reports ถูกลอกมาจากงานอ้างอิงชิ้นที่ 52 Zhao และคณะ “Designing a prediction model for athlete’s sports performance using neural network” ตีพิมพ์ใน Soft Computing ปี 2023
และเมื่อเราตามไปดูสถานะปัจจุบันของงานชิ้นนี้ มันก็ถูกประทับ RETRACTED ARTICLE ทุกหน้าเช่นกัน
งานชิ้นนี้มีอาการเดียวกันเป๊ะ: บทคัดย่อเคลมว่า “เหนือกว่า ความแม่นยำ 97.6%” แต่เนื้อในกลับเขียนตรงข้ามว่า วิธีที่เสนอ “มีค่าคลาดเคลื่อน สูงกว่า” คู่แข่งทุก ๆ จุด และตัวเลข “36.12%” ที่ถูกยกมาเป็นจุดขายนั้น แท้จริงคือค่าคลาดเคลื่อนที่ แย่มาก ในงานพยากรณ์ การที่ทั้งสองเปเปอร์หยิบ “36.12%” มาเชิดชูเหมือนความสำเร็จ พิสูจน์ว่าผู้เขียนลอกตัวเลขมาโดยไม่เข้าใจว่ามันแปลว่าอะไร
นี่คือปรากฏการณ์ที่เรียกว่า “การปนเปื้อนของห่วงโซ่การอ้างอิง” (citation contamination) งานที่ถูกถอดถอนไปแล้ว ไม่ได้หายไปเฉย ๆ มันยังถูกอ้างต่อในงานใหม่ ราวกับผีที่ยังเดินได้ ผู้อ่านงานใหม่ไม่มีทางรู้ว่ากำลังยืนอยู่บนรากฐานที่เน่าไปแล้ว ที่น่ากังวลคืองาน Soft Computing ชิ้นนี้ ยังคงถูกอ้างในงานปี 2024–2025 อีกหลายชิ้น รวมถึงงานที่ตีพิมพ์ในวารสารที่มีชื่อเสียง โดยผู้เขียนอาจไม่รู้ว่ามันถูก retract ไปแล้ว
ตอนนี้: เรามีงานอย่างน้อยสามชิ้นที่เกี่ยวพันกัน สองชิ้นเป็นเรื่องเดียวกันจากผู้เขียนคนเดียว อีกชิ้นเป็นแหล่งตัวเลขที่ถูกลอกต่อ และ ทั้งสามชิ้นถูกถอดถอน
ทำไมเรื่องแบบนี้ถึงเกิดขึ้นได้ โรงงานผลิตเปเปอร์ในยุคคลั่งไคล้การตีพิมพ์
มาถึงจุดนี้ คำถามที่ควรถามไม่ใช่ “ใครผิด” แต่เป็น “ทำไมระบบถึงปล่อยให้สิ่งนี้ผ่านมาได้” และคำตอบนำเราไปสู่ปรากฏการณ์ที่ใหญ่กว่าตัวบุคคลมาก paper mill หรือโรงงานผลิตเปเปอร์
paper mill คือธุรกิจที่ผลิตต้นฉบับงานวิจัยเกี่ยวกับการศึกษาที่ไม่เคยเกิดขึ้นจริง ขายตำแหน่งผู้เขียน แล้วส่งไปยังวารสารแทนลูกค้า บ่อยครั้งส่งหลายวารสารพร้อมกัน เมื่อโรงงานรู้ว่าวารสารไหนมีแนวโน้มรับงานปลอม ก็จะเพิ่มการส่งไปยังวารสารนั้น และคอยอ้างอิงงานที่ตีพิมพ์ไปแล้วในงานปลอมชิ้นใหม่ ๆ เพื่อสร้างเครือข่ายการอ้างอิงปลอมขึ้นมา ซึ่งอธิบายได้พอดีว่าทำไมงานที่ตายแล้วถึงยังถูกอ้างต่อเป็นวงจร
ขนาดของปัญหานี้น่าตกใจ มีการประเมินว่า บทความอย่างน้อย 400,000 ชิ้นที่ตีพิมพ์ระหว่างปี 2000–2022 มีลักษณะของงานที่ผลิตจาก paper mill จากการวิเคราะห์การถอดถอนงานวิจัย 46,000 ชิ้นช่วงปี 1997–2026 พบว่า สถาบันในจีนปรากฏในกว่า 52% ของงานที่ถูกถอดถอน ทั้งที่จีนผลิตงานวิจัยเพียง 16.5% ของทั้งโลกในช่วงเวลานั้น และงานศึกษาปี 2026 ประเมินว่าราว 36% ของผลงานจากจีนเข้าข่ายต้องสงสัยว่ามาจาก paper mill ตามมาด้วยอิหร่าน 20% ซาอุดีอาระเบีย 16% และอียิปต์ 15%
ต้นตอของปรากฏการณ์นี้เชื่อมโยงกับแรงกดดันที่เรียกว่า “publish or perish” (ตีพิมพ์ไม่ได้ก็ตกงาน) ที่หนักหน่วงเป็นพิเศษในจีน โดยเฉพาะกับแพทย์และพยาบาล ที่ถูกบังคับให้ตีพิมพ์งานวิจัยเพื่อเลื่อนตำแหน่ง ทั้งที่งานวิจัยไม่ใช่ส่วนหลักของหน้าที่พวกเขาเลย เมื่อความก้าวหน้าในอาชีพผูกกับจำนวนเปเปอร์ ไม่ใช่คุณภาพของความรู้ ตลาดของการซื้อขายงานวิจัยปลอมจึงเฟื่องฟู มูลค่าตลาดงานเขียนแทนในจีนเมื่อปี 2011 ถูกประเมินไว้สูงกว่า 4.4 ล้านดอลลาร์สหรัฐ และนั่นคือเมื่อสิบกว่าปีที่แล้ว
ที่หนักขึ้นในยุคนี้คือ AI ช่วยให้การผลิตงานปลอมง่ายและเร็วขึ้นมาก การศึกษาปี 2026 ประเมินด้วยการวิเคราะห์ด้วย machine learning ว่า ราว 10% ของวรรณกรรมวิจัยมะเร็งที่ตีพิมพ์เร็ว ๆ นี้อาจเป็นผลผลิตของ paper mill และพุ่งสูงถึง 20-22% ในมะเร็งบางชนิด เมื่อ AI เขียนข้อความได้ ปลอมรูปได้ สร้างตารางข้อมูลได้ ภาระจึงตกอยู่ที่ระบบ peer review และบรรณาธิการที่วิ่งตามไม่ทัน
นี่คือบริบทที่อธิบายว่าทำไมเปเปอร์ที่อ้างอิงงานปี 2045 ถึงผ่าน peer review มาได้ ทำไมตารางตัวเลขเส้นตรงเป๊ะถึงถูกตีพิมพ์ในวารสารที่มี impact factor และทำไมเรื่องเดียวกันถึงตีพิมพ์ซ้ำได้สองวารสาร เพราะระบบทั้งระบบกำลังเผชิญกับคลื่นการผลิตงานปลอมที่ถาโถมเข้ามาเร็วกว่าที่กลไกตรวจสอบจะรับมือไหว
ข่าวดีคือ เราไม่ต้องเป็นผู้เชี่ยวชาญ AI ขอแค่ถามคำถามพื้นฐานเหล่านี้:
ข้อแรก ข้อมูลมาจากไหน? ถ้าตอบไม่ได้ว่าใครถูกวัด กี่คน วัดยังไง เมื่อไหร่ ที่เหลือไม่ต้องอ่าน “ข้อมูลจากการทบทวนวรรณกรรม” ที่ถูกใส่ลงตารางเป็นตัวเลขดิบ คือธงแดงผืนใหญ่
ข้อสอง ตัวเลขดูเป็นมนุษย์ไหม? ข้อมูลชีวภาพจริงต้องมีความผันผวน ถ้าเรียงเป็นเส้นตรงเป๊ะหรือลงท้ายด้วยศูนย์ทุกตัว ให้สงสัย
ข้อสาม ขนาดตัวอย่างพอกับเครื่องมือไหม? ANN ที่จริงจังต้องการข้อมูลหลักร้อยถึงพัน ถ้าเทรนด้วย 5 จุดแล้วเคลมว่าทำ cross-validation นั่นคือพิธีกรรมที่ว่างเปล่า
ข้อสี่ “แม่น 99%” แม่นกับอะไร? ถ้าทดสอบกับข้อมูลชุดเดิมที่ใช้เทรน ความแม่นนั้นไร้ค่า ต้องดูผลกับข้อมูลใหม่ที่โมเดลไม่เคยเห็น
ข้อห้า ค้นชื่อผู้เขียนและสถานะงาน ลองเอาชื่อเปเปอร์ไปค้นใน Google Scholar หรือ Retraction Watch Database ถ้าเจอคำว่า RETRACTED หรือ Editorial Note ให้ระวัง และดูด้วยว่าผู้เขียนเคยตีพิมพ์เรื่องคล้ายกันซ้ำในหลายที่หรือไม่
ข้อหก ตามรอย reference สำคัญ ตัวเลขเด่น ๆ ในงานลอกมาจากไหน งานต้นทางยังมีชีวิตอยู่ไหม การอ้างงานที่ถูกถอดถอนคือสัญญาณว่าผู้เขียนไม่ได้ตรวจสอบแหล่งของตัวเอง
แล้วถ้าเราอยากทำ “AI พัฒนานักกีฬา” ให้ถูกต้องจริง ๆ ล่ะ?
“ควรทำอย่างไร” และนี่คือโจทย์ที่วิทยาศาสตร์การกีฬาบ้านเรากำลังเดินเข้าไปหาจริง ๆ
ที่สำคัญคือต้องเข้าใจว่า แนวคิดตั้งต้นของงานพวกนี้ไม่ได้ผิด core training สัมพันธ์กับความคล่องตัว แรงกระโดด และสมรรถภาพ เป็นสมมติฐานที่มีหลักฐานสนับสนุนจริง ปัญหาอยู่ที่ “วิธีพิสูจน์” ล้วน ๆ ถ้าจะทำให้คมจริง นี่คือเส้นทาง:
เก็บข้อมูลจากนักกีฬาจริง ด้วยเครื่องมือที่วัดได้ แทนที่จะหยิบตัวเลขจากการอ่านงานคนอื่น ให้วัดของจริง — core stability วัดด้วย Y-Balance Test หรือ trunk endurance test, core power วัดด้วย medicine ball throw หรือเซนเซอร์ IMU, agility ใช้ T-test หรือ 505 agility test, jump height ใช้ force plate หรือ jump mat ทุกตัวเลขต้องตามรอยกลับไปหาคนจริงและเครื่องมือจริงได้
ออกแบบวิธีวิจัยให้เห็นเหตุและผล ถ้าอยากรู้ว่าการเทรนคอร์ “ทำให้” ดีขึ้นจริงไหม ต้องใช้การทดลองที่มีกลุ่มควบคุม (RCT) มีการสุ่ม วัดก่อน-หลัง เทียบกับกลุ่มที่ไม่ได้เทรน ไม่ใช่แค่ดูความสัมพันธ์ในจุดเวลาเดียว
เลือกเครื่องมือสถิติให้เหมาะกับขนาดข้อมูล นี่คือบทเรียนใหญ่ที่สุดจากคดีนี้ ถ้ามีตัวอย่างไม่กี่สิบคน อย่าฝืนใช้ ANN สถิติพื้นฐานอย่าง multiple regression, mixed-model ANOVA หรือ correlation ที่รายงาน effect size พร้อม confidence interval ให้คำตอบที่ซื่อสัตย์และตีความได้มากกว่ามาก ANN จะเริ่มมีเหตุผลก็ต่อเมื่อมีข้อมูลหลักร้อยขึ้นไป และความสัมพันธ์ซับซ้อนไม่เป็นเส้นตรงจริง ๆ การใช้เครื่องมือซับซ้อนกับปัญหาง่าย ๆ ไม่ได้ทำให้งานดูฉลาดขึ้น มันทำให้งานดูน่าสงสัย
ถ้าจะใช้ Machine Learning จริง ต้องเล่นตามกติกา แบ่งข้อมูล train/validation/test ให้ชัดและมากพอ, ทดสอบกับข้อมูลที่โมเดลไม่เคยเห็น, เทียบกับ baseline ง่าย ๆ เพื่อพิสูจน์ว่าโมเดลซับซ้อนคุ้มกับความซับซ้อน, และซื่อสัตย์เรื่อง overfitting คำว่า “ทำ cross-validation แล้ว” ไม่มีความหมายถ้าข้อมูลมีแค่ 5 จุด
รายงานอย่างโปร่งใส และตรวจสอบแหล่งอ้างอิงของตัวเอง เปิดเผยข้อมูลดิบเท่าที่จริยธรรมเอื้อ เล่าข้อจำกัดตรงไปตรงมา และก่อนอ้างอิงงานใด ตรวจสอบว่ามันไม่ได้ถูกถอดถอนไปแล้ว งานที่ดีไม่ใช่งานที่ตัวเลขสวยที่สุด แต่เป็นงานที่คนอื่นทำซ้ำแล้วได้ผลใกล้เคียง
พูดอีกแบบ ถ้าเอาโจทย์เดิม (core สัมพันธ์กับ performance นักแบดไหม) มาทำใหม่ด้วยนักกีฬา 40 คน เครื่องมือวัดจริง การออกแบบ RCT และสถิติที่เหมาะกับขนาดตัวอย่าง ต่อให้ผลออกมาว่า “ความสัมพันธ์ไม่ชัดเท่าที่คิด” มันก็ยังมีค่ามากกว่า ANN ที่ทำนายเส้นตรงได้แม่น 99% เป็นล้านเท่า เพราะมันคือความรู้ที่เชื่อถือได้
ข้อมูลต้องมาจากความจริง เครื่องมือต้องเหมาะกับคำถาม คำตอบต้องตรวจสอบซ้ำได้ ชั้นที่ลึกกว่าคือเรื่องระบบ เมื่อความก้าวหน้าในอาชีพผูกกับ “จำนวนเปเปอร์” แทน “คุณภาพความรู้” เราก็สร้างแรงจูงใจให้คนผลิตงานว่างเปล่าออกมาท่วมวงการ และในยุคที่ AI ทั้งช่วยเขียนงานปลอมและถูกใช้เป็นคำขลังขายงาน ปัญหานี้จะยิ่งหนักขึ้น
เครื่องมือป้องกันตัวที่ทรงพลังที่สุดของเรา ไม่ใช่ความรู้เรื่อง AI ที่ลึกล้ำ แต่คือนิสัยง่าย ๆ ที่ชื่อว่า “การตั้งคำถาม” ถามว่าข้อมูลมาจากไหน ตัวเลขนี้เป็นไปได้ไหม ถ้าฉันทำเองจะได้ผลแบบนี้หรือเปล่า งานนี้ยังมีชีวิตอยู่หรือถูกถอดถอนไปแล้ว เพราะสุดท้าย สิ่งที่จะพัฒนานักกีฬาของเราได้จริง ไม่ใช่โมเดลที่ทำนายแม่นที่สุดบนกระดาษ แต่คือความรู้ที่เราเชื่อมือมันได้พอจะเอาไปวางเดิมพันกับร่างกายและอนาคตของนักกีฬา ผลงาน หรือไม่ ในวงการที่กำลังท่วมท้นไปด้วยงาน “AI พลิกวงการ” ความสามารถในการแยกแยะว่าอะไรจริงอะไรปลอม อาจเป็นทักษะที่มีค่าที่สุด สำหรับมนุษย์ ในยุคปัจจุบัน ตรรกศาสตร์ คือสิ่งที่เราควรจะต้องส่งต่อคุณค่าเหล่านี้ให้กับลูกศิษย์ของเราครับ
Ma, S. (2025). Investigating the increase in the specialized performance of athletes using artificial neural network (ANN) exercises. Scientific Reports, 15, 8600. https://doi.org/10.1038/s41598-025-86522-w
Ma, S., Soh, K. G., Japar, S. B., Xu, S., & Guo, Z. (2024). Maximizing the performance of badminton athletes through core strength training: Unlocking their full potential using machine learning (ML) modeling. Heliyon, 10(15), e35145. [RETRACTED] https://doi.org/10.1016/j.heliyon.2024.e35145
Ma, S. (2024). Editorial note to “Maximizing the performance of badminton athletes through core strength training…” Heliyon, 10, e40110. (บันทึกบรรณาธิการที่ระบุข้อผิดพลาดเรื่องการอ้างอิงบทความปี “2024–2045” และการแก้ชื่อผู้เขียน) https://doi.org/10.1016/j.heliyon.2024.e40110
Zhao, H., Li, W., Gan, L., & Wang, S. (2023). Designing a prediction model for athlete’s sports performance using neural network. Soft Computing, 27(19), 14379–14395. [RETRACTED] (งานอ้างอิงที่ 52 ในเปเปอร์ [1] เป็นแหล่งของตัวเลข 97.6% / 36.12%) https://doi.org/10.1007/s00500-023-09091-y
บทความนี้วิเคราะห์งานวิจัยสามชิ้นที่เกี่ยวข้องกัน ได้แก่ (1) Ma, S. (2025) ใน Scientific Reports 15:8600 [ถูกถอดถอน], (2) Ma, S. et al. (2024) ใน Heliyon 10:e35145 [ถูกถอดถอน พร้อม Editorial Note e40110] และ (3) Zhao, H. et al. (2023) ใน Soft Computing 27:14379–14395 [ถูกถอดถอน] โดยมีเจตนาเป็นกรณีศึกษาด้านการอ่านงานวิจัยเชิงวิพากษ์และความซื่อตรงทางวิชาการ (research integrity) ไม่ใช่การโจมตีบุคคล ผู้อ่านที่พบงานวิจัยลักษณะน่าสงสัยสามารถตรวจสอบสถานะการถอดถอนได้ที่ Retraction Watch Database (retractionwatch.com) และรายงานข้อกังวลผ่านแพลตฟอร์มตรวจสอบหลังการตีพิมพ์ เช่น PubPeer