OpenAI ทุบสถิติ! สอบเข้า ม.โตเกียว คว้าคะแนนเต็มคณิตศาสตร์ แซงหน้าหัวกะทิญี่ปุ่น
เขียนโดย มะม่วงแอปเปิ้ล
โมเดล OpenAI ทำข้อสอบเข้า ม.โตเกียวได้ 503 คะแนน คณิตศาสตร์เต็ม แซงคะแนนสูงสุดของผู้สอบจริง
content:
โมเดล AI รุ่น GPT-5.2 Thinking ของ OpenAI กลายเป็นประเด็นที่วงการศึกษาในญี่ปุ่นต้องหันมามองจริงจัง หลังมีรายงานว่าโมเดลนี้ทำคะแนนจากการทดสอบข้อสอบเข้ามหาวิทยาลัยโตเกียวได้สูงมาก โดยเฉพาะสาย Natural Sciences III ซึ่งเป็นสายที่แข่งขันหนักมากและเชื่อมโยงกับเส้นทางคณะแพทยศาสตร์ของโทได
ตัวเลขที่ถูกพูดถึงคือ 503 คะแนน จากคะแนนเต็ม 550 คะแนน ในการทดสอบของบริษัท LifePrompt Inc. จากกรุงโตเกียว คะแนนนี้สูงกว่าคะแนนสูงสุดของผู้สอบจริงในสายเดียวกันปี 2026 ซึ่งอยู่ที่ 453 คะแนน อยู่ราว 50 คะแนน เรื่องนี้เลยไม่ใช่แค่ข่าวเทคโนโลยีธรรมดา แต่เริ่มแตะคำถามใหญ่เรื่องระบบสอบและการวัดความสามารถของมนุษย์แล้ว
เอาจริง ๆ นะ จุดที่ควรระวังคือ AI ไม่ได้ “ไปสมัครสอบเข้าโทได” ในฐานะนักเรียนจริง แต่เป็นการนำข้อสอบมาทดสอบความสามารถของโมเดลภายใต้เงื่อนไขที่บริษัทกำหนด เพราะฉะนั้นการพาดหัวว่า “AI สอบติด ม.โตเกียว” อาจเรียกคลิกได้แรงก็จริง แต่มีโอกาสทำให้คนอ่านเข้าใจผิดได้ง่ายกว่าเดิม
รายงานยังระบุว่า GPT-5.2 Thinking ทำคะแนนในสาย Humanities and Social Sciences ได้ 452 จาก 550 คะแนน สูงกว่าคะแนนสูงสุดของผู้สอบจริงในกลุ่มที่มีรายงานอยู่ที่ 434 คะแนน เช่นกัน ส่วนในการสอบเข้ามหาวิทยาลัยเกียวโต ก็มีรายงานว่าโมเดลทำคะแนนได้สูงกว่าผู้สอบจริงในหลายเส้นทางด้วย ทำให้ประเด็นนี้ไม่ใช่แค่เรื่องของโทไดอย่างเดียว
จุดที่หลายคนจับตาคือวิชาคณิตศาสตร์ เพราะมีรายงานว่าโมเดลของ OpenAI ทำคะแนนได้เต็มในส่วนนี้ ซึ่งสะท้อนชัดว่า AI รุ่นใหม่เก่งมากกับโจทย์ที่มีโครงสร้างแน่น มีขั้นตอนคิดชัด และตรวจคำตอบได้เป็นระบบ พูดง่าย ๆ คือถ้าโจทย์มีตรรกะ มีสูตร มีรูปแบบให้ไล่ reasoning ต่อไปได้ AI จะได้เปรียบมากกว่ามนุษย์ในหลายจังหวะ
ที่หลายคนเข้าใจผิดคือ คะแนนสูงแบบนี้ไม่ได้แปลว่า AI “ฉลาดกว่าเด็กญี่ปุ่นทุกด้าน” เพราะบางวิชายังมีช่องโหว่ให้เห็นชัด รายงานจากสื่อหลายแห่งระบุว่าโมเดลทำภาษาอังกฤษได้ราว 90% แต่ในส่วนที่ต้องเขียนเรียงความวิชาประวัติศาสตร์โลก ทำได้เพียงประมาณ 25% ซึ่งเป็นตัวเลขที่บอกอะไรได้มากกว่าคะแนนรวมเสียอีก
ปัญหาอยู่ตรงนี้แหละ วิชาที่ต้องใช้การเชื่อมเหตุการณ์ ประเมินบริบททางสังคม อ่านอารมณ์ของข้อความ หรืออธิบายความเปลี่ยนแปลงของประวัติศาสตร์แบบมีน้ำหนัก ยังไม่ใช่พื้นที่ที่ AI ครองเกมได้หมด ต่อให้ตอบได้ไวและจำข้อมูลได้เยอะ แต่การเขียนให้มี “น้ำหนักแบบมนุษย์” ยังเป็นอีกเรื่องหนึ่ง
ก่อนหน้านี้ LifePrompt เคยทดสอบ ChatGPT กับข้อสอบ Common Test ของญี่ปุ่นเช่นกัน โดยมีรายงานว่าโมเดลล่าสุดทำอัตราความถูกต้องเฉลี่ยราว 97% ใน 15 วิชา และทำคะแนนเต็มได้ใน 9 วิชา เช่น คณิตศาสตร์ เคมี สารสนเทศ และการเมืองเศรษฐกิจ ข้อมูลชุดนี้ช่วยให้เห็นว่าความสามารถของ AI ไม่ได้พุ่งขึ้นเฉพาะข้อสอบโทได แต่กำลังขยับขึ้นทั้งระบบการสอบแบบมาตรฐานของญี่ปุ่น
เรื่องนี้ควรมองให้ไกลกว่าแค่ “AI เก่งกว่าคน” เพราะสนามสอบจำนวนมากยังออกแบบมาเพื่อวัดสิ่งที่เครื่องจักรทำได้ดีขึ้นเรื่อย ๆ เช่น การคำนวณ การค้นรูปแบบ การประมวลข้อมูลจำนวนมาก และการตอบโจทย์ที่มีคำตอบค่อนข้างแน่นอน ถ้าระบบการศึกษาไม่ปรับตาม เด็กอาจถูกฝึกให้แข่งกับเครื่องในเกมที่เครื่องเริ่มได้เปรียบไปแล้ว
ความเห็นส่วนตัวที่อยากชัดตรงนี้คือ โรงเรียนและมหาวิทยาลัยไม่ควรรีบสรุปว่า “สอบแบบเดิมหมดความหมาย” เพราะการสอบยังจำเป็นต่อการวัดพื้นฐานบางอย่าง แต่ถ้าข้อสอบทั้งชุดวัดได้แค่ว่าใครคำนวณเก่งกว่า จำแม่นกว่า หรือทำตามแพตเทิร์นได้เร็วกว่า AI ก็จะยิ่งทำให้ระบบสอบดูห่างจากโลกจริงมากขึ้นเรื่อย ๆ
OpenAI เองเปิดตัว GPT-5.2 เมื่อเดือนธันวาคม 2025 โดยระบุว่า GPT-5.2 Thinking ถูกพัฒนาให้เด่นขึ้นด้าน reasoning งานความรู้ระยะยาว การใช้บริบทยาว และงานเชิงวิชาชีพหลายประเภท พร้อมรายงานว่าลดข้อผิดพลาดจากรุ่นก่อนในบางชุดทดสอบภายในของบริษัทด้วย ข้อมูลนี้ช่วยอธิบายได้ว่าทำไมโมเดลจึงทำคะแนนสูงมากในโจทย์ที่ต้องใช้การคิดหลายขั้นตอน
ประเด็นที่น่าคิดกว่าคะแนนเต็มคณิตศาสตร์ คือเด็กและคนทำงานควรถูกฝึกให้ใช้ AI เป็นเครื่องมือ ไม่ใช่ถูกผลักให้แข่งกับ AI แบบตรง ๆ ตลอดเวลา เพราะสนามที่มนุษย์ยังมีน้ำหนักคือการตั้งคำถามให้ถูก เลือกข้อมูลให้เป็น ตรวจความจริงให้ละเอียด และตัดสินใจจากบริบทที่ไม่สวยงามเหมือนโจทย์ในกระดาษสอบ
ข่าวนี้เลยเป็นสัญญาณแรงมากว่า การศึกษาอาจต้องเปลี่ยนจากการถามว่า “ใครตอบถูกเร็วกว่า” ไปเป็น “ใครเข้าใจปัญหาได้ลึกกว่า และใช้เครื่องมือได้ฉลาดกว่า” เพราะถ้า AI ทำข้อสอบยากระดับโทไดได้ขนาดนี้แล้ว คำถามต่อไปคือ มนุษย์ควรฝึกทักษะอะไร เพื่อไม่ให้ตัวเองกลายเป็นแค่ผู้เข้าสอบในสนามที่เครื่องจักรเริ่มนำไปไกลแล้ว
แหล่งที่มา: Bangkok Post, The Straits Times, Xinhua, Japan Today, OpenAI
อ้างอิง: รายงานข่าวจาก LifePrompt Inc. ผ่านสื่อข้างต้น และข้อมูลประกาศ GPT-5.2 จาก OpenAI
เขียนโดย มะม่วงแอปเปิ้ล
สะพานมอญน้ำลด เห็นวัดจมน้ำโผล่ ช่วงนี้เกิดจากอะไร
ประเทศที่มีโรงแรมสัญชาติไทย ตั้งอยู่เป็นจำนวนมากที่สุดในโลก
สัตว์ใกล้สูญพันธุ์ที่เหลือเพียง 2 ตัวในโลก
โรงเรียนเอกชนที่มีนักเรียนมากที่สุดในประเทศไทย
10 จังหวัดที่มักถูกมองว่าเป็นแหล่งผลิตเด็กสอบติดมหาวิทยาลัยดัง
10 อันดับแบรนด์กาแฟโลก แบรนด์ไทยก็ติดกับเขาด้วย
7 ผลไม้ป่า ที่หายากที่สุดในประเทศไทย
จังหวัดในไทย ที่ยังไม่มี "มหาวิทยาลัยราชภัฏ" ตั้งในพื้นที่
5 ประเทศที่คนกินเผ็ดมากที่สุดในโลก (คนไทยอันดับ3)
จังหวัดเพียงหนึ่งเดียวในไทย ที่มีพื้นที่ติดกับจังหวัดอื่นเพียงแห่งเดียว
6 มหาวิทยาลัยเอกชนที่ POP ที่สุดในประเทศไทย
ไส้ติ่งมีไว้ทำไม?
ประเทศกินหวานสูงอันดับต้นของโลก พร้อมย้อนดูสถิติคนไทย
คู่รักวัย 50 ถูกแบนตลอดชีวิต หลังทำพฤติกรรมไม่เหมาะสมบนเครื่องก่อนเทกออฟ
"ตั๊กแตนตำข้าว" สัตว์ผู้พ่อที่เสียสละให้ลูกมากที่สุด
สะพานมอญน้ำลด เห็นวัดจมน้ำโผล่ ช่วงนี้เกิดจากอะไร
รวมธุรกิจสุดแปลกในต่างประเทศ เห็นไอเดียแล้วงง แต่บางเจ้าทำเงินได้จริง





