Malluba คือโปรแกรมวิจัยและเรียนรู้เชิงลึกที่ทาง Microsoft ได้ซื้อมาเมื่อช่วงเดือนมกราคมที่ผ่านมา แล้วนำมาพัฒนาต่อเพื่อเสริมสร้างการเรียนรู้จากการแยกแยะ และหาวิธีเอาชนะ และล่าสุดก็สามารถทำคะแนนเกม Pac-man ของเครื่อง Atari 2600 ได้คะแนนเต็ม 999,990 เป็นที่เรียบร้อย
นักวิจัยเลือกที่จะใช้วิดีโอเกมเพื่อที่จะทดสอบการเรียนรู้ของ AI เพื่อเลียนแบบความสับสนวุ่นวายในโลกแห่งความจริง ซึ่งอยู่ภายใต้สภาพแววดล้อมที่มีทั้งการควบคุม และกดดันเช่นพวกหมากรุก หรือโกะ ที่ทาง Google's DeepMind AI ได้แสดงผลงานมาแล้วในปี 2015 และล่าสุดที่เอาชนะมืออาชีพของจีนไปแบบขาดลอยเมื่อเดือนที่ผ่านมานี้ ซึ่งทาง Microsoft ไม่ได้คิดที่จะใช้ AI ที่มีมาเคลียร์เกมเก่าแต่อย่างใด แต่เป็นเพราะเกมซีรี่ส์ Pac-man นั้นไม่เคยมี AI พิชิตได้สำเร็จมาก่อน และสถิติของมนุษย์ที่ทำไว้บนเครื่อง Atari 2600 ก็คือ 266,330
Maluuba นั้นเรียนรู้ที่จะคาดการผลลัพธ์ที่จะได้ออกมา โดยทีมพัฒนาได้สอน AI โดยใช้สิ่งที่เรียกว่า Hybrid Reward Architecture เพื่อคำนึงถึงลักษณะการแยกแยะ และวิธีเอาชนะโดยอาศัยการเคลื่อนไหวของตัวเองเพื่อที่จะเน้นไปที่เส้นทางที่ดีที่สุด ไม่ว่าจะเป็นการหลบหลีกผีที่วิ่งอยู่ในจอ และหาเส้นทางเพื่อไปเก็บคะแนนให้ครบในเวลาเดียวกัน
ดูจากจอประมวลผลที่ด้านล่างจะเห็นการประมวลเพื่อหาผลลัพธ์ที่ดีที่สุด
AI จะประมวลหาเส้นทางที่ดีที่สุด เช่นเลือกทางที่มีผลไม้ หรือ เม็ดเพิ่มพลังเป็นต้น
ลูกศรอันใหญ่ที่แสดงผลให้เห็นคือทางเลือกสำคัญ ยิ่งขนาดยิ่งใหญ่เท่าไหร่ ความสำคัญก็มากขึ้นเท่านั้น
ที่มา : http://gigazine.net/news/20170615-microsoft-ai-master-pac-man/