ผลของการจับเอางานวิจัยด้านการรู้จำและแยกแยะวัตถุใน ภาพของ Google มารวมพลังกับงานวิจัยด้านภาษาธรรมชาติของ Stanford ทำให้ได้ระบบซอฟต์แวร์ที่สามารถทำความเข้าใจองค์ประก อบของภาพถ่าย และบรรยายออกมาเป็นประโยคด้วยถ้อยคำที่เป็นธรรมชาติ
เราเคยเห็นข่าวงานวิจัยของ Google ที่ได้รางวัลจากการประกวดซอฟต์แวร์รู้จำและแยกแยะวัต ถุในภาพมาแล้ว ซึ่งงานวิจัยดังกล่าวได้มีการพัฒนาโครงข่ายประสาทเที ยมเพื่อให้ระบบซอฟต์แวร์เรียนรู้รูปร่างของวัตถุสิ่ง ของต่างๆ จนทำให้ได้มาซึ่งความสามารถในการใช้คำระบุว่าสิ่งของ หรือคนที่ปรากฎในภาพนั้นคืออะไร มีลักษณะอย่างไร ทว่าด้วยข้อมูลที่ได้มาเป็นคำเหล่านี้คงยังไม่อาจเรี ยกว่าเป็นการบรรยายภาพถ่ายได้ ดังนั้นจึงมีการผนวกเอางานวิจัยของ Stanford ที่ใช้โครงข่ายประสาทเทียมเพื่อเรียนรู้วิธีการแยกแย ะสิ่งต่างๆ ในภาพ และนำเอาข้อมูลที่ได้มาเรียบเรียงให้เป็นภาษาธรรมชาต ิมาปรับใช้งานร่วมกัน
การดึงเอาความสามารถของโครงข่ายประสาทเทียมจาก 2 งานวิจัยนี้มาใช้ประโยชน์พร้อมกัน ทำได้โดยการป้อนตัวอย่างภาพถ่ายพร้อมประโยคบรรยายภาพ ให้โครงข่ายประสาทเทียมได้เรียนรู้ว่าการบรรยายภาพที ่ดีนั้นควรเป็นอย่างไร และด้วยปริมาณข้อมูลที่ถูกสอนให้มากพอก็จะทำให้ระบบส ามารถบรรยายภาพถ่ายบางภาพด้วยประโยคภาษาอังกฤษได้อย่ างถูกต้อง (แน่นอนว่ามีบางภาพอาจได้รับการบรรยายถูกต้องแค่บางส ่วน หรือไม่ถูกต้องเลย ซึ่งหมายความว่าโครงข่ายประสาทเทียมยังขาดตัวอย่างกา รฝึกสอนสำหรับภาพถ่ายแบบนั้น)
ลองนึกภาพว่าหาก Google สามารถเอางานวิจัยที่ทำร่วมกับ Oxford (ที่เน้นการพัฒนาปัญญาประดิษฐ์เพื่อการรู้จำภาพและทำ งานตอบสนองภาษาธรรมชาติ) มาทำคอมโบเข้าไปกับงานวิจัยร่วมกับ Stanford นี้เข้าไปอีก เราคงได้เห็นระบบปัญญาประดิษฐ์ที่น่าทึ่งเอามากๆ
ที่มา - Google Research Blog via Engadget
Google, Image Processing, Natural Language, Neural Network, Research, Stanford
อ่านต่อ...
Bookmarks