Please use this identifier to cite or link to this item: http://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/187
Full metadata record
DC FieldValueLanguage
dc.contributorTEERAPONG NGAMPROMWONGen
dc.contributorธีรพงศ์ งามพร้อมวงษ์th
dc.contributor.advisorLUEPOL PIPANMEKAPORNen
dc.contributor.advisorลือพล พิพานเมฆาภรณ์th
dc.contributor.otherKing Mongkut's University of Technology North Bangkoken
dc.date.accessioned2025-05-23T06:28:22Z-
dc.date.available2025-05-23T06:28:22Z-
dc.date.created2025
dc.date.issued9/6/2025
dc.identifier.urihttp://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/187-
dc.description.abstractLipreading focuses on developing efficient models to decode spoken words from the motion of the lips. Despite continuous advancements, there remain two significant challenges: Model Complexity and Lip Movement Homophones. Complex models are often designed with the aim of increasing lipreading accuracy; however, this complexity comes at the cost of high computational resource requirements, rendering them unsuitable for use in portable devices or resource-constrained systems. Additionally, many words exhibit similar pronunciations, leading to lip movements that closely resemble one another; for instance, the words "million" and "millions" demonstrate such similarities, necessitating that models discern differences based solely on visual data. To address these issues, this research focuses on developing a streamlined yet highly accurate model capable of distinguishing between lip movements that closely resemble one another. This is achieved through the use of a hybrid deep learning approach that integrates Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN), and Attention mechanisms, with the aim of enhancing the applicability and efficiency of lipreading in real-world scenarios.en
dc.description.abstractการอ่านริมฝีปาก (lipreading) มุ่งเน้นการพัฒนาแบบจำลองที่มีประสิทธิภาพในการถอดรหัสคำพูดจากภาพการเคลื่อนไหวของริมฝีปาก ถึงแม้จะมีความก้าวหน้าอย่างต่อเนื่อง แต่ยังคงมีความท้าทายที่สำคัญ 2 ประการ คือ 1) ความซับซ้อนของแบบจำลอง (Model Complexity) แบบจำลองที่ซับซ้อนมักถูกสร้างขึ้นโดยมีจุดมุ่งหมายเพื่อเพิ่มความแม่นยำในการอ่านริมฝีปาก แต่ก็มีข้อเสียคือต้องใช้ทรัพยากรในการประมวลผลสูง ทำให้ไม่เหมาะสำหรับการใช้งานใน อุปกรณ์พกพาหรือระบบที่มีข้อจำกัดด้านทรัพยากร 2) ความคล้ายคลึงในการขยับริมฝีปาก (Lip movement homophones) คำหลายคำมีการออกเสียงที่ใกล้เคียงกัน ทำให้ริมฝีปากขยับ ในลักษณะที่คล้ายคลึงกันมาก ตัวอย่างเช่น คำว่า "million" และ "millions" ซึ่งแบบจำลองต้องพยายามแยกแยะความแตกต่างจากข้อมูลภาพเพียงอย่างเดียว เพื่อแก้ไขปัญหาเหล่านี้ งานวิจัยนี้จึงมุ่งเน้นไปที่การพัฒนาแบบจำลองที่ไม่ซับซ้อนแต่ยังคงมีความแม่นยำสูง และสามารถแยกแยะความแตกต่างของการเคลื่อนไหวริมฝีปากที่มีความคล้ายคลึงกันได้ โดยใช้เทคนิคการเรียนรู้เชิงลึกแบบผสมผสานประกอบ CNN, RNN และ Attention เพื่อให้การอ่านริมฝีปากมีความสามารถนำไปใช้ทำงานได้ในสถานการณ์จริงและมีประสิทธิภาพมากยิ่งขึ้นth
dc.language.isoth
dc.publisherKing Mongkut's University of Technology North Bangkok
dc.rightsKing Mongkut's University of Technology North Bangkok
dc.subjectการจดจำคำพูดด้วยภาพth
dc.subjectการอ่านริมฝีปากth
dc.subjectการเรียนรู้เชิงลึกth
dc.subjectความสนใจเชิงพื้นที่th
dc.subjectVisual Speech Recognitionen
dc.subjectLipreadingen
dc.subjectDeep Learningen
dc.subjectSpatial Attentionen
dc.subject.classificationComputer Scienceen
dc.subject.classificationProfessional, scientific and technical activitiesen
dc.subject.classificationComputer scienceen
dc.titleDevelopment of Spatio-temporal Deep Learning Model for Visual speech recognitionen
dc.titleการพัฒนาแบบจำลองเรียนรู้แบบลึกเชิงพื้นที่และเวลาสำหรับการจดจำคำพูดด้วยภาพth
dc.typeThesisen
dc.typeวิทยานิพนธ์th
dc.contributor.coadvisorLUEPOL PIPANMEKAPORNen
dc.contributor.coadvisorลือพล พิพานเมฆาภรณ์th
dc.contributor.emailadvisorluepol.p@sci.kmutnb.ac.th,luepolp@kmutnb.ac.th
dc.contributor.emailcoadvisorluepol.p@sci.kmutnb.ac.th,luepolp@kmutnb.ac.th
dc.description.degreenameMaster of Science (วท.ม.)en
dc.description.degreenameวิทยาศาสตรมหาบัณฑิต (M.Sc.)th
dc.description.degreelevelMaster's Degreeen
dc.description.degreelevelปริญญาโทth
dc.description.degreedisciplineComputer and Information Sciencesen
dc.description.degreedisciplineวิทยาการคอมพิวเตอร์และสารสนเทศth
Appears in Collections:FACULTY OF APPLIED SCIENCE

Files in This Item:
File Description SizeFormat 
s6504062856039.pdf3.62 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.