Please use this identifier to cite or link to this item:
http://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/429| Title: | Sentiment analysis system for Thai reviews using long short-term memory ระบบวิเคราะห์ความรู้สึกจากข้อความรีวิวภาษาไทยด้วยเทคนิคหน่วยความจำระยะสั้น |
| Authors: | DUSIT SIRISACORN ดุสิต ศิริสาคร MALEERAT MALIYAM มาลีรัตน์ มะลิแย้ม King Mongkut's University of Technology North Bangkok MALEERAT MALIYAM มาลีรัตน์ มะลิแย้ม maleerat.m@itd.kmutnb.ac.th,msn@kmutnb.ac.th maleerat.m@itd.kmutnb.ac.th,msn@kmutnb.ac.th |
| Keywords: | การจำแนกความรู้สึก โมเดลภาษาที่ผ่านการฝึกสอนล่วงหน้า โครงข่ายประสาทเทียมแบบสองทิศทาง การเรียนรู้เชิงลึก การประมวลผลภาษาไทย Sentiment Classification Pre-trained Language Model Bidirectional LSTM Deep Learning Thai Natural Language Processing |
| Issue Date: | 7 |
| Publisher: | King Mongkut's University of Technology North Bangkok |
| Abstract: | This research aims to develop sentiment classification models for Thai text by applying Natural Language Processing techniques through pre-trained Thai language models combined with memory-extended models capable of handling longer data sequences. Four model architectures were developed: baseline model, bidirectional processing-enhanced model, feature extraction with bidirectional processing hybrid model, and a model utilizing the last four layers. Experiments were conducted on a dataset containing 11,118 samples divided into two classes: positive and negative. The results showed that the bidirectional processing-enhanced model achieved the highest performance with 90.93% accuracy. This research demonstrates that appropriate integration of pre-trained language models with memory-extended sequential processing models can effectively develop Thai sentiment classification systems. การวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาโมเดลการจำแนกความรู้สึกจากข้อความภาษาไทย โดยประยุกต์ใช้เทคนิคการประมวลผลภาษาธรรมชาติผ่านโมเดลภาษาไทยที่ผ่านการฝึกสอนล่วงหน้า ร่วมกับโมเดลที่สามารถขยายความจุหน่วยความจำเพื่อรองรับลำดับข้อมูลที่ยาวขึ้น โดยพัฒนาโมเดลทั้งหมด 4 รูปแบบ ได้แก่ โมเดลพื้นฐาน โมเดลที่เพิ่มชั้นประมวลผลสองทิศทาง โมเดลที่รวมการสกัดลักษณะเด่นกับการประมวลผลสองทิศทาง และโมเดลที่ใช้ข้อมูลจาก 4 ชั้นสุดท้าย ผู้วิจัยได้ทดลองกับชุดข้อมูลจำนวน 11,118 ตัวอย่าง แบ่งเป็น 2 คลาส ได้แก่ เชิงบวกและเชิงลบ ผลการวิจัยพบว่าโมเดลที่เพิ่มชั้นประมวลผลสองทิศทางให้ประสิทธิภาพสูงสุด โดยมีค่าความถูกต้องร้อยละ 90.93 งานวิจัยนี้แสดงให้เห็นว่าการผสมผสานโมเดลภาษาที่ผ่านการฝึกสอนล่วงหน้ากับโมเดลหน่วยความจำแบบขยายลำดับข้อมูลอย่างเหมาะสมสามารถพัฒนาระบบจำแนกความรู้สึกภาษาไทยได้อย่างมีประสิทธิภาพ |
| URI: | http://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/429 |
| Appears in Collections: | FACULTY OF INFORMATION TECHNOLOGY AND DIGITAL INNOVATION |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| s6507011858517.pdf | 5 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.