Please use this identifier to cite or link to this item:
http://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/424| Title: | The Application of Recurrent Neural Networks for Forecasting the Number of Tourists in Thailand's National Parks การประยุกต์ใช้โครงข่ายประสาทเทียมแบบเรียกซ้ำสำหรับการพยากรณ์จำนวนนักท่องเที่ยวในอุทยานแห่งชาติของประเทศไทย |
| Authors: | NATCHANAN LAI-NGOEN-MANEE ณัฐชานันท์ ลายเงินมณี LUEPOL PIPANMEKAPORN ลือพล พิพานเมฆาภรณ์ King Mongkut's University of Technology North Bangkok LUEPOL PIPANMEKAPORN ลือพล พิพานเมฆาภรณ์ luepol.p@sci.kmutnb.ac.th,luepolp@kmutnb.ac.th luepol.p@sci.kmutnb.ac.th,luepolp@kmutnb.ac.th |
| Keywords: | การพยากรณ์จำนวนนักท่องเที่ยว อนุกรมเวลา โครงข่ายประสาทเทียมแบบเรียกซ้ำ อาร์เอ็นเอ็น แอลเอสทีเอ็ม จีอาร์ยู Tourist Forecasting Time Series Recurrent Neural Networks RNN LSTM GRU |
| Issue Date: | 7 |
| Publisher: | King Mongkut's University of Technology North Bangkok |
| Abstract: | Thailand’s national parks are significant tourist destinations, serving both natural resource conservation and the promotion of the country’s economy. Accurate forecasting data, especially tourist numbers, play a crucial role in personnel planning, resource allocation, and providing services that meet actual demand. In practice, historical tourist count data are commonly used to support decision-making for planning and budget allocation for park management and operations aligned with the agency’s mission. However, the forecasting methods currently used typically rely primarily on data from the previous year, which may not reflect trends affected by other factors such as seasonality and weather conditions. This research aims to develop models for forecasting monthly tourist numbers in Thailand’s national parks using 10 years of historical data (2014-2023) from 146 national parks, applying recurrent neural networks (RNN, LSTM, and GRU), and to compare the forecasting capabilities of these models on time series data. The experiments were divided into three main approaches: Individual Park Model (IPM), Combined Model (CM), and Clustered Models (CRM, CUM), with parameter tuning of look-back periods and the number of hidden units to determine optimal values for each approach. In addition, the experiments were conducted in two phases: Phase 1 used only tourist count data as a single variable, while Phase 2 included additional variables-month, temperature, vehicle count, and spatial data (region and park characteristics)-to assess the impact of diverse factors on forecasting quality. The study also compared popular forecasting techniques for similar data and analyzed the importance of different groups of variables to identify those that most influence model performance. The results show that the best-performing model was the CM-LSTM, a combined LSTM model with a look-back period of 9 months and 40 hidden units, achieving the best evaluation metrics with Mean_Test_MAE = 1,955, Mean_Test_RMSE = 4,269, and Mean_Test_R² = 0.95, outperforming both Phase 1 models and other forecasting techniques. Although the inclusion of additional variables in Phase 2 did not substantially increase the R² value, it led to a clear reduction in MAE and RMSE, indicating an overall improvement. The variable importance analysis revealed that groups based on tourist count, supplemented by month or temperature, consistently yielded strong metrics, whereas spatial variables and vehicle count produced more varied results and did not significantly enhance performance. Nonetheless, combining multiple groups or all variables tended to help the model better capture data patterns and relationships more comprehensively. อุทยานแห่งชาติของประเทศไทยเป็นแหล่งท่องเที่ยวที่มีความสำคัญทั้งด้านการอนุรักษ์ทรัพยากรธรรมชาติและการส่งเสริมเศรษฐกิจของประเทศ ข้อมูลคาดการณ์ที่ใกล้เคียงความเป็นจริง โดยเฉพาะจำนวนนักท่องเที่ยว จึงมีบทบาทสำคัญต่อการวางแผนด้านบุคลากร การจัดสรรทรัพยากร และการให้บริการให้เหมาะสมกับความต้องการจริง ในทางปฏิบัติทั่วไปข้อมูลจำนวนนักท่องเที่ยวในอดีตมักถูกนำมาใช้ประกอบเพื่อสนับสนุนการตัดสินใจในการวางแผนและสนับสนุนการจัดสรรงบประมาณสำหรับการดูแลและบริหารจัดการอุทยาน หรือการดำเนินงานใด ๆ ตามภารกิจของหน่วยงาน อย่างไรก็ตาม วิธีการพยากรณ์ที่ใช้อยู่ในปัจจุบันมักอ้างอิงข้อมูลของ ปีที่ผ่านมาเป็นหลัก ซึ่งอาจไม่สะท้อนแนวโน้มที่ได้รับผลกระทบจากปัจจัยอื่น ๆ เช่น ฤดูกาล สภาพอากาศ เป็นต้น ซึ่งในงานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาแบบจำลองสำหรับการพยากรณ์จำนวนนักท่องเที่ยวรายเดือนในอุทยานแห่งชาติของประเทศไทย โดยใช้ข้อมูลย้อนหลัง 10 ปี (พ.ศ. 2557 - 2566) จากอุทยานแห่งชาติ 146 แห่ง ด้วยการประยุกต์ใช้โครงข่ายประสาทเทียมแบบเรียกซ้ำ ได้แก่ RNN, LSTM และ GRU และเปรียบเทียบความสามารถของแบบจำลอง ในการคาดการณ์ข้อมูลอนุกรมเวลา โดยการทดลองแบ่งออกเป็น 3 แนวทางหลัก ได้แก่ แบบจำลองรายอุทยาน (IPM), แบบจำลองรวม (CM) และแบบจำลองแบบจัดกลุ่ม (CRM, CUM) โดยมีการทดสอบค่าพารามิเตอร์ Look-back และจำนวน Hidden Units เพื่อเลือกค่าที่เหมาะสมในแต่ละแนวทาง นอกจากนี้ ได้มีการแบ่งการทดลองเป็น 2 ระยะ โดยระยะที่ 1 ใช้เพียงข้อมูลจำนวนนักท่องเที่ยวเป็นตัวแปรเดียว ส่วนระยะที่ 2 ได้เพิ่มตัวแปรเพิ่มเติม ได้แก่ เดือน อุณหภูมิ ปริมาณรถยนต์ และข้อมูลเชิงพื้นที่ ประกอบด้วย ภูมิภาค และลักษณะเด่นของอุทยาน เพื่อประเมินผลกระทบของปัจจัยที่หลากหลายต่อคุณภาพการพยากรณ์ ทั้งนี้ ยังมีการเปรียบเทียบกับเทคนิคที่นิยมใช้ในการพยากรณ์ข้อมูลในลักษณะคล้ายกัน และการวิเคราะห์ความสำคัญของกลุ่มตัวแปรต่าง ๆ เพื่อค้นหาข้อมูลที่ส่งผลต่อประสิทธิภาพของแบบจำลองมากที่สุด ซึ่งผลการวิจัยพบว่า แบบจำลองที่ให้ผลลัพธ์ดีที่สุดในงานวิจัยนี้ คือ CM-LSTM ซึ่งเป็นแบบจำลองรวม ที่ใช้ LSTM ด้วยการกำหนดค่า Look-back เท่ากับ 9 เดือน และ Hidden Units เท่ากับ 40 หน่วย ให้ค่าตัวชี้วัดที่ดีที่สุดทั้ง MAE (Mean_Test) = 1,955, RMSE (Mean_Test) = 4,269 และ R² (Mean_Test) = 0.95 ซึ่งสูงกว่าทั้งแบบจำลองจากระยะที่ 1 และเทคนิคพยากรณ์อื่น ๆ แม้ว่าการเพิ่มตัวแปรอื่น ๆ ในระยะที่ 2 จะไม่ได้ทำให้ค่า R² สูงขึ้นมากนัก แต่ส่งผลให้ค่า MAE และ RMSE ลดลงอย่างชัดเจน ซึ่งแสดงถึงการเปลี่ยนแปลงในทางที่ดีขึ้น ในส่วนของการวิเคราะห์ความสำคัญของตัวแปร พบว่า กลุ่มที่มีข้อมูลจำนวนนักท่องเที่ยวเป็นพื้นฐาน และเสริมด้วย ข้อมูลเดือน หรือ ข้อมูลอุณหภูมิ มักให้ค่าตัวชี้วัดที่ดีต่อเนื่อง ในขณะที่ตัวแปรเชิงพื้นที่และข้อมูลปริมาณรถยนต์ให้ผลที่หลากหลาย แต่ยังไม่สามารถช่วยให้ผลลัพธ์ดีขึ้นเท่าทีควร อย่างไรก็ตาม การรวมข้อมูลหลายกลุ่มหรือทุกตัวแปรเข้าด้วยกันมีแนวโน้มช่วยให้แบบจำลองเข้าใจรูปแบบและความสัมพันธ์ของข้อมูลได้ดีและครอบคลุมมากยิ่งขึ้น |
| URI: | http://kmutnb-ir.kmutnb.ac.th/jspui/handle/123456789/424 |
| Appears in Collections: | FACULTY OF APPLIED SCIENCE |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| s6504062856021.pdf | 7.47 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.