มหาวิทยาลัยราชภัฏนครสวรรค์
สถาบันวิจัยและพัฒนา
ระบบจัดการงานวิจัย
NSRU
RESEARCH
หน้าหลัก
ค้นหารายการ
ข้อมูลงานวิจัย
ข้อมูลนักวิจัย
รายงานสถิติ
งานวิจัย
งานทรัพย์สินทางปัญญา
เข้าสู่ระบบ
รายละเอียดโครงการวิจัย
ชื่อโครงการ (ภาษาไทย) :
การคัดกรองและวิเคราะห์ข้อมูลท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตและเทคนิคการทำเหมืองข้อความ
ชื่อโครงการ (ภาษาอังกฤษ) :
Tourism Web Filtering and Analysis using Na?ve Bayes with Boundary Values and Text Mining
หน่วยงานเจ้าของโครงการ :
คณะวิทยาศาสตร์และเทคโนโลยี
ลักษณะโครงการวิจัย :
โครงการวิจัยเดี่ยว
ลักษณะย่อยโครงการวิจัย :
ไม่อยู่ภายใต้แผนงานวิจัย/ชุดโครงการวิจัย
ประเภทโครงการ :
โครงการวิจัยใหม่
วันเริ่มต้นโครงการ :
1 ตุลาคม 2559
วันสิ้นสุดโครงการ :
30 กันยายน 2561
ประเภทของการวิจัย :
งานวิจัยประยุกต์
ความสำคัญและที่มาของปัญหา :
ปัจจุบันการสืบค้นข้อมูลออนไลน์ผู้ใช้ส่วนใหญ่จะสืบค้นผ่านเว็บเสิร์ชเอนจิน แต่ข้อมูลที่ได้จากการสืบค้นมีจำนวนมาก ไม่ถูกจัดหมวดหมู่และมีข้อมูลที่ไม่ต้องการปะปนอยู่ทำให้เสียเวลาในการคัดเลือกข้อมูลให้ตรงกับความต้องการทั้งหมด (Cao and Nguyen, 2012; Panawong et al., 2014) และผู้พัฒนาเว็บไซต์ก็มีความต้องการให้ผลลัพธ์จากการสืบค้นอยู่ในอันดับต้น ๆ หรือติดอยู่ในหน้าแรกของเว็บเสิร์ชเอนจิน ทั้งนี้เพื่อเป็นการเปิดโอกาสการเข้าถึงเว็บไซต์หรือทำให้มีผู้เข้าชมเว็บไซต์เพิ่มมากขึ้นหรือมียอดขายสินค้าเพิ่มมากขึ้น ซึ่งผู้พัฒนาจะใช้วิธีการใส่คำสำคัญไว้ตาม Tags ต่าง ๆ เช่น Title, Body เป็นต้น สอดคล้องกับพฤติกรรมของผู้ใช้ที่จะคลิกเพื่อเข้าไปอ่านเนื้อหาของเว็บไซต์ 10-20 ลำดับแรกของผลลัพธ์จากการสืบค้นเท่านั้น (Lu and Cong, 2015) แต่อย่างไรก็ตามผู้พัฒนาเว็บไซต์อาจไม่รู้ว่าจะใช้คำสำคัญอะไรบ้างเพื่อให้ผลลัพธ์จากการสืบค้นอยู่ในลำดับที่ดีได้ ทำให้เสียเวลาทดลองหาคำสำคัญที่เหมาะสม (Deka, 2014; Vignesh and Deepa, 2014) โดยคำสำคัญที่ใช้นั้นอาจประกอบด้วย คำ 1 คำ หรือมากกว่า 1 คำในรูปแบบของประโยคหรือใช้คำสำคัญในการแบ่งแยกเอกสารให้เป็นหมวดหมู่หรือใช้สำหรับสืบค้นข้อมูลตามความสนใจ (Jain and Sharma, 2012; Ozbal et al., 2014) ในการใช้คำสำคัญเพื่อวิเคราะห์ข้อมูลหรือจัดหมวดหมู่นั้น มีงานวิจัยจากนักวิจัยต่าง ๆ เช่น งานวิจัยของ Namahoot et al. (2015) ได้นำเสนอการใช้คำสำคัญในการวิเคราะห์กลุ่มข้อมูลท่องเที่ยวและจัดหมวดหมู่เว็บไซต์ท่องเที่ยวจำนวน 500 เว็บไซต์ด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต แบ่งเป็น 6 หมวดหมู่ คือ สถานที่ท่องเที่ยว ที่พัก ร้านอาหาร ร้านขายของฝาก ร้านหนึ่งตำบลหนึ่งผลิตภัณฑ์และเทศกาล ส่วนงานวิจัยของวิชุดา โชติรัตน์ และคณะ (2554) ใช้คำสำคัญในการวิเคราะห์ข่าวออนไลน์ที่เกี่ยวข้องกับพื้นที่ 5 จังหวัดชายแดนใต้เพื่อแยกองค์ประกอบสำคัญในเนื้อหาข่าว คือ บุคคลที่เกี่ยวข้อง สถานที่เกิดเหตุ อาวุธที่ใช้ ผลลกระทบ รูปแบบเหตุการณ์และเวลาที่เกิดเหตุ ในขณะที่งานวิจัยของ Tosqui-Lucks and Silva (2012) ได้สร้างฐานความรู้ในรูปแบบออนโทโลจีท่องเที่ยวโดยมีคำศัพท์ต่าง ๆ ที่เกี่ยวข้องกับการท่องเที่ยวเป็นภาษาอังกฤษและใช้คำสำคัญท่องเที่ยวเหล่านั้นไปจัดหมวดหมู่เว็บไซต์ โดยแยกเป็นสถานที่ท่องเที่ยว ที่พัก ร้านอาหารและการเดินทาง และงานวิจัยของ Namahoot et al. (2014) ได้นำเสนอการใช้เทคนิคการจัดกลุ่มข้อมูลเว็บไซต์ท่องเที่ยวจำนวน 200 เว็บไซต์ โดยคำนวณหาความถี่และค่าน้ำหนักของคำสำคัญท่องเที่ยวในส่วนต่าง ๆ ของแต่ละเว็บไซต์ท่องเที่ยว ซึ่งแบ่งเป็น 31 รูปแบบ และจากการทดลองพบว่าเนื้อหาส่วน Body มีความสำคัญต่อการจัดกลุ่มข้อมูลท่องเที่ยวมากที่สุด จากปัญหาและจากงานวิจัยต่าง ๆ ที่ได้กล่าวมานั้น ผู้วิจัยจึงมีแนวคิดที่จะวิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความโดยคำนวณหาค่าความถี่ของคำแล้วนำมาวิเคราะห์คำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการสืบค้นข้อมูลท่องเที่ยวที่ให้ผลลัพธ์ที่ตรงกับความต้องการของผู้ใช้หรือส่งผลต่อการสืบค้นข้อมูลท่องเที่ยว โดยผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยว อีกทั้งจะใช้ Apriori Algorithm และพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว ทั้งนี้เพื่อหากลุ่มคำสำคัญที่ปรากฏร่วมกัน จากนั้นนำไปทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว ซึ่งผลลัพธ์ที่ได้จากการทำวิจัยครั้งนี้จะทำให้ได้กลุ่มของคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก (SEO: Search Engine Optimization) ของเว็บเสิร์ชเอนจินต่าง ๆ เช่น กูเกิ้ล (Google) บิง (Bing) และยาฮู (Yahoo) เป็นต้น โดยสามารถนำไปประยุกต์ใช้ในการเรียนรู้คำสำคัญที่จำเป็นต้องมีในเนื้อหาของเว็บไซต์ต่าง ๆ ได้อีกด้วย
วัตถุประสงค์ของโครงการ :
1. เพื่อคัดกรองข้อมูลเว็บไซต์ที่เกี่ยวกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต 2. เพื่อวิเคราะห์คำสำคัญท่องเที่ยวโดยใช้เทคนิคการทำเหมืองข้อความ 3. เพื่อพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยวได้ 4. เพื่อเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวกับอัลกอริทึมอื่น ๆ
ขอบเขตของโครงการ :
ในงานวิจัยครั้งนี้ผู้วิจัยได้จะทำจัดเก็บข้อมูลเว็บไซต์และพัฒนาอัลกอริทึม ดังรายละเอียดต่อไปนี้ 1. ด้านข้อมูล ผู้วิจัยจะใช้ผลลัพธ์ของการสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล โดยใช้คำค้นหาเป็นชื่อจังหวัดพิษณุโลกและอีก 10 จังหวัดที่นิยมท่องเที่ยวในประเทศไทย คือ เชียงใหม่ ภูเก็ต กระบี่ เชียงราย ชลบุรี แม่ฮ่องสอน ประจวบคีรีขันธ์ สุราษฎร์ธานี ระยอง และเลย (กรมการท่องเที่ยว, 2559) รวมถึงใช้ชื่อหมวดหมู่จำนวน 3 หมวดหมู่ (สถานที่ท่องเที่ยว, ที่พัก, ร้านอาหาร) กับชื่อจังหวัด ไปสืบค้นข้อมูลท่องเที่ยวจากเว็บไซต์กูเกิ้ล เช่น ท่องเที่ยวเชียงใหม่ ที่พักเชียงใหม่ ร้านอาหารเชียงใหม่ เป็นต้น จากกระบวนการนี้จะทำให้ได้รายชื่อเว็บไซต์ต่าง ๆ ซึ่งผลลัพธ์ที่ได้จากการสืบค้นจะถูกจัดเก็บลงฐานข้อมูล MySQL 2. ด้านอัลกอริทึม ผู้วิจัยจะประยุกต์ใช้อัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขตจากงานวิจัยของ Namahoot et al. (2015) เพื่อคัดกรองเฉพาะข้อมูลเว็บไซต์ที่เกี่ยวข้องกับการท่องเที่ยวเท่านั้น และใช้เทคนิคการทำเหมืองข้อความในการวิเคราะห์คำสำคัญท่องเที่ยว โดยผู้วิจัยจะพัฒนาอัลกอริทึมหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว โดยใช้ภาษา Java ในการพัฒนา อีกทั้งจะประยุกต์ใช้ Apriori Algorithm ในการหาคำสำคัญที่ปรากฏร่วมกันบ่อยเพื่อนำมาเปรียบเทียบกับอัลกอริทึมที่ผู้วิจัยพัฒนาขึ้น 3. ด้านการทดสอบ ผู้วิจัยจะทำการทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว โดยทำการเปรียบเทียบประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยวที่ได้จากการทำงานของ Apriori Algorithm กับอัลกอริทึมที่ผู้วิจัยพัฒนาเอง
ผลที่คาดว่าจะได้รับ :
1. ได้อัลกอริทึมที่สามารถหากลุ่มคำสำคัญท่องเที่ยวที่มีประสิทธิภาพ 2. ได้กลุ่มคำสำคัญท่องเที่ยวที่สามารถนำไปใช้ในการปรับแต่งเว็บไซต์เพื่อให้ติดอันดับการค้นหาในตำแหน่งที่ดีที่สุดหรือติดหน้าแรก 3. เมื่อนำคำสำคัญท่องเที่ยวที่ได้ไปใช้จะทำให้มีจำนวนผู้เข้าชมเว็บไซต์เพิ่มมากขึ้น 4. ลดเวลาในค้นหากลุ่มคำสำคัญท่องเที่ยวที่จะนำไปใส่ในเว็บไซต์ 5. สามารถนำไปประยุกต์ใช้เรียนรู้กับโดเมนอื่น ๆ ได้ 10.6 ได้ผลงานวิชาการที่สามารถนำไปเขียนเป็นบทความทางวิชาการหรือเผยแพร่ในงานวิจัยระดับชาติหรือนานาชาติอย่างน้อย 1 บทความ
วิธีการดำเนินการวิจัย และสถานที่ทำการทดลอง/เก็บข้อมูล :
ในงานวิจัยครั้งนี้ผู้วิจัยได้ลำดับขั้นตอนของการดำเนินงานวิจัยไว้ ซึ่งมีรายละเอียดดังต่อไปนี้ 1. ศึกษาเอกสารข้อมูลและงานวิจัยที่เกี่ยวข้อง 2. จัดเก็บข้อมูล 3. คัดกรองเฉพาะข้อมูลที่เกี่ยวข้องกับการท่องเที่ยวด้วยอัลกอริทึมนาอีฟเบย์โดยใช้ค่าขอบเขต 4. วิเคราะห์คำสำคัญท่องเที่ยวด้วยเทคนิคการทำเหมืองข้อความ 5. ประยุกต์ใช้อัลกอริทึม Apriori และพัฒนาอัลกอริทึมในการหาคำสำคัญท่องเที่ยวที่ใช้บ่งบอกความเป็นเว็บไซต์ท่องเที่ยว 6. ทดสอบและวัดประสิทธิภาพของกลุ่มคำสำคัญท่องเที่ยว 7. สรุปผล อภิปรายผล และข้อเสนอแนะ รวมทั้งจัดทำรูปเล่มรายงาน
คำอธิบายโครงการวิจัย (อย่างย่อ) :
-
รายชื่อนักวิจัยในโครงการ :
ลำดับที่
รายชื่อ
ประเภทนักวิจัย
บทบาทหน้าที่
สัดส่วน
1
นายนฤพนธ์ พนาวงศ์
นักวิจัยภายในมหาวิทยาลัย
หัวหน้าโครงการวิจัย
100%
สถาบันวิจัยและพัฒนา
มหาวิทยาลัยราชภัฏนครสวรรค์ ศูนย์การศึกษาย่านมัทรี
398/1 หมู่ 3 ตำบลย่านมัทรี อำเภอพยุหะคีรี
จังหวัดนครสวรรค์ 60130
หมายเลขโทรศัพท์
056-219100 ต่อ 1139 งานวิจัย
website
rdi.nsru.ac.th
Smart Rdi Nsru