มหาวิทยาลัยราชภัฏนครสวรรค์
สถาบันวิจัยและพัฒนา
ระบบจัดการงานวิจัย
NSRU
RESEARCH
หน้าหลัก
ค้นหารายการ
ข้อมูลงานวิจัย
ข้อมูลนักวิจัย
รายงานสถิติ
งานวิจัย
งานทรัพย์สินทางปัญญา
เข้าสู่ระบบ
รายละเอียดโครงการวิจัย
ชื่อโครงการ (ภาษาไทย) :
การบูรณะภาพเอกสารทางประวัติศาสตร์ของไทยที่เสื่อมสภาพโดยใช้การไบนาไรเซชันแบบปรับตัวตามสารสนเทศหลายระดับ
ชื่อโครงการ (ภาษาอังกฤษ) :
Restoration of Degraded Thai Historical Document Images Using Adaptive Multilevel-Information Binarization
หน่วยงานเจ้าของโครงการ :
คณะวิทยาศาสตร์และเทคโนโลยี
ลักษณะโครงการวิจัย :
โครงการวิจัยเดี่ยว
ลักษณะย่อยโครงการวิจัย :
ไม่อยู่ภายใต้แผนงานวิจัย/ชุดโครงการวิจัย
ประเภทโครงการ :
โครงการวิจัยใหม่
วันเริ่มต้นโครงการ :
19 พฤศจิกายน 2556
วันสิ้นสุดโครงการ :
18 พฤศจิกายน 2557
ประเภทของการวิจัย :
งานวิจัยประยุกต์
ความสำคัญและที่มาของปัญหา :
การเก็บรักษาเอกสารทางประวัติศาสตร์มีความสำคัญในแง่ของการเก็บรักษา ประวัติ ความเป็นมา และภูมิปัญญาของประเทศ การเก็บรักษาต้นฉบับเอกสารดังกล่าวต้องเผชิญกับสภาะความเสื่อมสภาพหลายประการ เช่น มลภาวะที่เป็นพิษ สภาพอากาศที่แปรปรวน คุณภาพของกระดาษที่ใช้พิมพ์เอกสาร การรบกวนจากฝุ่น และการเก็บรักษาที่ผิดวิธี เป็นต้น ในทางปฏิบัติ การเก็บรักษาหรือบูรณะเอกสารต้นฉบับให้คงสภาพเดิมได้มากที่สุดนั้นค่อนข้างทำได้ยากเนื่องจากต้องควบคุมปัจจัยหลายประการ เช่น อุณภูมิห้อง ความเข้มของแสง ความชื้นสัมพัธในอากาศ ปัจจัยดังกล่าวนั้นมีค่าใช้จ่ายค่อนข้างสูง จึงเป็นที่มาของการนำเอกสารต้นฉบับดังกล่าวมาทำการแสกนเพื่อเก็บรักษาไว้ในรูปแบบเอกสารดิจิตอล ซึ่งในปัจจุบันได้รับความนิยมเพิ่มขึ้นอย่างรวดเร็ว โดยสังเกตุได้จากจำนวนคลังเอกสารดิจิตอลที่มีอัตราเติบโตเพิ่มมากขึ้นอย่างต่อเนื่อง [5] เมื่อเอกสารอยู่ในรูปแบบเอกสารดิจิตอลแล้ว หากต้องการบูรณะหรือฟื้นฟูภาพเอกสารเสื่อมสภาพดังกล่าวจะสามารถดำเนินการได้ด้วยเทคนิคการประมวลผลภาพดิจิตอล (digital image processing) โดยวิธีการหนึ่งที่ได้รับความนิยมในการบูรณะภาพเอกสารดิจิตอลดังกล่าวคือ การไบนาไรเซชัน (binarization) การไบนาไรเซชัน คือการตัดสินใจเพื่อจัดกลุ่มค่าระดับเทาของภาพให้อยู่ในกลุ่มของ foreground ที่เป็นสีดำ หรือ background ที่เป็นสีขาว โดยมีจุดประสงค์เพื่อเตรียมการประมวลผล (pre-processing) เพื่อการประมวลผลภาพเอกสาร (document image) อันนำไปสู่การประมวลผลในขั้นตอนลำดับถัดไปเช่น การแบ่งส่วนภาพอักษร (character segmentation) การรู้จำภาพอักษร (character recognition) และการรู้จำอักขระด้วยแสง (optical character recognition) เป็นต้น นอกจากนั้นยังใช้เพื่อการบูรณะฟื้นฟูภาพเอกสารดิจิตอลอีกด้วย [1-4] จากการทดลองใช้อัลกอริทึมการทำไบนาไรเซชันที่เป็นที่รู้จักแพร่หลายจำนวน 6 อัลกอริทึม ประกอบด้วย Otsu’s method [5] Kapur’s method [6] Kittler’s method [7] Bernsen’s method [8] Niblack’s method [9] และ Sauvola’s method [10] กับคลังภาพเอกสารภาษาไทยจำนวน 100 ภาพ พบว่าหากภาพเอกสารอยู่ในสภาพสมบูรณ์แล้วผลลัพธ์ที่ได้จะเป็นที่น่าพอใจ แต่หากเป็นภาพเอกสารที่มีลักษณะของความเสื่อมสภาพแล้ว จะพบว่าผลลัพธ์ที่ได้นั้นอยู่ในระดับที่ไม่สามารถนำไปใช้งานในขั้นตอนถัดไปได้
วัตถุประสงค์ของโครงการ :
1 เพื่อศึกษาหลักการและอัลกอริทึมการทำภาพสองระดับที่เป็นที่รู้จักอย่างแพร่หลาย (well-known) จำนวน 6 อัลกอริทึม ประกอบด้วยวิธีการของ Otsu, Kapur, Kittler, Bernsen, Niblack และ Sauvola และวิเคราะห์หาสาเหตุของปัญหาความไม่สมบูรณ์เมื่อดำเนินการกับเอกสารเสื่อมสภาพ 2 เพื่อออกแบบกรอบการทำงาน (framework) และวิธีการการทำภาพสองระดับกับภาพเอกสารเสื่อมสภาพภาษาไทยที่มีประสิทธิภาพ 3 เพื่อพัฒนาซอฟต์แวร์ที่สามารถดำเนินการทำภาพสองระดับกับภาพเอกสารเสื่อมสภาพภาษาไทยได้ตามกรอบการทำงานที่ได้ออกแบบไว้อย่างมีประสิทธิภาพ 4 ทดสอบซอฟต์แวร์กับภาพเอกสารทางประวัติศาสตร์ไทยที่เสื่อมสภาพ
ขอบเขตของโครงการ :
1 ใช้ MATLAB เป็นเครื่องมือในการพัฒนาซอฟต์แวร์ให้มีความสามารถตามกรอบการทำงานที่ออกแบบไว้ 2 ทดสอบอัลกอริทึมการทำภาพสองระดับแบบปรับตัวตามสารสนเทศหลายระดับ กับภาพเอกสารทางประวัติศาสตร์ไทยที่เสื่อมสภาพ 2 กลุ่ม กลุ่มที่ 1 เป็นภาพเอกสารที่เขียนด้วยลายมือจำนวน 10 ภาพ กลุ่มที่ 2 เป็นภาพเอกสารที่เป็นตัวพิมพ์จำนวน 10 ภาพ รวมเป็นจำนวน 20 ภาพ 3 ประเมินผลการทำงานของซอฟต์แวร์ในเชิงคุณภาพโดยตัวชี้วัด 7 ประการ [11] และในเชิงปริมาณโดยใช้ตัวชี้วัด ค่าความแม่นยำ (precision) [11] ค่าการระลึก (recall) [11] และดัชนีเอฟ (f-index) [11]
ผลที่คาดว่าจะได้รับ :
วิธีการดำเนินการวิจัย และสถานที่ทำการทดลอง/เก็บข้อมูล :
1 วิธีการดำเนินการวิจัย ในการดำเนินการวิจัยนี้เป็นการคิดค้นกรอบการทำงานและอัลกอริทึมที่มีความเหมาะสมในการบูรณะภาพเอกสารไทยที่เสื่อมสภาพ เมื่อได้กรอบการทำงานและอับกอริทึมดังกล่าวแล้ว จะนำไปพัฒนาเป็นซอฟต์แวร์เพื่อทดสอบกับกลุ่มตัวอย่างภาพเอกสารไทยที่เสื่อมสภาพโดยได้รับความร่วมมือจากหอสมุดแห่งชาติในการจัดเตรียมกลุ่มตัวอย่างดังกล่าว เนื่องจากโครงการวิจัยนี้ใช้วิธีการพัฒนาซอฟต์แวร์เพื่อแก้ปัญหาและทดสอบสมมติฐานดังที่ได้นำเสนอแล้ว ดังนั้นผู้เสนอโครงการวิจัยจะดำเนินโครงการวิจัยตามหลักการของวิศวกรรมซอฟต์แวร์รูปแบบ water fall model ซึ่งประกอบด้วย 7 ขั้นตอนดังนี้ 1. ศึกษาค้นคว้าข้อมูลเบื้องต้น แนวคิด และวิธีดำเนินงาน ในขั้นตอนนี้ผู้ดำเนินโครงการวิจัยได้ศึกษาถึงปัญหาการทำไบนาไรเซชันที่เกิดกับภาพเอกสารเสื่อมสภาพภาษาไทยจากคลังเอกสารภาพทางประวัติศาสตร์ของหอสมุดแห่งชาติ โดยโจทย์วิจัยนี้เกิดขึ้นระหว่างเวทีการเสวนา IRPUS ซึ่งจัดโดยมหาวิทยาลัยนเรศวร จากนั้นผู้ดำเนินโครงการวิจัยได้ศึกษาวิธีการฟื้นฟูภาพเอกสารโดยการทำไบนาไรเซชันที่มีการใช้งานในต่างประเทศจากบทความในวารสารวิชาการระดับนานาชาติ พบว่ามีผู้นำเสนอไว้หลายวิธีซึ่งแต่ละวิธีก็มีข้อดี ข้อเสีย และลักษณะการนำไปใช้ที่เหมาะสมแตกต่างกัน เมื่อนำมาประยุกต์ใช้งานกับภาพเอกสารของหอสมุดแห่งชาติพบว่าผลลัพธ์ไม่เป็นที่น่าพอใจ เนื่องจากคุณลักษณะและความเสื่อมสภาพของเอกสารต้นฉบับนั้นไม่เหมือนกัน (ขั้นตอนนี้ดำเนินการไปแล้ว) 2. วิเคราะห์ความต้องการของระบบ ในขั้นตอนนี้ผู้ดำเนินโครงการวิจัยได้วิเคราะห์อัลกอริทึมการทำไบนาไรเซชันที่เคยมีผู้นำเสนอไว้ พบว่าประเด็นสำคัญคือต้องใช้การทำ pre-processing และ post-processing ที่เหมาะกับลักษณะของเอกสาร รวมไปถึงเทคนิคการทำ adaptive threshold ซึ่งคาดว่าจะได้ผลลัพธ์ที่ดีขึ้น จากนั้นจึงสร้าง frame work ที่เหมาะสมกับคุณลักษณะของภาพเอกสารเสื่อมสภาพ 3. การเตรียมการและนำเสนอโครงการ ขั้นตอนนี้ เป็นการรวบรวมสิ่งที่เป็นผลลัพธ์ของขั้นตอนที่ 12.1 และ 12.2 เรียบเรียงออกมาเป็นแบบเสนอโครงการวิจัยฉบับนี้และนำเสนอโครงการวิจัยต่อคณะกรรมการผู้ทรงคุณวุฒิ 4. การวิเคราะห์และออกแบบระบบ เป็นขั้นตอนที่ผู้วิจัยจะทำการออกแบบระบบโดยลักษณะ coarse to fine โดยใช้ UML และ flow chart เป็นเครื่องมือ ผลลัพธ์ที่ได้จากขั้นตอนนี้จะส่งผลให้ทีมพัฒนาระบบในขั้นตอนต่อไปสามารถเข้าใจกรอบการทำงานและอัลกอริทึมที่ผู้ดำเนินโครงการวิจัยคิดขึ้นมาได้ 5. พัฒนาระบบ เป็นขั้นตอนการพัฒนาระบบโดยใช้ MATLAB เป็นเครื่องมือ โดยเขียนโปรแกรมให้สามารถทำงานตามกรอบการทำงานและอัลกอริทึมในขั้นตอนที่ 4 และตรวจสอบการทำงานของระบบในแต่ละขั้นตอนว่าเป็นไปตามกรอบการทำงานและอัลกอริทึมที่คิดไว้หรือไม่ เมื่อพัฒนาระบบจนเกือบจะสมบูรณ์แล้วผู้ดำเนินโครงการจะเขียนบทความวิจัยที่เน้นถึงกรอบการทำงานและผลลัพธ์เบื้องต้นที่ได้เพื่อเผยแพร่และร่วมนำเสนอในงานประชุมวิชาการระดับนานาชาติ โดยมุ่งหวังที่จะได้รับฟังข้อคิดเห็นจากการประชุมวิชาการระดับนานาชาติดังกล่าวเพื่อรวบรวมข้อคิดเห็นมาปรับปรุงระบบให้มีความสมบูรณ์มากที่สุด 6. ทดสอบและปรับปรุงแก้ไขระบบ ในขั้นตอนนี้เป็นการนำระบบที่พัฒนาสำเร็จแล้วมาทำการทดสอบกับชุดทดสอบที่ได้กล่าวถึงไปแล้วในส่วนขอบเขตของงานวิจัยเพื่อหาข้อบกพร่องของระบบที่ได้สร้างขึ้น และเมื่อพบจุดบกพร่องก็ทำการหาสาเหตุ และแก้ไขโปรแกรมเพื่อให้ได้ตัวระบบที่สมบูรณ์มากที่สุด 7. จัดทำรายงานและเอกสารที่เกี่ยวข้อง ผู้ดำเนินโครงการวิจัยจะจัดทำรายงานวิจัยฉบับสมบูรณ์ คู่มือการใช้งานซอฟต์แวร์ และเขียนบทความวิจัยเพื่อการเผยแพร่ในวารสารวิชาการระดับนานาชาติ 2 สถานที่ทำการทดลอง ห้องปฏิบัติการสาขาวิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ภาควิชาวิทยาศาสตร์ประยุกต์ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏนครสวรรค์ 3 สถานที่เก็บข้อมูล หอสมุดมหาวิทยาลัยราชภัฏนครสวรรค์และหอสมุดแห่งชาติ
คำอธิบายโครงการวิจัย (อย่างย่อ) :
-
รายชื่อนักวิจัยในโครงการ :
ลำดับที่
รายชื่อ
ประเภทนักวิจัย
บทบาทหน้าที่
สัดส่วน
1
ผู้ช่วยศาสตราจารย์ ดร.กฤษดา ขันกสิกรรม
นักวิจัยภายในมหาวิทยาลัย
หัวหน้าโครงการวิจัย
100%
สถาบันวิจัยและพัฒนา
มหาวิทยาลัยราชภัฏนครสวรรค์ ศูนย์การศึกษาย่านมัทรี
398/1 หมู่ 3 ตำบลย่านมัทรี อำเภอพยุหะคีรี
จังหวัดนครสวรรค์ 60130
หมายเลขโทรศัพท์
056-219100 ต่อ 1139 งานวิจัย
website
rdi.nsru.ac.th
Smart Rdi Nsru