รายละเอียดโครงการวิจัย

ชื่อโครงการ (ภาษาไทย) :
การใช้หลักการประมวลผลภาษาธรรมชาติเพื่อสอบสวนโรคจากเอกสารบันทึกอาการของผู้ป่วยโควิด-19
ชื่อโครงการ (ภาษาอังกฤษ) :
The use of Natural Language Processing principles for the investigation of diseases from patients COVID-19 records
หน่วยงานเจ้าของโครงการ :
สถาบันวิจัยและพัฒนา
ลักษณะโครงการวิจัย :
โครงการวิจัยเดี่ยว
ลักษณะย่อยโครงการวิจัย :
ไม่อยู่ภายใต้แผนงานวิจัย/ชุดโครงการวิจัย
ประเภทโครงการ :
โครงการวิจัยใหม่
วันเริ่มต้นโครงการ :
1 มกราคม 2564
วันสิ้นสุดโครงการ :
1 มกราคม 2565
ประเภทของการวิจัย :
การวิจัยพื้นฐาน
ความสำคัญและที่มาของปัญหา :
         จากข้อมูลของกรมควบคุมโรค โรคติดเชื้อไวรัสโคโรนา 2019 (โควิด-19) นั้น ถูกจัดว่าเป็นโรคอุบัติใหม่ หมายถึงการมีผู้ป่วย หรือมีแนวโน้มที่จะพบผู้ติดเชื้อเพิ่มมากขึ้น โดยโควิด-19 นั้น เริ่มพบการติดเชื้อครั้งแรกที่ประเทศจีนในเมืองอู่ฮั่น ในช่วงปลายปี 2562 โดยได้รับการยืนยันอย่างเป็นทางการเมื่อ 31 ธันวาคม 2562 และจากจุดเริ่มต้นการระบาดในประเทศจีนนั้น ปัจจุบัน โควิด-19 ได้แพร่ขยายเป็นการระบาดใหญ่ (Pandemic) ไปยังทั่วโลก โดยมีผู้ติดเชื้อมากกว่า 4 ล้านราย และมีผู้เสียชีวิตเกือบ 3 แสนคน โดยมีการติดเชื้อแพร่กระจายไปในทุกทวีป และประเทศสหรัฐอเมริกา เป็นประเทศที่มีผู้จำนวนผู้เสียชีวิตต่อประชากรหนึ่งแสนคน โดยมีตัวเลขสูงกว่า 8 หมื่นคน คิดเป็นร้อยละ 24.7 ของผู้ติดเชื้อรวมกว่า 1.3 ล้านคน สำหรับสถานการณ์ โควิด-19 ในประเทศไทยนั้น มีการตรวจพบผู้ติดเชื้อรายแรกเมื่อวันที่ 12 มกราคม 2563 รวมถึงพบผู้ติดเชื้อจำนวนมากเกิดหนึ่งร้อยรายต่อวัน อยู่ในระหว่างวันที่ 22 มีนาคม 2563 ถึง 3 เมษายน 2563 และพบผู้ติดเชื้อไม่ถึง 10 ราย ตั้งแต่วันที่ 27 เมษายน 2563 โดยคงสถานะผู้ป่วยต่ำกว่า 10 รายได้เป็นส่วนใหญ่ ทั้งนี้เมื่อทำการสรุปจำนวนผู้ติดเชื้อในประเทศไทยแล้ว พบว่ามีผู้ติดเชื้อสะสมถึงวันที่ 12 พฤษภาคม 2563 อยู่ที่ 3,017 คน มีผู้เสียชีวิต 56 ราย โดยจังหวัดที่มีผู้ติดเชื้อสูงสุด ได้แก่กรุงเทพมหานคร ซึ่งมีผู้ติดเชื้อสะสมถึง 1,547 ราย และมี 9 จังหวัดที่ไม่พบผู้ติดเชื้อ ได้แก่จังหวัดน่าน กำแพงเพชร พิจิตร บึงกาฬ สิงห์บุรี ชัยนาท อ่างทอง ตราด และระนอง ในช่วงที่พบการระบาดครั้งใหญ่ (Super spreader) ในประเทศไทยนั้น เกิดจากการจัดรายการมวยแชมเปี้ยนเกียรติเพชร ในวันที่ 6 มีนาคม 2563 ที่สนามมวยลุมพินี ซึ่งผู้ที่ทำการแพร่เชื้อนั้น ได้เดินทางกลับมาจากประเทศอิตาลี ซึ่งเป็นหนึ่งในประเทศที่มีการระบาดของเชื้อเป็นวงกว้าง โดยบุคคลดังกล่าวได้แพร่เชื้อให้กับผู้ที่เข้ามาภายในสนามมวยมากกว่า 50 คน และหลังจากนั้น ผู้ที่ได้รับเชื้อกว่า 50 คนนี้ ได้นำเชื้อไปแพร่กระจายให้กับส่วนต่าง ๆ ของประเทศเป็นวงกว้างต่อไป ดังนั้น จึงจะพบจำนวนผู้ป่วยจำนวนมากหลังจากการแข่งขันมวยเสร็จสิ้นแล้วประมาณ 14 วัน โดยการจะได้มาซึ่งของผู้รับเชื้อกว่า 50 คนนี้ ต้องมีการสอบสวนโรค ในกลุ่มของประชาชนกลุ่มที่เข้ามาสัมผัสกับผู้ป่วย การสอบสวนโรคโควิด-19 นั้น มีเกณฑ์การตรวจสอบจากผู้ที่มีอาการไข้ พร้อมกับมีประวัติอย่างใดอย่างหนึ่งต่อไปนี้ประกอบ ได้แก่ การเดินทางกลับมาจากพื้นที่การระบาด ตามการประกาศของกระทรวงสาธารณสุข การอาศัยอยู่ในพื้นที่เสี่ยง การสัมผัสใกล้ชิดกับผู้ป่วย และการสัมผัสสัตว์แหล่งรังโรค โดยเป็นประวัติในช่วง 14 วัน ก่อนอาการป่วย โดยมีการใช้งานร่วมกับแบบสอบสวนโรค Novelcorona 2 ซึ่งนอกจากจะมีรายละเอียดของข้อมูลในลักษณะการเติมคำลงในช่องว่าง และรายการตัวเลือกแล้ว ยังมีรายละเอียดเหตุการณ์ ประวัติเสี่ยงต่อการติดเชื้อ ก่อนเริ่มป่วย ไว้เป็นคำถามปลายเปิด เพื่อให้เจ้าหน้าที่ที่ทำการสอบสวนข้อมูล ได้ทำการบันทึกข้อความการสอบสวนเพิ่มเติมลงไปอีกด้วย ซึ่งอาจจะเป็นข้อมูลในส่วนของสถานที่ หรือเวลา และรายละเอียดของสถานการณ์ที่เกิดขึ้นกับผู้สงสัยว่าตนเองจะติดเชื้อไวรัสโควิด-19 จากข้อมูลในแบบสอบสวนในส่วนของ รายละเอียดเหตุการณ์ฯ นั้น จะเห็นได้ว่าเป็นการบันทึกข้อมูลที่เป็นลักษณะของข้อความ และไม่เป็นโครงสร้าง เมื่อต้องมีการบันทึกข้อมูลเป็นจำนวนมาก ตัวอย่างเช่น หากต้องการสอบสวนจากเหตุการณ์ Super Spread จำเป็นต้องแยกกลุ่มหาบุคคลที่เกี่ยวข้องกับผู้แพร่เชื้อ สถานที่ที่คนเหล่านั้นเคยไป ซึ่งอาจจะทำการแพร่เชื้อต่อไปยังผู้อื่นได้อีก การหาความสัมพันธ์ของบุคคล สถานที่ และเวลา ซึ่งเป็นเรื่องที่สิ้นเปลืองทรัพยากรบุคคลเป็นอย่างยิ่ง ในการจำแนกข้อมูลด้วยแรงงานคน ดังนั้นทางผู้วิจัยจึงเห็นว่า หากมีการนำเอาระบบอัตโนมัติมาเพื่อใช้ในการสกัดข้อมูล แล้วนำข้อมูลเหล่านั้นมาวิเคราะห์แทนเจ้าหน้าที่สาธารณสุข ก็จะเป็นประโยชน์ และลดระยะเวลาในการทำการสอบสอบโรคได้เป็นอย่างดีต่อไป
วัตถุประสงค์ของโครงการ :
1. เพื่อศึกษาแบบฟอร์ม และวิธีการเก็บข้อมูลการสอบสวนโรคไวรัสโควิด-19 2. เพื่อวิจัยหาทฤษฎี เทคโนโลยีที่เหมาะสมมาวิเคราะห์ข้อมูลจากการสอบสวนโรค 3. เพื่อนำข้อมูลที่รวบรวมได้แบบสอบสวนโรค มาการวิเคราะห์หาความสัมพันธ์ระหว่างบุคคล เวลา และสถานที่ 4. เพื่อให้เกิดแบบแผนการบันทึกข้อมูลแบบไร้โครงสร้าง แต่สามารถเข้าถึงหรือวิเคราะห์ข้อมูลได้อย่างรวดเร็ว 5. เพื่อสร้างเครื่องมือต้นแบบด้าน NLP เพื่อนำไปใช้ในการสอบสวนโรค สำหรับสถานพยาบาลในเขตจังหวัดนครสวรรค์
ขอบเขตของโครงการ :
1. การใช้ข้อมูล จากข้อมูลทุติยภูมิ จากตัวอย่างแบบสอบสวนโรค Novelcorona 2 2. การใช้ข้อมูล จากข้อมูลตัวอย่าง เพื่อตรวจสอบความแม่นยำของระบบ
ผลที่คาดว่าจะได้รับ :
1. ต้นแบบระบบ AI โดยใช้ NLP เพื่อหาความสัมพันธ์ของรายการบันทึกแบบสอบสวนโรคในส่วนของ Social Networking and Relationship 2. โปรแกรมต้นแบบสำหรับการศึกษาในด้าน NLP ของหลักสูตรวิทยาการคอมพิวเตอร์ หรือที่เกี่ยวข้อง 3. แนวทางการบันทึกคำตอบให้กับคำถามปลายเปิดสำหรับการสอบสวนโรค เพื่อเพิ่มประสิทธิภาพให้กับระบบอัตโนมัติในการทำความเข้าใจกับข้อมูลที่ได้บันทึกไว้
วิธีการดำเนินการวิจัย และสถานที่ทำการทดลอง/เก็บข้อมูล :
         1. เตรียมความพร้อม หาข้อมูลในรูปแบบทุติยภูมิ เพื่อนำมาใช้ในงานวิจัย 2. ออกแบบการทดลอง 3. พัฒนาระบบ NLP Healthcare ในส่วนของ Data Extraction 4. พัฒนาระบบ NLP Healthcare ในส่วนของ Social Networking and Relationship 5. ทดสอบกับข้อมูลตัวอย่าง 6. สรุปผลดำเนินงาน 7. ทำรายงานสรุปผลโครงการ 8. จัดทำเอกสารเผยแพร่ผลงานวิจัย
คำอธิบายโครงการวิจัย (อย่างย่อ) :
การอ่านข้อความ จากแบบสอบส่วนโรค เพื่อหาความสัมพันธ์ระหว่าง บุคคล สถานที่ และเวลา ด้วยการใช้ NLP
รายชื่อนักวิจัยในโครงการ :
ลำดับที่ รายชื่อ ประเภทนักวิจัย บทบาทหน้าที่ สัดส่วน
1 นายถิรภัทร มีสำราญ นักวิจัยภายในมหาวิทยาลัย หัวหน้าโครงการวิจัย 40%
2 นายวิฑูร สนธิปักษ์ นักวิจัยภายในมหาวิทยาลัย ผู้ร่วมวิจัย 40%
3 นายภาสกร วรอาจ นักวิจัยภายในมหาวิทยาลัย ผู้ร่วมวิจัย 20%

สถาบันวิจัยและพัฒนา

มหาวิทยาลัยราชภัฏนครสวรรค์ ศูนย์การศึกษาย่านมัทรี
398/1 หมู่ 3 ตำบลย่านมัทรี อำเภอพยุหะคีรี
จังหวัดนครสวรรค์ 60130

หมายเลขโทรศัพท์

056-219100 ต่อ 1139 งานวิจัย