• Insiderly AI - TH
  • Posts
  • สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

Keynote: Generative AI for Thai Document OCR

Event: SCBX Unlocking AI EP4, Computer Vision: How AI See Things Like We Do

Collaboration: SCBX และ Insiderly.ai

Venue: SCBX NextTech, สยามพารากอน ชั้น 4

Speaker: ดร. กอบกฤตย์ วิริยะยุทธกร, President, AIEAT และ CEO บริษัท iApp Technology

น้อยคนนักจะชอบทำงานเอกสาร เพราะเป็นงานที่ยุ่งยาก ซับซ้อน และไม่ได้เสริมสร้างทักษะใหม่ๆ ให้เกิดขึ้นกับตัวเอง แต่หลายคนน่าจะถูกใจเมื่อรู้ว่าการใช้ Generative AI นั้นทำให้งานเอกสารที่เคยน่าเบื่อ สามารถเสร็จสิ้นได้ในเวลารวดเร็ว เพื่อไปทำงานอื่นที่มีประโยชน์กว่าแทน

ดร.กอบกฤตย์ วิริยะยุทธกร, President, AIEAT มาเล่าสั้นๆ ในหัวข้อ Generative AI for Thai Document OCR ในงานเสวนา SCBX UNLOCKING AI: EP4 Computer Vision: How AI See Things Like We Do ว่า เทคโนโลยีช่วยทำงานเอกสารนี้มีชื่อว่า OCR หมายถึง Optical Character Recognition ซึ่งเป็นกระบวนการเปลี่ยนข้อมูล ไม่ว่าจะเป็นรูปภาพ หรือข้อความ ในรูปแบบ Analog ให้กลายมาเป็นข้อมูลดิจิทัลที่จัดเรียงกันอย่างเป็นระเบียบนั่นเอง

ดร.กอบกฤตย์ อธิบายว่าในเมืองไทย เราสามารถใช้ AI ช่วยแกะข้อมูลเอกสารได้นานแล้วตั้งแต่ปี 2018 โดยเฉพาะอย่างยิ่งการแกะข้อมูลในบัตรประชาชน ผ่านการทำ Object Detection หรือการตัดข้อมูลขนาดใหญ่ให้เป็นชิ้นเล็กๆ จากนั้นจึงจัดวางตำแหน่งข้อมูลให้เรียงกันอย่างมีรูปแบบ เพื่อจะได้รู้ว่าส่วนไหนเป็นส่วนไหน 

แต่ในอนาคต เราจะไม่ต้องใช้ Object Detection แล้ว เพราะเราสามารถใช้ความฉลาดอย่าง GPT สามารถสกัดข้อความที่เป็น OCR ทั้งภาพแบบดิบๆ และจัดเรียงออกมาเป็นข้อมูลที่มีโครงสร้างได้อัตโนมัติ

ข้อได้เปรียบเพิ่มเติมของการไม่ต้องใช้ Object Detection คือเราจะสามารถสนับสนุนเอกสารที่ไม่มี Template ตายตัวได้ อาทิเช่น ใบเสร็จรับเงินที่มีรูปแบบหลากหลาย ทำให้ Thai Document OCR มีความ Flexible และสามารถรับเอกสารใหม่ๆได้ทันที

ข้อดีของการทำ OCR ก็คือ ช่วยคนทำงานจัดการกับข้อมูลในเอกสารต่างๆ เช่น จดหมายราชการ ใบเสนอราคา ใบเสร็จรับเงิน ใบแจ้งหนี้ ที่สามารถนำมาจัดเรียงเป็นโครงสร้างที่จัดเรียงสวยงามได้อย่างเป็นระเบียบในเวลาที่รวดเร็ว ไม่ต้องเสียเวลาคีย์ข้อมูลทีละอย่างและทีละใบจนจบ

แต่ทั้งนี้ก็มีข้อเสียคือ ระบบ GPT4 ในปัจจุบันนั้นยังประมวลผลข้อมูลช้ามาก โดยเฉพาะอย่างยิ่งหากป้อนข้อมูลเป็นภาษาไทย โดยเฉลี่ยแล้วจะกินเวลาในการประมวลนาน 60-90 วินาที ซึ่งดูเผินๆ อาจเหมือนไม่นาน แต่หากต้องจัดการเอกสารมากกว่า 100 แผ่น นั่นหมายถึงต้นทุนที่เพิ่มมากขึ้นตามไปด้วย

ข่าวดีก็คือ ในประเทศไทยกำลังพัฒนา Generative AI ของไทยเองชื่อว่า OpenThaiGPT ซึ่งเป็น AI ที่รวบรวมองค์ความรู้ภาษาไทย และมีฐานข้อมูลแหล่งสำคัญมาจากเว็บไซต์ Pantip ปัจจุบันแม้กำลังอยู่ในช่วงทดลองใช้งาน แต่ก็สามารถทำ OCR ช่วยจัดการงานเอกสารตามขั้นตอนดังกล่าวได้ในเวลาเพียงแค่ 5 วินาที ได้รับการคาดหมายว่าจะช่วยให้คนไทยทำงานกับเอกสารขนาดเยอะได้รวดเร็วขึ้น

ดร.กอบกฤตย์ ยังแย้มอีกว่า OpenThaiGPT กำลังฉลาดๆ ขึ้นเรื่อยๆ ล่าสุดทีมพัฒนาลองเอาข้อสอบ ONET ระดับชั้นมัธยมศึกษาปีที่ 6 ให้ทำแล้วได้ผลคะแนนมากกว่าค่าเฉลี่ยที่เด็กไทยสามารถทำได้อีกด้วย ไม่เพียงแค่นั้น OpenThaiGpt ยังเก่งภาษาอังกฤษด้วย ไม่แค่ถนัดภาษาไทยอย่างเดียว

ทั้งนี้ทั้งนั้น ดร.กอบกฤตย์ ยอมรับว่าในภาพรวม Open AI ของบ้านเราอาจยังฉลาดสู้ AI เมืองนอกไม่ได้ แต่ก็ถือเป็นนิมิตหมายอันดีว่า นี่จะเป็นก้าวย่างสำคัญ ช่วยให้การทำงานของคนไทยดีขึ้นกว่าเดิม และภายในสิ้นปีนี้จะมีการปล่อย OpenThaiGPT เวอร์ชัน 70b ออกมาด้วย ซึ่งจะฉลาดกว่าเดิมอีกหลายเท่า หวังว่าจะช่วยให้เกิดการทำงานที่แหลมคมมากขึ้นตามมา

Reply

or to participate.