Please use this identifier to cite or link to this item: http://nuir.lib.nu.ac.th/dspace/handle/123456789/1542
Title: Text Detection and Recognition for Industrial Automation
การตรวจจับและรู้จำข้อความเพื่อการทำงานแบบอัตโนมัติในภาคอุตสาหกรรม
Authors: SORAWEE POPAYORM
สรวีย์ โพธิ์พยอม
Wansuree Masagram
วันสุรีย์ มาศกรัม
Naresuan University. Faculty of Science
Keywords: การแปลงเรดอนหลายขนาด
การตรวจจับจอภาพที่แสดงผลในรูปแบบเจ็ดส่วน
การรู้จำตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วน
การเพิ่มข้อมูล
การตัดแบบกำหนดช่วงบนแบบจำลองสี HSV
Predefined HSV color slicing
multiscale Radon transform
seven segment display detection
seven segment number recognition
data augmentation
Issue Date: 2562
Publisher: Naresuan University
Abstract: Detection of LED seven segment panels presents a particular challenge of locating characters among background clutter. This study proposed a framework based on a predefined HSV color slicing technique for detection and recognition by using the convolutional neural network. The problem of limited data in creating rotation, scale, perspective, and illumination invariant of the neural network training sets are alleviated by the data augmentation technique. The multiscale Radon transform is proposed in this study to enhance the data augmentation for seven segment display recognition. The results demonstrate the framework’s superiority over other color slicing methods with 94.46% precision and 92.24% recall for the part of detection. And the accuracy rates for the recognition part demonstrate the overall accuracy performance of 87.05%.
การตรวจจับตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วนบนจอภาพแอลอีดีนั้นมีความท้าทายโดยเฉพาะอย่างยิ่งในการค้นหาตัวเลขท่ามกลางวัตถุที่หลากหลายบนภาพซึ่งอาจมีส่วนประกอบหรือรูปทรงที่คล้ายคลึงกัน ดังนั้น ในงานวิจัยนี้จะนำเสนอวิธีการนำตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วนออกมาจากภาพ โดยการตัดแบบกำหนดช่วงบนแบบจำลองสี HSV (Predefined HSV color slicing technique) เพื่อการตรวจจับ และประยุกต์ใช้โครงข่ายประสาทเทียมแบบคอนโวลูชัน (Convolutional neural network) ในการรู้จำ ทางผู้วิจัยนำเสนอวิธีการเพิ่มข้อมูลโดยการแปลงเรดอนหลายขนาด (Multiscale Radon transform) เพื่อลดปัญหาด้านข้อจำกัดของข้อมูลภาพสอนสำหรับโครงข่ายประสาทเทียม รวมถึงการลดปัญหาพฤติกรรมการถ่ายภาพซึ่งส่งผลให้ภาพเอียง มีขนาดภาพที่หลากหลาย มุมมองของภาพ และผลจากการตกกระทบของแสงที่แตกต่างกัน ซึ่งอาจส่งผลต่อการรู้จำภาพตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วน และผลการทดลองแสดงให้เห็นว่าวิธีการตรวจจับที่ผู้วิจัยนำเสนอมีค่าความแม่นยำ และค่าการเรียกคืนตัวอักษรที่สูงที่สุดอยู่ที่ 94.46% และ 92.24% ตามลำดับ รวมไปถึงวิธีการรู้จำที่ผู้วิจัยนำเสนอมีค่าเฉลี่ยของอัตราความถูกต้องอยู่ที่ 87.05% อีกด้วย
Description: Master of Science (M.S.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)
URI: http://nuir.lib.nu.ac.th/dspace/handle/123456789/1542
Appears in Collections:กลุ่มวิทยาศาสตร์และเทคโนโลยี

Files in This Item:
File Description SizeFormat 
61062373.pdf7.06 MBAdobe PDFView/Open


Items in NU Digital Repository are protected by copyright, with all rights reserved, unless otherwise indicated.