Please use this identifier to cite or link to this item:
http://nuir.lib.nu.ac.th/dspace/handle/123456789/1542
Title: | การตรวจจับและรู้จำข้อความเพื่อการทำงานแบบอัตโนมัติในภาคอุตสาหกรรม Text Detection and Recognition for Industrial Automation |
Authors: | SORAWEE POPAYORM สรวีย์ โพธิ์พยอม Wansuree Masagram วันสุรีย์ มาศกรัม Naresuan University. Faculty of Science |
Keywords: | การแปลงเรดอนหลายขนาด การตรวจจับจอภาพที่แสดงผลในรูปแบบเจ็ดส่วน การรู้จำตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วน การเพิ่มข้อมูล การตัดแบบกำหนดช่วงบนแบบจำลองสี HSV Predefined HSV color slicing multiscale Radon transform seven segment display detection seven segment number recognition data augmentation |
Issue Date: | 2562 |
Publisher: | Naresuan University |
Abstract: | Detection of LED seven segment panels presents a particular challenge of locating characters among background clutter. This study proposed a framework based on a predefined HSV color slicing technique for detection and recognition by using the convolutional neural network. The problem of limited data in creating rotation, scale, perspective, and illumination invariant of the neural network training sets are alleviated by the data augmentation technique. The multiscale Radon transform is proposed in this study to enhance the data augmentation for seven segment display recognition. The results demonstrate the framework’s superiority over other color slicing methods with 94.46% precision and 92.24% recall for the part of detection. And the accuracy rates for the recognition part demonstrate the overall accuracy performance of 87.05%. การตรวจจับตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วนบนจอภาพแอลอีดีนั้นมีความท้าทายโดยเฉพาะอย่างยิ่งในการค้นหาตัวเลขท่ามกลางวัตถุที่หลากหลายบนภาพซึ่งอาจมีส่วนประกอบหรือรูปทรงที่คล้ายคลึงกัน ดังนั้น ในงานวิจัยนี้จะนำเสนอวิธีการนำตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วนออกมาจากภาพ โดยการตัดแบบกำหนดช่วงบนแบบจำลองสี HSV (Predefined HSV color slicing technique) เพื่อการตรวจจับ และประยุกต์ใช้โครงข่ายประสาทเทียมแบบคอนโวลูชัน (Convolutional neural network) ในการรู้จำ ทางผู้วิจัยนำเสนอวิธีการเพิ่มข้อมูลโดยการแปลงเรดอนหลายขนาด (Multiscale Radon transform) เพื่อลดปัญหาด้านข้อจำกัดของข้อมูลภาพสอนสำหรับโครงข่ายประสาทเทียม รวมถึงการลดปัญหาพฤติกรรมการถ่ายภาพซึ่งส่งผลให้ภาพเอียง มีขนาดภาพที่หลากหลาย มุมมองของภาพ และผลจากการตกกระทบของแสงที่แตกต่างกัน ซึ่งอาจส่งผลต่อการรู้จำภาพตัวเลขที่แสดงผลในรูปแบบเจ็ดส่วน และผลการทดลองแสดงให้เห็นว่าวิธีการตรวจจับที่ผู้วิจัยนำเสนอมีค่าความแม่นยำ และค่าการเรียกคืนตัวอักษรที่สูงที่สุดอยู่ที่ 94.46% และ 92.24% ตามลำดับ รวมไปถึงวิธีการรู้จำที่ผู้วิจัยนำเสนอมีค่าเฉลี่ยของอัตราความถูกต้องอยู่ที่ 87.05% อีกด้วย |
Description: | Master of Science (M.S.) วิทยาศาสตรมหาบัณฑิต (วท.ม.) |
URI: | http://nuir.lib.nu.ac.th/dspace/handle/123456789/1542 |
Appears in Collections: | คณะวิทยาศาสตร์ |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
61062373.pdf | 7.06 MB | Adobe PDF | View/Open |
Items in NU Digital Repository are protected by copyright, with all rights reserved, unless otherwise indicated.