Please use this identifier to cite or link to this item: http://nuir.lib.nu.ac.th/dspace/handle/123456789/5328
Title: การเปรียบเทียบวิธีประมาณค่าตัวแปรตามที่สูญหายในการวิเคราะห์การถดถอยเชิงเส้นพหุคูณ
A Comparison of Missing Response Estimation Methods in Multiple Linear Regression
Authors: SIRIWATTANA SEEDEE
ศิริวัฒนา สีดี
Katechan Jampachaisri
เกตุจันทร์ จำปาไชยศรี
Naresuan University
Katechan Jampachaisri
เกตุจันทร์ จำปาไชยศรี
katechanj@nu.ac.th
katechanj@nu.ac.th
Keywords: การวิเคราะห์การถดถอยเชิงเส้นพหุคูณ, ข้อมูลสูญหาย, วิธีแบบเบส์, วิธีเบส์เซียนบูตสแตรป
Multiple Linear Regression Analysis Regression Imputation method Multiple Imputation method Expectation Maximization Algorithm method Bayesian Method Bayesian Bootstrap
Issue Date: 2564
Publisher: Naresuan University
Abstract: The objective of this research is to compare the efficiency of 6 estimation methods for missing response in multiple linear regression: Regression Imputation method (RI), Multiple Imputation method (MI), Expectation Maximization Algorithm method (EM), Bayes’ method with informative prior (Bay-in), Bayes’ method with non-informative priors (Bay-non) and Bayes bootstrap regression imputation method (BBRI). Data are simulated and repeated 10,000 times using R program. The average mean squares error (AMSE) is used as criteria for comparison. The sample sizes were set to 50, 100 and 200, with low, moderate and high levels of associations between independent variables and response, the percentage of missing response as 5, 10 and 20, and error variances as 0.5, 1, 2, 5 and 10. The results indicated that, for all sample sizes all percentages of missing response with low and moderate associations and error variance equaling 0.5, Bay-in was the most efficient in most cases. When error variances equal to 1 and 2, Bay-in and BBRI were mostly efficient while BBRI was the most efficient as error variances equal to 5 and 10. With high association, BBRI was mostly efficient in all values of error variances.
งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของวิธีประมาณค่าตัวแปรตามที่สูญหายสำหรับการวิเคราะห์การถดถอยเชิงเส้นพหุคูณ 6 วิธี ได้แก่ วิธีสมการถดถอย (RI) วิธีแทนค่าข้อมูลสูญหายหลายค่า (MI) วิธีค่าคาดหวังสูงสุด (EM) และวิธีแบบเบส์ที่ให้สารสนเทศที่เป็นประโยชน์ (Bay-in) วิธีแบบเบส์ที่ให้สารสนเทศน้อยมาก (Bay-non) และวิธีการถดถอยแบบเบส์บูตสแตรป (BBRI) ทำการจำลองข้อมูลโดยใช้โปรแกรม R กระทำซ้ำ 10,000 ครั้ง โดยใช้ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองเฉลี่ย (AMSE) เป็นเกณฑ์ในการเปรียบเทียบประสิทธิภาพ กำหนดขนาดตัวอย่างที่ใช้ในการศึกษาเป็น 50, 100 และ 200 ระดับความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตามเป็น ต่ำ ปานกลาง และสูง เปอร์เซ็นต์การสูญหายของข้อมูลในตัวแปรตามเป็น 5, 10 และ 20 ความแปรปรวนของความคลาดเคลื่อนเป็น 0.5, 1, 2, 5 และ 10 ผลการวิจัยพบว่า ในทุกระดับขนาดตัวอย่างและเปอร์เซ็นต์การสูญหายของข้อมูล เมื่อความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตามอยู่ในระดับต่ำและปานกลาง ความแปรปรวนของความคลาดเคลื่อนเท่ากับ 0.5 พบว่า วิธี Bay-in มีประสิทธิภาพดีที่สุดเป็นส่วนใหญ่ เมื่อความแปรปรวนของความคลาดเคลื่อนเท่ากับ 1 และ 2 วิธี Bay-in และวิธี BBRI มีประสิทธิภาพดีที่สุดเป็นส่วนใหญ่ แต่เมื่อความแปรปรวนของความคลาดเคลื่อนเท่ากับ 5 และ 10 พบว่า วิธี BBRI มีประสิทธิภาพดีที่สุดเป็นส่วนใหญ่ กรณีตัวแปรอิสระและตัวแปรตามมีความสัมพันธ์กันในระดับสูง พบว่าวิธี BBRI มีประสิทธิภาพดีที่สุดเป็นส่วนใหญ่ในทุกค่าความแปรปรวนของความคลาดเคลื่อน
URI: http://nuir.lib.nu.ac.th/dspace/handle/123456789/5328
Appears in Collections:คณะวิทยาศาสตร์

Files in This Item:
File Description SizeFormat 
SiriwattanaSeedee.pdf1.53 MBAdobe PDFView/Open


Items in NU Digital Repository are protected by copyright, with all rights reserved, unless otherwise indicated.