Journal of Agricultural Science and Technology
Journal of Agricultural Science and Technology
JAST
Agriculture
http://jast.modares.ac.ir
1
admin
1680-7073
2345-3737
10.22034/jast
en
jalali
1397
7
1
gregorian
2018
10
1
20
4
online
1
fulltext
fa
جایگذاری داده های گمشده با متغیرهای حمایتی و کاربرد آن در عملکرد دانه جو
Imputing Missing Values Using Support Variables with Application to Barley Grain Yield
<span style="font-family:b zar;"><span style="font-size:12.0pt;">عددهای گمشده در یک مجموعه از داده ها مسله ای است که به طور گسترده مطالعه شده است. در پژوهش حاضر، برای استفاده از متغیر های حمایتی (</span></span><span dir="LTR"><span style="font-size:12.0pt;">support variables </span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">) که رابطه نزدیکی با متغییر مورد نظر دارند و جاگذاری آنها به جای داده های گمشده </span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">پیشنهادی ارایه شده است. پیش از این که متغیرهای حمایتی جاگذاری شود، سطح همراهی یا رابطه آنها با متغیر مورد نظر تعیین شد. در این پژوهش، از عملکرد دانه جو ( </span></span><em><span dir="LTR"><span style="font-size:12.0pt;">Hordeum vulgare</span></span></em><span style="font-family:b zar;"><span style="font-size:12.0pt;">) در منطقه نیمه خشک قبرس به صورت مطالعه موردی استفاده شد. در این زمینه، باران ماهانه، میانگین ماهانه درجه حرارت، و نسبت مواد آلی خاک به عنوان متغیر های حمایتی در نظر گرفته شد. برای جاگذاری داده های گمشده از تکنیک های رگرسیون چند متغییره با متغییر های حمایتی، متغیر دو گانه (</span></span><span dir="LTR"><span style="font-size:12.0pt;">bivariate</span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">)، رگرسیون هسته ای (</span></span><span dir="LTR"><span style="font-size:12.0pt;">kernel regression </span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">)، و </span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">زنجیره مونت کارلو مارکوف(</span></span><span dir="LTR"><span style="font-size:12.0pt;">Markov Chain Monte Carlo </span></span><span style="font-family:b zar;"><span style="font-size:12.0pt;">) استفاده شد. نتایج به دست آمده حاکی از کارکرد بهتر رگرسیون چند متغیره با متغیر های حمایتی در مقایسه با دیگر روش ها بود.</span></span>
Missing values in a data set is a widely investigated problem. In this study, we propose the use of support variables that are closely associated with the variable of interest for the imputation of missing values. Level of association or relationship between the variable of interest and support variables is determined before they are included in the imputation process. In this study, the barley (<em>Hordeum vulgare</em>) grain yield in the semi-arid conditions of Cyprus was used as a case study. Monthly rain, monthly average temperature, and soil organic matter ratio were selected as support variables to be used. Multivariate regression employing support variables, bivariate, kernel regression and Markov Chain Monte Carlo techniques were employed for the imputation of missing values. Obtained results indicated a better performance using multivariate regression with support variables, compared with those obtained from other methods.
Imputing missing data, Incomplete data, Rain equivalent grain yield, Regression techniques.
829
839
http://jast.modares.ac.ir/browse.php?a_code=A-23-39633-149&slc_lang=fa&sid=23
M.
Erbilen
100319475328460085265
100319475328460085265
No
Department of Mathematics, Eastern Mediterranean University, Mağusa, North Cyprus.
Member of faculty
Y.
Tandogdu
100319475328460085266
100319475328460085266
Yes
Department of Mathematics, Eastern Mediterranean University, Mağusa, North Cyprus.
Director of GIS Center at Eastern Mediterranen University, Department of Mathematics, Mağusa, Mersin 10, TURKEY