اگر نمودار پراکندگی مجموعه ای از جفت (x ، y) نه روند رو به بالا یا رو به پایین را نشان دهد ، آنگاه خط افقی y ^ = y - آن را به خوبی متناسب می کند ، همانطور که در شکل 10. 11 نشان داده شده است. فقدان هر روند رو به بالا یا نزولی به این معنی است که وقتی یک عنصر از جمعیت به طور تصادفی انتخاب می شود ، دانستن مقدار اندازه گیری X برای آن عنصر در پیش بینی مقدار اندازه گیری مفید نیست.

خط y ^ = y - به خوبی نمودار پراکندگی متناسب است.
اگر نمودار پراکندگی روند خطی را به سمت بالا یا رو به پایین نشان دهد ، محاسبه حداقل خط رگرسیون مربع y ^ = β ^ 1 x + β ^ 0 مفید است و از آن در پیش بینی y استفاده می کنید. شکل 10. 12 "نمودار پراکندگی مشابه با دو خط تقریبی" این را نشان می دهد. در هر پانل ما داده های قد و وزن بخش 10. 1 "روابط خطی بین متغیرها" را ترسیم کرده ایم. این همان طرح پراکندگی است که شکل 10. 2 "طرح قد و وزن جفت" است ، با میانگین خط ارزش y ^ = y - که در پانل سمت چپ و کمترین خط رگرسیون مربع که در پنل سمت راست بر روی آن تحمیل شده است. خطاها به صورت گرافیکی توسط بخش های خط عمودی نشان داده شده اند.
شکل 10. 12 نمودار پراکندگی مشابه با دو خط تقریبی

مجموع خطاهای مربع محاسبه شده برای خط رگرسیون ، S S E ، از مجموع خطاهای مربع محاسبه شده برای هر خط دیگر کوچکتر است. به طور خاص کمتر از مجموع خطاهای مربع محاسبه شده با استفاده از خط y ^ = y - ، که جمع در واقع تعداد s y y است که قبلاً چندین بار دیده ایم. اندازه گیری چقدر مفید است که از معادله رگرسیون برای پیش بینی Y مفید باشد ، این است که چقدر کوچکتر از S y y است. به طور خاص ، نسبت مجموع خطاهای مربع برای خط y ^ = y - که با رفتن به حداقل خط رگرسیون مربع از بین می رود
s s y y - s s e s s y = s s y y s s y - s s e s s s y y = 1 - s s s e s s y y y y y y y y y y y y y y y
ما می توانیم به عنوان نسبت تنوع در y که نمی توان با رابطه خطی بین x و y به حساب آورد ، فکر کنیم ، زیرا حتی وقتی x به بهترین شکل ممکن در نظر گرفته می شود (با استفاده از آن ، هنوز هم وجود دارد. حداقل خط رگرسیون مربع ؛ به یاد داشته باشید که S E کوچکترین تعداد خطاهای مربع برای هر خط است). در این نور دیده می شود ، ضریب تعیین ، نسبت مکمل تنوع در Y ، نسبت تنوع در کلیه اندازه گیری های Y است که با رابطه خطی بین x و y به حساب می آید.
در زمینه رگرسیون خطی ، ضریب تعیین همیشه مربع ضریب همبستگی R است که در بخش 10. 2 "ضریب همبستگی خطی" مورد بحث قرار گرفته است. بنابراین ضریب تعیین R 2 مشخص شده است ، و ما دو فرمول اضافی برای محاسبه آن داریم.
تعریف
ضریب تعیین تعدادی که نسبت تنوع در Y را اندازه گیری می کند که توسط x توضیح داده شده است. مجموعه ای از جفت (x ، y) تعداد R 2 است که توسط هر یک از سه عبارت زیر محاسبه شده است:
r 2 = s s y y - s s e s s y = s s x y 2 s s x x s s y = β ^ 1 s s x y s s y y y y y y y y y y y y y y y y y y y y y y y y y
این نسبت متغیر در Y را اندازه گیری می کند که با رابطه خطی بین x و y به حساب می آید.
اگر ضریب همبستگی R از قبل شناخته شده باشد ، می توان ضریب تعیین را به سادگی با مربع R محاسبه کرد ، همانطور که نشان می دهد ، r 2 = (r) 2.
مثال 10
مقدار وسایل نقلیه استفاده شده از ساخت و مدل مورد بحث در یادداشت 10. 19 "مثال 3" در بخش 10. 4 "حداقل خط رگرسیون مربع" بسیار متفاوت است. گرانترین خودرو در نمونه در جدول 10. 3 "داده های مربوط به سن و ارزش خودروهای استفاده شده از یک مدل و مدل خاص" دارای 30. 500 دلار است که تقریباً نیمی از آن به اندازه کمترین قیمت است که به ارزش 20400 دلار است. نسبت تنوع موجود در مقدار را که به دلیل رابطه خطی بین سن و ارزش به حساب می آید ، پیدا کنید.
نسبت تنوع در مقدار y که با رابطه خطی بین آن و سن x به حساب می آید با ضریب تعیین ، r 2 داده می شود. از آنجا که ضریب همبستگی R قبلاً در یادداشت 10. 19 "مثال 3" به عنوان r = - 0. 819 ، r 2 = ( - 0. 819) 2 = 0. 671 محاسبه شده است. حدود 67 ٪ از تنوع در ارزش این وسیله نقلیه را می توان با سن آن توضیح داد.
مثال 11
از هر یک از سه فرمول برای ضریب تعیین برای محاسبه مقدار آن برای مثال سنین و مقادیر وسایل نقلیه استفاده کنید.
s s x x = 14 s s x y = - 28. 7 s s y = 87. 781 β ^ 1 = - 2. 05
قرار دادن این مقادیر در فرمول ها در تعریف ، یکی پس از دیگری ، می دهد
r 2 = s s y - s s e s s y = 87. 781 - 28. 946 87. 781 = 0. 6702475479 r 2 = s s x y 2 s s x s s s y = ( - 28. 7) 2 (14) (87. 781) = 0. 6702475475479 r 2 β ^- 2. 05 - 28. 7 87. 781 = 0. 6702475479
که به 0. 670 می رسد. اختلاف بین مقدار در اینجا و در مثال قبلی به این دلیل است که مقدار گرد R از یادداشت 10. 19 "مثال 3" در آنجا استفاده شده است. مقدار واقعی R قبل از گرد کردن 0. 8186864772 است که وقتی مربع مقدار R 2 را که در اینجا به دست می آید ، می دهد.
ضریب تعیین R 2 همیشه می تواند با مربع ضریب همبستگی r در صورت شناخته شدن محاسبه شود. از هر یک از فرمول های تعیین کننده نیز می توان استفاده کرد. به طور معمول می توان این انتخاب را بر اساس کدام مقادیر از قبل محاسبه کرد. آنچه باید از آن جلوگیری کرد ، تلاش برای محاسبه R با گرفتن ریشه مربع R 2 است ، در صورتی که از قبل شناخته شده باشد ، زیرا به راحتی می توان خطای علامت را از این طریق ایجاد کرد. برای دیدن چه چیزی می تواند اشتباه پیش برود ، فرض کنید r 2 = 0. 64. گرفتن ریشه مربع یک عدد مثبت با هر دستگاه محاسبه همیشه نتیجه مثبت را برمی گرداند. ریشه مربع 0. 64 0. 8 است. با این حال ، مقدار واقعی R ممکن است عدد منف ی-0. 8 باشد.
غذای اصلی
- ضریب تعیین R 2 نسبت تنوع در متغیر Y را که با رابطه خطی بین Y و متغیر x توضیح داده شده است ، تخمین می زند.
- چندین فرمول برای محاسبه R 2 وجود دارد. انتخاب کدام یک از آن می تواند بر اساس آن باشد که تاکنون مقادیر قبلاً محاسبه شده است.
تمرینات
پایه ای
برای تمرینات اساسی و کاربردی در این بخش از محاسباتی که برای تمرینات با همان تعداد در بخش 10. 2 "ضریب همبستگی خطی" ، بخش 10. 4 "حداقل خط رگرسیون مربع" و بخش 10. 5 "استنتاج آماری درباره" استفاده کنید ، استفاده کنید. واد
برای مجموعه داده های نمونه از تمرین 1 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S S Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 2 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S S Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 3 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S S Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 4 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 5 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S S Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 6 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = β ^ 1 S S X Y ∕ S S Y Y Y y پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 7 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول r 2 = (s s y y - s s e) پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 8 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول r 2 = (s s y y - s s e) پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 9 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = (S S Y Y - S S E) پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برای مجموعه داده های نمونه از تمرین 9 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را با استفاده از فرمول R 2 = (S S Y Y - S S E) پیدا کنید. پاسخ خود را با استفاده از مربع R همانطور که در آن تمرین محاسبه می شود تأیید کنید.
برنامه های کاربردی
برای داده های موجود در تمرین 11 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه سن و واژگان تفسیر می کند.
برای داده های موجود در تمرین 12 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و مقدار آن را در زمینه وزن وسیله نقلیه و فاصله ترمز تفسیر می کند.
برای داده های موجود در تمرین 13 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه سن و ضربان قلب در حال تفسیر تفسیر می کند. در محدوده سنی داده ها ، آیا سن با توجه به ضربان قلب یک عامل بسیار مهم است؟
برای داده های موجود در تمرین 14 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و مقدار آن را در زمینه سرعت باد و ارتفاع موج تفسیر می کند. آیا به نظر می رسد سرعت باد با توجه به ارتفاع موج یک عامل بسیار مهم است؟
برای داده های موجود در تمرین 15 بخش 10. 2 "ضریب همبستگی خطی" نسبت تنوع در درآمد را که با سطح تبلیغات توضیح داده شده است ، پیدا کنید.
برای داده های موجود در تمرین 16 بخش 10. 2 "ضریب همبستگی خطی" نسبت تنوع در ارتفاع بزرگسالان را پیدا کنید که با تغییر طول در سن دو سالگی توضیح داده شده است.
برای داده های موجود در تمرین 17 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه میانگین دوره قبل از امتحان نهایی و نمره در امتحان نهایی تفسیر می کند.
برای داده های موجود در تمرین 18 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه هکتار کاشته شده و هکتار برداشت شده تفسیر می کند.
برای داده های موجود در تمرین 19 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه میزان دارو مصرف شده و غلظت خون ماده فعال تفسیر می کند.
برای داده های موجود در تمرین 20 بخش 10. 2 "ضریب همبستگی خطی" ضریب تعیین را محاسبه کرده و مقدار آن را در زمینه اندازه و سن درخت تفسیر می کند.
برای داده های موجود در تمرین 21 بخش 10. 2 "ضریب همبستگی خطی" نسبت تنوع را در استحکام 28 روزه بتن که با تغییر در قدرت 3 روزه به حساب می آید ، پیدا کنید.
برای داده های موجود در تمرین 22 بخش 10. 2 "ضریب همبستگی خطی" نسبت تنوع در تقاضای انرژی را که با تغییر در دمای متوسط به حساب می آید ، پیدا کنید.
تمرینات مجموعه داده های بزرگ
مجموعه داده های بزرگ 1 نمرات SAT و GPA 1000 دانش آموز را لیست می کند. ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه نمرات SAT و GPA تفسیر کنید.
مجموعه داده های بزرگ 12 نمرات گلف را در یک دور گلف برای 75 گلف باز با استفاده از کلوپ های اصلی خود ، سپس با استفاده از کلوپ های یک طرح جدید و آزمایشی (پس از دو ماه آشنایی با باشگاه های جدید) لیست می کند. ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه نمرات گلف با دو نوع باشگاه گلف تفسیر کنید.
مجموعه داده های بزرگ 13 تعداد داوطلبان و قیمت فروش یک نوع خاص از ساعت پدربزرگ عتیقه را در 60 حراج ثبت می کند. ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه تعداد داوطلبان در حراج و قیمت این نوع ساعت پدربزرگ عتیقه تفسیر کنید.< SPAN> مجموعه داده های بزرگ 1 نمرات SAT و GPA 1000 دانش آموز را لیست می کند. ضریب تعیین را محاسبه کرده و ارزش آن را در زمینه نمرات SAT و GPA تفسیر کنید.
آموزش تحلیل گری...
ما را در سایت آموزش تحلیل گری دنبال می کنید
برچسب :
نویسنده : ملیکا زارعی
بازدید : 38
تاريخ : پنجشنبه
14 ارديبهشت
1402 ساعت: 12:08