دانلود فایل تحقیق : دانلود پروژه رشته ریاضی در مورد رگرسیون خطی ساده و همبستگی – قسمت دوم

دانلود پایان نامه

خط رگرسیون جامعه اصلی به صورت زیر نمایش داده می گردد:

آمدن در طرف چپ ارتباط فوق بدین مفهوم می باشد که حتی اگر خط رگرسیون جامعه اصلی را می داشتیم، حداکثر کاری که می توانستیم با آن بکنیم این بود که میانگین Y را برای یک مقدار خاص داده شده X به دست آوریم. این به آن خاطر می باشد که نقاط متعلق به جامعه همانگونه که در شکل دیده می گردد در اطراف خط رگرسیون پراکنده هستند. برای مثال: چنانچه دو متغیر درآمد قابل تصرف (x) و مصرف (y) را در نظر بگیرید، واضح می باشد که مصرف برای کلیه افرادی که دارای درآمد قابل تصرف مساوی هستند یکسان نخواهد بود. به بیانی دیگر برای هر تعداد زیادی مقادیر متفاوت وجود خواهد داشت و خط رگرسیون بهترین کاری که می تواند بکند این می باشد که فقط تخمینی از میانگین مصرف را در سطح درآمدی ارائه کند. این امر در شکل برای سطح درآمدی به نمایش گذاشته شده می باشد.

شما می توانید تکه های دیگری از این مطلب را در شماره بندی انتهای صفحه بخوانید              

نکته مهم : برای بهره گیری از متن کامل پژوهش یا مقاله می توانید فایل ارجینال آن را از پایین صفحه دانلود کنید. سایت ما حاوی تعداد بسیار زیادی مقاله و پژوهش دانشگاهی در رشته های مختلف می باشد که می توانید آن ها را به رایگان دانلود کنید
از جامعه فوق می توان تعداد بی شماری نمونه های مثلاً 35 تائی انتخاب نمود. یکی از این نمونه ها به همراه خط رگرسیون آن در شکل 11.8 نشان داده شده می باشد. این خط، یعنی ، تقریبی از خط رگرسیون جامعه اصلی، یعنی می باشد.

مقدار ثابت برآوردی می باشد از مقدار ثابت خط رگرسیون جامعه اصلی (a) و شیب نیز برآوردی از شیب خط جامعه اصلی می باشد.
و پارامترهای رگرسیون جامعه اصلی هستند. در شکل زیر خط رگرسیون جامعه و یکی از خطوط رگرسیون متعددی که می تواند بر اساس نمونه به دست آورده گردد نشان داده شده می باشد.

توجه داشته باشید که خط رگرسیون مبتنی بر نمونه، الزاماً منطبق بر خط رگرسیون جامعه اصلی نخواهد بود، همچنانکه خط رگرسیون فوق بر خط رگرسیون جامعه اصلی منطبق نمی باشد. اما از آنجا که به علت های عیان نمی توانیم کل مشاهدات موجود در یک جامعه آماری را جمع آوری کنیم و مورد توجه قرار دهیم، مجبوریم که به خطر رگرسیون به دست آمده از نمونه بسنده کنیم.

فرض نرمال در مورد مدل رگرسیون
وقتی خط رگرسیون مبتنی بر نمونه ای تصادفی به عنوان برآوردی از خط رگرسیون جامعه اصلی به کار گرفته گردد، ضرورت استنباط آماری نیز حس می گردد. برای مثال ممکن می باشد بخواهیم فاصله اطمینانی برای شیب خطر رگرسیون بسازیم و یا آزمون فرضیه ای در خصوص انجام دهیم. بدیهی می باشد استنباط آماری ممکن نخواهد بود مگر اینکه فرض کنیم مسائل خاصی در ارتباط با جامعه ای که از آن و نمونه گیری شده می باشد صادق می باشد. فرض نرمال بودن جامعه اصلی یکی از فرض هایی بود که مجبور بودیم بارها در ساختن فاصله اطمینان و آزمون فرضیه در نظر بگیریم. در رگرسیون نیز، به طریق مشابه، فرض نرمال بودن و چند فرض دیگر اغلب جهت انجام استنباط های آماری ضروری می باشد.
قبلاً بدین نکته تصریح گردید که برای هر مقدار تعداد زیادی مقادیر متفاوت هست. پس می توان چنین تصور نمود که متغیری می باشد تصادفی با میانگین که بر روی خط رگرسیون قرار دارد. در این صورت ارتباط بین و می تواند به صورت زیر نوشته گردد:

که در آن متغیری تصادفی با میانگین صفر و واریانس می باشد.
فرض نرمال بودن در رگرسیون بدین مفهوم می باشد که برای هر مقدار خاص X مقادیر Y به صورت نرمال توزیع شده اند و یا به بیانی دیگر توزیع متغیر تصادفی نرمال می باشد. برای مثال تصور کنید که به ازاء مقدار در شکل 11.10 عمودی در نقطه بر محور X ها رسم کنیم و سپس بر روی آن هیستوگرام مربوط به کلیه مقادیر را به گونه ای که در شکل دیده می گردد بسازیم. این نمودار در فضای سه بعدی سرم شده می باشد و هیستوگرام می بایستی به صورت عمود بر صفحه کاغذ تجسم گردد.
فرض نرمال بودن بدین مفهوم می باشد که این هیستوگرام می تواند توسط یک منحنی نرمال که دارای میانگین می باشد نمایش داده گردد. این منحنی در شکل رسم شده می باشد.
اکنون مقدار دیگری از X مثلاً را در نظر بگیرید. در این صورت می باشد. فرض نرمال بودن بدین مفهوم می باشد که این هیستوگرام می تواند توسط یک منحنی نرمال که دارای میانگین می باشد نمایش داده گردد. این منحنی درشکل زیر رسم شده می باشد.
اکنون مقدار دیگری از مثلاً را در نظر بگیرید. در این صورت می باشد. فرض نرمال مدل رگرسیون اظهار می کند که مقادیر به ازاء نیز نرمال می باشد، با میانگینی معادل و انحراف معیاری برابر ، همانند توزیع به ازاء ، به طریق مشابه می توان چنین عنوان نمود که برای هر مقدار توزیع مقادیر ها نرمال می باشد و میانگین آن بر روی خط رگرسیون قرار دارد؛ همچنین تمامی این توزیعها دارای انحراف معیار یکسان ، همانند توزیع به ازاء ، به طریق مشابه می توان چنین عنوان نمود که برای هر مقدار توزیع مقادیر ها نرمال می باشد و میانگین آن بر روی خط رگرسیون قرار دارد؛ همچنین تمامی این توزیعها دارای انحراف معیار یکسان می باشند. در نتیجه فرض نرمال مدل رگرسیون می تواند در یک فضای سه بعدی به صورت شکل نمایش داده گردد.

فرمول انحراف معیار خطا که در استنباط آماری مورد بهره گیری قرار خواهد گرفت بر این فرض استوار می باشد که هر مقدار از سایر مقادیر مستقل می باشد.
به گونه اختصار فرض نرمال مدل رگرسیون عبارت از این می باشد که مقادیر ها به ازاء هر مقدار به صورت نرمال مدل رگرسیون عبارت از این می باشد که مقادیر ها به ازاء هر مقدار به صورت نرمال و مستقل از یکدیگر توزیع شده اند و هر توزیع دارای انحراف معیار یکسان می باشد. پس به گونه کلی در ارتباط با معادله رگرسیون فرض ها از این قرارند:
1. میانگین هر یک از ها برابر صفر می باشد.

2. مقادیر ها از یکدیگر مستقل اند. در نتیجه برای داریم:

3. کلیه ها دارای واریانس یکسان هستند:
4.
4.مقدار برای کلیه مقادیر ها ثابت می باشد. به بیانی دیگر متغیر یک متغیر غیر تصادفی می باشد.

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید                     

5. توزیع هر یک از ها نرمال و مستقل از یکدیگر می باشد.
برای معادله رگرسیون جامعه، یعنی:

معادله رگرسیون مبتنی بر نمونه معمولاً به صورت زیر نوشته می گردد.

که در آن، همانگونه که قبلاً تصریح گردید ، و به ترتیب برآوردی از عرض از مبدأ و شیب خط رگرسیون جامعه می باشند و بر طبق روش حداقل مربعات برابرند با:

و مقدار خطا می باشد که منطقی به نظر می رسد آنرا به منزله برآوردی از تلقی کنیم. توجه داشته باشید که برآورد دو پارامتر و از نمونه، یعنی به دست آوردن و ، بدین معنی خواهد بود که دو درجه آزادی از دست می رود. پس اگر حجم نمونه برابر n باشد تعداد درجات آزادی برابر خواهد بود با:

انحراف معیار خطای تخمین
به مقصود انجام استنباط های آماری در مورد خط رگرسیون نیاز می باشد مقدار معمولاً نامشخص می باشد می بایستی مقدار آن را توسط انحراف معیاری می باشد که پراکندگی نقاط نمونه را در بالا و پائین خط رگرسیون نمونه اندازه گیری می کند. به عبارت دقیق تر انحراف معیار خطاها یعنی e می باشد که قبلاً به توضیح آن پرداختیم. فرمول محاسبه به قرار زیر می باشد:

بدین لحاظ ارتباط فوق بر تقسیم شده می باشد که در ارتباط با برآورد و از نمونه دو درجه آزادی از دست رفته می باشد.
از آنجا که هر خطا ”e” اختلاف بین نظاره شده و به دست آمده از خط رگرسیون نمونه می باشد. و می باشد ( زیرا می باشد) می توان نوشت:

پس می توانیم را از ارتباط فوق محاسبه کنیم. آغاز مجبوریم ها را از خط رگرسیونو نمونه برای کلیه مقادیر X به دست آوریم. این امر می تواند بسیار وقت گیر باشد. از این رو بهتر می باشد فرمول ساده زیر را برای محاسبه مورد بهره گیری قرار دهیم.

به عنوان یک مثال، جدول زیر را در نظر بگیرید که شامل مشاهدات بر روی X و Y و کلیه محاسباتی می باشد که برای به دست آوردن و و لازم می باشد.

00/9 16 12 0/3 4
25/30 36 33 5/5 6
25/42 100 65 5/6 10
00/81 144 108 0/9 12

برای بدست آوردن خط رگرسیون و همچنین انحراف معیار خطای تخمین آغاز مقدار را محاسبه می کنیم.

انحراف معیار خطای تخمین در نمونه ” ” پراکندگی نقاط نمونه را در بالا و پائین خط رگرسیون نمونه اندازه گیری می کند. اگر معادل صفر باشد کلیه نقاط نمونه بر روی خط رگرسیون نمونه قرار دارند. اما اغلب صفر نیست و هر چه که بزرگتر باشد میزان برآورد که از خط به ازاء مقادیر X به دستد می آید کمتر دقیقاست. به زودی خواهید دید که تأثیر عمده ای در انجام استنباط های آماری خط رگرسیون اعمال می کند.
قبل از آنکه به مبحث بعد بپردازیم فرمولهای دیگری را که برای محاسبه مورد بهره گیری قرار می گیرد ذکر می کنیم. لازم به توجه می باشد که بسط هر یک از فرمولهای زیر نهایتاً به فرمولی که قبلاً برای عنوان کردیم منجر خواهد گردید و در واقع فرمولهای زیر گونه های مختلف یک فرمول هستند.

این نوشته در ریاضی ارسال شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.

دیدگاهتان را بنویسید