資源描述:
《《回歸分析》導(dǎo)學(xué)案3》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、《回歸分析》導(dǎo)學(xué)案3【課標要求】1.了解隨機誤差、殘差、殘差分析的概念;2.會用殘差分析判斷線性回歸模型的擬合效果;3.掌握建立回歸模型的步驟;4.通過對典型案例的探究,了解回歸分析的基本思想方法和初步應(yīng)用.【核心掃描】1.利用散點圖分析兩個變量是否存在相關(guān)關(guān)系,求線性回歸方程.(重點)2.回歸模型的選擇,特別是非線性回歸模型.(難點、易錯點)自學(xué)導(dǎo)引1.回歸分析回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.2.線性回歸模型(1)由散點圖易發(fā)現(xiàn),樣本點散布在某一條直線附近,而不是一條直線上,不能用一次函數(shù)y=bx+a描述它們之間的關(guān)系,因此用線性回歸模型y=bx+a+e來表
2、示,其中a、b為未知參數(shù),e為隨機誤差.(2)對參數(shù)a和b的估計,由《數(shù)學(xué)必修3》可知:最小二乘法估計和就是未知參數(shù)a、b的最好估計,其計算公式為==,=-,其中=i,=i,(,)稱為樣本點的中心.(3)解釋變量和預(yù)報變量線性回歸模型與一次函數(shù)模型的不同之處是增加了隨機誤差項e,因變量y由自變量x和隨機誤差e共同確定,即自變量x只解釋部分y的變化,在統(tǒng)計中,我們也把自變量x稱為解釋變量,因變量y稱為預(yù)報變量.試一試:下表是x和y之間的一組數(shù)據(jù),則y關(guān)于x的線性回歸方程必過( ).x1234y1357 A.點(2,3)B.點(1.5,4)C.點(2.5,4)
3、D.點(2.5,5)提示 選C.線性回歸方程必過樣本點的中心(,),即(2.5,4).3.刻畫回歸效果的方式殘差數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異(yi-i)是隨機誤差.稱i=y(tǒng)i-i為殘差,i稱為相應(yīng)于點(xi,yi)的殘差.(yi-i)2稱為殘差平方和殘差圖利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘差圖殘差圖法殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較適合,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高殘差平方和殘差平方和為(yi-)2,殘差平方和越小,模型擬合效果越好相關(guān)指數(shù)R2R2=1-,R2
4、表示解釋變量對預(yù)報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好想一想:回歸分析中,利用線性回歸方程求出的函數(shù)值一定是真實值嗎?為什么?提示 不一定是真實值,利用線性回歸方程求的值,在很多時候是個預(yù)報值,例如,人的體重與身高存在一定的線性關(guān)系,但體重除了受身高的影響外,還受其他因素的影響,如飲食,是否喜歡運動等.4.非線性回歸分析(1)非線性相關(guān)關(guān)系:樣本點分布在某一條曲線的周圍,而不是一條直線附近.我們就稱這兩個變量之間不具有線性相關(guān)關(guān)系而是非線性相關(guān)關(guān)系.(2)非線性回歸方程線性化①y=axn(其中a,x,y均為正值)(冪函數(shù)型函數(shù))lgy=lga+nlgx,令u=lgy,v=l
5、gx,b=lga,則u=nv+b,圖象為一直線.②y=cax(a>0,c>0)(指數(shù)型函數(shù))lgy=xlga+lgc,令u=lgy,b=lgc,d=lga,則u=dx+b,圖象為一直線.名師點睛1.線性回歸方程(1)在分析兩個變量的相關(guān)關(guān)系時,可根據(jù)樣本數(shù)據(jù)散點圖確定兩個變量之間是否存在相關(guān)關(guān)系,然后利用最小二乘法求出回歸直線方程.(2)求線性回歸方程=x+的關(guān)鍵是求未知參數(shù)和,其中可借助于計算器求出,因為=-,即=+,所以點(,)一定滿足線性回歸方程,即回歸直線一定過點(,).(3)求線性回歸方程的步驟:①先把數(shù)據(jù)制成表,從表中計算出,,x+x+…+x,x1y1+x2y2+…+xnyn的
6、值;②計算未知參數(shù),;③寫出線性回歸方程=x+.2.線性回歸分析(1)由線性回歸方程給出的是一個預(yù)報值而非精確值.(2)隨機誤差的主要來源①線性回歸模型與真實情況引起的誤差;②省略了一些因素的影響產(chǎn)生的誤差;③觀測與計算產(chǎn)生的誤差.(3)殘差分析是回歸分析的一種方法.(4)用相關(guān)指數(shù)R2來刻畫回歸效果.R2越大,意味著殘差平方和越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差.3.建立回歸模型的基本步驟(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量.(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)
7、驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應(yīng)殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.題型一 求線性回歸方程【例1】某班5名學(xué)生的數(shù)學(xué)和物理成績?nèi)缦卤恚骸 W(xué)生學(xué)科 ABCDE數(shù)學(xué)成績(x)8876736663物理成績(y)786571