Cách bấm máy tính phương trình hồi quy tuyến tính

Các phần tửbất thườngvà các quan sát có ảnh hưởngDò tìm các phần tử bất thường- Một phần tử bất thườnglà một quan sát khác thường khi được so sánh với dữ liệu khác.- Minitab xếp một quan sát vào loại phần tử bất thường nếu giá trị phần dư chuẩn hoá của nó +2.- Quy tắc phần dư chuẩn hoá này đôi khi không nhận ra một quan sát lớn khác thường là một phần tử bất thường.- Khiếm khuyết của quy tắc này có thể vượt qua bằng cách dùng các phần dư xoá bỏ student hoá.- |Phần dư xoá bỏ student hoá thứ i| sẽ lớn hơn |phần dư chuẩn hoá thứ i|.

Bạn đang xem: Cách bấm máy tính phương trình hồi quy tuyến tính


Bạn đang xem: Cách bấm máy tính phương trình hồi quy tuyến tính

*

Xem thêm: Ý Nghĩa, Lịch Sử Ra Đời Ngày 26/3 Được Chọn Là Ngày Thành Lập Đoàn Tncs Hồ Chí

*

Xem thêm: Tiểu Sử Dũng Ct Là Ai - Thông Tin Mới Về Dũng Ct

Bạn đang xem nội dung tài liệu Bài giảng Hồi quy tuyến tính đơn giản, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên1GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònChương 4Hồi quy tuyến tính đơn giảnQ Mô hình hồi quy tuyến tính đơn giảnQ Phương pháp bình phương bé nhất Q Hệ số xác địnhQ Các giả định của mô hìnhQ Kiểm định ý nghĩaQ Công cụ hồi quy của ExcelQ Dùng phương trình hồi quy ước lượng để ước lượngvà dự đoánQ Phân tích phần dư: Xác nhận tính hợp lệ của cácgiả định của mô hìnhQ Các phần tử bất thường và các quan sát có ảnh hưởng2GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích hồi quyQ Phân tích hồi quy nghiên cứu mối liên hệ phụthuộc của một biến (gọi là biến phụ thuộc hay biến được giải thích) vào một hay nhiều biến khác (được gọi là (các) biến độc lập hay giải thích) với ý tưởng là ước lượng hoặc dự báo biến phụ thuộc trên cơ sở giá trị đã cho của (các) biến độc lập.Q Biến phụ thuộc là biến ngẫu nhiên, có quy luật phân phối xác suấtQ (Các) biến độc lập không phải là biến ngẫu nhiên, giá trị của chúng đã được cho trước.3GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònMối liên hệ tuyến tínhLượng cầuvề thịt bò, y∈(1)Giá thịt bò (x1)(2)Giá của mặt hàng thay thế (x2)(3)Thu nhập của người tiêu dùng (x3)(4)Tập quán, thị hiệu, sở thích của người tiêu dùng (x4)(5)Quy mô thị trường (x5)Biểu diễn dưới dạng toán học,y = f(x1, x2, x3, x4, x5) + ε4GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònMối liên hệ tuyến tính (tiếp theo)Nếu y phụ thuộc vào các x theo dạng tuyến tính (dạng đường thẳng)Nếu y phụ thuộc vào các x theo dạng phi tuyến tính (dạng đường cong)0 1 1 2 2 3 3 4 4 5 5y x x x x xβ β β β β β ε= + + + + + +0 1 1 2 2 3 3 4 4 5 5y x x x x xβ β β β β β ε≠ + + + + + +5GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònMô hình hồi quy tuyến tính đơn giảnQ Mô hình hồi quy tuyến tính đơn giảny = β0 + β1x + εQ Phương trình hồi quy tuyến tính đơn giảnE(y) = β0 + β1xQ Phương trình hồi quy tuyến tính đơn giản ước lượngy = b0 + b1x^6GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài Gòn1Mô tả phương trình hồi quytuyến tính đơn giảnPhương trình hồi quy tuyến tính đơn giản chỉ mối liên hệ tuyến tính chính xác giữa giá trị kỳvọng hay giá trị trung bình của y, biến phụ thuộc, và x, biến độc lập hay biến dự báo:E=β0 + β1 xiCác giá trị quan sát thực tế của y khác với giá trị kỳ vọng bởi một sai số không giải thích được hay sai số ngẫu nhiên:Yi = E + εi= β0 + β1 xi + εiXYE=β0 + β1 xXi} β1 = Hệ số gócβ0 = Tung độ gốcYi {Sai số:εiĐồ thị hồi quy7GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQuy trình ước lượng trong hồi quy tuyến tính đơn giảnMô hình hồi quyy = β0 + β1x +εPhương trình hồi quyE(y) = β0 + β1xCác tham số không biếtβ0, β1Dữ liệu mẫu:x yx1 y1. .. .xn ynb0 và b1đưa ra các ước lượng choβ0 và β1Phương trình hồi quyước lượngCác số thống kê mẫub0, b10 1yˆ b b x= +8GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònTìm một đường thẳng “thích hợp” nhấtXYDữ liệuXYBa sai số so với giá trị tính theo đường thẳng thích hợpXYBa sai số so với giá trị tính theo đường thẳng bình phương bé nhấtXCác sai số so với giá trị tính theo đường thẳng bình phương bé nhất được cực tiểu hoá9GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCác sai số trong hồi quy.{ˆi i ie y y= −yxiyˆiyxiˆ :iySai sốĐiểm dữ liệu quan sátGiá trị dự báo của y ứng với xiĐường hồi quy thích hợp nhất0 1ˆ xy b b= +10GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhương pháp bình phương bé nhấtQ Tiêu chuẩn bình phương bé nhấttrong đó:yi = giá trị quan sát của biến phụ thuộc cho quan sát thứ iyi = giá trị ước lượng của biến phụ thuộc cho quan sát thứ i^n n2 2i ii=1 i=1ˆmin SSE = e (y )iy= −∑ ∑11GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhương pháp bình phương bé nhấtb0SSEb1b0b1Ở điểm này SSE cực tiểu đối với b0 và b10 11 120 11 1 1n ni ii in n ni i i ii i iy nb b xx y b x b x= == = == += +∑ ∑∑ ∑ ∑12GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Hệ số góc của phương trình hồi quy ước lượngQ Hệ số chặn của phương trình hồi quy ước lượngb0 = y - b1x hay b0 = (Σyi / n) - b1(Σxi / n)trong đó:xi = trị số của biến độc lập với quan sát thứ iyi = trị số của biến phụ thuộc với quan sát thứ ix = giá trị trung bình của biến độc lập y = giá trị trung bình của biến phụ thuộcn = tổng số quan sát__1 2 2( )( )i i i ii in x y x ybn x x−= −∑ ∑ ∑∑ ∑__Phương pháp bình phương bé nhất∑ − −= ∑ −1 2( )( )( )i iix x y ybx xhay13GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài Gònx i y i x i2 y i2 x iy ix 1 y 1 x 12 y 12 x 1y 1x 2 y 2 x 22 y 22 x 2y 2: : : : :x n y n x n2 y n2 x ny nΣx i Σy i Σx i2 Σy i2 Σx iy iBảng tính toán14GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònVí dụ: Đợt bán xôn của Reed AutoQ Hồi quy tuyến tính đơn giảnReed Auto định kỳ có một đợt bán xôn đặc biệt kéo dài suốt một tuần. Nhưlà một phần của chiến dịch quảng cáo Reed thực hiện một hoặc một số quảng cáo trên TV trong thời gian cuối tuần trước đợt bán xôn. Dữ liệu từ một mẫu gồm 5 đợt bán xôn trước đây được cho dưới đây.15GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònVí dụ: Đợt bán xôn của Reed AutoSố lần quảng cáo Số lượng xe ô tôtrên TV bán được 1 143 242 181 173 2716GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Hệ số góc (hay độ dốc) của phương trình hồi quy ước lượngQ Hệ số chặn (hay tung độ gốc) của phương trình hồi quy ước lượngb0 = 100/5 - 5(10/5) = 10Q Phương trình hồi quy ước lượngy = 10 + 5x^Ví dụ: Đợt bán xôn của Reed Auto−= =−1 25(220) (10)(100) 55(24) (10)b17GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònDùng CASIO fx-500MSMODE 3 (Reg) 1 (Lin) SHIFT MODE 1 (Scl) = (Nhập dữ liệu)1 14 M+ 3 24 M+ 2 18 M+ 1 17 M+ 3 27 M+ ACSHIFT 2   1 = SHIFT 2   2 = SHIFT 2   3 = 18GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònDùng CASIO fx-570MSMODE MODE 2 (Reg) 1 (Lin)SHIFT MODE 1 (Scl) = (Nhập dữ liệu:)1 14 M+ 3 24 M+ 2 18 M+ 1 17 M+ 3 27 M+ ACSHIFT 2   1 = SHIFT 2   2 = SHIFT 2   3 = 19GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònDùng CASIO fx-500ESSHIFT 9 3 = AC SHIFT MODE ∇ 4 Frequency?1: ON 2: OFFMODE 2 (STAT) 2: A+BX (Nhập dữ liệu)20GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònDùng CASIO fx-500ES(Nhập dữ liệu)1 = 3 = 2 = 1 = 3 =  14 = 24 = 18 = 17 = 27 = ONSHIFT 1 7 1:A ; 2:B ; 3: r ; 4: x mũ ; 5: y mũSHIFT MODE 6 Fix 0~9? (định số số lẻ)Với CASIO fx-570ES:MODE 3 (STAT) 2: A+BX 21GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònHệ số xác định, r2, là một tiêu chuẩn mô tả để đánh giá cường độ của mối liên hệ hồi quy, một tiêu chuẩn đánh giá đường hồi quy phù hợp với dữ liệu tốt tới mức độ nào..{YXY Y Y X {Tổng độ lệchĐộ lệchđược giải thíchĐộ lệchkhông được giải thíchSSTSSESSTSSRrSSR+ SSE = SST )yy()y(y)y(y −==∑ −+∑ −=∑ −−+−=−1ˆˆ2222ˆˆquy) (Hồi dư) (Phần thích giải được thích giải được lệch độlệch ộ Đ khônglệch Độ= Tổng )yy( )y(y )y(yTỷ lệ phần trăm của toàn bộ biến thiên được giải thích bởi hồi quy.Hồi quy tốt tới mức độ nào?22GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònHồi quy tốt tới mức độ nào?Q SST = tổng các độ lệch bình phương toàn bộQ SSR = tổng các độ lệch bình phương do hồi quyQ SSE = tổng các độ lệch bình phương do phần dư( ) ( )22 2= − = − ∑∑ ∑i ySST y y y n( )2 1ˆi x ySSR y y b xy nΣ Σ⎛ ⎞= − = Σ −⎜ ⎟⎝ ⎠∑( )2 2 1 0ˆi iSSE y y y b xy b y= − = Σ − Σ − Σ∑23GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Hệ số xác địnhr2 = SSR/SST = 100/114 = 0,8772Mối liên hệ hồi quy là rất mạnh vì 88% phần biến thiên trong số xe ô tô đã bán ra có thể được giải thích bởi mối liên hệ tuyến tính giữa số lần quảng cáo trên TV và số xe ô tô bán được.Ví dụ: Đợt bán xôn của Reed Auto24GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònHệ số tương quanQ Hệ số tương quan mẫutrong đó:b1 = hệ số góc phương trình hồi quy ước lượngb= 21(dấu của ) r rá ûb= 1(dấu của ) Hệ số xác địnhr á û ä á ùxbby 10ˆ +=25GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCác giá trị khác nhau của hệ số tương quan26GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònVí dụ: Đợt bán xôn của Reed AutoQ Hệ số tương quan mẫuDấu của b1 trong phương trình là “+”.r = +0,9366 b= 21(dấu của ) r rá ûˆ 10 5y x= += + 0,8772r27GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKiểm định ρQ Chúng ta có thể kiểm định để xem liệu sự tương quan là có ý nghĩa không sử dụng các giả thuyếtH0: ρ = 0 H0: ρ = 0 H0: ρ = 0 Ha: ρ > 0 Ha: ρ tα/2; n-2 Kiểm định ý nghĩa: Kiểm định tibisbt 0−=34GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Kiểm định ty Các giả thuyết: H0: β1 = 0Ha: β1 ≠ 0y Thống kê kiểm địnht = 5/1,08 = 4,63y Quy tắc bác bỏVới α = 0,05 và df = 3, t0,025;3 = 3,182Bác bỏ H0 nếu t > 3,182y Kết luậnBác bỏ H0Ví dụ: Đợt bán xôn của Reed Auto35GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKhoảng tin cậy cho βiαα αβ−− −±− ≤ ≤ +2; 22; 2 2; 2ii ii n bi n b i i n bb t shayb t s b t s36GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKhoảng tin cậy cho β1Q Ta có thể dùng khoảng tin cậy 95% của β1 đểkiểm định các giả thuyết vừa sử dụng trong kiểm định t.Q H0 bị bác bỏ nếu giá trị giả thuyết của β1 không bao gồm trong khoảng tin cậy của β1.37GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònVí dụ: Đợt bán xôn của Reed AutoQ Quy tắc bác bỏBác bỏ H0 nếu 0 không thuộc khoảng tin cậy cho β1.Q Khoảng tin cậy 95% cho β1= 5 +/- 3,182(1,08) = 5 +/- 3,44hay từ 1,56 đến 8,44Q Kết luậnBác bỏ H0 11 2; 2n bb t sα −±38GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKiểm định ý nghĩa: Kiểm định FQ Các giả thuyếtH0: β1 = 0Ha: β1 ≠ 0Q Thống kê kiểm địnhF = MSR/MSEQ Quy tắc bác bỏBác bỏ H0 nếu F > Fα;1;n-2trong đó Fα;1;n-2 dựa vào phân phối F với 1 bậc tựdo trên tử số và n - 2 bậc tự do dưới mẫu số.39GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Kiểm định Fy Các giả thuyết H0: β1 = 0Ha: β1 = 0y Thống kê kiểm địnhF = MSR/MSE = 100/4,667 = 21,43y Quy tắc bác bỏVới α = 0,05 và df = 1; 3: F0,05; 1; 3 = 10,13Bác bỏ H0 nếu F > 10,13.y Kết luận:Bác bỏ H0. Có đủ chứng cứ bằng thống kê để kết luận rằng có một mối liên hệ có ý nghĩa giữa số lần quảng cáo trên TV và số lượng xe ô tô bán được.Ví dụ: Đợt bán xôn của Reed Auto40GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònMột vài cảnh báo về việcdiễn giải kết quả của các kiểm định ý nghĩaQ Việc bác bỏ H0: β1 = 0 và kết luận rằng mối liên hệ giữa x và y là có ý nghĩa không cho phép ta kết luận là có mối liên hệ nhân quả giữa x và y.Q Chỉ vì ta có thể bác bỏ H0: β1 = 0 và chứng tỏ làcó ý nghĩa thống kê không cho phép ta kết luận có mối liên hệ tuyến tính giữa x và y.41GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Ước lượng khoảng tin cậy của E(yp)Q Ước lượng khoảng dự báo của yptrong đó: hệ số tin cậy là 1 - α vàtα/2; n-2 dựa trên phân phối t với n - 2 dfDùng phương trình hồi quy ước lượngđể ước lượng và dự báoˆ2; 2ˆ α −± pp n yy t s2; 2ˆ p n indy t sα −±42GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKhoảng dự báo cho giá trị trung bình của y,với xp đã choƯớc lượng khoảng dự báo chogiá trị trung bình của y với một giá riêng biệt xpKích thước của khoảng này dao động theo khoảng cách tính từ trung bình, x2/ 2, 2 2( )1ˆ( )pp n ex xy t sn x xα −−± + −∑43GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKhoảng tin cậy cho một giá trị cá biệt của y,với xp đã choƯớc lượng khoảng tin cậy cho một giá trị cá biệt của y với một giá riêng biệt xpSố hạng cộng thêm này làm tăng thêm bềrộng khoảng nhằm phản ánh sự không chắc chắc gia tăng đối với một trường hợp riêng lẻ.2/ 2, 2 2( )1ˆ 1( )pp n ex xy t sn x xα −−± + + −∑44GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCác ước lượng khoảng với các giá trị khác nhau của xyxKhoảng dự báo cho một giá trị cá biệt của y, với xp đã choxpy = b 0 + b 1x∧xKhoảng tin cậy cho giá trị trung bình của y, với xpđã cho45GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Ước lượng điểmNếu có 3 lần quảng cáo trên TV được tổ chức trước một đợt bán xôn (xp = 3), ta hy vọng số lượng xe ô tô bán được trung bình sẽ là:yp = 10 + 5(3) = 25 xeQ Khoảng tin cậy cho E(yp)Ước lượng khoảng với độ tin cậy 95% cho số lượng xe ô tô bán được trung bình khi có 3 lần quảng cáo trên TV được tổ chức là:25 + 4,61 = 20,39 tới 29,61 xeQ Dự báo khoảng cho ypƯớc lượng khoảng với độ tin cậy 95% cho số lượng xe ô tô bán được trong một tuầøn đặc biệt khi có 3 lần quảng cáo trên TV được tổ chức là:25 + 8,28 = từ 16,72 đến 33,28 xe^Ví dụ: Đợt bán xôn của Reed Auto46GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònMặc dù sự xấp xỉtuyến tính được đưa ra bởi là tốt trong vùng giá trị x quan sát được trong mẫu, nó trởnên xấu với các giá trị x nằm ngoài vùng đó. xyGiá trị xnhỏ nhấtGiá trị xlớn nhấtMối quan hệthực sựVùng giá trị xquan sát đượcVí dụ về một sự xấp xỉ tuyến tính của một mối liên hệ phi tuyến47GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònDiễn giải các hệ sốQ Hệ số góc hay độ dốc (b1)y Xét các giá trị của x nằm trong vùng quan sát, khi x tăng hay giảm 1 đơn vị thì y tăng hay giảm (nếu b1 +) hay giảm hay tăng (nếu b1 -) khoảng b1 đơn vị.Q Tung độ gốc hay hệ số chặn trục tung (b0) cho ta biết giá trị trung bình của y khi x = 0.y Trên thực tế, x có thể nhận giá trị 0 không? vày 0 có phải là một trong các giá trị quan sát của x không?y Khi điều kiện trên không xảy ra thì sự diễn giải ýnghĩa của b0 không hợp lý lắm. 48GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích phần dưQ Mục đíchy Kiểm tra giả định tuyến tínhy Kiểm tra phương sai không thay đổi với mọi mức độ của x y Đánh giá giả định phân phối chuẩn của phần dưy Kiểm tra tính độc lập của phần dưQ Phân tích các phần dư bằng đồ thịy Có thể vẽ đồ thị các phần dư theo x hoặc theo yy Có thể tạo các biểu đồ (histogram) phần dư đểkiểm tra tính chuẩn^49GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Nếu giả định về số hạng sai số ε có vẻ đáng ngờ, các kiểm định giả thuyết về ý nghĩa của mối liên hệ hồi quy và kết quả ước lượng khoảng có thểkhông có căn cứ vững chắc.Q Các phần dư cung cấp thông tin tốt nhất về ε.Q Phần lớn phân tích phần dư dựa trên việc xem xét các biểu đồ (graphical plots).Phân tích phần dư50GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích phần dư cho tính tuyến tính (Linearity)Phi tuyến tính Tuyến tính9xPhaàndưxyxyxPhaàndư51GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKiểm tra giả định phương sai không đổiQ Nếu giả định phương sai của ε bằng nhau với mọi giá trị của x là đúng, và mô hình hồi quy được giả định là một sự mô tả hay biểu diễn thích đáng mối liên hệ giữa các biến, thìBiểu đồ phần dư sẽ đem lại một ấn tượngchung về một dải các điểm nằm ngang52GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích phần dư cho phương sai không đổiPhương sai thay đổi 9 Phương sai không đổix xyx xyPhaàndưPhaàndư53GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKiểm tra giả định phương sai không đổiQ Nếu với nhiều biến giải thích ta có thể vẽ phần dưtheo từng biến giải thích mà ta nghi ngờ gây ra hiện tượng phương sai thay đổi hoặc tốt hơn là vẽ phần dư theo y là giá trị ước lượng được từ mô hình.Q Trêân thực tế không có một phương pháp chắc chắc nào để phát hiện ra hiện tượng phương sai thay đổi mà chỉ có thể dùng vài công cụ để chẩn đoán thôi. Để biết thêm chi tiết, có thể đọc Vũ Thiếu, Nguyễn Quang Dong và Nguyễn Khắc Minh, Kinh tế lượng, Nxb. Khoa học và Kỹ thuật, Hà Nội, 2001.^54GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònKiểm tra giả định phân phối chuẩn của phần dưQ Có hai cách làm:y Sử dụng biểu đồ phần dư chuẩn hoá theo xy Sử dụng đồ thị xác suất chuẩn (Normal probability plot)55GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònQ Phần dư chuẩn hoá cho quan sát itrong đó:Các phần dư chuẩn hoለi ii iy yy ys −−ˆ 1i i iy ys s h− = −22( )1( )iiix xhn x x−= + −∑56GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònBiểu đồ phần dư chuẩn hoáQ Biểu đồ phần dư chuẩn hoá có thể giúp ta hiểu rõ giả định số hạng sai số ε có phân phối chuẩn.Q Nếu giả định này được thoả mãn thì phân phối của các phần dư chuẩn hoá sẽ có vẻ bắt nguồn từ hay lấy từ một phân phối xác suất chuẩn tắc (vì s được dùng thay cho σ, phân phối xác suất của các phần dư chuẩn hoá về mặt kỹ thuật là không chuẩn. Tuy nhiên, trong hầu hết các nghiên cứu hồi quy, cỡ mẫu thường đủ lớn để một sự xấp xỉ chuẩn là rất tốt). Do vậy, khi xem xét biểu đồ phần dư chuẩn hoá, chúng ta kỳ vọng nhìn thấy khoảng 95% các phần dư chuẩn hoá nằm trong khoảng từ -2 đến +2.57GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònBiểu đồ phần dư chuẩn hoáQ Tất cả các phần dư chuẩn hoá khoảng từ –1,5 đến +1,5 cho biết không có lý do để nghi ngờ giảđịnh là ε có phân phối chuẩn.58GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích phần dư cho tính độc lậpQ Thống kê Durbin-Watsony Sử dụng khi dữ liệu được thu thập theo thời gian nhằm phát hiện có tự tương quan (các phần dư ở một thời đoạn có liên quan với các phần dư ở một thời đoạn khác)y Đo lường sự vi phạm giả định độc lập21221( )ni iiniie eDe−==−=∑∑Nên gần bằng 2. Nếu không, hãy xem xét mô hình để tìm tự tương quan.59GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCó được các giá trị tới hạn củathống kê Durbin-WatsonBảng 4.6 Tìm các giá trị tới hạn của thống kê Durbin-Watson1,540,981,371,10161,540,951,361,0815dUdLdUdLnp = 2p = 1α = 0,0560GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònSử dụng thống kê Durbin-WatsonChấp nhận H0 (không có tự tương quan): Không có tự tương quan (các số hạng sai số độc lập với nhau): Có tự tương quan (các số hạng sai số không độc lập với nhau)0H1H0 42dL 4-dLdU 4-dUBác bỏ H0(tự tương quan dương)Không quyết định Bác bỏ H0(tự tương quan âm)61GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònPhân tích phần dư cho tính độc lậpKhông độc lập Độc lập9e eThờigianThờigianPhần dư được vẽ đồ thị theo thời gian để phát hiện tự tương quanKhông có mẫu hìnhriêng biệt nàoMẫu hình chu kỳPhương pháp đồ thị62GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònBốn tập dữ liệu khác nhau có kết quả hồi quynhư nhau86,8955,7354,7455,6887,9176,4277,2674,8285,56128,15129,131210,841912,5045,3943,1044,2685,2566,0866,1367,2487,04148,84148,10149,9688,47117,81119,26118,3388,8497,1198,7798,8187,711312,74138,74137,5885,7686,7788,1486,9586,58107,46109,14108,04xyxyxyxyTập DTập CTập BTập A63GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCác biểu đồ phân tán của bốn tập dữ liệu xy có các đặc tính thống kê rất giống nhau nhưng trông hoàn toàn khác nhau y = 3 + 0 ,5 x024681 01 20 2 4 6 8 1 0 1 2 1 4y = 3 + 0 ,5 X024681 01 20 2 4 6 8 1 0 1 2 1 4y = 3 + 0 ,5 X024681 01 21 40 2 4 6 8 1 0 1 2 1 4y = 3 + 0 , 5 x024681 01 21 40 2 4 6 8 1 0 1 2 1 4 1 6 1 864GV: Th.S Trần Kim NgọcĐại học Công nghệ Sài GònCác phần tử bất thường và các quan sátcó ảnh hưởngQ Dò tìm các phần tử bất thườngy Một phần tử bất thường là một quan sát khác thường khi được so sánh với dữ liệu khác.y Minitab xếp một quan sát vào loại phần tử bất thường nếu giá trị phần dư chuẩn hoá của nó +2.y Quy tắc phần dư chuẩn hoá này đôi khi không nhận ra một quan sát lớn khác thường là một phần tử bất thường.y Khiếm khuyết của quy tắc này có thể vượt qua bằng cách dùng các phần dư xoá bỏ student hoá.y |Phần dư xoá bỏ student hoá thứ i| sẽ lớn hơn |phần dư chuẩn hoá thứ i|.