Video: Essence of linear algebra preview 2024
Linjära regressionsmodeller används för att visa eller förutsäga förhållandet mellan två variabler eller faktorer. Den faktor som förutspås (den faktor som ekvationen löser för ) kallas den beroende variabeln. De faktorer som används för att förutse värdet av den beroende variabeln kallas de oberoende variablerna.
Goda data berättar inte alltid hela berättelsen. Regressionsanalys används ofta i forskning, eftersom det fastställs att det finns en korrelation mellan variablerna.
Men korrelationen är inte densamma som orsakssambandet. Även en rad i en enkel linjär regression som passar datapunkterna väl kanske inte säger något definitivt om ett orsakssamband.
I enkel linjär regression består varje observation av två värden. Ett värde är för den beroende variabeln och ett värde är för den oberoende variabeln.
- Enkel linjär regressionsanalys Den enklaste formen av en regressionsanalys använder sig av beroende variabel och en oberoende variabel. I denna enkla modell approximerar en rak linje relationen mellan den beroende variabeln och den oberoende variabeln.
- Multipel regressionsanalys När två eller flera oberoende variabler används i regressionsanalys är modellen inte längre en enkel linjär.
y
= ( β 0 + β > 1 + Ε Med matematisk konvention betecknas de två faktorer som är involverade i en enkel linjär regressionsanalys x
och y . Ekvationen som beskriver hur y
är relaterad till x kallas regressionsmodellen . Den linjära regressionsmodellen innehåller också ett felbegrepp som representeras av Ε < eller den grekiska bokstaven epsilon. Felbegreppet används för att ta hänsyn till variabiliteten i y som inte kan förklaras av det linjära förhållandet mellan x och y >. Det finns också parametrar som representerar befolkningen som studeras. Dessa parametrar av modellen som representeras av ( β 0+ β 1
x ) Enkel linjär regressionsmodell Den enkla linjära regressionsekvationen representeras så här: Ε ( y
) = (
0 + β 1 x ). Den enkla linjära regressionsekvationen är grafad som en rak linje. 0 är y avlyssning av regressionslinjen.
β
1 är lutningen. Ε ( y ) är det genomsnittliga eller förväntade värdet på
y för ett givet värde av
x . En regressionslinje kan visa ett positivt linjärt förhållande, ett negativt linjärt förhållande, eller inget förhållande.Om den grafiska linjen i en enkel linjär regression är platt (ej snedställd), finns det inget samband mellan de två variablerna. Om regressionslinjen sluttar uppåt med linjens nedre ände vid y avsnitten (axeln) i grafen och den övre änden av raden sträcker sig uppåt i graffältet bort från x intercept (axel) finns ett positivt linjärt förhållande. Om regressionslinjen lutar nedåt med linjens övre ände vid grafens y
avsnittsaxel och axelns nedre ände sträcker sig nedåt i graffältet mot x < avlyssning (axel) finns ett negativt linjärt förhållande. Beräknad linjär regressionsekvation Om parametrarna för befolkningen var kända kan den enkla linjära regressionsekvationen (nedan) användas för att beräkna medelvärdet av y för ett känt värde av < x . Ε (
y
) = ( β 0 + β 1
x ). I praktiken är parametervärdena emellertid inte kända, så de måste beräknas med hjälp av data från ett urval av befolkningen. Befolkningsparametrarna beräknas med hjälp av provstatistik. Provstatistiken representeras av b 0 + b 1. När provstatistiken ersätts för populationsparametrarna bildas den beräknade regressionsekvationen. Den uppskattade regressionsekvationen visas nedan.
) = ( β 0 + β 1
x
( ŷ ) uttalas < y hat . Grafen för den beräknade enkla regressionsekvationen kallas den beräknade regressionslinjen. b 0 är y-avlyssningen.
The b 1 är lutningen. ŷ
) är det uppskattade värdet på
y för ett givet värde på x
. Viktig anmärkning: Regressionsanalys används inte för att tolka orsakssamband mellan variabler. Regressionsanalys kan emellertid ange hur variabler är relaterade eller i vilken utsträckning variabler är associerade med varandra.
På så sätt tenderar regressionsanalysen att skapa framträdande relationer som motiverar en kunnig forskare att ta en närmare titt. Även känd som: bivariat regression, regressionsanalys Exempel: Minsta kvadratmetoden är en statistisk procedur för att använda provdata för att hitta värdet av den uppskattade regressionsekvationen . Den Minsta Kvadreringsmetoden föreslogs av Carl Friedrich Gauss, som föddes år 1777 och dog 1855. Minsta kvadratmetoden används fortfarande allmänt.
Källor: Anderson, D.R., Sweeney, D.J. och Williams, T. A. (2003). Viktiga ämnen i statistik för näringsliv och ekonomi (3: e upp.) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Förklarade: Regressionsanalys. MIT News.
McIntyre, L. (1994). Använda cigarettdata för en introduktion till flera regressioner. Journal of Statistics Education, 2
(1). Mendenhall, W. och Sincich, T. (1992). Statistik för ingenjörsvetenskap och vetenskap (3: e upp.), New York, NY: Dellen Publishing Co. Panchenko, D. 18. 443 Statistik för ansökningar, hösten 2006, avsnitt 14, enkel linjär regression. (Massachusetts Institute of Technology: MIT OpenCourseWare)