Mitme muutujaga regressioon - Mitmemõõtmelise regressiooni näited

Lang L: none (table-of-contents):

Anonim

Sissejuhatus mitme muutujaga regressiooni

  • Termin mitme muutuja korral tähendab mudelit, millel on rohkem kui üks muutuja
  • Mitmemõõtmeline regressioon on osa mitme muutujaga statistikast.
  • Mitmemõõtmeline regressioon on tehnika, mida kasutatakse ühe regressioonimudeli hindamiseks, kui tulemuste muutujaid on rohkem kui üks.
  • Mitmemõõtmelise regressioonina kasutati tavaliselt masinõppe algoritmi, mis on juhendatud õppe algoritm.

Miks üks regressioonimudel ei tööta?

  • Nagu teada, kasutatakse regressioonanalüüsi peamiselt sõltuva ja sõltumatu muutuja vahelise seose uurimiseks.
  • Reaalses maailmas on palju olukordi, kus paljud sõltumatud muutujad mõjutavad teisi muutujaid, selleks peame liikuma erinevatesse võimalustesse kui üks regressioonimudel, mis võib võtta ainult ühe sõltumatu muutuja.

Mis on mitme muutujaga regressioon?

  • Mitmemõõtmeline regressioon aitab mõõta enam kui ühe sõltumatu muutuja ja enam kui ühe sõltuva muutuja nurka. See leiab seose muutujate vahel (lineaarselt seotud).
  • Selle abil ennustati väljundmuutuja käitumist ja ennustaja muutujate seostamist ning seda, kuidas ennustaja muutujad muutuvad.
  • Seda saab rakendada paljudes praktilistes valdkondades, näiteks poliitikas, majanduses, meditsiinis, teadustöödes ja paljudes erinevates ettevõtetes.
  • Mitmemõõtmeline regressioon on mitme regressiooni lihtne laiendus.
  • Mitme regressiooni abil ennustatakse ja vahetatakse ühe muutuja väärtusi, tuginedes ennustaja muutujate enam kui ühe väärtuse ühisele väärtusele.
  • Esiteks võtame näite mitme muutujaga regressiooni kasutamise mõistmiseks, seejärel otsime sellele probleemile lahendust.

Mitmemõõtmelise regressiooni näited

  • Kui e-kaubanduse ettevõte on kogunud oma klientide andmeid nagu vanus, on kliendi ostetud ajalugu, sugu ja ettevõte soovinud leida seose nende erinevate ülalpeetavate ja sõltumatute muutujate vahel.
  • Spordisaalitreener on kogunud andmeid oma treeningsaali tuleva kliendi kohta ja soovib jälgida mõnda kliendi asja, mis on tervis, toitumisharjumused (millist toodet klient iga nädal tarbib), kliendi kaal. Sellega tahetakse leida seos nende muutujate vahel.

Nagu kahes eelnevas näites nägite, on mõlemas olukorras rohkem kui üks muutuja, mõned sõltuvad ja mõned on sõltumatud, seega ei piisa ainuüksi regressioonist sedalaadi andmete analüüsimiseks.

Siin on mitme muutuja regressioon, mis pildile satub.

1. Funktsiooni valik -

Funktsioonide valik mängib mitmevariaarses regressioonis kõige olulisemat rolli.

Funktsiooni otsimine, mida on vaja selle muutuja leidmiseks, sõltub sellest funktsioonist.

2. Funktsioonide normaliseerimine -

Parema analüüsi jaoks tuleb funktsioone skaleerida, et saada need konkreetsesse vahemikku. Samuti võime muuta iga funktsiooni väärtust.

3. Valige funktsioon Loss ja hüpotees -

Kaotusfunktsioon arvutab kaotuse, kui hüpotees ennustab vale väärtust.

Ja hüpotees tähendab tunnuse muutuja prognoositud väärtust.

4. Määrake hüpoteesi parameetrid -

Seadke hüpoteesi parameeter, mis võib vähendada kahjumifunktsiooni ja oskab ennustada.

5. Minimeerige funktsioon Loss-

Kaotuse minimeerimine mõne kaotamise minimeerimise algoritmi abil ja selle kasutamine andmestiku kohal, mis võib aidata hüpoteesi parameetreid kohandada. Kui kaotus on viidud miinimumini, saab seda ennustamiseks kasutada.

On palju algoritme, mida saab kasutada kadude, näiteks gradiendi laskumise vähendamiseks.

6. Testige hüpoteesi funktsiooni -

Kontrollige, kas hüpoteesi funktsioon ennustab väärtusi, ja testige seda katseandmetel.

Mitme muutujaga regressiooni arhiivi jälgimise sammud

1) Importige vajalikud ühised teegid, näiteks tuimas ja panda

2) Lugege andmestikku pandade raamatukogu abil

3) Nagu me eespool arutlesime, peame paremate tulemuste saamiseks andmeid normaliseerima. Miks normaliseerida, kuna igal funktsioonil on erinev väärtusvahemik.

4) Looge mudel, mis võib regressiooni arhiivida, kui kasutate lineaarse regressiooni kasutamise võrrandit

Y = mx + c

Selles, kus x-le antakse sisend, m on kaldenurk, c on konstant, y on väljundmuutuja.

5) Treenige mudelit hüperparameetri abil. Saage aru hüperparameetrist, määrake see vastavalt mudelile. Nagu õppimiskiirus, ajajärgud, iteratsioonid.

6) Nagu ülalpool arutletud, kuidas hüpoteesil on analüüsimisel oluline roll, kontrollib hüpoteesi ja mõõdab kahjumi / kulude funktsiooni.

7) Funktsioon kahjum / kulu aitab meil mõõta, kuidas hüpoteesi väärtus on tõene ja täpne.

8) Kahjumi / kulude minimeerimine aitab mudelil ennustamist täiustada.

9) Kaotusvõrrandit saab määratleda kui prognoositud väärtuse ja tegeliku väärtuse ruutvahe erinevust, mis on jagatud andmekogumi kahekordse suurusega.

10) Funktsiooni Lose / cost minimeerimiseks kasutage gradiendi laskumist, algab see juhusliku väärtusega ja leiab punkti, mille kadumisfunktsioon on kõige väiksem.

Ülaltoodut järgides saame rakendada mitme muutujaga regressiooni

Mitme muutujaga regressiooni eelised

  • Mitmemõõtmeline tehnika võimaldab leida seose muutujate või tunnuste vahel
  • See aitab leida korrelatsiooni sõltumatute ja sõltuvate muutujate vahel.

Dis Mitme muutujaga regressiooni eelised

  • Mitmemõõtmelised tehnikad on vähe keerukas ja kõrgetasemeline matemaatiline arvutus
  • Mitmemõõtmelise regressioonimudeli väljund pole hõlpsasti tõlgendatav ja mõnikord seetõttu, et mõned kadude ja vigade väljundid pole identsed.
  • Seda ei saa väikese andmehulga korral rakendada, kuna suuremates andmekogumites on tulemused sirgjoonelisemad.

Järeldus - mitme muutujaga regressioon

  • Mitmemõõtmelise regressiooni kasutamise peamine eesmärk on see, kui teil on saadaval rohkem kui üks muutuja ja sel juhul üks lineaarne regressioon ei toimi.
  • Peamiselt on reaalses maailmas mitu muutujat või tunnust, kui mängu tulevad mitu muutujat / tunnust, kasutatakse mitme muutujaga regressiooni.

Soovitatavad artiklid

See on mitme muutujaga regressiooni juhend. Siin käsitleme sissejuhatust, mitme muutujaga regressiooni näiteid koos eeliste ja eelistega. Lisateavet leiate ka meie muudest soovitatud artiklitest -

  1. Regressioonivalem
  2. Andmeteaduse kursus Londonis
  3. SASi operaatorid
  4. Andmeteaduse tehnikad
  5. Muutujad JavaScriptis
  6. Regressiooni ja klassifitseerimise peamised erinevused