Sissejuhatus tagasiulatuvasse elimineerimisse

Kui inimene ja masin koputavad digitaalse evolutsiooni poole, on mitmekesised tehnikamasinad raamatupidamiseks nii, et nad pole mitte ainult koolitatud, vaid ka nutikalt koolitatud, et tulla välja reaalmaailma objektide parema äratundmisega. Niisugune varem kasutusele võetud „tagasiulatuv eemaldamine” oli mõeldud selleks, et eelistada hädavajalikke funktsioone, kaotades samas masina parema optimeerimise jaoks tühised omadused. Masina poolt kogu objekti tuvastamise oskus on proportsionaalne sellega, milliseid omadusi ta arvestab.

Funktsioonid, millel puudub eeldatava väljundi viide, tuleb masinast välja viia ja see järeldatakse tagasiulatuvalt. Mis tahes tõelise sõnaobjekti masina poolt tuvastamise hea täpsus ja ajaline keerukus sõltub selle õppimisest. Seega mängib tagasiulatuv elimine funktsioonide valimisel jäika rolli. Arvatakse tunnuste sõltuvuse määra sõltuvast muutujast, leitakse selle kuulumise olulisus mudelis. Selle akrediteerimiseks kontrollib ta arvestatud määra standardse olulisuse tasemega (näiteks 0, 06) ja teeb otsuse funktsiooni valimise kohta.

Miks on vaja tagasiulatuvat kõrvaldamist ?

Ebaolulised ja ülearused tunnused ajavad masinaloogika keerukust edasi. See kulutab asjatult aega ja mudeli ressursse. Niisiis mängib eelmainitud tehnika pädevat rolli mudeli lihtsaks muutmisel. Algoritm viljeleb mudeli parimat versiooni, optimeerides selle toimivust ja kärpides kulutatavaid määratud ressursse.

See vähendab mudeli kõige vähem tähelepanuväärseid omadusi, mis regressioonijoone üle otsustamisel põhjustab müra. Ebasobivad objektiomadused võivad põhjustada valesti klassifitseerimist ja ennustamist. Üksuse ebaolulised tunnused võivad moodustada mudeli tasakaalustamatuse muude objektide muude oluliste tunnuste suhtes. Tagasiulatuv eemaldamine soodustab mudeli sobitamist parimal juhul. Seetõttu on mudelis soovitatav kasutada tagasiulatuvat elimineerimist.

Kuidas taotleda tagasiulatuvat elimineerimist?

Tagasiulatuv elimineerimine algab kõigi tunnusmuutujatega, katsetades seda sõltuva muutujaga mudeli kriteeriumi valitud sobitamise all. See hakkab likvideerima need muutujad, mis halvendavad regressiooni sobivat joont. Seda kustutamist korratakse seni, kuni mudel saavutab hea sobivuse. Allpool on toodud sammud tagasiulatuva kõrvaldamise harjutamiseks:

1. samm: valige sobiv masenduse olulisuse aste. (Võtke S = 0, 06)

2. samm: lisage mudelisse kõik saadaolevad sõltumatud muutujad sõltuva muutuja suhtes ja arvutage kalle ja ristlõige arvutatud regressiooni- või liitumisjoone joonistamiseks arvutisse.

3. samm: liikuge ükshaaval läbi kõigi kõige suurema väärtusega sõltumatute muutujatega (võtke I) ja jätkake järgmise röstsaiaga: -

a) Kui I> S, viige läbi 4. samm.
b) Teine abort ja mudel on täiuslik.

4. samm: eemaldage valitud muutuja ja suurendage liikumist.

5. samm: sepistage mudel uuesti ja arvutage jääkmuutujatega uuesti liibumisjoone kalle ja ristlõige.

Eespool nimetatud etapid võetakse kokku nende tunnuste tagasilükkamisel, mille olulisuse määr ületab valitud olulisuse väärtuse (0, 06), vältimaks kõrge keerukusena täheldatud ressursside liigset klassifitseerimist ja ülekasutamist.

Tagasiulatuva kaotamise plussid ja miinused

Allpool on toodud mõned tagasiulatuva kõrvaldamise plussid ja miinused:

1. Teened

Tagasi elimineerimise eelised on järgmised:

  • Kiire koolitus: masin treenitakse olemasolevate mustrifunktsioonide abil, mis tehakse väga lühikese aja jooksul, kui mudelist eemaldatakse ebaolulised omadused. Andmekogumi kiire treenimine tuleb ette alles siis, kui mudel tegeleb oluliste omadustega ja välistab kõik müramuutujad. See tõmbab koolituse lihtsaks. Kuid mudelit ei tohiks alajuhita, mis tuleneb funktsioonide puudumisest või ebapiisavatest näidistest. Parima klassifitseerimise mudelis peaks näidisfunktsiooni olema küllaga. Mudeli koolitamiseks kuluv aeg peaks olema lühem, säilitades samas klassifitseerimise täpsuse ja jätmata alaprognoositava muutujata.
  • Madalam keerukus: mudeli keerukus on sageli keeruline, kui mudel kaalub funktsioonide, sealhulgas müra ja sõltumatute funktsioonide ulatust. Sellise funktsioonide töötlemiseks kulub mudel palju ruumi ja aega. See võib suurendada mustri tuvastamise täpsuse määra, kuid kiirus võib sisaldada ka müra. Mudeli sellisest kõrgest keerukusest vabanemiseks mängib tagurpidi elimineerimise algoritm vajalikku rolli, lükates mudelisse soovimatud omadused. See lihtsustab mudeli töötlemise loogikat. Ainult mõned olulised omadused on piisavad, et joonistada sobiv, mõistliku täpsusega sisu.
  • Parandage jõudlust: mudeli jõudlus sõltub paljudest aspektidest. Mudel optimeeritakse, kasutades tagasiulatuvat elimineerimist. Mudeli optimeerimine on mudeli treenimiseks kasutatava andmestiku optimeerimine. Mudeli jõudlus on otseselt võrdeline selle optimeerimise määraga, mis sõltub oluliste andmete sagedusest. Tagasiulatuv elimineerimisprotsess ei ole ette nähtud muutmise alustamiseks mis tahes madalsagedusliku ennustajaga. Kuid see alustab muutmist ainult kõrgsagedusandmetest, kuna enamasti sõltub mudeli keerukus sellest osast.
  • Ümberpaigutamisest mööda hiilimine: üleliigne olukord ilmneb siis, kui mudelil on liiga palju andmekogumeid ja viiakse läbi klassifitseerimine või ennustamine, kus mõned predikaatorid said teiste klasside müra. Selles paigalduses pidi mudel andma ootamatult suure täpsuse. Liigse sobitamise korral võib mudel ebaõnnestuda muutuja klassifitseerimisel, kuna liiga paljude tingimuste tõttu on loogika tekitatud segadus. Tagasiulatuv elimineerimise tehnika vähendab kõrvalist joont, et vältida üleliigse paigaldamise olukorda.

2. Halvad küljed

Tagasiulatuva eliminatsiooni puudused on järgmised:

  • Tagasiulatuva elimineerimise meetodi puhul ei õnnestu välja selgitada, milline ennustaja vastutab teise ennustaja tagasilükkamise eest, kuna see jõuab tähtsusetuks. Näiteks kui ennustajal X on mingi tähendus, mis oli pärast Y ennustaja lisamist piisavalt hea, et selles mudelis viibida. Kuid X tähtsus vananeb, kui mudelisse tuleb teine ​​ennustaja Z. Nii et tagurpidi elimineerimise algoritm ei ilmne kahe ennustaja vahelise sõltuvuse osas, mis juhtub eelvaliku meetodis.
  • Pärast mudeli mis tahes funktsiooni loobumist tagasiulatuva elimineerimise algoritmi abil ei saa seda funktsiooni uuesti valida. Lühidalt, tagasiulatuval elimineerimisel puudub paindlik lähenemisviis funktsioonide / ennustajate lisamiseks või eemaldamiseks.
  • Normid olulisuse väärtuse (0, 06) valimiseks mudelis on paindumatud. Tagasiulatuval elimineerimisel ei ole paindlikku protseduuri, mille abil mitte ainult valida, vaid ka muuta ebaolulist väärtust vastavalt vajadusele, et saada parim sobivus piisava andmekogumi alla.

Järeldus

Tagasiulatuva eliminatsiooni tehnika, mis oli loodud mudeli jõudluse parandamiseks ja selle keerukuse optimeerimiseks. Seda kasutatakse ilmekalt mitmetes regressioonides, kus mudel tegeleb ulatusliku andmekogumiga. See on lihtne ja lihtne lähenemisviis võrreldes eelvaliku ja ristvalideerimisega, kus ilmneb optimeerimise ülekoormus. Tagurpidi elimineerimise tehnika algatab kõrgema tähtsusega omaduste kõrvaldamise. Selle põhieesmärk on muuta mudel vähem keerukaks ja keelata üleliigne olukord.

Soovitatavad artiklid

See on tagasiulatuva likvideerimise juhend. Siin arutletakse, kuidas rakendada tagasiulatuvat kõrvaldamist koos teenete ja puudustega. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. Hüperparameetri masinõpe
  2. Klastrid masinõppes
  3. Java virtuaalmasin
  4. Juhendamata masinõpe

Kategooria: