SAS vs R vs Python - kui hakkate valima analüütiku elukutset, siis tekib teie peas peamine küsimus: „Milline on selle töö jaoks parim tööriist?”

See on aastaid olnud lahing ja alati on raske otsustada, milliseid programmeerimiskeeli andmete analüüsiks kõige paremini kasutada.

Traditsiooniliselt tõstatati see küsimus SAS vs R vastu, kuid nüüd on selle aruteluga ühinenud python. Kumb on parem sas vs r vs pythoni vahel.

Paar aastat tagasi oli nende tööriistade kaudu keeruline karjääriteed jälgida. Kuid õnneks osutus see varjatud õnnistuseks.

Kuid nüüd, kui analüütikaalane spetsialist otsustab, millist tehnikat nad peaksid kasutama, otsivad nad selle ülesande täitmiseks parimat tööriista.

SAS vs R vs Pythoni vahel on tihe konkurents. Kuid aus vastus on see, et iga tööriist on omal moel ainulaadne. Selles kontekstis pole universaalset võitjat. Igal tööriistal on oma tugevus ja nõrkus.

Analüütiku jaoks on oluline teada iga tööriista tugevaid ja nõrku külgi, et otsustada, mida on kõige parem kasutada oma kutsealal.

SAS vs R vs Pythoni infograafika

Nüüd vaatame, mis on tööriistad ja milleks seda kasutatakse.

Kirjeldus

Siin on 3 tööriista lühike kirjeldus

SAS

SAS on tarkvaralahenduste integreeritud süsteem ja andmeanalüütika valdkonnas liider. Sellel tarkvaral on vinge tehnilise toe pakkumiseks palju funktsioone, näiteks hea GUI ja muud. SAS aitab teil järgmisi toiminguid teha

  • Andmete sisestamine, otsimine ja haldamine
  • Aruannete kirjutamine ja graafiline kujundamine
  • Statistiline ja matemaatiline analüüs
  • Ettevõtte prognoosimine ja otsuste toetamine
  • Operatsioonide uurimine ja projektijuhtimine
  • Rakenduste arendamine

SASi kasutavad tuntud firmad nagu Barclays, Nestle, HSBC, Volvo ja BNB Paribas.

R

R on statistilise andmetöötluse ja graafika programmeerimiskeel, mille lõid 1995. aastal Ross Ihaka ja Robert Gentleman. See pakub laias valikus statistilisi ja graafilisi tehnikaid. See on avatud lähtekoodiga marsruut, mida on väga võimalik laiendada. See on lihtne ja tõhus programmeerimiskeel. See on midagi enamat kui lihtsalt statistikasüsteem. See teeb järgmist tööd

  • Käsitseb pakenditega hõlpsalt
  • Manipuleerib stringe
  • Töötab regulaarsete ja ebaregulaarsete aegridadega
  • Andmete visualiseerimine
  • Masinõpe

R-d kasutavad sellised kõrgelt hinnatud ettevõtted nagu Bank of America, bing, Ford, Uber ja Foursquare.

Python

Python on objektorienteeritud programmeerimiskeel, millel on selge süntaks ja loetavus. Selle lõi 1991. aastal Guido Van Rossem. Seda on lihtne õppida ja see aitab teil kiiremini ja tõhusamalt töötada. See on lihtsuse tõttu lühikese aja jooksul populaarsemaks muutunud.

Pythoni kasutavad sellised kuulsad ettevõtted nagu ABN-AMRO, Quora, Google ja reddit.

Võrdluse põhjused

Tööstusharud kasvavad dünaamiliselt. Põllu kasvades on igas keeles palju tehnoloogilisi edusamme.

Kui olete andmeanalüütika väljal uus, siis võiksite õppida uue välja oma huvi tõttu või suurema osa ajast, mida teie organisatsioon töötab. Tööriistade ja tarkvaraprogrammide täienduste tõttu võivad tekkida väljakutsed ja pettumused.

Keelte võrdlus on nüüd väärt kaalumist. Mis tahes võrdlus, mis tehti enne paari aastat, ei ole praeguses olukorras asjakohane. Võrdlused aitavad valida ka kolme seast parimat.

Neid keeli on selles artiklis võrreldud järgmiste tegurite põhjal. Te ei pruugi osta tööriista, mis põhineb järgmistel võrdlustel, kuid kindlasti on teile kasulik valida see, mis sobib teie karjääriga.

  1. Avatud lähtekoodiga vs suletud süsteem

SAS on suletud allikas ja ei toeta läbipaistvaid funktsioone. R ja Python on SASi avatud lähtekoodiga vaste ning sisaldab kõigi selle funktsioonide ja algoritmide üksikasjalikku läbipaistvust.

SAS on aeganõudvam, kuna funktsionaalsuse tundmine võtab kaua aega.

SAS on ka vastupidine.

  1. Maksumus

SAS on üks kallimatest tarkvaradest maailmas. SASi litsentsi saamiseks tuleb investeerida miljoneid dollareid. Seetõttu saavad seda kasutada ainult suured ettevõtted.

SASi kasutavaid ettevõtteid on vähe. Kui olete SAS-i professionaal, peate valima töökoha, kus nad kasutavad SAS-i. Kui liitute ettevõttes, kus nad SASi ei kasuta, suunatakse teie karjäär uuele teele.

R on avatud lähtekoodiga tarkvara, mille saab igaüks tasuta alla laadida.

Python on teiselt poolt ka tasuta avatud lähtekoodiga tarkvara ja seda saab alla laadida igaüks.

  1. Õppimine

SAS-i on lihtne õppida spetsiaalselt inimestele, kes juba tunnevad SQL-i. Ka SAS-il on stabiilne GUI-liides. SASi õpetused on saadaval erinevatel saitidel ja sellel on põhjalik dokumentatsioon.

Pythoni on andmeanalüütika maailmas väga lihtne õppida. Pythonil pole laialdast GUI-liidest, kuid Pythoni sülearvutid on populaarseks saanud. Need pakuvad teile dokumentide ja õpetuste funktsioone.

R on madal programmeerimiskeel ja seetõttu on lühemate protseduuride jaoks vaja ka pikemaid koode. Peate R-s kodeerimise kohta sügavama ülevaate saama.

  1. Juurdepääsetavus

SAS nõuab SASi täiustatud funktsioonidega tutvumiseks uute toodete ostmist. See ei paku teile võimalust ühtegi funktsiooni alla laadida ja seda kohe kasutada. SASil on ka ranged litsentsimispiirangud.

Arvestades, et R-s ja Pythonis lubatakse teil korduvate toimingute tegemiseks juurde pääseda sellistele lisafunktsioonidele nagu paralleelne töötlemine, mitmetuumalised paketid jne.

  1. Andmete käsitlemise võimalused

Kõik kolm keelt on võrdselt head andmetöötluses ja neil on ka võimalus paralleelseteks arvutusteks. Selles teguris pole kolme vahel suurt vahet. Kõigi nende keelte standardi parandamiseks võiks olla vähe uuendusi.

  1. Graafilised võimalused

Selle teguri osas on R-l ülejäänud kahega võrreldes parimad graafilised võimalused.

SASil on põhilised graafilised võimalused, kuid see on ainult funktsionaalne. Kruntide kohandamine on keeruline ja SAS Graphi paketi tundmiseks on vaja põhjalikke teadmisi

Pythonil on võimalus kasutada natiivraamatukogusid (matplotlib) või neist tuletatud raamatukogusid, mis võimaldab helistada R-funktsioonidele.

R-l on nende kolme hulgas suurepärased graafilised võimalused. Neil on täiustatud graafiliste võimaluste paketid.

  1. Tööriista edasiminek

Kõigil kolmel keelel on põhifunktsioonid ja kõige nõutavad funktsioonid, kuid uusim tehnoloogia ja funktsioonid on olulised, kui teie töö seda eeldab.

R ja Python on oma olemuselt avatud lähtekoodiga, nii et neid täiendatakse uusimate tehnoloogiate ja funktsioonidega kiiremini kui kahte muud keelt. Uute tehnikate väljatöötamine on R-s väga kiire.

Teisalt võtab SASi värskete funktsioonide ja võimaluste värskendamine aega, kuna see töötab kontrollitud keskkonnas.

SAS-i peamine eelis on kontrollitud keskkonnas töötamine. Neid on hästi testitud ja seega on vigade tõenäosus väga väike.

Kuid Python ja R toimivad avatud lähtekoodiga ning neid värskendatakse uusimale tehnoloogiale väga kiiresti, kuid need on vigade suhtes avatavamad.

  1. Töö stsenaarium

R-il ja Pythonil on lähiminevikus rohkem tööpakkumisi ja tulevikus on oodata ka selle arvu suurenemist.

R ja Pythoni kasutavad ettevõtted, kes otsivad kulutõhusust. Need on alustavatele ettevõtetele parim valik.

SASi kasutavad laialdaselt suured organisatsioonid ja ettevõtted.

Värske uuring on tõestanud, et ka Pythoni töökohad andmete analüütikas suurenevad samamoodi nagu R.

  1. Visualiseerimise tugi

Visualiseerimine on infoteaduse oluline osa. SASi peamist visualiseerimisplatvormi nimetatakse SAS Visual Analyticsiks. Selle kasutamine on liiga kulukas.

R ja Pythonil on palju tasuta visualiseerimisvahendeid. See ei nõua lepingu sõlmimist ja iga tegevuse eest tasumist nagu SASis.

  1. Klienditugi ja kogukond

Klienditoele ja teenindusele tuginedes on SAS kahe teise keelega võrreldes parim. SASil on spetsiaalne klienditugi ja -teenus ning kogukond. Kui teil on tehnilisi probleeme, võite pöörduda otse tugikeskuse poole.

R-l on suur veebikogukond, kuid puudub klienditoe keskus. Neilt saate abi, kuid mitte kohe.

Ka Pythonil pole klienditoe keskust. See pakub abi oma klientidele, kuid mitte SASi tasemele.

  1. Tööstuse suundumused

Tööturu suundumus liigub kiiresti avatud lähtekoodiga tehnoloogiate poole. R, Hadoop, Python on kõik selle peamised näited. SAS on ka üks sellise tehnoloogia hulgas, kuid see on ainus tasuline toode. Inimesed eelistavad R-i ja Pythoni SAS-i asemel, kuna see ei paku tasuta toodete suhtes mingeid lisaeeliseid. Ainult vähesed ettevõtted pöörduvad teatud päevadel SASi poole.

R ja Python tulevad tasuta ja neid saab hõlpsalt alla laadida.

  1. Agility

R ja Pythoni toetavad tuhanded toetajad kogu maailmas. Kui keelte jaoks on olemas mõni arendus või ülesastumine, tehakse see klientidele hõlpsasti kättesaadavaks.

SAS-i tootele pääseb juurde ainult SAS-i Instituudi poolt ja ainult SAS-i arendajatel on lubatud toota uusi funktsioone. See võtab palju aega. Ja enne SAS-i funktsioonide värskendamist uute algoritmidega saate oma projekti lõpule viia mis tahes muu tööriista abil.

  1. Juhendid ja juhend

SAS ei paku oma klientidele mingeid samm-sammult juhiseid. Kui alustate uue teemaga või soovite õppida midagi uut SAS-is, siis peaksite kindlasti otsima SAS-i konsultandi abi, kes on jällegi SAS Institute Incorporated-ist.

R ja Python teiselt poolt pakuvad teile üksikasjalikke näiteid. See pakub ka õpetust Internetis. Python sisaldab reprodutseeritavaid sülearvuteid nimega iPython. R-harjutused ja iPython-sülearvutid on laialdaselt saadaval saitidel, näiteks github jt.

Siin on tabelivaade, et saaksite kõiki kolme tööriista hõlpsalt võrrelda mõne kriteeriumi alusel

KriteeriumSASRPython
MaksumusTasulineTasutaTasuta
ÕppimineRaskeLihtneLihtne
Andmete manipuleerimineKõrgeKõrgeKõrge
Analüütiline modelleerimineKõrgeKõrgeKeskmine
Graafiline võimekusMadalKõrgeKeskmine
Teksti töötlemineMadalKeskmineKõrge
Suured andmedKeskmineMadalKeskmine
Tavalised tavadKõrgeKõrgeKeskmine
Töö stsenaariumKõrgeKeskmineMadal
KlienditugiKõrgeMadalKeskmine
Tööriista edasiminekKõrgeMadalKeskmine

Järeldus

SAS suudab kindlasti rahuldada kõik teie andmeteaduste vajadused, kuid see ei sobi pikas perspektiivis. Nüüd liiguvad ettevõtted kiiresti avatud lähtekoodiga programmeerimiskeelte poole, millele on lihtne juurde pääseda ja neid kasutada.

Kuna SAS on piirav ja suletud tööriist, pole see tänapäeval eriti eelistatud.

R ja Python on avatud lähtekoodiga tööriistad, mis aitavad teil täiendada oma teaduse teadmisi, õppida uusi tehnoloogiaid ja algoritme. R-i ja Pythoni tundmine muudab teid tänapäeval automaatselt andmeteadustöödeks sobivaks.

Kõige parem on see, et kolme hulgas pole ühtegi ilmset võitjat. Kõigil kolmel tööriistal on oma plussid ja miinused. Nende tugevused panevad nad turul pikaajaliselt püsima.

Keelte vahel peab otsustama lõppkokkuvõttes andmeteadlane. Andmeteadlasena on teie ülesanne otsustada, milline keel sobib teie vajadustele kõige paremini. Võite esitada endale mõned küsimused ja selle üle otsustada

  • Milliseid probleeme soovite lahendada?
  • Kui palju olete valmis keele õppimiseks kulutama?
  • Millised on teie valdkonnas kõige sagedamini kasutatavad tööriistad?
  • Millised on muud turul kättesaadavad sarnased tööriistad ja kuidas on see seotud üldiselt kasutatavate tööriistadega?

Nendele küsimustele antud vastused aitavad teil valida parima tööriista ja minna oma karjääris edasi.

Õppige ja saate keelemeistriks.

Kategooria: