SAS vs R vs Python - kui hakkate valima analüütiku elukutset, siis tekib teie peas peamine küsimus: „Milline on selle töö jaoks parim tööriist?”
See on aastaid olnud lahing ja alati on raske otsustada, milliseid programmeerimiskeeli andmete analüüsiks kõige paremini kasutada.
Traditsiooniliselt tõstatati see küsimus SAS vs R vastu, kuid nüüd on selle aruteluga ühinenud python. Kumb on parem sas vs r vs pythoni vahel.
Paar aastat tagasi oli nende tööriistade kaudu keeruline karjääriteed jälgida. Kuid õnneks osutus see varjatud õnnistuseks.
Kuid nüüd, kui analüütikaalane spetsialist otsustab, millist tehnikat nad peaksid kasutama, otsivad nad selle ülesande täitmiseks parimat tööriista.
SAS vs R vs Pythoni vahel on tihe konkurents. Kuid aus vastus on see, et iga tööriist on omal moel ainulaadne. Selles kontekstis pole universaalset võitjat. Igal tööriistal on oma tugevus ja nõrkus.
Analüütiku jaoks on oluline teada iga tööriista tugevaid ja nõrku külgi, et otsustada, mida on kõige parem kasutada oma kutsealal.
SAS vs R vs Pythoni infograafika
Nüüd vaatame, mis on tööriistad ja milleks seda kasutatakse.
Kirjeldus
Siin on 3 tööriista lühike kirjeldus
SAS
SAS on tarkvaralahenduste integreeritud süsteem ja andmeanalüütika valdkonnas liider. Sellel tarkvaral on vinge tehnilise toe pakkumiseks palju funktsioone, näiteks hea GUI ja muud. SAS aitab teil järgmisi toiminguid teha
- Andmete sisestamine, otsimine ja haldamine
- Aruannete kirjutamine ja graafiline kujundamine
- Statistiline ja matemaatiline analüüs
- Ettevõtte prognoosimine ja otsuste toetamine
- Operatsioonide uurimine ja projektijuhtimine
- Rakenduste arendamine
SASi kasutavad tuntud firmad nagu Barclays, Nestle, HSBC, Volvo ja BNB Paribas.
R
R on statistilise andmetöötluse ja graafika programmeerimiskeel, mille lõid 1995. aastal Ross Ihaka ja Robert Gentleman. See pakub laias valikus statistilisi ja graafilisi tehnikaid. See on avatud lähtekoodiga marsruut, mida on väga võimalik laiendada. See on lihtne ja tõhus programmeerimiskeel. See on midagi enamat kui lihtsalt statistikasüsteem. See teeb järgmist tööd
- Käsitseb pakenditega hõlpsalt
- Manipuleerib stringe
- Töötab regulaarsete ja ebaregulaarsete aegridadega
- Andmete visualiseerimine
- Masinõpe
R-d kasutavad sellised kõrgelt hinnatud ettevõtted nagu Bank of America, bing, Ford, Uber ja Foursquare.
Python
Python on objektorienteeritud programmeerimiskeel, millel on selge süntaks ja loetavus. Selle lõi 1991. aastal Guido Van Rossem. Seda on lihtne õppida ja see aitab teil kiiremini ja tõhusamalt töötada. See on lihtsuse tõttu lühikese aja jooksul populaarsemaks muutunud.
Pythoni kasutavad sellised kuulsad ettevõtted nagu ABN-AMRO, Quora, Google ja reddit.
Võrdluse põhjused
Tööstusharud kasvavad dünaamiliselt. Põllu kasvades on igas keeles palju tehnoloogilisi edusamme.
Kui olete andmeanalüütika väljal uus, siis võiksite õppida uue välja oma huvi tõttu või suurema osa ajast, mida teie organisatsioon töötab. Tööriistade ja tarkvaraprogrammide täienduste tõttu võivad tekkida väljakutsed ja pettumused.
Keelte võrdlus on nüüd väärt kaalumist. Mis tahes võrdlus, mis tehti enne paari aastat, ei ole praeguses olukorras asjakohane. Võrdlused aitavad valida ka kolme seast parimat.
Neid keeli on selles artiklis võrreldud järgmiste tegurite põhjal. Te ei pruugi osta tööriista, mis põhineb järgmistel võrdlustel, kuid kindlasti on teile kasulik valida see, mis sobib teie karjääriga.
SAS on suletud allikas ja ei toeta läbipaistvaid funktsioone. R ja Python on SASi avatud lähtekoodiga vaste ning sisaldab kõigi selle funktsioonide ja algoritmide üksikasjalikku läbipaistvust.
SAS on aeganõudvam, kuna funktsionaalsuse tundmine võtab kaua aega.
SAS on ka vastupidine.
SAS on üks kallimatest tarkvaradest maailmas. SASi litsentsi saamiseks tuleb investeerida miljoneid dollareid. Seetõttu saavad seda kasutada ainult suured ettevõtted.
SASi kasutavaid ettevõtteid on vähe. Kui olete SAS-i professionaal, peate valima töökoha, kus nad kasutavad SAS-i. Kui liitute ettevõttes, kus nad SASi ei kasuta, suunatakse teie karjäär uuele teele.
R on avatud lähtekoodiga tarkvara, mille saab igaüks tasuta alla laadida.
Python on teiselt poolt ka tasuta avatud lähtekoodiga tarkvara ja seda saab alla laadida igaüks.
SAS-i on lihtne õppida spetsiaalselt inimestele, kes juba tunnevad SQL-i. Ka SAS-il on stabiilne GUI-liides. SASi õpetused on saadaval erinevatel saitidel ja sellel on põhjalik dokumentatsioon.
Pythoni on andmeanalüütika maailmas väga lihtne õppida. Pythonil pole laialdast GUI-liidest, kuid Pythoni sülearvutid on populaarseks saanud. Need pakuvad teile dokumentide ja õpetuste funktsioone.
R on madal programmeerimiskeel ja seetõttu on lühemate protseduuride jaoks vaja ka pikemaid koode. Peate R-s kodeerimise kohta sügavama ülevaate saama.
SAS nõuab SASi täiustatud funktsioonidega tutvumiseks uute toodete ostmist. See ei paku teile võimalust ühtegi funktsiooni alla laadida ja seda kohe kasutada. SASil on ka ranged litsentsimispiirangud.
Arvestades, et R-s ja Pythonis lubatakse teil korduvate toimingute tegemiseks juurde pääseda sellistele lisafunktsioonidele nagu paralleelne töötlemine, mitmetuumalised paketid jne.
Kõik kolm keelt on võrdselt head andmetöötluses ja neil on ka võimalus paralleelseteks arvutusteks. Selles teguris pole kolme vahel suurt vahet. Kõigi nende keelte standardi parandamiseks võiks olla vähe uuendusi.
Selle teguri osas on R-l ülejäänud kahega võrreldes parimad graafilised võimalused.
SASil on põhilised graafilised võimalused, kuid see on ainult funktsionaalne. Kruntide kohandamine on keeruline ja SAS Graphi paketi tundmiseks on vaja põhjalikke teadmisi
Pythonil on võimalus kasutada natiivraamatukogusid (matplotlib) või neist tuletatud raamatukogusid, mis võimaldab helistada R-funktsioonidele.
R-l on nende kolme hulgas suurepärased graafilised võimalused. Neil on täiustatud graafiliste võimaluste paketid.
Kõigil kolmel keelel on põhifunktsioonid ja kõige nõutavad funktsioonid, kuid uusim tehnoloogia ja funktsioonid on olulised, kui teie töö seda eeldab.
R ja Python on oma olemuselt avatud lähtekoodiga, nii et neid täiendatakse uusimate tehnoloogiate ja funktsioonidega kiiremini kui kahte muud keelt. Uute tehnikate väljatöötamine on R-s väga kiire.
Teisalt võtab SASi värskete funktsioonide ja võimaluste värskendamine aega, kuna see töötab kontrollitud keskkonnas.
SAS-i peamine eelis on kontrollitud keskkonnas töötamine. Neid on hästi testitud ja seega on vigade tõenäosus väga väike.
Kuid Python ja R toimivad avatud lähtekoodiga ning neid värskendatakse uusimale tehnoloogiale väga kiiresti, kuid need on vigade suhtes avatavamad.
R-il ja Pythonil on lähiminevikus rohkem tööpakkumisi ja tulevikus on oodata ka selle arvu suurenemist.
R ja Pythoni kasutavad ettevõtted, kes otsivad kulutõhusust. Need on alustavatele ettevõtetele parim valik.
SASi kasutavad laialdaselt suured organisatsioonid ja ettevõtted.
Värske uuring on tõestanud, et ka Pythoni töökohad andmete analüütikas suurenevad samamoodi nagu R.
Visualiseerimine on infoteaduse oluline osa. SASi peamist visualiseerimisplatvormi nimetatakse SAS Visual Analyticsiks. Selle kasutamine on liiga kulukas.
R ja Pythonil on palju tasuta visualiseerimisvahendeid. See ei nõua lepingu sõlmimist ja iga tegevuse eest tasumist nagu SASis.
Klienditoele ja teenindusele tuginedes on SAS kahe teise keelega võrreldes parim. SASil on spetsiaalne klienditugi ja -teenus ning kogukond. Kui teil on tehnilisi probleeme, võite pöörduda otse tugikeskuse poole.
R-l on suur veebikogukond, kuid puudub klienditoe keskus. Neilt saate abi, kuid mitte kohe.
Ka Pythonil pole klienditoe keskust. See pakub abi oma klientidele, kuid mitte SASi tasemele.
Tööturu suundumus liigub kiiresti avatud lähtekoodiga tehnoloogiate poole. R, Hadoop, Python on kõik selle peamised näited. SAS on ka üks sellise tehnoloogia hulgas, kuid see on ainus tasuline toode. Inimesed eelistavad R-i ja Pythoni SAS-i asemel, kuna see ei paku tasuta toodete suhtes mingeid lisaeeliseid. Ainult vähesed ettevõtted pöörduvad teatud päevadel SASi poole.
R ja Python tulevad tasuta ja neid saab hõlpsalt alla laadida.
R ja Pythoni toetavad tuhanded toetajad kogu maailmas. Kui keelte jaoks on olemas mõni arendus või ülesastumine, tehakse see klientidele hõlpsasti kättesaadavaks.
SAS-i tootele pääseb juurde ainult SAS-i Instituudi poolt ja ainult SAS-i arendajatel on lubatud toota uusi funktsioone. See võtab palju aega. Ja enne SAS-i funktsioonide värskendamist uute algoritmidega saate oma projekti lõpule viia mis tahes muu tööriista abil.
SAS ei paku oma klientidele mingeid samm-sammult juhiseid. Kui alustate uue teemaga või soovite õppida midagi uut SAS-is, siis peaksite kindlasti otsima SAS-i konsultandi abi, kes on jällegi SAS Institute Incorporated-ist.
R ja Python teiselt poolt pakuvad teile üksikasjalikke näiteid. See pakub ka õpetust Internetis. Python sisaldab reprodutseeritavaid sülearvuteid nimega iPython. R-harjutused ja iPython-sülearvutid on laialdaselt saadaval saitidel, näiteks github jt.
Siin on tabelivaade, et saaksite kõiki kolme tööriista hõlpsalt võrrelda mõne kriteeriumi alusel
Kriteerium | SAS | R | Python |
Maksumus | Tasuline | Tasuta | Tasuta |
Õppimine | Raske | Lihtne | Lihtne |
Andmete manipuleerimine | Kõrge | Kõrge | Kõrge |
Analüütiline modelleerimine | Kõrge | Kõrge | Keskmine |
Graafiline võimekus | Madal | Kõrge | Keskmine |
Teksti töötlemine | Madal | Keskmine | Kõrge |
Suured andmed | Keskmine | Madal | Keskmine |
Tavalised tavad | Kõrge | Kõrge | Keskmine |
Töö stsenaarium | Kõrge | Keskmine | Madal |
Klienditugi | Kõrge | Madal | Keskmine |
Tööriista edasiminek | Kõrge | Madal | Keskmine |
Järeldus
SAS suudab kindlasti rahuldada kõik teie andmeteaduste vajadused, kuid see ei sobi pikas perspektiivis. Nüüd liiguvad ettevõtted kiiresti avatud lähtekoodiga programmeerimiskeelte poole, millele on lihtne juurde pääseda ja neid kasutada.
Kuna SAS on piirav ja suletud tööriist, pole see tänapäeval eriti eelistatud.
R ja Python on avatud lähtekoodiga tööriistad, mis aitavad teil täiendada oma teaduse teadmisi, õppida uusi tehnoloogiaid ja algoritme. R-i ja Pythoni tundmine muudab teid tänapäeval automaatselt andmeteadustöödeks sobivaks.
Kõige parem on see, et kolme hulgas pole ühtegi ilmset võitjat. Kõigil kolmel tööriistal on oma plussid ja miinused. Nende tugevused panevad nad turul pikaajaliselt püsima.
Keelte vahel peab otsustama lõppkokkuvõttes andmeteadlane. Andmeteadlasena on teie ülesanne otsustada, milline keel sobib teie vajadustele kõige paremini. Võite esitada endale mõned küsimused ja selle üle otsustada
- Milliseid probleeme soovite lahendada?
- Kui palju olete valmis keele õppimiseks kulutama?
- Millised on teie valdkonnas kõige sagedamini kasutatavad tööriistad?
- Millised on muud turul kättesaadavad sarnased tööriistad ja kuidas on see seotud üldiselt kasutatavate tööriistadega?
Nendele küsimustele antud vastused aitavad teil valida parima tööriista ja minna oma karjääris edasi.
Õppige ja saate keelemeistriks.