Talendi ja SSIS-i sissejuhatus
Talend on ETL-i tööriist, mis aitab organisatsiooni juurdepääsetavate andmetega. See võimaldab teil luua ühenduse paljude andmebaasidega. Talend on paindlik erinevate andmeallikate ja platvormidega töötamiseks. See aitab andmete integreerimisel, äriprotsesside haldamisel, põhiandmete haldamisel ja andmete kvaliteedil. Seda võib öelda kui andmete integreerimise tulevikku. SSIS tähistab SQL Serveri integratsiooniteenuseid. See aitab andmete migreerimisel, ümberkujundamisel, ETL-is ja muudes funktsioonides. See on veel üks ETL-i tööriist, mis aitab teostada keerulisi lahendusi, näiteks lugeda andmeid erinevatest allikatest, ning hõlmab ka andmete analüüsimist ja puhastamist, ETL-i protsesside käivitamist andmeladude värskendamiseks. See sisaldab komplekti tööriistu nimega SQL Server Data Tools, mis on ette nähtud integratsiooniprogrammide väljatöötamiseks ja testimiseks.
Uurime üksikasjalikumalt Talendi ja SSISi kohta:
Selles artiklis võrdleme kahte parimat turul saada olevat ETL-i tööriista - Talend ja SSIS. Enne selle nägusa mängu alustamist proovime välja selgitada, mis on Talend ja SSIS? Ja milleks nad võimelised on?
Mis on Talend?
Talend on ETL-i tööriist, nagu ka Informatica, mis aitab ettevõtetel andmeid paremini juurdepääsetavaks muuta. See võimaldab teil luua ühenduse paljude andmebaasidega. Talend on üles ehitatud nii, et see on piisavalt paindlik, et töötada koos kõigi turul olevate andmeallikate ja platvormidega. See hõlmab andmete integreerimist, andmete kvaliteeti, põhiandmete haldamist ja äriprotsesside juhtimist. Selles on kõik teie jaoks, et teie andmed oleksid teie jaoks vajalikud. Me arvame, et see on andmete integreerimise tulevik.
Talendi omadused:
- Talend töötab Java platvormil.
- Talend kasutab JDBC-d teiste andmebaasisüsteemidega ühenduse loomiseks.
- Talend salvestab ühenduse stringe metaandmetes, kus ühenduse stringid on määratletud.
- Talend kasutab ülesande tüübi määramiseks olenevalt ETL-i tööst Paletti.
- Töötlemispaletil on mitmeid ülesandeid, mida kasutatakse andmete filtreerimiseks ja koondamiseks ning mitme andmeallika ühendamiseks primaarse abil.
Mis on SSIS?
SSIS tähistab SQL Serveri integratsiooniteenuseid. Andmete migratsiooni, ETL-i ja ümberkujundamise segmendis konkureerimiseks oli Microsoft kasutusele võtnud SSIS-i. Microsoft annab sellele kogu laskemoona abil andmete rände, ümberkujundamise, ETL-i ja muid funktsioone. Selle ETL-i tööriista abil saab teostada keerulisi lahendusi, nagu näiteks andmete lugemine erinevatest allikatest, andmete analüüsimine ja puhastamine, ETL-i protsesside käivitamine andmeladude värskendamiseks, andmete kirjutamine erinevatesse allikatesse ja e-kirjad konkreetsele isikule või rühmale. See sisaldab tööriistakomplekti integratsiooniprogrammide arendamiseks ja testimiseks, mida nimetatakse SQL Server Data Tools
SSIS-i omadused:
- SSIS saab käsitleda andmeid heterogeensetest andmeallikatest.
- SSIS-i on lihtsam hooldada.
- SSIS on tihedalt integreeritud SQL Serveri ja Microsoft Visual Studioga.
- SSIS laadib SQL Serveri sihtkoha abil andmed SQL-i kiiremini.
- SSIS eemaldab andmete SQL-i sisestamisel võrgu kitsaskohtade probleemi.
- SSIS on parem keerukate teisenduste, mitmeastmeliste toimingute, erinevatest andmeallikatest või tüüpidest pärinevate andmete koondamise ja struktureeritud erandite käsitlemise jaoks.
Talendi ja SSIS-i võrdlus ühest otsast teise (Infograafika)
Allpool on 8 parimat Talendi ja SSIS-i võrdlust
Kiiruse võrdlus Talendi ja SSISi vahel
KASUTAMISJUHT
Mõlema ETL-i tööriistade võimekuse kontrollimiseks laadisime ühe eraldatud lameda faili samasse serverisse teise eraldatud lameda faili. Fail koosneb 20 miljonist dokumendist ja selle suurus on umbes 1, 5 GB.
Klastri konfiguratsioon
- Server: IBM - System x3650 M3
- Protsessor: Intel Xeon X5680 @ 3, 33 GHz (2 protsessorit)
- RAM: 76 GB
- OS: Windows Server 2008 R2 - 64-bitine
- Talend v5.3.1 Open Studio
- JDK 1.7.0
- JRE 7
- SQL Server 2008 - SP1
VÕRDLUS - segisti vs SSIS
Piisavalt suure proovi saamiseks läbisin testi 3 korda.
Prooviversioon | Rekordid | Talendi aeg | SSIS aeg |
1 | 20000000 | 92, 28 | 49, 71 |
2 | 20000000 | 92, 99 | 50, 2 |
3 | 20000000 | 86, 69 | 51, 83 |
Talendil kulus selle töö täitmiseks keskmiselt 67, 69 sekundit, samal ajal kui SSIS tegi sama töö keskmise ajaga 39, 8 sekundit.
Talend vs SSIS võrdlustabel
Võrdluse alus | SSIS | Talend |
Arendaja | Microsoft | Talend |
Objektiivne | Andmete ekstraheerimine, teisendamine ja laadimine mitmest allikast erineva vorminguga | ETL-i töökohtade või allikate loomine mitmest asukohast ja andmete parema ühilduvuse tagamiseks tuleb need integreerida |
Plussid |
|
|
|
|
|
Miinused |
|
|
|
|
|
Investeeringutasuvus | Pärast väljatöötamist on teie paketid väga stabiilsed ja vajavad suhteliselt vähe hooldust, mis säästab palju tööaega | Talend Data Integration on andmelaohaldust sujuvamaks muutnud, mis võimaldab vähendada nii kulusid kui ka aega |
Arenguruum | SSIS võib parandada erinevat tüüpi andmetöötlust. SSIS-ide jaoks on suureks väljakutseks ka ühenduvus erinevate andmeallikatega, näiteks Salesforce'i ühenduvus, Oracle Cloudi ühenduvus jne. Nii et ootan neis valdkondades paranemist. | Avatud lähtekoodiga versioon peaks sisaldama selliseid funktsioone nagu lähtekoodi versioonimine ja paralleelne täitmine. |
Mastaapsuse probleemid | Puudub | Enne optimaalse jõudluse saavutamist on vaja natuke häälestada. |
Toetus | Tugi on suurepärane. Samuti saate mitmesuguste funktsioonidega ettekirjutatud skriptiülesandeid, mis säästab palju aega. | Hea tugi, eriti kui see on seotud PROD keskkonnaga. |
Järeldus - Talend vs SSIS
Pärast seda testi on selgelt näha, et SSIS toimib mõne lihtsa teisenduse korral paremini kui Talend. Kuid see ei tähenda, et SSIS edestaks Talendit kõigis valdkondades. See testi suurus oli väike ja me teame, et Talend suudab SSIS-iga ja avatud lähtekoodiga süsteemina teha paljusid asju tõhusamalt. Lõpuks võime öelda, et mõlemal neist tööriistadest on omad plussid ja miinused ning sõltuvalt teie soovist saate teha valiku nende kahe vahel.
Soovitatavad artiklid
See on olnud juhend Talend vs SSIS, nende tähendus, pea võrdlus, kiiruste võrdlus, võrdlustabel ja järeldus. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -
- Uurige välja 12 parimat erinevust Talend Vs Informatica PowerCenteri vahel
- Andmete kaevandamine vs andmete visualiseerimine - kumb on parem
- Parim erinevus andmete kaevandamise ja andmete analüüsi vahel
- Äriteave vs BigData - 6 hämmastavat võrdlust