Sissejuhatus Talendi avatud stuudiosse
Talend pakub Open Studio, mis on andmete integreerimiseks avatud lähtekoodiga. Sellel on rohkem kui 800 komponenti erinevatel integratsiooni eesmärkidel. Laadige Talend Open Studio alla aadressilt https://www.talend.com/download/
Andmete integreerimine tähendab erinevatest allikatest pärinevate andmete ühendamist ja nende ühendamist üheks vaateks, et saada olulisi andmeid nendest, mis aitavad ettevõttel või organisatsioonil nende andmete analüüsi abil oma äri parendada. Integreerimine aitab andmeid hankida, andmeid puhastada, tehes vajaliku ümberkujundamise jms, seejärel laadides need andmelattu.
Mis on Talend?
Talend on ETL-i tööriist, mida kasutatakse andmete integreerimiseks. Talend pakub lahendust andmete ettevalmistamiseks, andmete kvaliteediks, andmete integreerimiseks ja suurandmete jaoks. Siin käsitleme mõnda komponenti. Allpool toodud näite hõlpsaks nägemiseks on sim-operaatoril tohutul hulgal andmeid plaanide, klientide, simide üksikasjade jms kohta. Need andmed on tohutud, seega kasutatakse integratsioonis ka suuri andmeid.
Klient Simmi ostmine valitsuse ID abil
Pannes talle nimeks AB C
aadress Chennai, Chennai
telefoninumber 1234567890
Pärast andmete integreerimist
Eesnimi: AB
Perekonnanimi: C
Aadress: Chennai, India
Telefoninumber: +911234567890
Siin andmed puhastatakse ja muudetakse millekski tähendusrikkamaks.
Kasu
- Äritrendide analüüsimine andmete integreerimise abil
- Andmete ühendamine ühtseks süsteemiks
- Ajasäästlik ja tõhusam ning vähem ümbertegemist
- Lihtne aruandluse genereerimine - kasutatakse BI-tööriistades
- Andmete säilitamine ja sisestamine andmelaosse ja andmekaardid
Rakendus
Järgnevalt mainitakse järgmisi rakendusi
1. Töö Talendiga
- Veenduge, et teil oleks Java installitud ja keskkonnamuutujad seadistatud.
- Laadige Talenni veebisaidilt alla avatud lähtekoodiga tarkvara ja installige tarkvara.
- Looge uus projekt ja viige seadistamine lõpule
- Talend avaneb koos disainerite vahekaardiga.
- Talend on eclipse-põhine tööriist ja komponente saab lohistada paletist või klõpsata ja tippida komponentide nime.
2. Esimene töö Faili lugemine
- Otsige komponenti tFileinputdelimited. Seda komponenti kasutatakse eraldatud failide lugemiseks.
- Asetage sisestatudimoodustatud komponent. Otsige üles tlogrow ja asetage see töökujundajasse.
- Paremklõpsake käsku tfileinputdelimited ja valige rida-> pea ja tõmmake joondamiseks rida.
- Komponendis valib vahekaart selle faili tee, mida soovite lugeda, ja annab rea eraldajaks \ n. Kui failil on eraldaja, võite piiritleja mainida.
- Klõpsake skeemil ja andke veeru tüübi üksikasjad või võite kogu rea lugeda ühe veeruga stringina ja eraldusväärtus peaks olema tühi.
- Võite ka päise ja jaluse vahele jätta.
- Valige tlogrow komponendis viis, kuidas soovite andmeid näha. Tabeli vorming või üherealine vorming.
- tlogrow kuvab väljundi käituskonsoolis.
- Pärast ühendamist nii tfileinputdelimimited kui ka tlogrow käivitage töö vahekaardil Run.
- Faili sisu näete konsoolis trükitud kujul.
3. Teine töö Tmap abil
- Lugege faili ja filtreerige see erinevatesse väljundfailidesse.
- Lugege failis tfileinputdelimited komponenti, mille kirjeks on ühe veeru skeem.
- Tmap-komponent - see komponent aitab andmeid muuta mõnede sisseehitatud funktsioonidega, näiteks otsing, liitumine jne.
- Tmap-is looge kaks väljundit1 ja 2.
- Lisage filtrisse out1 filter rida3.record.contains (“talend”) ja juhtige rekord out1-le.
- Joonistage rekordjoon teisele out2.
- Võtke tmapilt peamised read ja looge ühendus kahega tfileoutputdelimited.
- välja1 link ühele failile väljundmudeldatud1 kui fail1.txt ja välja2 muudele failidele väljundmudeldatud2 faili2.txt.
- txt sisaldab kirjeid, mis sisaldavad talendit.
- txt-l on kirjed, millel on muud nimed.
4. Sisseehitatud ja hoidla
- Sisseehitatud tähendab, et peaksite iga kord andmebaasiga ühenduse loomiseks määrama skeemi või üksikasjad.
- Hoidla on kasulik detailide salvestamiseks metaandmetesse, et saaksite samu detaile iga kord uuesti kasutada, ilma et andmeid iga kord käsitsi sisestaks. Metaandmetes saate salvestada failiskeemi, andmebaasiühendused, Hadoopi ühenduse, taruühenduse, s3-ühenduse ja palju muud.
Talendi avatud stuudio komponendid
Siin on järgmised Talend Open Studio mainitud komponendid
1. tFileList
- See komponent loetleb antud failimaski mustriga kataloogid või kaustad.
2. tMysqlConnection
- Seda komponenti kasutatakse ühenduse loomiseks mysql andmebaasiga.
- Mysql-komponendid saavad seda ühendust kasutada andmebaasiga ühenduse loomiseks.
3. tMysqlinput
- See komponent aitab käivitada mysql andmebaasi päringut ja saada tabelit või veerge. Seda komponenti kasutatakse päringute valimiseks ja üksikasjade saamiseks.
4. tMysqlOutput
- Seda komponenti kasutatakse andmete sisestamiseks või värskendamiseks andmebaasi Mysql.
5. tprejob
- See komponent käivitatakse töös esimesena ja seda saab ühendada teiste komponentidega, mille alamtöötlus on ok.
6. tpostjob
- See komponent on viimane, mida töös täidetakse. Selle saate ühendada ühenduse lähedal olevate komponentidega.
7. tlogipüüdja
- See komponent püüab hoiatusi ja vigu töös.
- Kõige olulisem komponent, mida kasutatakse veakäsitlustehnikas.
- Selle komponendi ja tfileoutputdelimited abil saab tõrkelogisid kirjutada.
- Komponente on rohkem kui 800+.
Kontekstimuutuja
- Kontekstimuutujad on muutujad, mida saab töös kasutada ükskõik kus.
- See hoiab väärtusi ja selle saab teisele tööle üle kanda ka tüvikomponendi abil.
- Kontekstimuutujate kasutamine on see, kui saame väärtust erinevatel eesmärkidel muuta.
- Näiteks võib meil olla arenduse kontekstirühma väärtuste komplekt ja tootmiseks erinevad kontekstiväärtuste komplektid.
- Sel moel ei pea me töökohta vahetama, piisab ainult kontekstiparameetrite muutmisest.
Töö ehitamine
- Töö loomiseks paremklõpsake tööl ja valige ehitada töö.
- Ehitustöö saab importida TAC-is.
- Talendi halduskonsoolis plaanite tööd, et käivitada ka sõltuvus tööst.
- Töö saab ka artefakti abil importida Nexuse hoidlast.
Looge ülesanne TAC-is
- Avatud tööjuht TACis
- Klõpsake uusi ülesandeid ja valige tavalised või esemelised ülesanded.
- Importige ehitatud töö või valige seostest.
- Valige tööserver, kus talend käivitatakse.
- Salvestage ülesanne.
- Nüüd saate seda tööd juurutada ja käivitada.
Järeldus - Talendi avatud stuudio
“Lihtsustage ETL-i ja ELT-i juhtiva tasuta avatud lähtekoodiga ETL-i tööriistaga suurandmete jaoks.” On avatud stuudio sildiliin. Talend Bigdata sisaldab tohutute andmete töötlemiseks palju komponente. Tavaline töö, Bigdata töö, Bigdata voogesitustööd on Talendis saadaolevat tüüpi tööd. Bigdata töökohti saab luua sädeme või kaardi vähendamise raamistikus.
Soovitatavad artiklid
See on Talend Open Stuudio juhend. Siin arutame Talend Open Studio eeliseid, rakendusi ja komponente. Võite lisateabe saamiseks vaadata ka järgmisi artikleid -
- Andmete integreerimise Talend juhend
- Olulised Talendi intervjuu küsimused
- Talend vs Mulesoft: erinevused
- Talend vs Pentaho: 8 kasulikku võrdlust õppimiseks