Installige NLTK - Kuidas installida NLTK Windowsi ja Linuxi jaoks

Lang L: none (table-of-contents):

Anonim

Kuidas installida NLTK?

Järgmine artikkel NLTK installimine pakub NLTK installimise ülevaate. NLTK on looduslike keelte töötlemise raamatukogude komplekt. See on platvorm Pythoni programmide loomiseks looduskeele töötlemiseks. NLTK on kirjutatud Pythoni programmeerimiskeeles. Selle töötasid välja Steven Bird ja Edward Loper. See toetab teadusuuringuid ja õpetamist NLP-s või sellega tihedalt seotud valdkondades, sealhulgas kognitiivteadus, empiiriline lingvistika, teabe otsimine, tehisintellekt ja masinõpe. NLTK pakub hõlpsasti kasutatavat liidest.

NLTK (looduskeele tööriistakomplekt)

  • Looduslik keele töötlemine (NLP) on osa tehisintellektist, mis töötleb inimeste räägitud keelt. Seega aitab see inimestel arvutitega suhelda, isegi kui neil pole teadmisi selle kasutamise kohta. NLP-d kasutades peavad inimesed lihtsalt käskluse dikteerima arvutitele. Masinõppe abil on looduslik keele töötlemine muutumas populaarseks ja hõlpsamini rakendatavaks. Põhimõtteliselt on see tehnika inimestega suhtlemiseks ja häälkäsklustega toimingute tegemiseks.
  • See võimaldab seadmeid kasutada isegi algajatel, kes ei tunne tehnikat. Kuid loomuliku keeletöötluse rakendamine pole lihtne, kuna inimeste räägitaval keelel puudub kindel ülesehitus. See on mitmetähenduslik ja sõltub kontekstisõnadest, millel võib olla erinev tähendus.
  • NLTK-l on üle 50 korporatsiooni ja leksikaalse allika, nagu WordNet, Problem Report Corpus, Penn Treebank Corpus jne. Samuti on kaasas juhend, mis selgitab keelekasutuse mõisteid tööriistakomplekti abil ja Pythoni programmeerimise põhialuseid, mis teeb selle inimestele lihtsaks kellel puuduvad sügavad teadmised programmeerimisest. Sellel on lai valik pakette, mis teeb sellest ühe NLP võimsa tööriistakomplekti. Tokeniseerimine, Lemmatiseerimine, Tüveldus, Parsimine, Märgite arv, Kirjavahemärgid, Sõnade arv on mõned neist pakettidest.

Installige NLTK Windowsi jaoks

Allpool on juhised NLTK installimiseks Windowsi. Need põhinevad eeldusel, et Python pole süsteemi installitud. NLTK nõuab Pythoni versioone 2.7, 3.5 ja uuemaid.

1. samm: laadige alt üles lingi alla uusim Python for Windows versioon

https://www.python.org/downloads/

2. samm: selle käivitamiseks klõpsake allalaaditud .exe-il.

3. samm: valige kohandatav install.

4. samm: kontrollige kõiki funktsioone, eriti pip, kuna see aitab installida NLTK ja klõpsake nuppu Edasi.

5. samm . Järgmisel ekraanil valige täpsemad suvandid, valige tee ja klõpsake installil.

6. samm: kui installimine on õnnestunud akna lähedal.

7. samm: kopeerige skriptide tee, et installida NLTK samasse kausta.

NLTK-i saab hõlpsasti paigaldada pip-installeri abil. Samuti peame installima ka tuima.

8. samm: NLTK installimiseks avage käsuviip ja tippige käsk allpool.

Veenduge, et installimine õnnestus.

Pärast edukat installimist on nüüd aeg kasutada NLTK-d loomuliku keele töötlemiseks.

9. samm: avage Pythoni kest ja tippige käsk allpool.

Kui see imporditakse ilma tõrgeteta, tähendab see, et NLTK on õigesti installitud.

Installige NLTK Mac / Linuxile

Erinevalt Windowsist tulevad Linuxi süsteemid selle jaoks installitud Pythoni abil. NLTK installimiseks Linuxisse / Mac'i kasutatakse Pythoni paketipaketti Pip. Pipi installimiseks või selle värskendamiseks tippige käsureale allpool olevad käsud.

Pythoni installimiseks Linuxisse kasutage allpool toodud käske.

1. samm: pakettindeksi värskendamiseks kasutage alltoodud käsku.

2. samm: Pythoni installimiseks Linuxi süsteemi kasutage allpool.

3. samm: sisestage allpool olev käsk, et installida Python 3 jaoks pip.

4. samm: Pärast „Pip” installimist kasutage NLTK installimiseks järgmisi käske.

NLTK andmekogu

NLTK-il on looduslike keelte töötlemiseks saadaval palju andmekogumeid, näiteks WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank jne. Neid andmekogumeid nimetatakse korporatsioonideks. Põhimõtteliselt sisaldab NLTK andmekogum failide või dokumentide komplekti. Iga fail / dokument sisaldab sõnade, tähtede või teksti kogumit ühes keeles. Seega on korpus peamiselt keele mõistmiseks / õppimiseks mõeldud raamatukogud. Sellel on grammatikareeglid ja keele struktuur.

Pärast NLTK edukat installimist saate selle importida ja ka selle korpused järgmise käsuga alla laadida.

NLTK allalaadija avab akna andmekogude allalaadimiseks. Andmekogum on suur, seetõttu võtab see aega. Et testida, kas andmekogumid on õigesti installitud, proovige importida andmekogum ja kasutada seda.

NLTK töötlemine

Looduskeele töötlemisel on 5 peamist protsessi. Need on mis tahes teksti töötlemise sammud.

  1. EOS-tuvastus : kõnetuvastuse lõpp jaotab teksti tähenduslike lausete kogumiks. See jagab pika teksti osadeks, millel on teatav tähendus.
  2. Tokeniseerimine : see samm jagab laused tokeniteks . Märgid ei sisalda ainult sõnu, vaid sisaldavad ka tühikuid, lausepause.
  3. POS-i sildistamine : POS tähendab kõne kõnet. Siin määratakse teave märgiks. See teave viitab sellele, mis tüüpi kõnes see on pingeline, tegusõna, omadussõna, nimisõna jne.
  4. Tükeldamine : tükeldamine tähendab siltide põhjal teksti kogumist.
  5. Ekstraheerimine: ekstraheerimine on käimasolev protsess, mille käigus lõigatakse tükid läbi ja sildistatakse need nimega üksustena nagu inimesed, asukohad, organisatsioonid jne.

Järeldus:

NLTK-d kasutatakse teksti klassifitseerimiseks, pildi pealdiseks, kõnetuvastuseks, küsimustele vastamiseks, keele modelleerimiseks, dokumentide kokkuvõtmiseks ja paljudeks muudeks toiminguteks. Loodusliku keele töötlemiseks on palju muid tööriistu. Kuid NLTK-l on lai valik raamatukogusid, mis teeb sellest ühe võimsa loomuliku keele töötlemise tööriista. See on täpsem kui ükski teine ​​tööriist, kuid paljude teekide tõttu on see natuke aeglane. Niisiis, kõik sõltub kasutaja nõudmistest. Kui kasutaja soovib kiirust, siis saavad nad eelistada ka teisi tööriistu, kuid siis peavad nad tegema sisu täpsusega kompromisse. Kuid kui täpsus on prioriteet, peaksid nad kindlasti minema NLTK-i.

Soovitatavad artiklid:

See on olnud juhend NLTK installimiseks. Siin käsitleme NLTK installimise põhikontseptsiooni ja erinevaid samme Windowsi ja Linuxi \ Mac'i jaoks. Lisateabe saamiseks võite vaadata ka järgmisi artikleid -

  1. Installige Kubernetesi juhtpaneel
  2. Kuidas installida JDK
  3. Installige Docker
  4. Kuidas installida Magento?
  5. Magento versioonid | Magento versioonide omadused