Kako vježbati Hadoop Online: 11 koraka (sa slikama)

Sadržaj:

Kako vježbati Hadoop Online: 11 koraka (sa slikama)
Kako vježbati Hadoop Online: 11 koraka (sa slikama)
Anonim

Kao jedan od najmoćnijih programskih okvira otvorenog koda, Hadoop je važan alat za svakoga tko se nada da će pronaći posao s velikim podacima. Ako želite poboljšati svoje vještine Hadoopa ili naučiti kako ga ovladati, vaša najbolja opcija je pohađanje internetskog tečaja. Ako vam to nije dostupno, gledajte besplatne mrežne vodiče i upotrijebite referentne materijale za rješavanje određenih problema. Nakon što ste shvatili osnove, vježbajte na malim skupovima podataka iz stvarnog svijeta kako biste poboljšali svoje vještine.

Koraci

Metoda 1 od 2: Pohađanje tečajeva i korištenje vodiča

Vježbajte Hadoop Online korak 1
Vježbajte Hadoop Online korak 1

Korak 1. Prijavite se za Cloudera za tečaj od 6 dijelova i interaktivne vodiče

Cloudera vam daje primjere iz stvarnog svijeta za vježbanje u okruženju samo za čitanje, tako da ne morate brinuti o velikim greškama. Oni također nude analitičke alate koji će vam pomoći da eksperimentirate s upitima za podatke, kao i besplatnu demo verziju uživo pod nazivom Cloudera Live koja će vam pomoći da naučite okruženje Hadoop.

Iako će vas potpuni, detaljni tečaj sa certifikacijom koštati 295 USD, definitivno će se isplatiti ako koristite ove vještine za svoj posao. Korištenje tečaja Cloudera pomoći će vam da uhvatite pogreške i uštedite vrijeme, zbog čega će se brzo isplatiti

Vježbajte Hadoop Online korak 2
Vježbajte Hadoop Online korak 2

Korak 2. Isprobajte besplatne online tečajeve kroz Cloudera ako već znate osnove

Ako imate iskustva s Hadoopom i samo želite osvježenje, možda nećete morati izdvojiti novac za tečaj iz 6 dijelova. Umjesto toga, provjerite besplatne internetske tečajeve na web stranici Sveučilišta Cloudera.

Postoje resursi za administratore, programere i analitičare podataka, pa bez obzira na to koja je vaša uloga, trebali biste moći pronaći odgovarajući tečaj

Vježbajte Hadoop Online korak 3
Vježbajte Hadoop Online korak 3

Korak 3. Idite na sveučilišni tečaj o Courseri ako želite više teorije

Coursera je poznati, cijenjeni izvor tečajeva programiranja. Iako su upute općenito više teoretske prirode i ne sadrže toliko primjera, možete vježbati zajedno s vodičem i koristiti projekte tečaja za stjecanje praktičnog iskustva.

  • Ovaj tečaj možete pronaći na mreži na
  • Cijena varira između tečajeva, ali Coursera nudi i mogućnost financijske pomoći onima koji se kvalificiraju.
Vježbajte Hadoop Online korak 4
Vježbajte Hadoop Online korak 4

Korak 4. Slijedite besplatni tečaj na Sveučilištu Big Data za isplativu opciju

Ako ne želite platiti online tečaj, Sveučilište Big Data izvrsna je opcija. Imaju tečaj iz 2 dijela, koji se prvo usredotočuje na osnove Hadoopa, zatim na programiranje s Hadoopom, a mrežni format olakšava kretanje vlastitim tempom.

  • Ove tečajeve možete pronaći na
  • Nude mnoge vodiče na engleskom, te japanskom, španjolskom, portugalskom i ruskom jeziku.
Vježbajte Hadoop Online korak 5
Vježbajte Hadoop Online korak 5

Korak 5. Potražite upute na YouTubeu ako vam je potrebna besplatna, specifična obuka

Postoje tisuće video zapisa koji objašnjavaju Hadoop i kako ga koristiti. Širok raspon videozapisa daje vam fleksibilnost, a i besplatan je. Ako naiđete na određeni problem, potražite na YouTubeu videozapis koji vas vodi kroz postupak.

Hadoop vodiče također bi trebalo biti prilično lako pronaći jer je "hadoop" jedinstven pojam za pretraživanje

Vježbajte Hadoop Online korak 6
Vježbajte Hadoop Online korak 6

Korak 6. Iskoristite Yahooove besplatne vodiče ako želite vježbati s virtualnim primjerom

Ovi su vodiči podijeljeni u 7 modula i upućuju vas na instaliranje i rad s Hadoopom od samog početka. Ovo je izvrsna opcija za osvježavanje određenih vještina ako su malo zahrđale.

Vježbajte Hadoop Online korak 7
Vježbajte Hadoop Online korak 7

Korak 7. Pogledajte IBM Open Source dokument za besplatne, detaljne upute

Ovo je nevjerojatno temeljit PDF dokument otvorenog koda stvoren IBM-ovom inicijativom za obuku. Pažljivo vas vodi korak po korak kroz Hadoop i daje jasne pisane upute.

Ove upute također dobro funkcioniraju kada su uparene s demo verzijom uživo poput Cloudere

Metoda 2 od 2: Prijelaz na primjenu u stvarnom svijetu

Vježbajte Hadoop Online korak 8
Vježbajte Hadoop Online korak 8

Korak 1. Pitajte možete li primijeniti Hadoop na poslu za vježbanje s pravim podacima

Postavite zahtjev svom šefu ili nadzorniku ili razgovarajte s njima jedan na jedan o unosu ovih novih vještina na radno mjesto. To je osobito važno ako je vaša tvrtka platila bilo kakvu obuku ili internetske tečajeve.

Što prije počnete primjenjivati naučene vještine, prije ćete ih moći svladati

Vježbajte Hadoop Online korak 9
Vježbajte Hadoop Online korak 9

Korak 2. Potražite jednostavne projekte na kojima ćete vježbati svoje vještine

Odaberite projekte koji su relativno jednostavni i niskorizični, poput brojanja i rangiranja broja interakcija po korisničkom agentu, poput e-pošte i sesija chata.

  • Neke druge aplikacije za stvarne podatke uključuju skeniranje grešaka putem web dnevnika ili praćenje osjećaja robne marke na društvenim mrežama.
  • Također možete vježbati s uzorcima podataka sa web mjesta poput https://www.kaggle.com/datasets ili
Vježbajte Hadoop Online korak 10
Vježbajte Hadoop Online korak 10

Korak 3. Redovito provjeravajte svoj kod s malim podskupovima kako biste riješili sve greške

Prije izvođenja cijelog skupa podataka, odnesite manji skup podataka za testiranje na svoj lokalni stroj i pokrenite ga kroz nekoliko različitih načina. Na primjer, mogli biste ga pokrenuti iterativno kroz Local Jobrunner Mode, zatim Pseudo-Distributed Mode, a zatim Fully-Distributed Mode.

  • To će vam omogućiti da prepoznate nedostatke ili greške prije nego što se pojačaju u cijelom skupu podataka.
  • Lokalni način rada Jobrunner omogućuje vam lokalno testiranje i ispravljanje pogrešaka na karti i smanjenje koda, Pseudo-distribuirani način oponaša proizvodno okruženje, a potpuno raspoređeni način gleda vaš pravi proizvodni klaster.
Vježbajte Hadoop Online korak 11
Vježbajte Hadoop Online korak 11

Korak 4. Iskoristite 1-godišnje besplatno probno razdoblje za vježbanje u okruženju virtualnih strojeva

Tvrtke kao što su Amazon i Microsoft nude plaćene pretplate za svoje usluge vježbanja Hadoop. Amazonov virtualni stroj naziva se Amazon Web Service (AWS), a Microsoftova usluga Microsoft Azure. Za obje usluge vaša prva godina je besplatna kada unesete podatke o kreditnoj kartici.

Ne zaboravite otkazati pretplatu nakon 1 godine kako biste izbjegli naplatu

Savjeti

  • Imajte na umu da je Hadoop specijaliziraniji programski jezik uske uporabe. To će vam zasigurno dati prednost u svijetu velikih podataka, ali nije uvijek potrebno postati programer.
  • Također možete čitati knjige i članke o Hadoopu, poput Hadoopa: Definitivni vodič, 3. izdanje Toma Whitea.

Preporučeni: