Technikai készségek
Programozás
A Python az adattudomány elsődleges programozási nyelve. A NumPy, Pandas, Matplotlib, Scikit-learn és PyTorch/TensorFlow könyvtárak ismerete a legtöbb pozícióban elvárás. Az R statisztikai elemzéshez, bioinformatikához és akadémiai kutatáshoz széleskörűen alkalmazott.
SQL és adatbázisok
Az SQL nélkülözhetetlen: adatlekérdezések, aggregálások, JOIN-ok, ablakfüggvények. PostgreSQL, MySQL, BigQuery – a konkrét rendszer másodlagos, az SQL logika az elsődleges.
Gépi tanulás
Felügyelt és felügyelet nélküli tanulás, modellkiválasztás, hyperparaméter-optimalizálás, túlillesztés kezelése, modell értékelési metrikák.
Matematikai alapok
| Terület | Releváns fogalmak |
|---|---|
| Lineáris algebra | Mátrixok, vektorok, sajátértékek – ML modellek alapjai |
| Valószínűségszámítás | Eloszlások, Bayes-tétel, statisztikai hipotézisvizsgálat |
| Kalkulus | Derivált, gradiens – neurális hálók optimalizálásához |
| Statisztika | Leíró statisztika, konfidenciaintervallumok, A/B tesztelés |
Kommunikáció és üzleti értés
Az adattudomány nem csupán modellek készítéséről szól. A legfontosabb nem-technikai készségek:
- Vizualizáció és storytelling: eredmények érthető bemutatása nem-technikai közönségnek
- Üzleti kontextus megértése: a probléma helyes megfogalmazása az üzleti célt tükrözi
- Dokumentáció: kód, modellek és döntések átlátható leírása
- Csapatmunka: együttműködés mérnökökkel, üzleti elemzőkkel, termékvezetőkkel
Eszközkészlet
Python, R, SQL
Az adattudomány alapnyelvei minden munkakörben.
Tableau, Power BI
Üzleti intelligencia eszközök riportoláshoz.
AWS, GCP, Azure
Felhő alapú adatfeldolgozás és ML platformok.