EDA:n (Exploratory Data Analysis) avainkomponentit ovat:
1. Tietojen puhdistus ja valmistelu: Tämä sisältää tietojoukon puhdistamisen, puuttuvien tietojen käsittelyn, kategoristen muuttujien koodauksen ja tietojen valmistelun analysointia varten.
2. Yksimuuttuja-analyysi: Tämä sisältää yksittäisten muuttujien ja niiden ominaisuuksien, kuten taajuuden, jakautumisen ja keskeisen taipumuksen, tutkimisen.
3. Kaksimuuttuja-analyysi: Tämä sisältää kahden muuttujan välisen suhteen tutkimisen käyttämällä korrelaatiota tai ristiintaulukkoa.
4. Monimuuttuja-analyysi: Tämä sisältää useamman kuin kahden muuttujan välisen suhteen tutkimisen käyttämällä tekniikoita, kuten pääkomponenttianalyysiä (PCA) tai tekijäanalyysiä.
5. Visualisointi: Tämä sisältää graafisten esityksiä tiedoista, jotka auttavat tunnistamaan kuvioita, suhteita ja poikkeavuuksia.
6. Outlier-tunnistus: Tämä tarkoittaa sellaisten tietopisteiden tunnistamista, jotka eroavat merkittävästi tietojoukon muista datapisteistä.
7. Tilastollinen mallintaminen: Tämä sisältää tilastollisten mallien käyttämisen tietojen analysoimiseksi ja johtopäätösten tekemiseksi.
8. Raportointi ja havaintojen esittäminen: Tähän kuuluu yhteenveto tärkeimmistä havainnoista ja niiden esittäminen selkeästi ja ytimekkäästi.
Julkaisupäivämäärä: