DATA MINIG
– dolování, získávání dat
Základní metody:
1. Rozhodovací stromy
– rozhodovací strom nemůže být příliš hluboký – neměl by statisticky významné hodnoty pro rozhodování v nižších úrovních
– je třeba vybrat strom, který nejspolehlivěji předikuje výsledky
2. Shlukování (Clustering)
– problémy:
– je zadán postačující počet shluků?
– nalezení „nejlepších shluků“
– jsou shluky sémanticky smysluplné?
– ukládání shluků na disk?
3. Dolování asociačních pravidel
– trend – jaké položky se kupují spolu např. lyže si někdo koupí společně s vázáním
– asociační pravidla:
– pravidla P1, P3, P8
– support – počet košů obsahující tento produkt
– častá množina položek
– problém – nalezení všech častých položek
– důsledky:
– mohutnost množiny dvojic
– mohutnost množiny n-tic