Wybór róznych datasetów dla kwazonu
Na początek podzbiorów rum@ka/ceona. Datasety zawierałyby dokumenty charakteryzujące się pewną cechą wewnątrz każdego datasetu
datasety
- dataset1 - tematycznie spójne (dotyczą głównie jednego tematu)
- dataset2 - o wielu przewodzących tematach
- dotyczące filmóœ/muzyki/ksiazek
- dotyczące rzeczy niepopolarnych w grafie dbpedii
- dokumenty krótkie
- dokumenty średnie
- dokumenty długie