Session 8 – Nutzergenerierte Daten

In Session 8 drehte sich alles um nutzergenerierte Daten. Den Anfang machte Dominik Fischer von der Heinrich-Heine-Universität Düsseldorf mit seinem Vortrag „Sind Tag-Verteilungen vom Inhalt der getaggten Ressource abhängig?“ der auf seiner Bachelorarbeit basierte. Hierbei teilte er 145.000 englischsprachige Delicious Dokumente automatisch in unterschiedliche Kategorien ein, je nachdem, ob es sich um Text Dokumente oder Applikationen, Startseiten oder Subseiten, Seiten mit einem Country Code (.de, .co.uk) oder mit einer allgemeinen TLD (.com, .org) handelte. Dann benutze er zwei verschieden Formeln (A1 und A2) zur Berechnung der Powertags aller Dokumente und untersuchte ob sich die Anzahl der so berechneten Powertags je nach Kategorie unterschieden.
Weiterlesen

Share