Web Science

Eine der letzten beiden Sessions der DGI 2012 in Düsseldorf umfasste drei Vorträge zum Thema Web Science.

Agnes Mainka von der Universität Düsseldorf präsentierte ihr Forschungsprojekt zur korpusbasierten Online- Dialoganalyse am Beispiel von Twitter. Ihre Ausgangsfrage, wie die Gemeinde von Twitter funktioniert, versuchte sie mit einer methodischen Analysemethode zu beantworten. Der Versuch einer automatischen Extraktion stand dabei im Vordergrund. Können Dialoge bei Twitter automatisch extrahiert werden? Gibt es eine typische Zeitspanne für solche Dialoge? Können thematische Dialoge mittels automatischem „Part of Speech Tagging“ bei Twitter gefunden werden? All diese Fragestellung sollten in dem Forschungsprojekt analysiert werden.

Gespräche finden heutzutage zunehmend in sozialen Netzwerken statt. Doch wie verändert sich ein solches Gespräch? Gibt es typische Dialoge? Wie sieht so ein Dialog aus? All diese Fragen lassen sich manuell beantworten. Eine automatische Dialoganalyse würde jedoch viel Zeit und Arbeit sparen. Das offensichtlichste Problem dabei stellen Dialogeigenschaften wie Umgangssprache, Emoticons, Mehrsprachigkeit oder Tippfehler dar. Des Weiteren war zu klären, ob @-Nachrichten und Retweets gleich das Bestehen eines Dialoges bedeuten.
Um sich diesen Fragen zu stellen, hat Frau Mainka sich zunächst via Twitter- API einen Korpus mit 20 Nutzern als Grundlage erschaffen  diesen auf 241 Nutzer bzw. Timelines erweitert, indem sie die @-Mentions der Personen betrachtet hat und alle Kommunikationspartner mit aufgenommen hat. Ihr Augenmerk legte sie anschließend auf bezugnehmende Tweets und die Nutzer auf die sich der Text bezieht. Daraufhin hat sie die sich ergebenden Dialogketten automatisch auf ihre Länge untersucht.

Sie stellte fest, dass meistens nur zwei Nutzer beteiligt sind, selten auch drei. Über 74% der Beteiligten Dialogpartner antworten bereits innerhalb der ersten fünf Minuten, 90 % nach spätestens 30 Minuten. Eine Antwort auf eine typische Zeitspanne für Dialoge konnte jedoch nicht gefunden werden, da kein Mittelwert oder Ähnliches ermittelt werden kann.

Das POS- Tagging stellte einen wichtiges Gebiet in dem Forschungsprojekt dar. Ist es möglich thematische Dialoge mit diesem Verfahren zu finden? Frau Mainka beantwortet diese Frage weitgehend mit ja, jedoch nur sehr eingeschränkt. Durch die Satzanalyse können gleich verwendete Wörter, Nominalköpfe und Nominalphrasen identifiziert werden, welche auf einen Dialog hinweisen. Probleme bei der Phrasenanalyse sind jedoch vor allem die Verwendung von Pronomen, Geplauder ohne Themenbezug oder Ausrufe. Wie diese Probleme der automatischen Extraktion behoben werden können, bleibt offen.

Alles in allem ein sehr interessante Thema. Dennoch war zu dem Fazit zu kommen, dass nur ein kleiner Teil der Dialoge automatisch erkannt werden können, wodurch dieses Verfahren sich als eher weniger geeignet herausstellte.

Die Präsentationsfolien finden Sie hier: pdf.

 

Der zweite Vortrag – gehalten von Laura Dorfer von der Universität Siegen – befasste sich mit Daten als Wettbewerbsfaktor in Social Network Sites. Frau Dorfer betrachtete dabei die strategische Bedeutung von Daten im Web 2.0 und das Datenmanagement in Social Network Sites.

Sie stellte heraus, dass Daten eine elementare Bedeutung in Wertschöpfungsprozessen haben. Es gäbe jedoch einen Wandel der strategischen Funktion mit zunehmender Mediatisierung von marktlichen Transaktionen. Sie erhalten eine immer mehr wettbewerbstrategischere Bedeutung für Unternehmen und Web 2.0, sowie 1.0 Geschäftsstellen.
Daten und Datenmanagement dienen dabei als Quelle von nachhaltigen Wettbewerbsvorteilen, dessen Ressource im Web 2.0 liegt.  Durch die Effizienz und Effektivität dieser beiden Quellen gewinnen temporäre Wettbewerbsvorteile und kontinuierliche Weiterentwicklung des Ressourcenbündels an Bedeutung. Web 2.0- Unternehmen müssen daher neben Datenmanagement auch funktionale Funktionen besitzen.
Ebenfalls wichtiger Punkt des Vortrags waren Daten als erfolgskritischer Faktor in Geschäftsmodellen von Social Networks. Frau Dorfer betonte die Relevanz von Daten aus Kundenperspektive, sowie als Werttreiber und als Grundlage für Social Networks.

User generieren den Inhalt der Plattform auf der sie sich befinden, wodurch die Daten als Basis für Monetarisierungsstrategie dienen. Werbekunden können auf den einzelnen Nutzer personalisierte Werbeanzeigen schalten und somit gezielte Kunden erreichen. Umso mehr Nutzer sich einer Plattform anschließen, desto größer wird die Datenmenge und der Wert der Seite steigt.
Zum Management der Nutzerdaten erläuterte Frau Dorfer verschiedene Strategien. Hierzu zählen die Datengewinnung, Datenverarbeitung und Datenmonetarisierung. Zur Gewinnung einer Datenpluralität können verschiedene Tools, die die Datenfreizügigkeit des Nutzers fördern. Dies verdeutlichte Frau Dorfer am Beispiel von Facebook. Dort gibt es das Tool der automatischen Synchronisation. Hierdurch erhält Facebook Informationen über en Nutzer, aber auch über Nicht-Nutzer.

Frau Dorfer betont dabei, dass nicht allein eine Vielzahl an Datengenerierungen wichtig ist, sondern auch die Strukturierung.
Sinnvoll sei hier der Einsatz von semantischen Technologien zur maschinellen Strukturierung und Analyse, sowie die Umsetzung im Open Graph Protocol.
Als Strategien zur Monetarisierung von Daten Social Media Targeting und Provisionserlöse über Facebook Credits genannt.

Zum Schluss erläuterte Frau Dorfer, dass aktuelle Herausforderungen in den Datenschutzforderungen liegen, welche den Wert von Ressource Daten erodieren könnten.

 

Der letzte Vortrag zu dem Thema Web Science wurde von Anja Lorenz der Technischen Universität Chemnitz gehalten. Sie befasste sich zusammen mit Christian Schieder mit dem Forschungsprojekt „Towards a pathology of social media“.

Beide beschäftigten sich zusammen mit der Frage, wo die Ursachen für das stetige Wachstum der Onlineaktivität liegen. Das Medium Internet wurde ursprünglich von Fachleuten für die Masse entwickelt, heutzutage wird es von der Masse selbst gesteuert. Das Problem jedoch ist dabei nicht mehr die Informationsbeschaffung, sondern die Informationsfilterung.
Es gibt viele neue Phänomene, die sich mit dem Web 2.0 entwickelt haben. Zum einem gibt es Cybermobbing. Studien haben festgestellt, dass es sich bei den Opfern um die gleichen Personen handelt wie im „echten“ Leben auf beispielsweise dem Schulhof. Jedoch kann im Internet jeder darauf zugreifen und alles wird abgespeichert und taucht immer wieder im Alltag auf. So kann zum Beispiel ein potenzieller Arbeitgeber sehen, dass jemand öffentlich gemobbt wurde, was seine Entscheidung beeinflusst. Des Weiteren gibt es einen Informationsvandalismus, der erfundene Informationen wahr erscheinen lässt, sowie Shitstorms und Filterbubbles.
Diese Phänomene haben bereits starke Auswirkungen. Es entwickelten sich neue Krankheitsbilder, die das Leben der Betroffenen stark beeinflusst. Hierzu zählen Information Overload, durch welchen Personen beispielsweise nicht mehr zur Arbeit erscheinen oder Facebook- Depressionen, die durch wenige Likes oder Facebook-Freunde entstehen.
Forschungsziel ist es, herauszufinden, wie den Ursachen dafür vorgebeugt werden kann. Frau Lorenz und Herr Schieder kamen zu dem Ergebnis, dass Partizipation und Exposition sehr  partizipationsabhängig sind und es neben den gewinnbringenden Eigenschaften von Social Media auch viele negative Seiten gibt, die es zu erforschen gilt.

Frau Lorenz weist daraufhin, dass verschiedene Forschungspartner aus themenverwandten Bereichen gesucht werden.
Weitere Informationen dazu sind in ihrem Blog auffindbar.

Die Präsentationsfolien finden Sie hier: pdf.

 

Alle drei Vorträge waren sehr interessant und haben ein großes Diskussionsbedürfnis im Publikum hervorgerufen.

Share