Big Data: Wie DataSift und fflick aus Twitter Mehrwert extrahieren

Was ist Big Data, und welche Relevanz hat das Thema? Roger Magoulas, Director of Research bei O’Reilly, bezeichnet Big Data als die entscheidende Kernkompetenz im Informationszeitalter:

Big Data has become really the key core competence in the information age, what distinguishes the current era. It’s really when data is large enough that you really have to think about it: How you’re going to organise it, how you’re going to store it, how you’re going to manage it, in order to gain some benefit from it. Big data can confer enormous competitive advantage for those who can make the most sense out of it and take actions based on what they’re learning.


Spannende Beispiele für Big Data gruppieren sich derzeit vor allem um Twitter. Start-ups wie DataSift befassen sich damit, aus dem endlosen Strom von Tweets für den Nutzer relevanten Sinn und Mehrwert zu generieren. Robert Scoble hat heute ein ausführliches Interview mit Gründer Nick Halstead veröffentlicht:

Ein weiteres Beispiel ist das amerikanische Start-up fflick, das den gleichen Ansatz wie DataSift verfolgt, im Unterschied zu DataSift allerdings mit einem konkreten Anwendungsfall aufwartet: fflick extrahiert Kinokritiken aus Twitter. Gründer und CEO Kurt Wilms stand kürzlich bei This Week in Startups Jason Calacanis Rede und Antwort:

Kennen Sie weitere Beispiele? Dann lassen Sie es uns bitte in den Kommentaren wissen.

Lars Hinrichs sieht Big Data und Location als Trends

Im Juni feierte Xing-Gründer Lars Hinrichs sein Comeback mit HackFwd, einer Investmentfirma neuen Typs, die in junge Entwickler und deren Ideen investiert. In einem Interview nennt er jetzt neben Location (siehe Foursquare und Facebook Places) das Thema Big Data als einen der großen aktuellen Trends. Die Grundfrage für ihn lautet:

Wie verarbeite ich Millionen von Informationen gleichzeitig, um daraus interessante neue Applikationen für den Konsumenten herzustellen?


Big Data ist ein Schlagwort, das sich in den vergangenen zwölf Monaten aus der High-Performance-Ecke des IT-Markts an die Oberfläche gedrängt hat. Neben dem technologischen Aspekt des Umgangs mit sehr großen Datenmengen in sehr kurzer Zeit hat Big Data auch einen anwendungsbezogenen Aspekt: Dank Internet stehen dem einzelnen Nutzer heute weitaus mehr Daten zur Verfügung als er verarbeiten kann. Es geht darum, die richtigen Daten zur richtigen Zeit in aggregierter Form bereitzustellen.
Was das Thema Big Data für Start-ups interessant macht, ist die Tatsache, dass die Infrastruktur heute vorhanden ist, auf der neue Anwendungen leicht und schnell entstehen können. In den Worten von Lars:

Wir sind in einer Phase im Internet, wo es sehr viele etablierte Marktplätze gibt, Marktplätze wie Google App Store, Twitter, Facebook, iTunes. Hier brauchen wir für die neue Zeitrechnung im Internet eigentlich nur noch ein ganz, ganz kleines Team, was auf dem bestehenden Ökosystem sehr große Firmen aufbauen kann.

Auf einer digitalen Wellenlänge?

Digital wird real – wie Augmented-Reality unseren Alltag bereichert!
Wired hat gestern über ein interessantes Projekt geschrieben: dass das Sprichwort auf einer Wellenlänge zu liegen, tatsächlich wissenschaftlich bewiesen werden kann, haben Greg Stephens und Uri Hasson von der Princeton-University herausgefunden. Dazu haben sie die Blutströme im Gehirn zweier Menschen gemessen, die sich miteinander unterhalten.
Themen, die den Gesprächsteilnehmern auch hinterher noch im Gedächtnis geblieben waren, verursachten in der neurologischen Untersuchung starke Wechselspiele der Gehirnaktivitäten von Sprecher und Zuhörer während des Gesprächs. Dabei ist unklar, was genau für die Verlinkung der beiden Gehirne geführt hat, aber sie hat stattgefunden – über Sprache, Empathie, schlicht: Interaktion.
Das gleiche Prinzip gilt auch im digitalen Zeitalter für die Interaktion mit Websites, Anwendungen und neuen Technologien. Ein digitales Phänomen, das in Zukunft die Wellenlänge der Menschen treffen wird, ist Augmented-Reality (erweiterte Realität). Diese endlich im Alltag angekommene Technik erlaubt es, Informationen direkt auf der Kamera unseres Smartphones anzuzeigen und die Schlucht zwischen realer und digitaler Welt kleiner zu machen:

Instead of plunging us into a completely digital environment, augmented reality means placing digital things into the regular old world.

Hier eine Auswahl dreier guter Beispiele dafür, welche Rolle AR-Anwendungen in Zukunft spielen könnten:

I. das spielerische Kennenlernen der Möglichkeiten.

oder hier.
II. Produkte überall für sich entdecken.

oder hier.
III. nützliche Hilfe im Alltag.

Gerade hat Google Standort-basierte Werbung eingeführt und somit (zusammen mit Google Goggles?) den kommerziellen Grundstein für den Erfolg relevanter AR-Anwendungen gelegt. acrossair erweitert den Blick durch die Handykamera um nahe gelegene Restaurants, Bars etc. und macht so die Suche nach dem richtigen Ort für die Mittagspause zum Kinderspiel.
Es ist also zur Zeit sehr spannend … und ich bin gespannt, was da noch kommt!

Warum Twitter der bessere Nachrichtendienst ist

Wenn es noch eines Beweises bedurft hätte, dann hat ihn Flipboard in der vergangenen Woche geliefert: Der Nachrichtenkonsum verschiebt sich weg von den klassischen medialen Knotenpunkten hin zum persönlichen Netzwerk. Dabei bewahrheitet sich jener berühmte Satz eines unbekannten Studenten: If the news is that important, it will find me.
Flipboard ist eine iPad-App, die aus dem kontinuierlichen Strom von Neuigkeiten von Twitter und Facebook das Fleisch extrahiert: die Links. Auch zwanzig Jahre nach der Erfindung des Web sind die Hyperlinks seine heißeste Ware. Und mit dem Trend zur Echtzeit übernehmen die Links die Rolle des Nachrichtentickers. In den Echtzeitlinks steckt der Nachrichtenwert.

Flipboard bereitet die Artikel hinter den Links auf ansprechende, angenehm konsumierbare Weise auf – wie eine Zeitung oder ein Magazin. Es ist nicht die erste Anwendung, die so etwas versucht, und es wird auch nicht die letzte sein. Der Gedanke liegt einfach auf der Hand. Etwas Ähnliches leistet zum Beispiel Feedly, eine Erweitung für Firefox und Google Reader.
Als das Web anfing, sich zu beschleunigen, war RSS der Treiber. Die wirklich einfache Syndizierung (Really Simple Syndication) standardisierte den Nachrichtentransport und rationalisierte ihn. Nutzer konnten nun mit einem RSS-Reader (wie Google Reader) Dutzende oder gar Hunderte von Websites auf dem Radar behalten, ohne sie alle Naselang besuchen zu müssen. Statt dass der Nutzer zur Website ging, kam die Nachricht zum Nutzer.
RSS allerdings konnte sich niemals wirklich flächendeckend durchsetzen, weder bei den Nutzern noch auf Seiten der Medienhäuser. Unter den Nutzern sind es bis heute eher die Geeks, die sich mit RSS anfreunden können. Und während zwar Blogs standardmäßig einen RSS-Feed publizieren, tun sich klassische Medienhäuser nach wie vor schwer mit dem Kontrollverlust. Viele bieten nur verkrüppelte Feeds, schlimmstenfalls nur mit Überschriften und Links.
Doch für Überschriften und Links gibt es inzwischen ein anderes Medium, das RSS den Rang abgelaufen hat: Twitter. Der Kurznachrichtendienst scheint mit seinen 140 Zeichen wie geschaffen für Überschriften und Links. Klingt die Überschrift interessant, genügt ein Klick, um zur Quelle zu gelangen.
Flipboard dreht diese Logik einen Schritt weiter und holt zusätzlichen Inhalt wie Bilder und Textexzerpte direkt von der Zielwebsite. Damit sind wir im Prinzip wieder dort, wo wir vor RSS schon einmal waren. Und im Unterschied zu RSS kommen die Feeds nun nicht nur von Websites, sondern auch von Menschen, die Links zu ganz unterschiedlichen Websites publizieren.
Wem ich auf Twitter folge, entscheidet darüber, welche Nachrichten mich über Twitter erreichen. Auf Twitter ist die Beziehung zwischen Autor und Leser (Follower) asymmetrisch wie in anderen Medien auch. Leser entscheiden sich für Autoren, ohne dass Wechselseitigkeit gefordert wäre. Unter den reichweitenstärksten Twitter-Autoren folgen nur die wenigsten auch ihrerseits sehr vielen anderen Autoren.
Twitter ist deshalb gut dafür geeignet, Nachrichten zu verbreiten, und zwar in Form von Überschriften mit Links. Was die Nachrichtengeber auf Twitter publizieren, verbreiten andere Nutzer durch Mechanismen wie Retweets weiter. Auf diese Weise erreichen mich über Twitter auch Nachrichten, die ich sonst nicht gesehen hätte.
Die Nachrichtengebung auf Twitter ist somit höchst individuell, ohne sich allerdings vom großen, allgemeinen Nachrichtenstrom völlig abzukoppeln. Bedeutende Ereignisse finden, solange ich einer gewissen kritischen Masse an Nutzern folge, ihren Weg auf jeden Fall zu mir. Gleiches gilt im Grundsatz auch für Facebook. Zwar ist die Freundschaftsbeziehung dort immer symmetrisch, bedarf also der Zustimmung beider Seiten. Doch kennt Facebook inzwischen auch asymmetrische Beziehungen wie bei Twitter.
Flipboard ist nicht mehr als eine ansprechende Oberfläche für die individuellen Netzwerke von Twitter und Facebook. Doch es zeigt, wie die Bedeutung dieser Netzwerke für den individuellen Medienkonsum immer weiter wächst – und dass auch das iPad kein Heilsbringer für die Verlagswelt sein muss.