Visuelle Suche

Wie sie die Art, we wir die Welt sehen, verändern wird

Computer werden besser darin, Gesichter und Formen zu erkennen und Verbindungen zwischen Bildern herzustellen. Die visuelle Suche rutscht in ein neues Zeitalter. Dies könnte die Art und Weise verändern, wie wir mit der Welt um uns herum interagieren.

Hast Du schon einmal Google Maps nach einem Ziel durchsucht und bist dann in die falsche Richtung abgebogen? Bestimmt schon einige Male. Du bist zu weit die Straße hinunter, bevor der Pfeil auf Deinem Smartphone in die richtige Position gerutscht ist und Dir sagt, dass Du weiter entfernt und nicht näher bist.

1. GPS, Augmented Reality und die visuelle Suche

Problematisch ist, dass GPS-Signale in viel bebauten Städten nicht so gut funktionieren wie sie sollten. Die Signale prallen von den Wänden hoher Gebäude ab und gehen in der Regel zum Teil verloren.

Stell Dir vor, wie schön es wäre, ohne den Gebrauch von GPS zu navigieren. Wenn Pfeile auf dem Bildschirm der Smartphone-Kamera eingeblendet würden, könnten diese den Weg weisen.

Dies ist eine der vielen Anwendungen von Mixed oder Augmented Reality (AR) und Computer Vision, die zusammenarbeiten. Computer Vision ist ein Zweig der künstlichen Intelligenz. Dieser lehrt Computern, wie Objekte in der realen Welt erkannt und unterschieden werden können. Es handelt sich um die Technologie, die selbstfahrenden Fahrzeuge, Gesichtserkennung, medizinische Diagnostik und sogar die Hasenohren und Schnurrhaare unterstützt, die Du auf Snapchat Deinem Gesicht hinzufügen kannst.

2. Visuelle Suche – AR City App

Das Technologieunternehmen Blippar hat eine „urbane visuelle Positionierung“ entwickelt, von der behauptet wird, sie hätte die doppelte Genauigkeit von GPS. Diese Computer-Vision-Funktion, die in der neuen App AR City integriert ist, erkennt genau, wo sich die Benutzer befinden, und überlagert die Richtungsinformationen auf dem Bildschirm des Telefons.

Jetzt wirst Du sehen können, in welche Richtung Du gehen sollst, indem Du den Pfeilen folgst, die auf dem Bild der echten Straße liegen.

Aber diese Detailtiefe ist derzeit nur in Central London in Großbritannien und in San Francisco und Mountain View in Kalifornien verfügbar, erklärt Danny Lopez, Chief Operating Officer von Blippar.

Grundlegende Navigation, Nutzung von AR, welche über Apple Maps gelegt wird, wird Wege durch 300 Städte zeigen und die bestehende GPS-Technologie nutzen, sagt er. Straßennamen und Informationen über besondere Orte werden ebenfalls über die Karten gelegt. Diese Beta-Version der AR City App ist jedoch nur auf Apple iPhone 6s und höher verfügbar.

Blippar hat sich anfangs darauf spezialisiert, AR auf Marketing zu übertragen – Produkte werden zum Leben erweckt, wenn Du Dein Smartphone auf diese richtest. Seither hat es seine Aufmerksamkeit auf die „Indexierung und Katalogisierung der physischen Welt“ fokussiert, sagt Lopez.

3. Wie Computer die Welt verstehen

Aber Maschinen dazu zu bekommen, die Welt visuell zu verstehen, ist keine leichte Aufgabe. „In der Vergangenheit haben Computer Textdaten verstanden und organisiert“, sagt Ian Fogg, Principal Analyst bei der Forschungsfirma IHS Markit. „Aber in den letzten Jahren haben wir gesehen, wie Computer Fotos basierend auf dem Verständnis der Zusammensetzung organisieren. Ob es sich nun hauptsächlich um Strände, Wälder, Menschen usw. handelte.

„Jetzt werden sie in Echtzeit analysiert – so wie die Microsoft Translate App ein Zeichen erkennt und es sofort übersetzt.“ Computer „sehen“ digitale Bilder nicht, sie sehen nur Zahlen, also müssen sie trainiert werden, diese Muster zu interpretieren. „Dazu müssen Tausende und Abertausende von Bildern in Pixel zerlegt werden. Dann werden mithilfe von Algorithmen der Maschine der Unterschied zwischen einem Menschen, einem Haus oder einem Auto vermittelt“, sagt Lopez.

Blippar benötigte drei Monate, um sein System zu trainieren. Jede Fahrzeugmarke und jedes -modell in den USA wird mit einer Genauigkeit von 97,5% erkannt. Nichts davon hätte ohne den Anstieg der Cloud-Computing-Leistung erreicht werden können, fügt er hinzu.

4. Fazit

Die Technik und ihre stetige Weiterentwicklung führt zu neuen Sichtweisen und Möglichkeiten. So ist es auch mit der visuellen Suche, GPS oder auch Augmented Reality. Wo man früher noch Straßenkarten oder Städtepläne benötigte, so reicht heutzutage das Smartphone aus. In Zukunft wird der Computer die Welt visuell verstehen können. Wie schnell und wann das sein wird, darauf müssen wir wohl erstmal warten. Aber es zeigt, die Technikwelt bleibt spannend!