2. Oktober 2023
StartAktuellWie Google das Internet revolutioniert und keine Sau merkt es!

Wie Google das Internet revolutioniert und keine Sau merkt es!

Wusstest du schon, dass Computer Bilder von Katzen zeichnen können? Kommunizierst du ab und zu mit deinem Smartphone? Bist du auch der Überzeugung, dass deine Nachfahren schon bald von Robotern gepflegt, geliebt oder herumkommandiert werden? Bist du sicher, dass dieser Text hier von einem Menschen verfasst wurde und nicht von einer Maschine?

Wenn du auf alle vier Fragen mit „Ja“ geantwortet hast, dann kann ich dir vermutlich nicht mehr viel Neues erzählen und du bist auf der Höhe der Zeit, was künstliche Intelligenz, Robotik und Spracherkennung anbelangt und du siehst in Google auch nicht in erster Linie die „Datenkrake“. In allen anderen Fällen: viel Spaß beim Lesen!

Gesprochenes verstehen

Praktisch jeden Tag kommen wir in eine Situation, in der wir unser Gegenüber bzw. einen Kommunikationspartner verstehen müssen. Dabei ist nicht der akustische Vorgang gemeint, bei dem zum Beispiel Lärm die Kommunikation stört, sondern der kleine Unterschied zwischen dem Gesagten und dem Gemeinten. „Es zieht!“ bedeutet nicht, dass A B zieht und ist in den meisten Fällen auch kein Hinweis darauf, dass Luft zirkuliert, sondern meint „Mach bitte das Fenster zu!“ Wenn wir via Chat ein Herz verschicken, dann ist damit nicht das innere Organ gemeint, sondern die Botschaft „Ich mag dich!“, und je nachdem, in welchem Tonfall der Satz „Das hast du aber toll gemacht!“ erklingt, ist es ein Kompliment oder eine Häme. Solche Dinge lernen wir von Klein auf und gehen deshalb im Laufe unseres Lebens immer kompetenter mit Sprache um.

Computer sind inzwischen Meister in der Spracherkennung. Bereits in den 90-er Jahren gab es auf dem PC eine kleine Revolution in dieser Hinsicht und auf einmal wollten alle Windows-Nutzer Ihre Word-Dokumente diktieren, anstatt zu schreiben. Ich kann mich noch gut an „IBM Via Voice“ (oder so) erinnern und war nahe dran, die Software zu kaufen. Doch in der Praxis war die Spracherkennung noch weit davon entfernt, was heutige Systeme schaffen. Es kam immer wieder zu vertippen, falschen Erkennungen, und ohne Training funktionierte die Sache nicht wirklich. Nicht so heute (unter Android): In den meisten Fällen erkennt das System das Gesprochene fast perfekt. Klar haben die eigene Sprache und der eigene Dialekt eine gewisse Auswirkung auf die Trefferquote, aber Google versteht mich erstaunlich gut.

Was ist nun das Besondere daran? Seit rund sechs Monaten (ich benutze die Spracherkennung von Google recht fleißig) kann Google nicht nur meine Stimme erkennen, sondern versteht auch, was ich sagen will. Das ist noch nicht 100 Prozent identisch damit, dass Google verstehen würde, was ich mit dem Gesagten meine, aber es kommt schon sehr nahe ran. Das folgende Video verdeutlicht das:

YouTube video

Diktiere ich zum Beispiel „Hallo Marc, kannst du bitte dazu eine News schreiben“ und spreche dabei nicht deutlich, so dass „Hallo Marc, kannst du bitte dazu eine News treiben“ herauskommt, dann korrigiert die Spracherkennung den Satz am Schluss noch so, dass der Inhalt wieder stimmt, also „schreiben“ statt „treiben“. Das funktioniert nur, weil Google versteht, was ich eigentlich sagen will und „News schreiben“ mehr Sinn ergibt als „News treiben“. Probiere es einfach mal auf deinem Smartphone aus. Ich bin mir sicher, auch du wirst überrascht sein, wie gut sich mit dem Handy diktieren lässt.

Das Internet verstehen

Google bzw. Android versteht Sprache besser als jedes andere von mir ausprobierte mobile Betriebssystem. Mag sein, dass es für bestimmte professionelle Anwendungsgebiete noch bessere Systeme gibt, aber in so vielen Sprachen und in dem Umfang an Allgemeinwissen ist Google mit Sicherheit Marktführer, Sprache inklusive Bedeutung des Gesprochenen zu verstehen.

Logischerweise macht die Firma aus Mountain View dabei nicht halt. Denn schließlich gibt es noch das Internet. So wie Google Buch um Buch diverser Bibliotheken einscannt, um den Text analysieren zu können, scannt die Firma mit ihren Bots auch Webseite um Webseite im Internet. Doch das beste Archiv ist nichts wert, wenn man zwar den Inhalt kennt, aber nicht seine Bedeutung. Und hier setzt der Knowledge Graph von Google an. So wie Google über seine Suchmaschine bereits seit Jahren den „Wert“ einer bestimmten Seite im Internet bestimmen kann, kann Google nun auch die Inhalte analysieren. Dazu gehört vor allem die Objekterkennung von Fotos. Egal ob ein Gesicht, eine Katze, ein Baum oder ein Auto. Google weiß, was sich auf dem Foto befindet. Hier steht man aktuell noch bei den Anfängen, was sich zum Beispiel an den Treffern für Fotos zu

  • Elvis Presley Schwager
  • Elvis Presleys Schwager

zeigt. Im ersten Fall zeigt Google vor allem Bilder von Elvis an, nicht von seinem Schwager. Im zweiten Fall sind es Bilder zum Thema Elvis und „schwanger“, also vor allem von Frauen. Hier tappt Google in seine eigene „meinten Sie….“ Falle.

Solche Zusammenhänge richtig zu erkennen, sind aber eigentlich ein Kinderspiel. Google kann also spielend Anfragen im Stil von „zeige mir die 1000 meistbesuchten Seiten im Internet zum Thema Umweltverschmutzung“ oder „suche mir grüne Bilder mit einem Auto drauf“ beantworten. Welch großen Fortschritt Google dabei gemacht hat, zeigt dir zum Beispiel die Bildersuche nach „Tisch“. Hier ordnet Google bereits nach Unterkategorien wie Esstisch oder Schreibtisch. Kategorien wie „Tisch Clipart“ oder „Tisch Design“ sind ein klares Indiz dafür, dass Google diese Einteilung nicht „von Hand“ vornimmt, sondern aufgrund der am meisten eingegebenen Suchbegriffe zum Stichwort „Tisch“. Google lernt laufend von uns allen.

An einer so banalen Anfrage wie "Tisch" langweilt sich Google und schlägt dir deshalb automatisch ein paar Unterkategorien vor.
An einer so banalen Anfrage wie „Tisch“ langweilt sich Google und schlägt dir deshalb automatisch ein paar Unterkategorien vor.

Warum tut Google das?

Google ist ein Datensammler. Doch im Unterschied zu anderen Firmen will Google die gesammelten Daten nicht einfach speichern, auswerten oder verkaufen, sondern diese verstehen. Denn das Verständnis ist der zentrale Schritt dazu, künstliche Intelligenz zu schaffen. Wenn ein Computer nicht versteht, was eine Katze sein soll, dann kann der Computer auch keine Bilder von Katzen erkennen oder selbst welche malen. Aber genau daran hat Google in den vergangenen Jahren hart gearbeitet und erkennt seit 2012 Katzen. Mit Training, klar aber auch mit dem entsprechenden Erfolg. Und seither erkennt Google praktisch jedes Tier, auch wenn es mit der Unterscheidung von Tier und Mensch manchmal noch hapert ;-).

Jetzt will man wissen, was die Computernetzwerke gelernt haben, welche Dinge sie alle schon kennen (oder zumindest zu kennen glauben). Deep Dream nennt Google dieses Forschungsprojekt, und es ist mindestens so spannend wie die Semantik im Web. Google hat den Quellcode für seinen Deep Dream Generator im Internet veröffentlicht, so dass du aus deinen eigenen Fotos entsprechende Bilder erstellen kannst, zum Beispiel über den Deep Dream Generator. Je weniger konkrete Informationen im Foto, desto besser stehen die Chancen, dass der Deep Dream Generator etwas im Bild sieht, das es dort gar nicht gibt.

Im unteren Bild hat der Deep Dream Generator von Google alles markiert, was „etwas“ sein könnte. Bildquelle: Google

Wozu Google diese Informationen braucht? Na klar, für seine selbstfahrenden Autos — zum Beispiel. Denn die müssen wissen, ob gerade ein Kind, eine Katze oder ein Pappkarton auf der Straße unterwegs ist. Aber die Anwendungszwecke für die so erlernten Funktionen kennen schon bald keine Grenzen mehr. Zum Beispiel sind da die Roboter von Boston Robotics, die sich nicht nur auffällig geschickt wie echte Tiere verhalten, sondern darüber hinaus auch in der Lage sein müssen, Objekte korrekt zu erkennen, um nicht darüber zu stolpern oder herunterzufallen.

YouTube video

Natürlich kann man solche Roboter auch für militärische Zwecke nutzen, im Stil von „Geh nach München und erschieße alle Menschen mit einem roten Pullover“. Wer jedoch die Geschichte von Google und seinen Gründern etwas mitverfolgt hat, weiß, dass es Larry Page und Sergey Brin in erster Linie um humane Ziele geht. Ein praktisches Beispiel für einen Boston-Roboter wäre also eher: „Marschiere zu Block 4 in Fukushima und stopfe das Leck“. Solche Arbeiten müssen heute von „lebenden“ Menschen oder von Robotern mit Fernsteuerung durchgeführt werden. Ich bin mir sicher, dass dazu schon bald intelligente Roboter eingesetzt werden können.

Doch nicht nur körperliche Arbeit werden Roboter verrichten. Sie werden auch für uns Texte schreiben. Zum Beispiel setzt Associated Press bereits Computer ein, um automatisch Sport-Berichte von gewissen Sportarten zu schreiben. Andere Firmen lassen sich aus puren Börsenzahlen von normalen Menschen lesbare Berichte schreiben oder bei einem Erdbeben automatisch eine News online gehen. Und nichts anderes tun Google Now, Siri, Cortana und all die praktischen Assistenten, wenn sie uns am Morgen mit „Du brauchst heute keinen Mantel und keinen Schirm!“ begrüßen. Sie alle wandeln Informationen aus dem Internet in normal verständliche Sprache um.

Die Informationen zu all diesen Objekten holt sich Google aus dem schier unendlichen Fundus des Internets. Je mehr Material wir online stellen, desto intelligenter werden auch die Maschinen, die nach (neuen) Informationen suchen. Wenn man so will ist die künstliche Intelligenz immer maximal so intelligent wie die Summe der Informationen, die wir ihr zur Verfügung stellen. (Ein Kind, das nie eine Kiwi zu sehen bekommt und nie davon gehört hat, kann ohne zusätzlichen Input nicht wissen, dass es eine Kiwi ist/gibt.)

Fazit

Anschauen -> verstehen, lesen -> verstehen, hören -> verstehen. Bei all diesen drei Dingen ist Google eine der Firmen, die technisch ganz vorne mit dabei oder sogar Marktführer ist. Wir als Android-Anwender bekommen davon auch recht viel mit: Nur wissen wir die Arbeit, die dahinter steckt, nicht gebührend zu schätzen. Das ist auch gut so: Denn je natürlicher das Ganze funktioniert, desto smarter ist die Technik wirklich. Schließlich soll uns die Technik eine Hilfe sein, und nicht umgekehrt. Denke daran, bevor du das nächste Mal über die „Datenkrake“ lästerst!

Marcel Hilzinger
Marcel Hilzinger
Ich bin Marcel und Gründer von Android User. Unsere Webseite existiert nun bereits seit dem Jahr 2011. Hier findest du eine Vielzahl von Artikeln rund um das Thema Android.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

EMPFEHLUNGEN DER REDAKTION

MAGAZIN

APPS & SPIELE