Google Gemini: ein neues KI-Modell, das denken und programmieren kann

Google Gemini: ein neues KI-Modell, das mit ChatGPT und Microsoft konkurrieren kann

Google hat am Mittwoch mit der Einführung von Gemini begonnen, seinem neuen Modell für künstliche Intelligenz (KI), das dem Unternehmen dabei helfen soll, effektiver mit OpenAI (dem Erfinder von ChatGPT) und Microsoft zu konkurrieren, von Verbraucheranwendungen bis hin zu Unternehmenscomputern.

"Dies ist unser beständigstes, talentiertestes und allgemeinstes KI-Modell", versicherte Eli Collins, Vizepräsident von Google DeepMind, dem KI-Forschungslabor des kalifornischen Konzerns, während einer Pressepräsentation.

Dann führte er ein Video vor, in dem ein Nutzer Gemini Objekte, Zeichnungen und Videos zeigt. Das KI-System kommentiert verbal, was es "sieht", identifiziert Objekte, spielt Musik ab und beantwortet Fragen, die ein gewisses Maß an Analyse erfordern, um seine "Argumentation" zu rechtfertigen.

So schlägt Gemini beispielsweise bei der Abbildung einer Plastikente, die sich für einen von zwei Wegen entscheiden muss - links zu einer anderen auf Papier gezeichneten Ente und rechts zu einem bedrohlich aussehenden Bären - vor, den linken Weg zu wählen, weil "es besser ist, sich Freunde als Feinde zu machen".

Das Video zeigt auch, dass Gemini Anspielungen ohne viel Kontext erkennen kann, wie z. B. eine Szene aus The Matrix, die von einem Mann gespielt wird, der vorgibt, Kugeln in Zeitlupe auszuweichen.

Argumentation

Das neue Modell ist "von Anfang an multimedial, es hat ausgefeilte logische Fähigkeiten und kann auf einem fortgeschrittenen Niveau programmieren", so Eli Collins.

Er sagte, Gemini sei das erste KI-Modell, das menschliche Experten im branchenüblichen "MMLU"-Test übertrifft, mit dem die Fähigkeit von Computerprogrammen zum logischen Denken in Bereichen wie Mathematik, Geschichte und Recht bewertet wird.

Seit der Einführung von ChatGPT vor einem Jahr haben sich die Giganten des Silicon Valley dem rasanten Wettlauf um die so genannte generative KI angeschlossen, die durch einfache Abfragen in der Alltagssprache Texte, Bilder oder Codezeilen erstellen kann, die denen des Menschen entsprechen.

Google, der Marktführer im Bereich KI, wurde durch den phänomenalen Erfolg von ChatGPT überrascht und reagierte mit seinem eigenen Chatbot, Bard.

Aber alles dreht sich um die Modelle - die Computersysteme, die das Herzstück dieser Anwendungen bilden, die zunächst mit Text aus dem Internet gespeist wurden und jetzt alle Arten von Daten erhalten, um Bildanfragen zu verarbeiten und mit den Nutzern zu kommunizieren.

Im September erklärte OpenAI, dass es ChatGPT um Sprache und Bildverarbeitung erweitert hat, um es "intuitiver" zu machen.

Besserer Kollaborateur

Gemini ist "ein weiterer Schritt in Richtung unseres Ziels, Ihnen den besten KI-Kollaborateur der Welt zu bieten", wie Sissy Hsiao, Googles für Bard zuständiger Vizepräsident, am Mittwoch erklärte.

Die Fähigkeiten von Bard wurden bereits erweitert, sind aber immer noch auf schriftliche Anfragen und nur auf Englisch beschränkt.

Andere Funktionen und Formate, wie z. B. erweiterte Hilfe bei mathematischen Problemen, werden bis 2024 warten müssen.

Weniger bekannt als ChatGPT, hat Bard die Möglichkeit, seinem Konkurrenten, der Opfer seines eigenen Erfolgs geworden ist, den Boden unter den Füßen wegzuziehen: Mitte November hat OpenAI wegen der großen Nachfrage sein Abonnement für die kostenpflichtige Version eingestellt.

Am 13. Dezember wird Google die erste Version von Gemini auch seinen Kunden in der Cloud (Remote Computing) zugänglich machen, einschließlich der Entwickler, die seine Vertex-KI-Plattform für die Entwicklung ihrer eigenen KI-Anwendungen nutzen.

In diesem Bereich tritt der Internetriese in direkten Wettbewerb mit Microsoft, dem Hauptinvestor von OpenAI und der weltweiten Nummer 2 im Cloud Computing nach Amazon.

Beide US-Konzerne haben ihre Software (Suchmaschine, Büro- und Produktivitätssoftware, Cloud-Plattform usw.) seit einem Jahr um generative KI-Tools erweitert.

"Diese neue Ära der Modelle stellt eine der größten wissenschaftlichen und technologischen Anstrengungen dar, die wir als Unternehmen unternommen haben", wird Google-CEO Sundar Pichai in der Pressemitteilung zitiert.

Review

Feedback hinterlassen