CEO von Google DeepMind: AGI ist noch 5 bis 10 Jahre entfernt, und Chancen und Risiken in der KI-Entwicklung gehen Hand in Hand

ChainNewsAbmedia

Im Finale des “AI+SF Summit”, der von Axios in San Francisco veranstaltet wurde, skizzierte Demis Hassabis, CEO von Google DeepMind, die Forschungsrichtungen von DeepMind, technologische Fortschritte wie multimodale und Weltmodelle sowie die Entwicklung von KI-Agenten und damit verbundenen Risiken. Er bewertete auch den KI-Wettbewerb zwischen den Vereinigten Staaten und China und gab eine seltene Schätzung des AGI-Zeitrahmens, da er glaubte, dass noch etwa 5 bis 10 Jahre bis “KI-Systeme mit menschlichen kognitiven Fähigkeiten” verbleiben.

Mit dem Segen der Nobel-Aura dominiert wissenschaftliches Denken DeepMind

Zu Beginn der Veranstaltung stellte Gastgeber Mike Allen Hassabis als fünfjähriges Schachwunderkind und 48-jährigen Nobelpreisträger vor. Hassabis gibt zu, dass sich der Gewinn des Preises immer noch völlig unwirklich anfühlt, aber die tatsächliche Wirkung ist offensichtlich.

Denn wenn er mit Regierungsbeamten oder grenzüberschreitenden Entscheidungsträgern spricht, die mit KI nicht vertraut sind, ist der “Nobelpreis” wie ein Schlüssel, der schnell jede Tür öffnen kann, sodass sie eher bereit sind, ihm über Themen wie KI-Sicherheit und verantwortungsvollen Umgang zuzuhören, und er plant, diesen Titel in Zukunft aktiver zu nutzen.

Was seine tägliche Arbeit und seinen Führungsstil betrifft, betont Hassabis, dass er “immer zuerst als Wissenschaftler steht und als CEO an zweiter Stelle.” In seinen Augen ist die wissenschaftliche Methode eine der wichtigsten Erfindungen der Menschheit, und er wendet den Prozess der “Formulierung von Hypothesen, Experimenten und Aktualisierung von Meinungen auf Basis von Ergebnissen” direkt auf Produktentwicklung und Organisationsmanagement an.

Die Vorteile von DeepMind kommen von drei Ebenen gleichzeitig, nämlich “erstklassige Forschung, erstklassige technische Fähigkeiten und erstklassige Recheninfrastruktur”. Er ist der Ansicht, dass DeepMind nur dann qualifiziert sein kann, wenn diese drei Stufen gleichzeitig durchgeführt werden, an der Spitze der KI-Entwicklung zu stehen.

Layout für die nächsten 12 Monate: multimodale Entwicklung, Weltmodell und Agenten

Im Hinblick auf den spezifischen Fortschritt der KI in den nächsten 12 Monaten wies Hassabis darauf hin, dass Gemini von Anfang an als multimodales Modell konzipiert wurde, das Text, Bilder, Video und Audio gleichzeitig verarbeiten kann. Zum Beispiel kann sein neuestes Bildmodell “Nano Banana Pro” sehr genaue Infografiken erzeugen, was darauf hindeutet, dass sich die visuellen Verständlichkeiten des Modells rapide verbessern.

Der zweite Schwerpunkt liegt auf dem Weltmodell (World Models). Genie 3, entwickelt von DeepMind, kann interaktive Videos erzeugen, mit denen Nutzer nicht nur das Video ansehen, sondern auch auf den Bildschirm gehen können, als würden sie ein Spiel betreten, wodurch für etwa eine Minute Konsistenz und Kohärenz in der Welt bleibt. Diese Art von Modell gilt als wichtiger Schritt im Verständnis der KI für reale Erscheinungen und Regeln.

Die dritte sind KI-Agenten. Hassabis gab zu, dass die aktuellen KI-Agenten nicht entlastet werden können, ihr ein ganzes Paket von Aufgaben direkt zuzuwerfen und sicherzustellen, dass alles von Grund auf gut durchgeführt wird. Er erwartet jedoch, dass das Vertrauen der KI-Agenten in einem Jahr definitiv wachsen wird. Googles Ziel ist es, Gemini zu einem “universellen Assistenten” zu machen, der nicht nur auf Mobiltelefonen und Computern existiert, sondern auch jederzeit durch tragbare Geräte wie Brillen an der Seite des Nutzers sein kann und so ein regelmäßiger Assistent für das tägliche Leben und die Arbeit wird.

( Test: Gemini 3 Nano Banana Pro erzeugt nach dem Nachdenken automatisch humorvolle Cartoons und verwandelt Trump wieder in ein kleines, frisches )

Die Zukunft verspricht kosmische Erkundung, aber Sicherheitsrisiken sind ebenso wichtig wie das Verständnis von Videoaufnahmen

Apropos die besten Szenarien, die KI bieten kann, stellt Hassabis die Hypothese auf, dass KI der Menschheit helfen kann, mehrere wichtige Engpässe zu durchbrechen, wie Kernfusion oder neue Batterien, neue Durchbrüche in Materialwissenschaft und Halbleitern sowie Lösungen für große Krankheiten, und dass die Menschheit die Chance haben wird, mit reichlicheren Ressourcen in die Weltraumforschung voranzukommen.

Er wies aber auch auf das Worst-Case-Szenario hin, das in mehrere Ebenen unterteilt ist:

Böswillige Akteure nutzen KI, um Krankheitserreger zu entwerfen oder zu verbessern.

KI beschleunigt Cyberangriffe ausländischer Kräfte auf kritische Infrastrukturen wie Energie- und Wasserressourcen, und solche Dinge werden wahrscheinlich passieren, aber die eingesetzte KI ist noch nicht fortschrittlich.

Hochautonome KI-Agenten weichen von ihren ursprünglichen Anweisungen und menschlichen Erwartungen ab, weshalb sie erhebliche Ressourcen und Aufmerksamkeit investieren müssen, um diese zu verhindern.

Was die Fähigkeiten betrifft, glaubt er, dass das unterschätzte Element der Außenwelt das tiefe Verständnis von Video durch KI ist. Hassabis berichtete, dass er einmal Gemini gebeten habe, die Szene zu analysieren, und das Modell nicht nur das Bild versteht, sondern auch eine sehr tiefgehende Interpretation von Symbolen und Emotionen gibt, anstatt nur oberflächliche Handlungen zu beschreiben.

Er erwähnte außerdem, dass Gemini Live Ihnen sofortige Reparaturhilfe ermöglicht, indem Sie Ihre Handykamera auf mechanische Geräte richten, aber er glaubt, dass das wirklich ideale Fahrzeug Brillen sein werden, da Ihre Hände während der Vor-Ort-Operationen leer sein müssen, um gleichzeitig mit KI zu arbeiten und zu interagieren.

Es sind nur noch wenige Monate in der Lücke zwischen den Vereinigten Staaten und China, und der AGI ist noch ein oder zwei Meilen entfernt

Im internationalen Wettbewerb ist Hassabis der Meinung, dass die Vereinigten Staaten und der Westen China insgesamt weiterhin in Bezug auf Modellfähigkeiten und Innovation führen, aber Chinas neueste Modellreihe wie DeepSeek ist bereits sehr stark und holt die meisten schnell auf Basis bestehender Technologien auf. Er beurteilte, dass in der Vergangenheit die Vereinigten Staaten und der Westen jahrelang geführt haben mögen, China nun aber nur noch wenige Monate vor sich haben.

Hassabis definiert AGI sehr klar, nämlich:

“Du musst alle wichtigen kognitiven Fähigkeiten eines Menschen besitzen, einschließlich Langzeitplanung, Langzeitgedächtnis, kontinuierlichem Lernen, echtem Denken und Kreativität usw.”

Er wies darauf hin, dass LLMs in diesem Stadium zwar bereits in der Lage sind, Spitzenärzte in einigen Bereichen anzusprechen, aber in vielen Szenarien weiterhin Fehler machen werden und es weiterhin eine Lücke zwischen der echten AGI gibt und die auf 5 bis 10 Jahre geschätzt wird. Hassabis fügte hinzu, dass selbst wenn der Umfang bestehender LLMs bis an die Grenze getrieben wird, dies dennoch nicht ausreicht, um die AGI-Schwelle zu überschreiten, und dass das KI-Feld ein oder zwei große technologische Durchbrüche benötigen könnte, die Fähigkeiten erheblich verbessern können, wie etwa Transformatoren, bevor es eine echte Chance gibt, AGI zu erreichen.

(IBM CEO: Die KI-Branche ist ein Risiko, das “schwer zu erholen” ist, wobei LLMs nur eine 1%ige Chance haben, AGI erfolgreich zu schaffen )

Der Beitrag Google DeepMind CEO: AGI ist noch 5 bis 10 Jahre entfernt, KI-Entwicklungschancen und Risiken gehen Hand in Hand, erschien zuerst auf Chain News ABMedia.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare