Anzeige
Skip to content
Read full article about: Gemini 3.1 Pro: Googles neues KI-Modell führt Benchmark-Index an und kostet nur ein Drittel der Konkurrenz

Googles Gemini 3.1 Pro Preview führt den Artificial Analysis Intelligence Index an, vier Punkte vor Anthropics Claude Opus 4.6, und kostet dabei weniger als die Hälfte im Betrieb. Das Modell führt in sechs von zehn Einzelbewertungen, darunter agentenbasiertes Coding, Wissen, wissenschaftliches Denken und Physik. Die Halluzinationsrate sank um 38 Prozentpunkte gegenüber dem anfälligen Vorgänger Gemini 3 Pro. Der Artificial Analysis Intelligence Index fasst zehn verschiedene Benchmarks zu einer Gesamtpunktzahl zusammen.

Balkendiagramm des Artificial Analysis Intelligence Index: Gemini 3.1 Pro Preview führt mit 57 Punkten, gefolgt von Claude Opus 4.6 mit 53, Claude Sonnet 4.6 mit 51, GPT-5.2 mit 51 und GLM-5 mit 50. Weitere Modelle wie Kimi K2.5, Gemini 3 Flash und Grok 4 folgen mit niedrigeren Werten.
Gemini 3.1 Pro Preview erreicht 57 Punkte im Artificial Analysis Intelligence Index und liegt damit vier Punkte vor Claude Opus 4.6 und sechs vor GPT-5.2. | Bild: Artificial Analysis

Die Kosten für den gesamten Indextest lagen bei 892 Dollar, verglichen mit 2304 Dollar für GPT-5.2 und 2486 Dollar für Claude Opus 4.6. Gemini verbrauchte nur 57 Millionen Token, deutlich weniger als GPT-5.2 mit 130 Millionen. Bei realen Agentenaufgaben liegt Gemini 3.1 Pro allerdings weiterhin hinter Claude Sonnet 4.6, Opus 4.6 und GPT-5.2. Open-Source-Modelle wie GLM-5 sind mit 547 Dollar nochmals günstiger.

Benchmark-Ergebnisse sind wie immer nur eine Orientierung für den alltäglichen Nutzen. In unserem internen Fact-Checking-Benchmark schneidet 3.1 Pro viel schlechter ab als Opus 4.6 oder GPT-5.2, weil das Modell bei ersten Tests nur rund ein Viertel der Aussagen prüft; noch weniger als das in dieser Hinsicht schon schwache Gemini 3 Pro.

Read full article about: OpenAI-Chef sieht AGI in greifbarer Nähe: Interne Modelle beschleunigen die Forschung

OpenAI-Chef Sam Altman hält künstliche allgemeine Intelligenz (AGI) für nah. In einem Interview beim Express-Adda-Event sagte er, die Technologie, die OpenAI bereits intern nutze, beschleunige die Entwicklung so stark, dass AGI "ziemlich nah" sei (41:07). Auch Superintelligenz sei "nicht so weit entfernt" (41:53). Die KI-Entwicklung verlaufe schneller als ursprünglich gedacht, was er als "stressig und angsteinflößend" empfinde (38:45), so Altman.

Altman deutet damit an, dass OpenAI intern bereits über Modelle verfügt, die über das öffentlich Verfügbare hinausgehen. "Wir werden bald extrem leistungsfähige Modelle haben", so Altman. Aus der Innensicht der Labore sei die Welt darauf nicht vorbereitet.

Altman sprach auch über Berufe: Seine Ausbildung als Softwareentwickler sei praktisch irrelevant. Es werde zwar weiterhin Softwareentwickler geben, aber "C++-Code von Hand zu schreiben, das ist vorbei" (54:34). Viele weitere Berufsgruppen würden durch KI komplett überflüssig, andere kaum betroffen. Als Beispiel nannte er Grafikdesigner: Während einfache Auftragsarbeiten wie Geburtstagseinladungen durch KI ersetzt werden könnten, sei der Preis für von Menschen geschaffene Kunst seit Einführung der KI-Bildgeneratoren sogar gestiegen.

Anzeige
Read full article about: Anthropic erweitert Claude Code um automatisierte Desktop-Funktionen für Entwickler

Anthropic erweitert Claude Code auf dem Desktop um Funktionen, die den Entwicklungsprozess stärker automatisieren. Die KI kann nun Entwicklungsserver starten und laufende Web-Apps direkt in der Oberfläche anzeigen, Fehler erkennen und selbstständig beheben.

Neu ist auch eine Code-Review-Funktion, die Änderungen prüft und Kommentare direkt in der Diff-Ansicht hinterlässt. Für GitHub-Projekte überwacht Claude Code Pull Requests im Hintergrund, behebt CI-Fehler automatisch und kann PRs nach bestandenen Tests eigenständig zusammenführen. So können Entwickler an neuen Aufgaben arbeiten, während Claude Code offene PRs im Hintergrund fertigstellt. Sitzungen lassen sich zwischen CLI, Desktop, Web und Mobilgerät fortsetzen. Die Updates sind ab sofort verfügbar.

Anzeige

OpenAI meldete Amokläuferin in Kanada trotz Warnsignalen in ChatGPT nicht der Polizei

Jesse Van Rootselaar hinterließ vor ihrem Amoklauf in Tumbler Ridge zahlreiche digitale Warnsignale, auch bei ChatGPT. Rund ein Dutzend OpenAI-Angestellte diskutierten intern darüber, die kanadische Polizei zu informieren. Die Führungsebene entschied sich dagegen. Der Fall offenbart ein Dilemma, das die gesamte Online- und speziell die KI-Chatbot-Branche betrifft.

Read full article about: OpenAIs erster smarter Lautsprecher soll 200 bis 300 Dollar kosten

OpenAIs erster smarter Lautsprecher soll 200 bis 300 Dollar kosten. Laut The Information bietet das Gerät eine Kamera und Gesichtserkennung für Einkäufe. Es erfasst die Umgebung per Video für proaktive Vorschläge, etwa vor wichtigen Meetings rechtzeitig schlafen zu gehen. Laut einer Gerichtsakte von Vizepräsident Peter Welinder startet die Auslieferung frühestens im Februar 2027.

Das über 200-köpfige Hardware-Team entwickelt zudem eine smarte Brille (Massenproduktion frühestens ab 2028), Prototypen einer smarten Lampe mit ungewissem Marktstart und das Audio-Wearable "Sweetpea" als AirPods-Konkurrent. Außerdem soll der Stift "Gumdrop" in Arbeit sein. Produktionspartner soll Foxconn sein.

CEO Sam Altman stellte zumindest die Vorstellung eines Geräts für 2026 in Aussicht. Auch Konkurrenten wie Meta und Apple arbeiten an eigener KI-Hardware.

Anzeige