Anzeige
Skip to content

KI-Videogenerator Seedance 2.0: Hollywoods Branchenverband schickt erstmals Unterlassungsschreiben an Bytedance

Bytedances Versprechungen scheinen Hollywood nicht zu reichen: Die Motion Picture Association hat der Firma erstmals ein Cease-and-Desist-Schreiben wegen eines KI-Tools geschickt und spricht von „systemischer Rechtsverletzung“ durch Seedance 2.0.

Read full article about: Desinformation per Audio: ChatGPT Voice und Gemini Live lassen sich leicht manipulieren

Newsguard hat getestet, ob die Audio-Bots ChatGPT Voice (OpenAI), Gemini Live (Google) und Alexa+ (Amazon) falsche Behauptungen in realistisch klingenden Audioantworten wiedergeben. Solche Audioantworten können auf sozialen Medien geteilt und zur Verbreitung von Desinformation missbraucht werden.

Getestet wurden 20 nachweislich falsche Behauptungen aus den Bereichen Gesundheit, US-Politik, Weltnachrichten und ausländische Desinformation, jeweils mit einer neutralen Frage, einer suggestiven Frage und einer böswilligen Aufforderung, etwa ein Radioskript mit der Falschmeldung zu erstellen. ChatGPT wiederholte Falsches in 22 Prozent der Fälle, Gemini in 23 Prozent. Bei böswilligen Eingaben stiegen die Raten auf 50 bzw. 45 Prozent.

Die Grafik von NewsGuard zeigt die Fehlerquoten der drei Audio-Bots nach Eingabetyp. Bei neutralen Fragen (rot) lagen ChatGPT und Gemini bei je 5 Prozent. Bei suggestiven Fragen (blau) stieg die Rate auf 10 Prozent bei ChatGPT und 20 Prozent bei Gemini. Bei böswilligen Eingaben (braun) schnellten die Werte auf 50 Prozent bei ChatGPT und 45 Prozent bei Gemini hoch. Alexa+ blieb bei allen drei Eingabetypen bei 0 Prozent.
Fehlerquoten der Audio-Bots ChatGPT, Gemini und Alexa+ nach Eingabetyp: neutral (rot), suggestiv (blau) und böswillig (braun). Alexa+ blieb bei allen drei Typen bei 0 Prozent. | Bild: Newsguard

Amazons Alexa+ lehnte jede Falschbehauptung ab. Laut Amazon-Vizepräsidentin Leila Rouhi nutzt Alexa+ vertrauenswürdige Nachrichtenquellen wie AP, Reuters und weitere als Grundlage. OpenAI lehnte eine Stellungnahme ab, Google reagierte nicht auf zwei Anfragen. Details zur Methodik finden sich auf Newsguardtech.com.

Read full article about: Nvidias DreamDojo ist ein Open-Source-Weltmodell für das Robotertraining

Nvidias KI-Forschungsteam hat DreamDojo vorgestellt, ein Open-Source-Weltmodell für Robotik. Es nimmt Motorsteuerungsbefehle entgegen und erzeugt daraus eine simulierte Zukunft in Bildern, ohne klassische 3D-Engine oder manuell erstellte Physik. Jim Fan, Director of AI bei NVIDIA, spricht von "Simulation 2.0".

Das Kernproblem: Roboter in der echten Welt zu trainieren, ist langsam, teuer und riskant – begrenzt durch Zeit, Verschleiß, Sicherheit und ständiges Zurücksetzen. DreamDojo soll das lösen, indem es auf 44.000 Stunden menschlicher Ego-Perspektiv-Videos vortrainiert wurde. Sogenannte "latente Aktionen" übersetzen dabei menschliche Bewegungen in ein hardwareunabhängiges Format. So kann das Modell aus menschlichen Videos lernen, ohne je einen Roboter gesehen zu haben. In einem zweiten Schritt wird es dann auf die spezifische Mechanik eines konkreten Roboters zugeschnitten.

DreamDojo läuft in Echtzeit mit zehn Bildern pro Sekunde und ermöglicht VR-Fernsteuerung in einer simulierten Umgebung, Bewertung von Roboter-Strategien und vorausschauende Planung direkt im Weltmodell. Laut Jim Fan sind alle Gewichte, Code und Daten frei verfügbar. Details gibt es auf der Projektseite und im Paper. DreamDojo basiert auf Nvidia Cosmos.

Anzeige

KI-Agenten sind laut Anthropic bislang nur im Coding einigermaßen angekommen

KI-Agenten sollen bald den Arbeitsalltag revolutionieren. Anthropics eigene Daten zeigen: Bislang ist das fast nur im Software-Engineering der Fall. Und selbst dort lassen die Nutzer die Agenten längst nicht so autonom arbeiten, wie es technisch möglich wäre.

Anzeige
Read full article about: Gemini 3.1 Pro: Googles neues KI-Modell führt Benchmark-Index an und kostet nur ein Drittel der Konkurrenz

Googles Gemini 3.1 Pro Preview führt den Artificial Analysis Intelligence Index an, vier Punkte vor Anthropics Claude Opus 4.6, und kostet dabei weniger als die Hälfte im Betrieb. Das Modell führt in sechs von zehn Einzelbewertungen, darunter agentenbasiertes Coding, Wissen, wissenschaftliches Denken und Physik. Die Halluzinationsrate sank um 38 Prozentpunkte gegenüber dem anfälligen Vorgänger Gemini 3 Pro. Der Artificial Analysis Intelligence Index fasst zehn verschiedene Benchmarks zu einer Gesamtpunktzahl zusammen.

Balkendiagramm des Artificial Analysis Intelligence Index: Gemini 3.1 Pro Preview führt mit 57 Punkten, gefolgt von Claude Opus 4.6 mit 53, Claude Sonnet 4.6 mit 51, GPT-5.2 mit 51 und GLM-5 mit 50. Weitere Modelle wie Kimi K2.5, Gemini 3 Flash und Grok 4 folgen mit niedrigeren Werten.
Gemini 3.1 Pro Preview erreicht 57 Punkte im Artificial Analysis Intelligence Index und liegt damit vier Punkte vor Claude Opus 4.6 und sechs vor GPT-5.2. | Bild: Artificial Analysis

Die Kosten für den gesamten Indextest lagen bei 892 Dollar, verglichen mit 2304 Dollar für GPT-5.2 und 2486 Dollar für Claude Opus 4.6. Gemini verbrauchte nur 57 Millionen Token, deutlich weniger als GPT-5.2 mit 130 Millionen. Bei realen Agentenaufgaben liegt Gemini 3.1 Pro allerdings weiterhin hinter Claude Sonnet 4.6, Opus 4.6 und GPT-5.2. Open-Source-Modelle wie GLM-5 sind mit 547 Dollar nochmals günstiger.

Benchmark-Ergebnisse sind wie immer nur eine Orientierung für den alltäglichen Nutzen. In unserem internen Fact-Checking-Benchmark schneidet 3.1 Pro viel schlechter ab als Opus 4.6 oder GPT-5.2, weil das Modell bei ersten Tests nur rund ein Viertel der Aussagen prüft; noch weniger als das in dieser Hinsicht schon schwache Gemini 3 Pro.

Read full article about: OpenAI-Chef sieht AGI in greifbarer Nähe: Interne Modelle beschleunigen die Forschung

OpenAI-Chef Sam Altman hält künstliche allgemeine Intelligenz (AGI) für nah. In einem Interview beim Express-Adda-Event sagte er, die Technologie, die OpenAI bereits intern nutze, beschleunige die Entwicklung so stark, dass AGI "ziemlich nah" sei (41:07). Auch Superintelligenz sei "nicht so weit entfernt" (41:53). Die KI-Entwicklung verlaufe schneller als ursprünglich gedacht, was er als "stressig und angsteinflößend" empfinde (38:45), so Altman.

Altman deutet damit an, dass OpenAI intern bereits über Modelle verfügt, die über das öffentlich Verfügbare hinausgehen. "Wir werden bald extrem leistungsfähige Modelle haben", so Altman. Aus der Innensicht der Labore sei die Welt darauf nicht vorbereitet.

Altman sprach auch über Berufe: Seine Ausbildung als Softwareentwickler sei praktisch irrelevant. Es werde zwar weiterhin Softwareentwickler geben, aber "C++-Code von Hand zu schreiben, das ist vorbei" (54:34). Viele weitere Berufsgruppen würden durch KI komplett überflüssig, andere kaum betroffen. Als Beispiel nannte er Grafikdesigner: Während einfache Auftragsarbeiten wie Geburtstagseinladungen durch KI ersetzt werden könnten, sei der Preis für von Menschen geschaffene Kunst seit Einführung der KI-Bildgeneratoren sogar gestiegen.

Anzeige