Technews März 2025

Automatisierte* Nachrichten über KI, Robotiks und der Techindustrie

US Supreme Court bestätigt TikTok-Verbot, wenn es nicht verkauft wird

30.03.2025    Social Media

Der Oberste Gerichtshof der USA hat das TikTok-Verbot bestätigt, falls die App nicht verkauft wird. Diese Entscheidung setzt TikTok unter Druck, seine US-Aktivitäten zu veräußern.
Im Detail:

Die US-Regierung argumentiert, dass TikTok aufgrund seiner Verbindungen zu China ein nationales Sicherheitsrisiko darstellt.

Trump hat den Obersten Gerichtshof um einen Aufschub für das TikTok-Verbot gebeten, um die Angelegenheit sachlich zu prüfen.

TikTok hat Berichte zurückgewiesen, wonach China über den Verkauf seiner US-Aktivitäten an den Tech-Milliardär Elon Musk diskutiert.

Diese Entwicklung könnte weitreichende Folgen für die Zukunft der beliebten Social-Media-Plattform in den USA haben.

Warum es wichtig ist

Die Entscheidung des Supreme Court markiert einen Wendepunkt in der anhaltenden Debatte um Datensicherheit und nationale Sicherheitsinteressen im Zusammenhang mit chinesischen Technologieunternehmen. Sie könnte auch Auswirkungen auf andere internationale Tech-Unternehmen haben, die in den USA tätig sind.

Meta plant Entlassung von 5 % der Belegschaft

30.03.2025    Tech-Unternehmen

Meta, der Mutterkonzern von Facebook, Instagram und WhatsApp, plant einen Stellenabbau von 5 % seiner Belegschaft. Diese Maßnahme ist Teil einer größeren Umstrukturierung des Unternehmens.
Im Detail:

Der geplante Stellenabbau betrifft verschiedene Abteilungen des Unternehmens.

Meta begründet diesen Schritt mit der Notwendigkeit, effizienter zu werden und sich auf Kernbereiche zu konzentrieren.

Diese Entscheidung folgt auf frühere Entlassungsrunden und Kostensenkungsmaßnahmen des Unternehmens.

Trotz des Stellenabbaus plant Meta weiterhin Investitionen in KI und das Metaverse.

Warum es wichtig ist

Dieser Schritt von Meta spiegelt den anhaltenden Trend der Umstrukturierung und Kosteneinsparungen in der Tech-Branche wider. Er zeigt auch die Herausforderungen, denen sich selbst große Tech-Giganten in einem sich schnell verändernden digitalen Umfeld gegenübersehen.

EU-Kommission untersucht Musks mögliche Wahlbeeinflussung

30.03.2025    Politik & Tech

EU-Abgeordnete fordern eine strengere Prüfung von Elon Musks möglicher Einflussnahme auf die vorgezogene Bundestagswahl. Die EU-Kommission will Musks AfD-Interview in ihre X-Untersuchung einbeziehen.
Im Detail:

Europäische Parlamentarier haben die EU-Kommission aufgefordert, Musks potenzielle Einflussnahme auf die deutsche Wahl genauer zu untersuchen.

Die Beziehungen zwischen der italienischen Regierung und Musk im Zusammenhang mit SpaceX werden ebenfalls kritisch betrachtet.

Der ehemalige EU-Binnenmarktchef Thierry Breton hatte Musk bereits im vergangenen Sommer vor der Einhaltung des Gesetzes über digitale Dienste gewarnt.

Die Untersuchung könnte Auswirkungen auf die Regulierung von Social-Media-Plattformen in der EU haben.

Warum es wichtig ist

Diese Entwicklung unterstreicht die wachsende Besorgnis über den Einfluss von Tech-Milliardären und Social-Media-Plattformen auf demokratische Prozesse. Sie zeigt auch die Bemühungen der EU, strengere Kontrollen über digitale Dienste durchzusetzen, um die Integrität von Wahlen zu schützen.

OpenAI steht vor 40-Milliarden-Dollar-Finanzierungsrunde

30.03.2025    KI

OpenAI steht kurz vor dem Abschluss einer massiven Finanzierungsrunde von 40 Milliarden Dollar unter der Führung von SoftBank, was die größte private Finanzierung aller Zeiten wäre und die Bewertung des ChatGPT-Entwicklers auf fast 300 Milliarden Dollar verdoppeln würde.
Im Detail:

SoftBank wird zunächst 7,5 Milliarden Dollar investieren, gefolgt von weiteren 22,5 Milliarden Dollar später in diesem Jahr, mit anderen Investoren wie Magnetar Capital, Coatue und Founders Fund.

OpenAI erwartet, dass sich sein Umsatz 2025 auf 12,7 Milliarden Dollar verdreifachen wird und bis 2029 bei einem prognostizierten Umsatz von über 125 Milliarden Dollar einen positiven Cashflow erreicht.

Das Unternehmen soll 2024 bei einem Umsatz von 3,7 Milliarden Dollar bis zu 5 Milliarden Dollar verloren haben, was auf KI-Infrastruktur- und Trainingskosten zurückzuführen ist.

Die Finanzierung wird auch teilweise OpenAIs Engagement für Stargate unterstützen, das 300-Milliarden-Dollar-KI-Infrastruktur-Joint-Venture, das im Januar mit SoftBank und Oracle angekündigt wurde.

Warum es wichtig ist

OpenAIs Wandel zu einem gewinnorientierten Unternehmen scheint rekordverdächtig zu sein, und sowohl die Unternehmensprognosen als auch die Investorengelder signalisieren, dass der KI-Boom noch lange nicht nachlässt. Der Wettbewerb mag härter werden, aber wie wir diese Woche gesehen haben, dominiert kein Unternehmen die Aufmerksamkeit in der KI-Welt so sehr wie OpenAI.

Anthropic enthüllt, wie Claude "denkt"

30.03.2025    LLM

Anthropic veröffentlichte zwei Forschungsarbeiten, die enthüllen, wie sein KI-Assistent Claude Informationen verarbeitet und helfen, interne Mechanismen besser zu verstehen, die Fähigkeiten wie mehrsprachiges Denken und fortgeschrittene Planung erklären.
Im Detail:

Die Forscher entwickelten ein "KI-Mikroskop", das interne "Schaltkreise" im Modell aufzeigt und zeigt, wie Claude Eingaben in Ausgaben für Schlüsselaufgaben umwandelt.

Claude verwendet eine universelle "Denksprache" über verschiedene Sprachen hinweg, mit gemeinsamer konzeptioneller Verarbeitung für Englisch, Französisch und Chinesisch.

Beim Schreiben von Gedichten plant Claude mehrere Wörter im Voraus und identifiziert Reimoptionen, bevor er Zeilen konstruiert, um diese geplanten Wörter zu erreichen.

Das Team entdeckte auch eine Voreinstellung, die Spekulationen verhindert, es sei denn, sie werden durch starkes Vertrauen überschrieben, was erklärt, wie die Verhinderung von Halluzinationen funktioniert.

Warum es wichtig ist

Je näher wir der superintelligenten KI kommen, desto wichtiger wird es, zu verstehen, wie Modelle intern verarbeiten. Mit Forschungen, die bereits die täuschenden Eigenschaften von KI detaillieren, und leistungsfähigeren Systemen, die weltweit in das Leben integriert werden, wird die Entschlüsselung der inneren Funktionsweise von Tag zu Tag wichtiger.

Qwens QVQ-Max visuelles Reasoning-Modell

30.03.2025    LLM

Das Qwen-Team von Alibaba hat QVQ-Max veröffentlicht, ein neues visuelles Reasoning-Modell, das über die grundlegende Bilderkennung hinausgeht, um visuelle Informationen über Bilder und Videos hinweg zu analysieren und zu interpretieren.
Im Detail:

Das Modell ist eine Weiterentwicklung von QVQ-72B-Preview und erweitert die Fähigkeiten in den Bereichen mathematische Problemlösung, Code-Generierung und kreative Aufgaben.

QVQ-Max verfügt über einen "Denk"-Mechanismus, dessen Länge angepasst werden kann, um die Genauigkeit zu verbessern, und zeigt skalierbare Gewinne bei zunehmender Denkzeit.

Weitere komplexe visuelle Fähigkeiten umfassen die Analyse von Bauplänen, das Lösen von Geometrieproblemen und das Geben von Feedback zu von Benutzern eingereichten Skizzen.

Qwen gab bekannt, dass zukünftige Pläne die Erstellung eines vollständigen visuellen Agenten umfassen, der in der Lage ist, Geräte zu bedienen und Spiele zu spielen.

Warum es wichtig ist

Dies ist Qwens dritte Modellveröffentlichung in dieser Woche! Zwischen Omni, Qwen2.5-VL und jetzt QVQ-Max bringt der chinesische Powerhouse weiterhin leistungsfähige Modelle über das gesamte KI-Spektrum hinweg heraus. Mit China, das den Markt mit fortschrittlichen Systemen überschwemmt, war die Lücke zwischen den USA und China noch nie so klein.

Verbraucherschutz: Weniger Cookie-Banner dank neuer Verordnung

28.03.2025    Recht

Die Bundesregierung hat eine neue Verordnung beschlossen, die die Flut von Cookie-Bannern reduzieren und das Surferlebnis verbessern soll.
Im Detail:

Die Verordnung über Dienste zur Einwilligungsverwaltung ermöglicht eine Alternative zu den bisherigen Cookie-Bannern.

Nutzer können ihre Entscheidungen zur Cookie-Nutzung künftig dauerhaft hinterlegen, ohne bei jedem Webseitenbesuch erneut zustimmen zu müssen.

Unabhängige Einwilligungsverwaltungsdienste sollen die Nutzerentscheidungen zentral verwalten und auf allen angeschlossenen Websites anwenden.

Die Bundesbeauftragte für den Datenschutz und die Informationsfreiheit wird diese Dienste anerkennen, um Vertrauen und Akzeptanz zu stärken.

Webseitenbetreiber können Einwilligungen rechtssicher und nutzerfreundlich einholen, ohne das Design ihrer Webseite durch Banner zu stören.

Warum es wichtig ist

Die neue Verordnung zielt darauf ab, den Datenschutz und die digitale Selbstbestimmung zu stärken, indem sie Nutzern mehr Kontrolle über ihre Einwilligungen gibt und gleichzeitig das Surferlebnis verbessert[4]. Sie setzt einen neuen Rechtsrahmen, um der Cookie-Banner-Flut zu begegnen und die informationelle Selbstbestimmung im Internet zu fördern.

Quelle:

Die offizielle Website der Bundesbeauftragten für den Datenschutz und die Informationsfreiheit (BfDI)

Verbraucherschutz: Second-Hand-Plattformen auf dem Prüfstand

28.03.2025    Recht

Nach europäischem Recht müssen Online-Händler Verbraucher*innen über ihre Rechte informieren und dürfen keine irreführenden Werbeversprechen machen. Das Umweltbundesamt (UBA)
Im Detail:

Im Rahmen einer EU-weiten Untersuchung des europäischen Verbraucherschutz-Netzwerks wurden CPC Second-Hand-Plattformen unter die Lupe genommen. Ergebnis: Fast die Hälfte der untersuchten Plattformen informiert Verbraucher*innen nicht ausreichend über ihre Gewährleistungsrechte. ⁠UBA⁠-Präsident Dirk Messner sagte: „Den Second-Hand-Trend als Gegenbewegung zum Fast-Fashion-Konsum begrüße ich aus Sicht der ⁠Nachhaltigkeit⁠ sehr. Die Bestandsaufnahme des CPC-Netzwerks hat jedoch gezeigt, dass auch im Gebrauchtwarensektor durchaus noch Handlungsbedarf zur Verbesserung des Verbraucherschutzes besteht. Wichtig ist vor allem, dass die Umweltvorteile des Second-Hand-Shoppings realistisch dargestellt und dass Verbraucher*innen über ihre Rechte informiert werden."

Ein Sweep des Verbraucherschutz-Netzwerks CPC (Consumer Protection Cooperation Network) ist eine EU-weit abgestimmte Untersuchung, um Anhaltspunkte für ggf. nachfolgende Rechtsdurchsetzungsverfahren zu finden. Der Sweep liefert Indizien, stellt Verstöße aber noch nicht rechtsverbindlich fest. In diesem Sweep wurden 356 Second-Hand-Verkaufsplattformen überprüft. Dabei wurde nicht nur der Bekleidungssektor ins Visier genommen, sondern unter anderem auch Plattformen für gebrauchte Elektroartikel, Bücher oder Fahrzeugteile. Die beteiligten Behörden und Verbände wollten insbesondere wissen, ob die Plattformen ihren durch Europarecht vorgegebenen Informationspflichten nachkommen und ob Werbung mit irreführenden Umweltaussagen (sog. „Greenwashing") betrieben wird.

Ergebnis: Bei rund 45 Prozent der im Rahmen des Sweeps untersuchten Webseiten wurden Hinweise darauf erkannt, dass Verbraucher*innen nicht auf ihre gesetzlichen Gewährleistungsrechte hingewiesen werden, also auf die Rechte, die ihnen zustehen, wenn die gekaufte Ware mangelhaft ist. Rund 40 Prozent informieren nach dem gewonnenen ersten Eindruck nicht klar genug über das Widerrufsrecht, also das Recht, einen im Internet abgeschlossenen Vertrag innerhalb von 14 Tagen zu widerrufen. Diese Informationen müssen Online-Händler Verbraucher*innen nach der Verbraucherrechte-Richtlinie in klarer und verständlicher Weise zur Verfügung stellen.

Darüber hinaus werben 34 Prozent der überprüften Webseiten mit Umweltaussagen. Nach der Richtlinie über unlautere Geschäftspraktiken ist die Werbung mit Umweltaussagen verboten, wenn sie irreführend ist, also wenn sie einen in Wahrheit so nicht bestehenden Umweltvorteil suggeriert oder wenn wesentliche Informationen zurückgehalten werden, ohne die Verbraucher*innen die tatsächlichen Auswirkungen auf die Umwelt nicht einschätzen können. Positiv fiel auf: Nur rund 20 Prozent aller identifizierten Umweltaussagen wurden im Rahmen des Sweeps als potentiell irreführend eingestuft.

Für Deutschland koordinierte das Umweltbundesamt (⁠UBA⁠) die Teilnahme an dem Sweep. Diese erfolgte gemeinsam mit dem Verbraucherzentrale Bundesverband e.V. (vzbv) und der Zentrale zur Bekämpfung unlauteren Wettbewerbs e.V. (Wettbewerbszentrale).

Die Untersuchung der beim Sweep erkannten Auffälligkeiten obliegt den national zuständigen Behörden und Stellen, die im Rahmen ihrer jeweiligen Zuständigkeit Maßnahmen zur Beseitigung der von ihnen festgestellten Verstöße ergreifen.

Weitere Informationen

Das UBA setzt sich grenzüberschreitend für die kollektiven Interessen von Verbraucher*innen ein. Dabei werden jedoch keine individuellen Ansprüche einzelner Verbraucher*innen durchgesetzt. Diese profitieren vielmehr als Allgemeinheit davon, dass Missstände und Verstöße von europaweit tätigen Unternehmen aufgedeckt und abgestellt werden.

Der Sweep ist keine repräsentative Studie über die gesamte Second-Hand-Branche. Die abgestimmten Ermittlungen tragen vielmehr dazu bei, die europaweite Einhaltung des Verbraucherrechts zu verbessern und Verstöße gegen kollektive Verbraucherinteressen zu identifizieren.

Herausgeber / Quelle

Umweltbundesamt Hauptsitz Wörlitzer Platz 1 06844 Dessau-Roßlau Deutschland

BMW und Alibaba entwickeln KI-gesteuerte Autos

27.03.2025    KI

BMW und Alibaba haben eine strategische Allianz zur Entwicklung fortschrittlicher KI-Systeme für Fahrzeuge angekündigt, die speziell auf den chinesischen Markt zugeschnitten sind.
Im Detail:

Die Partnerschaft konzentriert sich auf einen neuen KI-Assistenten im Fahrzeug, der von Alibabas Qwen-Technologie angetrieben wird und über verbesserte Spracherkennung und kontextuelles Verständnis verfügt.

Der Assistent bietet Echtzeit-Informationen zu Restaurants, Parkmöglichkeiten und Verkehrsmanagement und reagiert auf natürliche Sprachbefehle anstatt auf Touchscreen-Eingaben.

BMW plant zudem die Einführung von zwei KI-Agenten: Car Genius für Fahrzeugdiagnosen und Travel Companion für personalisierte Empfehlungen und Reiseplanung.

Das System wird auch multimodale Eingaben wie Gestenerkennung, Blickverfolgung und Körperpositionserkennung für intuitivere Fahrerlebnisse umfassen.

Warum es wichtig ist

BMW positioniert sich an der Spitze der KI-Integration in Fahrzeuge. Während Tesla mit seiner internen xAI-Partnerschaft ein starker Konkurrent bleibt, unternehmen auch andere Autohersteller strategische Schritte, um in der KI-Ära führend zu sein.

Alibabas multisensorische KI für mobile Geräte

27.03.2025    KI

Alibaba hat Qwen2.5-Omni-7B veröffentlicht, eine neue multimodale KI, die Text, Bilder, Audio und Video gleichzeitig verarbeiten kann und effizient genug ist, um direkt auf Verbraucher-Hardware wie Smartphones und Laptops zu laufen.
Im Detail:

Das Modell verwendet ein neues "Thinker-Talker"-System für die Echtzeit-Verarbeitung über verschiedene Modalitäten (Text, Audio, Bild, Video) mit Text- und Sprachausgaben.

Es zeigt starke Leistungen in Sprachverständnis und -generierung und übertrifft spezialisierte Audio-Modelle in Benchmark-Tests.

Laut Alibaba kann Omni-7B effizient auf Telefonen und Laptops laufen und ermöglicht praktische Anwendungen wie Echtzeit-Audiobeschreibungen für sehbehinderte Nutzer.

Das Modell ist sofort auf Hugging Face und GitHub verfügbar, wobei Alibaba es als Grundlage für die Entwicklung praktischer KI-Agenten positioniert.

Warum es wichtig ist

Die Ära der Alleskönner-Modelle steht kurz bevor, wobei Omni-Systeme völlig neue Erfahrungen und Anwendungskategorien erschließen werden. Eine Intelligenz, die die volle Komplexität menschlicher Umgebungen verstehen und darauf reagieren kann - und dabei Open-Source und leicht zugänglich ist - ist eine mächtige Kombination.

Google’s Gemini 2.5 Pro führt AI-Ranking an

26.03.2025    LLM

Google hat **Gemini 2.5 Pro Experimental** veröffentlicht, ein neues KI-Modell mit integrierter Schlussfolgerungsfähigkeit, das aktuell die LMArena-Benchmarks anführt.
Im Detail:

Das Modell erreicht **63,8 %** auf SWE-Bench Verified und **68,6 %** auf Aider Polyglot, besonders stark in Web-Apps und agenter Code-Anwendungen.

Die aktuelle Token-Kontextgröße von **1 Mio.** wird bald auf **2 Mio.** erweitert, um ganze Code-Repositories zu verarbeiten.

Verfügbar in **Google AI Studio** und der Gemini-App für Advanced-Abonnenten, API-Preise folgen in den nächsten Wochen.

Warum es wichtig ist

Google setzt Schlussfolgerungsfähigkeiten als Standard statt Premium-Feature durch – ein strategischer Schritt, um trotz fehlender Hype um OpenAI mit SOTA-Modellen zu konkurrieren.

OpenAI integriert Bildgenerierung in GPT-4o

26.03.2025    LLM

OpenAI hat **Bildgenerierung** in GPT-4o und Sora eingeführt, wodurch Text und Bilder nun multimodal verarbeitet werden.
Im Detail:

Das System erzeugt präzise **Menüs, Diagramme und Infografiken** mit lesbarem Text – ein Fortschritt gegenüber früheren Schwächen.

Nutzer können Bilder per Sprachbefehl bearbeiten, wobei das Modell **10–20 Objekte** in Prompts verarbeiten kann.

DALL-E 3 wurde als Standardgenerator für ChatGPT durch die neue Lösung ersetzt – Enterprise/Edu folgen bald.

Warum es wichtig ist

Die Integration markiert einen Paradigmenwechsel: Visuelle KI-Inhalte werden durch **UI/UX-Designfähigkeiten** und natürliche Sprachbearbeitung revolutioniert.

Apple setzt auf Nvidia-Hardware für KI

26.03.2025    LLM

Apple bestellt **1 Mrd. USD** an Nvidia-Servern (GB300 NVL72), um seine erste generative KI-Infrastruktur mit Dell und Super Micro aufzubauen[1][2].
Im Detail:

Jeder Server kostet **3,7–4 Mio. USD** – ein strategischer Schritt nach Rückschlägen bei der Eigenentwicklung von KI-Chips[1].

Die Partnerschaft folgt auf Verzögerungen bei der KI-Siri-Upgrade und interne Umstrukturierungen.

Warum es wichtig ist

Apple erkennt die Notwendigkeit externer Rechenleistung, um im KI-Wettlauf mitzukommen – doch die Zeit drängt, da Konkurrenten wie OpenAI weiter vorpreschen.

Reve's neues führendes Bildmodell

25.03.2025    LLM

Reve hat mit Reve Image 1.0 ein neues Text-zu-Bild-KI-Modell vorgestellt, das globale Rankings anführt und außergewöhnliche Prompt-Genauigkeit, Textdarstellung und Bildqualität zeigt.
Im Detail:

Das Modell erreichte die #1-Position in Artificial Analysis' Image Arena und übertraf Konkurrenten wie Google's Imagen 3, Midjourney v6.1 und Recraft V3.

Reve's Mission ist es, "visuelle generative Modelle mit Logik zu verbessern", wobei 1.0 in Tests beeindruckende Prompt-Einhaltung und Langtext-Rendering zeigte.

Die Plattform bietet auch Bearbeitung in natürlicher Sprache, Foto-Uploads und einen 'Explore'-Tab zum Anzeigen von Community-Prompts und -Generationen.

Eine Vorschau von Reve Image 1.0 ist derzeit kostenlos zu testen, wobei das Unternehmen sagt, dass "noch viel mehr in Kürze kommt".

Warum es wichtig ist

Ein beeindruckendes Stealth-Debüt von Reve, dessen erstes Modell bereits die Bestenlisten gegen etablierte Giganten im Text-zu-Bild-Bereich anführt. 1.0 scheint das Beste der SOTA-Bildmodelle zu kombinieren - mit extremem Fotorealismus, erstklassiger Prompt-Befolgung, Bearbeitungstools und absolut erstklassigen Textfähigkeiten.

DeepSeek veröffentlicht leise V3-Upgrade

25.03.2025    KI

Das chinesische KI-Startup DeepSeek hat eine aktualisierte Version seines V3-Modells veröffentlicht, ein massives 641GB-Modell, das auf High-End-PCs laufen kann und eine sehr permissive Open-Source-MIT-Lizenz für breite Nutzung bietet.
Im Detail:

Das V3-Update, V3-0324, verwendet eine Mixture-of-Experts-Architektur, die nur 37B Parameter pro Token aktiviert und den Rechenaufwand drastisch reduziert.

Tester haben gezeigt, dass es reibungslos auf Apple's Mac Studio-Computern laufen kann, was es zum ersten Modell dieser Klasse macht, das außerhalb von Rechenzentren zugänglich ist.

Frühe Nutzer berichteten auch von verbesserten Mathematik- und Coding-Fähigkeiten, wobei es als das beste Nicht-Reasoning-Modell bezeichnet wurde.

V3-0324 kann mit einer Open-Source-MIT-Lizenz genutzt werden, eine Änderung gegenüber dem vorherigen V3-Modell mit einer restriktiveren benutzerdefinierten Lizenz.

Warum es wichtig ist

Chinas KI-Liebling liefert weiterhin, wobei ein vermeintlich kleines Update einige große Verbesserungen bringt. Gerüchte über die bevorstehende R2-Veröffentlichung gewinnen ebenfalls an Dynamik und deuten auf einen weiteren 'DeepSeek-Moment' hin, der die KI-Welt erschüttern könnte - möglicherweise ein Signal für einen neuen Marktführer in diesem Bereich.

ARC Prize kehrt zurück, um KI-Reasoning herauszufordern

25.03.2025    KI

Die ARC Prize Foundation hat ARC-AGI-2 gestartet, einen neuen Benchmark zur Förderung von KI-Reasoning-Fähigkeiten, zusammen mit einem 1-Millionen-Dollar-Wettbewerb zur Förderung der Forschung an effizienteren allgemeinen Intelligenzsystemen.
Im Detail:

ARC-AGI-2 zielt auf Fähigkeiten ab, die für KI schwierig, aber für Menschen einfach sind, mit Aufgaben, die von mindestens zwei Menschen in weniger als zwei Versuchen lösbar sind.

Aktuelle KI-Reasoner schneiden bei ARC-AGI-2 schlecht ab, wobei selbst OpenAIs o3-low nur geschätzte 4% erreicht, verglichen mit 75,7% bei der vorherigen Version.

ARC führte neben der reinen Leistung auch eine Effizienzmetrik ein, die die Kosten pro Aufgabe misst, um sowohl Fähigkeit als auch Ressourceneffizienz zu testen.

Der ARC Prize 2025 Wettbewerb startet diese Woche mit 1 Million Dollar an Preisgeldern, einschließlich 700.000 Dollar für den ersten, der 85% Genauigkeit innerhalb der Effizienzgrenzen erreicht.

Warum es wichtig ist

Viele der Top-KI-Labore glauben, dass AGI kurz bevorsteht, und beim ursprünglichen AGI-1-Benchmark erzielten Top-Modelle wie das o3 bereits Werte in den 80ern (nicht ohne Kontroversen). Während die neue Iteration möglicherweise ein besserer Test ist, ist es immer noch schwer vorstellbar, dass sie lange Bestand haben wird - aber die AGI-Zielpfosten werden sich wahrscheinlich weiter verschieben.

Neue KI erkennt Krebs mit nahezu perfekter Genauigkeit

24.03.2025    KI

Forscher haben ein KI-Modell namens ECgMLP vorgestellt, das Gebärmutterhalskrebs mit 99,26% Genauigkeit aus mikroskopischen Gewebebildern erkennt.
Im Detail:

ECgMLP nutzt spezielle Aufmerksamkeitsmechanismen, um Krebszellen in mikroskopischen Gewebebildern zu erkennen, die Ärzte bei Standardanalysen übersehen könnten.

Aktuelle menschliche Diagnosemethoden für Gebärmutterhalskrebs erreichen nur 78-81% Genauigkeit, weit unter der Genauigkeit dieses Modells von über 99%.

Die Forscher testeten auch die Vielseitigkeit des Modells bei anderen Krebsarten und erzielten hohe Genauigkeiten bei Darmkrebs (98,57%), Brustkrebs (98,20%) und Mundkrebs (97,34%).

Das Modell übertrifft deutlich menschliche Spezialisten und aktuelle automatisierte Methoden.

Warum es wichtig ist

Die medizinische Diagnostik erfährt einen großen Wandel, da KI nun konsistent bessere Leistungen als Menschen bei lebensrettenden Erkennungsaufgaben erbringt. Da viele Krebsarten bei frühzeitiger Erkennung gut behandelbar sind, werden diese Modelle viele Leben retten und letztendlich den Zugang zu Krebsvorsorge auf Expertenniveau weltweit demokratisieren.

Tencents Hunyuan T1 Reasoning-Modell

24.03.2025    LLM

Tencent hat Hunyuan T1 veröffentlicht, ein neues Reasoning-Modell, das in Leistung und Preisgestaltung mit DeepSeeks R1 mithalten kann.
Im Detail:

T1 erreicht oder übertrifft Konkurrenten wie DeepSeek R1 und OpenAIs o1 und GPT 4.5 in Benchmarks, besonders bei Mathematik und chinesischen Sprachevaluierungen.

Tencent behauptet, das Modell sei das erste, das Googles Transformer-Architektur mit dem Mamba-System von Carnegie Mellon und Princeton-Forschern kombiniert.

Der hybride Ansatz soll 2-fach schnellere Geschwindigkeiten bei gleichzeitiger Reduzierung des Rechenaufwands liefern, insbesondere bei der Verarbeitung von Langtext-Reasoning-Aufgaben.

Die Preisgestaltung von T1 entspricht DeepSeeks wettbewerbsfähigen Raten von 1 Yuan ($0,14) pro Million Token für Input und 4 Yuan ($0,55) pro Million Token für Output.

Warum es wichtig ist

Chinas KI-Labore haben den Rückstand zu den US-Marktführern fast vollständig aufgeholt - etwas, das vor einem Jahr noch sehr weit entfernt schien. Mit dem bald erscheinenden R2 der nächsten Generation scheint China näher denn je daran zu sein, offiziell die Führung bei den weltweit besten KI-Modellen zu übernehmen.

Perplexitys kühner Versuch, TikTok zu übernehmen

24.03.2025    Tech

Das KI-Suchstart-up Perplexity hat seinen Vorschlag zur Übernahme von TikToks US-Geschäft veröffentlicht.
Im Detail:

Perplexity plant, TikToks Empfehlungssystem in amerikanischen Rechenzentren neu aufzubauen und verspricht volle Transparenz durch Open-Source-Algorithmen.

Das Unternehmen würde seine KI-Zitierungsfähigkeiten in TikTok-Videos integrieren, sodass Nutzer Informationen in Echtzeit während des Anschauens von Inhalten überprüfen können.

Perplexity schlug auch vor, TikTok mit Nvidia Dynamo-Technologie zu verbessern, um Empfehlungsmodelle "100-fach" zu skalieren und die Inferenzgeschwindigkeit zu verbessern.

Die Vision beinhaltet plattformübergreifende Vorteile, mit TikTok-Videos in Perplexity-Suchergebnissen und Perplexitys Informations-Engine zur Unterstützung von TikTok-Suchen.

Warum es wichtig ist

Perplexity hat einige wilde Jahre hinter sich, von einem KI-Such-Startup über die Entwicklung eigener Modelle, die Partnerschaft bei einem KI-Telefon, den Aufbau eines KI-Browsers, die Provokation von Google in Werbespots bis hin zum Gebot für TikTok. Es könnte ein weiterer Publicity-Stunt sein, aber die Verbotsfrist ist der 5. April - wir werden es also bald herausfinden.

Claude erhält Echtzeit-Websuche

21.03.2025    LLM

Anthropic hat Claude um Websuchfunktionen erweitert und gibt seinem KI-Assistenten damit Zugang zu Echtzeitinformationen.
Im Detail:

Die Websuche ist direkt in Claude 3.7 Sonnet integriert und entscheidet automatisch, wann das Internet für aktuellere oder genauere Informationen durchsucht werden soll.

Claude liefert direkte Quellenangaben für webbasierte Informationen, sodass Nutzer Quellen einfach überprüfen können.

Die Funktion ist jetzt für alle zahlenden Claude-Nutzer in den USA verfügbar, mit geplanter Erweiterung für internationale und kostenlose Nutzer in naher Zukunft.

Nutzer können auf die Funktion auch zugreifen, indem sie das 'Web Search'-Tool in den Profileinstellungen der Plattform aktivieren.

Warum es wichtig ist

Es ist schwer zu glauben, dass es so lange gedauert hat, bis Claude Zugang zum Web erhielt. Aber Anthropics Modelle gehören zu den leistungsfähigsten auf dem Markt - und der Zugang zu Echtzeitinformationen könnte spezifischere Suchalternativen wie Perplexity komplett untergraben.

OpenAIs Sprach-KI mit Persönlichkeitsschub

21.03.2025    KI

OpenAI hat seine nächste Generation API-basierter Audiomodelle für Text-zu-Sprache und Sprache-zu-Text veröffentlicht, die es Entwicklern ermöglichen, KI-Sprechstile über Text anzupassen.
Im Detail:

Das neue gpt-4o-mini-tts-Modell passt seinen Sprechstil basierend auf einfachen Textaufforderungen an - wie "sprich wie ein Pirat" oder "verwende eine Gutenachtgeschichten-Stimme".

Die GPT-4o-transcribe Sprache-zu-Text-Modelle erreichen Spitzenleistungen in Genauigkeits- und Zuverlässigkeitstests und übertreffen bestehende Whisper-Modelle.

OpenAI veröffentlichte auch openai.fm, eine öffentliche Demo-Plattform, auf der Nutzer verschiedene Sprechstile testen und die neuen Modelle aus erster Hand erleben können.

Die Modelle sind über OpenAIs API verfügbar, mit Integrationsunterstützung durch das Agents SDK für Entwickler, die sprachfähige KI-Assistenten erstellen.

Warum es wichtig ist

KI-Sprachagenten werden bald in alle möglichen Anwendungen und Plattformen integriert - und die Möglichkeit, Ausgaben mit Textbefehlen anzupassen, ist ein massiver Fortschritt für vielfältigere, natürlichere KI-Interaktionen. Allerdings scheinen diese OpenAI-Demos noch nicht so menschlich wie Sprachrivalen wie Sesame und ElevenLabs, zumindest vorerst.

Apple strukturiert KI-Führung inmitten Siri-Krise um

21.03.2025    KI

Apple nimmt laut Bloomberg-Insider Mark Gurman große Änderungen in seiner KI-Führung vor - Vision Pro-Schöpfer Mike Rockwell übernimmt die Siri-Entwicklung, um die verzögerten KI-Funktionen zu beschleunigen.
Im Detail:

Siris bedeutendste KI-Upgrades, einschließlich der mit dem iPhone 16-Marketing angeteaserten Personalisierungsfunktionen, haben Verzögerungen erfahren, ohne absehbaren Veröffentlichungszeitplan.

Rockwell wird nun direkt an Softwarechef Craig Federighi berichten und Siri komplett aus der Aufsicht des derzeitigen KI-Leiters John Giannandrea herausnehmen.

Eine kürzlich durchgeführte interne Bewertung ergab erhebliche Probleme bei der Siri-Entwicklung, wobei Teamleiter verpasste Fristen und Implementierungshürden offenlegten.

Die Änderungen folgen auf Diskussionen bei Apples exklusivem jährlichen Führungsgipfel, bei dem die KI-Strategie als kritische Priorität hervorging.

Warum es wichtig ist

Apples KI-Ära war bisher ein Desaster - mit Apple Intelligence, das einst als wichtiger Treiber für die Massenadoption galt, entpuppte sich als eine Reihe von Überversprechungen, die nicht annähernd an die Fähigkeiten heranreichen, die anderswo in der Branche zu sehen sind. Eine Umstrukturierung ist eindeutig notwendig, aber es ist ein großes Schiff, das es zu wenden gilt.

Studie: KI-Fähigkeiten folgen dem "Moore'schen Gesetz"

20.03.2025    KI

Forscher bei METR haben neue Daten veröffentlicht, die zeigen, dass sich die Länge der Aufgaben, die KI-Agenten autonom bewältigen können, seit 2019 etwa alle 7 Monate verdoppelt hat.
Im Detail:

Die Studie verglich menschliche und KI-Leistungen bei 170 Softwareaufgaben, von 2-Sekunden-Entscheidungen bis zu 8-Stunden-Ingenieurherausforderungen.

Top-Modelle wie 3.7 Sonnet haben einen "Zeithorizont" von 59 Minuten - sie bewältigen Aufgaben, die für qualifizierte Menschen so lange dauern, mit mindestens 50% Zuverlässigkeit.

Ältere Modelle wie GPT-4 können Aufgaben bewältigen, die etwa 8-15 Minuten menschliche Zeit erfordern, während Systeme von 2019 mit allem jenseits weniger Sekunden kämpfen.

Wenn der exponentielle Trend anhält, werden KI-Systeme bis 2030 in der Lage sein, monatelange menschenäquivalente Projekte mit angemessener Zuverlässigkeit abzuschließen.

Warum es wichtig ist

Die Entdeckung eines vorhersagbaren Wachstumsmusters bei KI-Fähigkeiten bietet ein wichtiges Prognosewerkzeug für die Branche. Systeme, die viel längere und komplexere Aufgaben selbstständig bewältigen können, werden die Art und Weise, wie Unternehmen weltweit KI und Automatisierung angehen, völlig neu gestalten.

Nvidias Open-Source-Reasoning-Modelle

20.03.2025    LLM

Nvidia hat seine Llama Nemotron Familie von Open-Source-Reasoning-Modellen veröffentlicht, die die Einführung von agentischer KI in Unternehmen beschleunigen sollen.
Im Detail:

Die neue Modellfamilie kommt in drei Größen: Nano (8B), Super (49B) und Ultra (249B) - jede für verschiedene Einsatzszenarien optimiert.

Frühe Benchmarks zeigen beeindruckende Leistungen, wobei die Super-Version sowohl Llama 3.3 als auch DeepSeek V1 in STEM- und Tool-Tests übertrifft.

Die Modelle verfügen über einen Schalter, der es KI-Systemen ermöglicht, je nach Aufgabe zwischen intensivem Reasoning und direkten Antworten zu wechseln.

Das Post-Training führte zu 20% besserer Genauigkeit als Basis-Llama-Modelle und 5-fach höherer Geschwindigkeit als konkurrierende offene Reasoning-Modelle.

Warum es wichtig ist

Nvidias Reasoning-Modelle mögen von der Fülle an Veröffentlichungen der letzten 48 Stunden überschattet werden, aber der Chip-Gigant hat scheinbar jeden notwendigen Baustein geschaffen, um über den gesamten KI-Stack hinweg eine treibende Kraft zu sein - von der fortschrittlichsten Hardware bis hin zu hochwertigen Reasoning-Modellen, die für die agentische Ära bereit sind.

Nvidias Fortschritte in KI und Robotik

19.03.2025    Tech

Jensen Huang eröffnete die GTC 2025 von Nvidia mit einer zweistündigen Keynote, die er als „Super Bowl der KI“ bezeichnete, und enthüllte spannende Updates zu neuen Chips, Robotik, autonomen Fahrzeugen und mehr.
Im Detail:

Nvidias neue GPU-Reihe umfasst Blackwell Ultra (Ende 2025), Vera Rubin (2026) und Feynman (2028), die jeweils erhebliche Leistungssteigerungen versprechen.

Huang betonte, dass das Wachstum nicht nachlässt und der Rechenbedarf für KI „100-mal höher ist, als wir letztes Jahr dachten“.

Isaac GR00T N1, das erste offene humanoide Roboter-Foundation-Modell, wurde zusammen mit einem umfassenden physischen KI-Datensatz zur Roboterschulung vorgestellt.

Neue Produkte wie DGX Spark und DGX Station bringen KI-Rechenleistung auf Rechenzentrumsniveau zu persönlichen Workstations.

Nvidia präsentierte außerdem Newton, eine Robotik-Physik-Engine, in Zusammenarbeit mit Google DeepMind und Disney.

Warum es wichtig ist

Laut Huang befindet sich die KI an einem Wendepunkt. Die Ankündigungen zeigen Nvidias umfassende Infrastruktur für KI in nahezu jeder Branche – ein klares Zeichen dafür, dass das Wachstum von KI nicht so schnell abflacht.

Adobes Armee von Enterprise-KI-Agenten

19.03.2025    KI

Adobe hat eine umfassende Strategie für KI-Agenten vorgestellt, die auf dem neuen Experience Platform Agent Orchestrator basiert und zehn spezialisierte Agenten für Unternehmensaufgaben wie Kundenerlebnisse und Marketing-Workflows einführt.
Im Detail:

Die Plattform umfasst Agenten für Zielgruppenansprache, Content-Produktion, Website-Optimierung und B2B-Kontoverwaltung innerhalb von Adobes Unternehmensanwendungen.

Ein „Brand Concierge“ hilft Unternehmen bei der Erstellung personalisierter Chat-Erlebnisse, wobei der Traffic von KI-Plattformen zu Einzelhandelsseiten im Februar um 1.200 % gestiegen ist.

Der Adobe Marketing Agent integriert sich auch mit Microsoft 365 Copilot und ermöglicht Teams den Zugriff auf Adobes Fähigkeiten direkt in Microsoft-Anwendungen.

Adobe hat Partnerschaften mit AWS, Microsoft, SAP und ServiceNow geschlossen, um die Arbeit der Agenten über Drittanbieter-Systeme hinweg zu ermöglichen.

Warum es wichtig ist

Adobes Ansatz zeigt das Potenzial von KI-Agenten zur Neugestaltung von Unternehmensabläufen. Doch in einem zunehmend überfüllten Markt muss Adobe beweisen, dass seine Agenten mehr als nur Versprechungen liefern können.

Anthropic testet neue Sprachfunktionen

19.03.2025    LLM

Anthropic plant Berichten zufolge die Einführung eines Sprachmodus für seine Claude-Plattform und konzentriert sich dabei verstärkt auf Unternehmen und Geschäftskunden statt auf den Massenmarkt.
Im Detail:

CPO Mike Krieger erklärte, dass das Unternehmen Nutzer ansprechen möchte, die „den ganzen Tag in Meetings oder in Excel oder Google Docs verbringen“, mit Funktionen zur Optimierung von Arbeitsabläufen.

Eine neue Funktion wird Kalender analysieren und detaillierte Kundenberichte aus internen und externen Daten erstellen – speziell für Meeting-Vorbereitungen entwickelt.

Krieger verriet zudem, dass bereits Prototypen für Sprachfunktionen von Claude existieren und nannte sie eine „nützliche Modalität“.

Das Unternehmen hat angeblich Partnerschaften mit Amazon und ElevenLabs geprüft, um den Start der Sprachfunktionen zu beschleunigen.

Warum es wichtig ist

Anthropics Modelle gehören zu den besten der Branche. Mit dem Fokus auf das lukrative Unternehmenssegment zielt das Unternehmen darauf ab, Premiumpreise für Produktivitätssteigerungen zu rechtfertigen.

Roblox veröffentlicht Open-Source 3D-Generierungs-KI

18.03.2025    KI

Roblox hat Cube 3D angekündigt, ein neues Open-Source-KI-System zur Generierung von 3D-Objekten und -Szenen aus Textbefehlen, zusammen mit einer Reihe anderer Tools für KI-unterstützte Spieleentwicklung.
Im Detail:

Cube 3D generiert vollständige, funktionale 3D-Objekte aus Textbefehlen und trainiert auf nativen 3D-Daten statt traditioneller bildbasierter Rekonstruktion.

Entwickler können Assets durch einfache Befehle wie "/generate motorcycle" erstellen, wobei in Zukunft auch Bildeingabemöglichkeiten hinzukommen werden.

Cube verwendet '3D-Tokenisierung', um Formen auf die gleiche Weise vorherzusagen und zu generieren wie Sprachmodelle Text vorhersagen, was zukünftige 4D-Szenengenerierungsfähigkeiten ermöglicht.

Roblox veröffentlichte auch Updates für seine Studio-Content-Creation-Suite, einschließlich verbesserter Leistung, Echtzeit-Kollaborationsfunktionen und Monetarisierungstools.

Warum es wichtig ist

Mit diesen KI-Tools wird es einfacher denn je, ein Spiel von der Idee zur Realität zu bringen. Mit über 85 Millionen täglich aktiven Nutzern werden diese KI-Tools sowohl Roblox' Wachstum als auch die Fähigkeit der Nutzer, auf der Plattform zu bauen und zu monetarisieren, enorm steigern.

Zooms KI-Assistent wird agentisch

18.03.2025    KI

Zoom kündigte ein großes Upgrade seines KI-Assistenten an, mit neuen agentischen Fähigkeiten, die es dem Assistenten ermöglichen, Aufgaben im gesamten Ökosystem der Plattform zu identifizieren und auszuführen.
Im Detail:

Der KI-Assistent erhält neue Gedächtnis- und Argumentationsfähigkeiten, um Probleme zu lösen und die richtigen agentischen Tools für jede Aufgabe einzusetzen.

Zoom Tasks erkennt und führt automatisch Aktionspunkte aus Meetings aus, plant Nachbesprechungen oder generiert Dokumente ohne Benutzereingriff.

Weitere neue Funktionen umfassen Kalenderverwaltung, Clip-Generierung, Schreibhilfe, Transkriptionen von Sprachaufnahmen und Live-Notizen für Meetings.

Ein neues Custom AI Companion Add-on für 12 $/Monat wird im April eingeführt und bietet persönliche KI-Coaches, KI-Avatare für Videonachrichten und mehr.

Warum es wichtig ist

Zoom hat sich 2024 vollständig auf 'KI-first' ausgerichtet, daher überrascht es nicht, dass es nun mit automatisierten Workflows und Aufgaben auf der Plattform in den agentischen Bereich eintritt. Dies könnte der erste Schritt in Richtung KI-Doppelgänger sein, die an Meetings teilnehmen können.

Googles KI-Satellit zur frühzeitigen Erkennung von Waldbränden

18.03.2025    Tech

Google Research und Muon Space haben den ersten KI-gesteuerten FireSat-Satelliten gestartet, der leistungsstarke Tools zur frühzeitigen Erkennung von Waldbränden bietet und Feuer so klein wie ein Klassenzimmer innerhalb von Minuten nach der Entzündung erkennen kann.
Im Detail:

Die aktuelle Waldbranderkennung basiert auf selten aktualisierten, niedrig aufgelösten Bildern, die Brände oft erst erkennen, wenn sie mehrere Hektar groß sind.

Mit Infrarotsensoren und KI-Analyse aus dem Weltraum kann FireSat Brände so klein wie 5x5 Meter erkennen - deutlich kleiner als aktuelle Satellitensysteme.

Der Satellit ist der erste von mehr als 50 geplanten für die gesamte FireSat-Konstellation, die fast die gesamte Erdoberfläche alle 20 Minuten scannen wird.

Nach vollständiger Implementierung wird das System eine globale historische Aufzeichnung des Brandverhaltens erstellen, um Wissenschaftlern zu helfen, Waldbrandmuster besser zu verstehen und zu modellieren.

Warum es wichtig ist

Waldbrandsaisons intensivieren sich weltweit, und frühe Erkennung kann den Unterschied zwischen einer kleinen Eindämmung und einem katastrophalen Ereignis ausmachen. Zusätzlich zu den Echtzeitdaten für Notfalldienste wird FireSat auch das wissenschaftliche Verständnis für effizientere Brandbekämpfung vorantreiben.

Baidu startet ultra-günstige KI-Modelle

17.03.2025    LLM

Der chinesische Tech-Gigant Baidu hat zwei aggressiv günstige multimodale KI-Modelle veröffentlicht - ERNIE 4.5 und das neue Ernie X1.
Im Detail:

ERNIE 4.5 zeichnet sich durch verbesserte "EQ" und Sprachfähigkeiten sowie verbesserte Halluzinationsprävention, logisches Denken und Coding-Fähigkeiten aus.

Laut Baidu übertrifft ERNIE 4.5 GPT-4o in mehreren Benchmarks, kostet aber nur 1% des Preises - etwa 0,55 $ und 2,20 $ pro Million Input- und Output-Token.

ERNIE X1, Baidus erstes Reasoning-Modell, entspricht den Fähigkeiten des chinesischen Konkurrenten DeepSeek R1 zum halben Preis.

Wie DeepSeek's R1 verwendet ERNIE X1 einen schrittweisen "Denkansatz" und überzeugt bei komplexen Berechnungen und Aufgaben wie Dokumentenverständnis.

Warum es wichtig ist

China baut weiterhin KI-Intelligenz zu extrem niedrigen Kosten auf. Mit ERNIE 4.5 zu 1% der Kosten von GPT 4.5 und ERNIE X1, das DeepSeek's R1 zum halben Preis entspricht, erleben wir wahrscheinlich den Beginn eines globalen KI-Preiskriegs. Diese Strategie könnte westliche Konkurrenten zu Preissenkungen zwingen und den Zugang zu fortschrittlicher KI weltweit demokratisieren.

Harvard-Team entwickelt KI-Agent für personalisierte Medizin

17.03.2025    KI

Forscher von Harvard und MIT haben TxAgent vorgestellt, einen KI-Agenten, der mehrstufiges Reasoning und Echtzeit-Abruf biomedizinischen Wissens nutzt, um vertrauenswürdige, personalisierte Behandlungsempfehlungen für Patienten zu generieren.
Im Detail:

TxAgent verwendet 211 spezialisierte Tools zur Analyse von Arzneimittelinteraktionen und Kontraindikationen und schlägt patientenspezifische Behandlungen in Echtzeit vor.

Es bewertet Medikamente auf molekularer, pharmakokinetischer und klinischer Ebene und identifiziert Risiken basierend auf Komorbiditäten, laufenden Medikationen, Alter und genetischen Faktoren.

Das System synthetisiert Erkenntnisse aus biomedizinischen Quellen und verfeinert Empfehlungen durch strukturierte Funktionsaufrufe.

TxAgents Toolkit ist als "ToolUniverse" verfügbar und nutzt vertrauenswürdige Datenquellen wie openFDA und Open Targets, um validierte medizinische Erkenntnisse sicherzustellen.

Warum es wichtig ist

TxAgent markiert einen wichtigen Schritt in der personalisierten Medizin und bietet Ärzten einen KI-gestützten Assistenten für sicherere und maßgeschneidertere Behandlungen. Mit optimierten Vorschlägen kann dieses System auch medizinische Konsultationen beschleunigen, insbesondere in Entwicklungsregionen mit bereits überlasteten Gesundheitssystemen.

OpenAI drängt auf bundesweiten Schutz im KI-Aktionsplan

15.03.2025    KI

OpenAI hat eine 15-seitige Eingabe für den KI-Aktionsplan des Weißen Hauses veröffentlicht und fordert den Schutz von KI-Unternehmen vor staatlichen Regulierungen im Austausch für bundesweite Aufsicht.
Im Detail:

OpenAI warnt, dass 781 auf Staatsebene eingeführte KI-Gesetzentwürfe die amerikanische Innovation und Wettbewerbsfähigkeit gegenüber Chinas KI-Ambitionen behindern könnten.

Der Vorschlag umfasst zusätzliche Forderungen nach Infrastrukturinvestitionen, Urheberrechtsreform und erweitertem Zugang zu staatlichen Datensätzen für die KI-Entwicklung.

Sie kritisierten insbesondere Chinas "ungehinderten Zugang zu Daten" und bezeichneten das Rennen um KI als "effektiv beendet", wenn in den USA keine Fair-Use-Urheberrechtsgesetze angewendet werden.

OpenAI drängte auch darauf, dass die US-Regierung Modelle wie DeepSeek aufgrund von Sicherheitsrisiken verbietet und bezeichnete das Labor als "staatlich kontrolliert".

Warum es wichtig ist

Zwischen seinem 500-Milliarden-Dollar-Stargate-Projekt und wachsendem Einfluss in Washington rivalisieren OpenAIs regulatorische Ambitionen nun mit seinen technischen. Aber der Vorstoß für Ausnahmen von staatlichen Gesetzen bei gleichzeitiger Befürwortung der Einschränkung von Open-Source-Konkurrenten kommt zu einem ungünstigen Zeitpunkt angesichts der starken Kritik an Closed-Source-Modellen und Urheberrechtsstreitigkeiten.

Coheres neues effizientes Unternehmens-KI-Modell

15.03.2025    LLM

Cohere hat gerade Command A vorgestellt, ein neues unternehmensorientiertes KI-Modell, das die Leistung der Top-Konkurrenten erreicht, während es auf nur zwei GPUs läuft - es verfügt auch über starke mehrsprachige Fähigkeiten und ein großes Kontextfenster.
Im Detail:

Command A erreicht 156 Token pro Sekunde und läuft 1,75-mal schneller als GPT-4o und 2,4-mal schneller als DeepSeek-V3, während es nur zwei GPUs benötigt.

Coheres Modell übertrifft oder erreicht GPT-4o und DeepSeek-V3 in menschlichen Bewertungen für Geschäfts-, MINT-, Coding- und agentische Aufgaben.

Das Modell verfügt über ein 256k Kontextfenster, Unterstützung für 23 Sprachen und spezialisierte Unternehmensfunktionen wie erweiterte RAG-Fähigkeiten.

Command A wird auch in Coheres North-Plattform integriert, sodass Unternehmen Agenten sicher mit ihren eigenen internen Datenbanken einsetzen können.

Warum es wichtig ist

Ein Großteil des KI-Bereichs jagt höheren Benchmarks nach, aber Coheres Effizienz-Push könnte reif für die Unternehmensadoption sein. Die Fähigkeit, wettbewerbsfähige, agentische KI-Funktionen auf minimaler Hardware auszuführen, senkt nicht nur die Kosten, sondern macht auch private Implementierungen praktischer für Unternehmen, die sich um Datensicherheit sorgen.

Gemini greift mit Personalisierung auf Google-Verlauf zu

14.03.2025    LLM

Google hat gerade neue Personalisierungsfunktionen für seinen Gemini KI-Assistenten veröffentlicht, die es der KI ermöglichen, auf den Suchverlauf der Nutzer und später auch auf andere Google-Apps zuzugreifen, um maßgeschneidertere Antworten und kontextuell bewusste Gespräche zu liefern.
Im Detail:

Die experimentelle Funktion verwendet das Gemini 2.0 Flash Thinking-Modell, um zu analysieren, wann persönliche Daten die Antworten verbessern könnten.

Google beginnt mit dem Suchverlauf der Nutzer und plant, dies auf Apps wie Google Fotos und YouTube für zusätzliche Dateneinblicke auszuweiten.

Nutzer behalten die Kontrolle durch Opt-in-Berechtigungen und die Möglichkeit, ihren Verlauf jederzeit zu trennen, wobei die Funktion auf Nutzer über 18 Jahre beschränkt ist.

Kostenlose Nutzer können jetzt auch auf Gems (benutzerdefinierte Chatbots) und verbesserte Deep Research-Funktionen zugreifen, die zuvor Advanced-Abonnenten vorbehalten waren.

Warum es wichtig ist

Google nutzt sein riesiges Netz von Nutzerdaten, um ein personalisiertes Erlebnis zu schaffen - was auch mit dem heiklen Balanceakt einhergeht, persönliche Informationen zu nutzen, ohne das Vertrauen der Nutzer zu verletzen. Aber mit prominenten Opt-ins und einer Nutzerbasis, die bereits daran gewöhnt ist, über Apps zu verbinden, ist Google gut positioniert, um dies zu bewältigen.

Gemini Flash erhält neue Bildfähigkeiten

13.03.2025    LLM

Google hat neue experimentelle Bildgenerierungsfähigkeiten für sein Gemini 2.0 Flash-Modell veröffentlicht, die es Nutzern ermöglichen, Bilder direkt aus dem Sprachmodell hochzuladen, zu erstellen und zu bearbeiten, ohne ein separates Bildgenerierungssystem zu benötigen.
Im Detail:

Ein 2.0-flash-exp-Modell ist über API und im Google AI Studio verfügbar und unterstützt sowohl Bild- als auch Textausgaben sowie Bearbeitung über Textkonversation.

Gemini nutzt Reasoning und eine multimodale Grundlage, um Charakterkonsistenz zu wahren und reale Konzepte während eines Gesprächs zu verstehen.

Zum Beispiel können Sie es auffordern, eine Geschichte mit Bildern zu generieren und dann durch natürlichen Dialog zur perfekten Version führen.

Google sagt, dass Flash 2.0 auch bei der Textwiedergabe im Vergleich zu Konkurrenten hervorragend ist und Anzeigen, Social-Media-Beiträge und andere textlastige Designgenerationen ermöglicht.

Warum es wichtig ist

Dieses Upgrade ist ein wichtiger Schritt in der Veränderung, wie KI visuelle Inhalte generiert - weg von dedizierten Bildmodellen hin zu Sprachmodellen, die sowohl Text als auch Bilder nativ verstehen. So wie die natürliche Sprachsteuerung andere Bereiche übernommen hat, scheint die Bildbearbeitung als nächstes auf der Liste zu stehen.

OpenAI drängt auf bundesweiten Schutz im KI-Aktionsplan

13.03.2025    KI

OpenAI hat seine 15-seitige Eingabe für die Anfrage des Weißen Hauses nach öffentlichen Beiträgen zum KI-Aktionsplan veröffentlicht und fordert den Schutz von KI-Unternehmen vor staatlichen Regulierungen im Austausch für bundesweite Aufsicht.
Im Detail:

OpenAI warnt, dass die 781 in diesem Jahr eingeführten KI-Gesetzentwürfe auf Staatsebene die amerikanische Innovation und Wettbewerbsfähigkeit gegenüber Chinas KI-Ambitionen behindern könnten.

Der Vorschlag beinhaltet zusätzliche Forderungen nach Infrastrukturinvestitionen, Urheberrechtsreform und erweitertem Zugang zu staatlichen Datensätzen für die KI-Entwicklung.

Sie wiesen insbesondere auf Chinas "ungehinderten Zugang zu Daten" hin und bezeichneten das Rennen um KI als "effektiv beendet", wenn in den USA keine Fair-Use-Urheberrechtsgesetze angewendet werden.

OpenAI drängte auch darauf, dass die US-Regierung Modelle wie DeepSeek aufgrund von Sicherheitsrisiken verbietet und bezeichnete das Labor als "staatlich kontrolliert".

Warum es wichtig ist

Zwischen seinem 500-Milliarden-Dollar-Stargate-Projekt und wachsendem Einfluss in Washington rivalisieren OpenAIs regulatorische Ambitionen nun mit seinen technischen. Aber der Vorstoß für Ausnahmen von staatlichen Gesetzen bei gleichzeitiger Befürwortung der Einschränkung von Open-Source-Konkurrenten kommt zu einem ungünstigen Zeitpunkt angesichts der starken Kritik an Closed-Source-Modellen und Urheberrechtsstreitigkeiten.

Coheres neues effizientes Unternehmens-KI-Modell

13.03.2025    LLM

Cohere hat gerade Command A vorgestellt, ein neues unternehmensorientiertes KI-Modell, das die Leistung der Top-Konkurrenten erreicht, während es auf nur zwei GPUs läuft - es verfügt auch über starke mehrsprachige Fähigkeiten und ein großes Kontextfenster.
Im Detail:

Command A erreicht 156 Token pro Sekunde und läuft 1,75-mal schneller als GPT-4o und 2,4-mal schneller als DeepSeek-V3, während es nur zwei GPUs benötigt.

Coheres Modell übertrifft oder erreicht GPT-4o und DeepSeek-V3 in menschlichen Bewertungen für Geschäfts-, MINT-, Coding- und agentische Aufgaben.

Das Modell verfügt über ein 256k Kontextfenster, Unterstützung für 23 Sprachen und spezialisierte Unternehmensfunktionen wie erweiterte RAG-Fähigkeiten.

Command A wird auch in Coheres North-Plattform integriert, sodass Unternehmen Agenten sicher mit ihren eigenen internen Datenbanken einsetzen können.

Warum es wichtig ist

Ein Großteil des KI-Bereichs jagt höheren Benchmarks nach, aber Coheres Effizienz-Push könnte reif für die Unternehmensadoption sein. Die Fähigkeit, wettbewerbsfähige, agentische KI-Funktionen auf minimaler Hardware auszuführen, senkt nicht nur die Kosten, sondern macht auch private Implementierungen praktischer für Unternehmen, die sich um Datensicherheit sorgen.

Gemini greift mit Personalisierung auf Google-Verlauf zu

13.03.2025    LLM

Google hat gerade neue Personalisierungsfunktionen für seinen Gemini KI-Assistenten veröffentlicht, die es der KI ermöglichen, auf den Suchverlauf der Nutzer und später auch auf andere Google-Apps zuzugreifen, um maßgeschneidertere Antworten und kontextuell bewusste Gespräche zu liefern.
Im Detail:

Die experimentelle Funktion verwendet das Gemini 2.0 Flash Thinking-Modell, um zu analysieren, wann persönliche Daten die Antworten verbessern könnten.

Google beginnt mit dem Suchverlauf der Nutzer und plant, dies auf Apps wie Google Fotos und YouTube für zusätzliche Dateneinblicke auszuweiten.

Nutzer behalten die Kontrolle durch Opt-in-Berechtigungen und die Möglichkeit, ihren Verlauf jederzeit zu trennen, wobei die Funktion auf Nutzer über 18 Jahre beschränkt ist.

Kostenlose Nutzer können jetzt auch auf Gems (benutzerdefinierte Chatbots) und verbesserte Deep Research-Funktionen zugreifen, die zuvor Advanced-Abonnenten vorbehalten waren.

Warum es wichtig ist

Google nutzt sein riesiges Netz von Nutzerdaten, um ein personalisiertes Erlebnis zu schaffen - was auch mit dem heiklen Balanceakt einhergeht, persönliche Informationen zu nutzen, ohne das Vertrauen der Nutzer zu verletzen. Aber mit prominenten Opt-ins und einer Nutzerbasis, die bereits daran gewöhnt ist, über Apps zu verbinden, ist Google gut positioniert, um dies zu bewältigen.

McDonald's KI-gestützte Restaurants

11.03.2025    KI

McDonald's transformiert seine 43.000 Restaurants weltweit durch den Einsatz von KI-Systemen, die von der Wartung der Geräte bis zur Verbesserung der Bestellgenauigkeit reichen.
Im Detail:

McDonald's setzt Edge-Computing-Systeme in Zusammenarbeit mit Google Cloud ein, um Echtzeitdatenverarbeitung und KI-Analysen direkt vor Ort zu ermöglichen.

Geplante KI-Funktionen umfassen prädiktive Wartung für Küchengeräte, Computer Vision zur Bestellgenauigkeit und einen „generativen KI-virtuellen Manager“.

Die Initiative zielt darauf ab, Kundenprobleme zu lösen und Mitarbeiter bei der Verwaltung mehrerer Bestellkanäle wie Drive-in und Lieferung zu unterstützen.

McDonald's plant außerdem, Kundendaten und KI zu nutzen, um personalisierte Angebote wie McFlurry-Deals an heißen Tagen basierend auf Kaufhistorie zu erstellen.

Warum es wichtig ist

Mit 70 Millionen täglichen Kunden können selbst kleine Probleme große Herausforderungen darstellen. Durch die Integration von KI in seine umfangreichen Abläufe kann McDonald's die Effizienz steigern – ein Schritt, dem andere Fast-Food-Ketten wie Taco Bell und Wendy's wahrscheinlich folgen werden.

Foxconn präsentiert „FoxBrain“: Eigene KI mit Reasoning

11.03.2025    KI

Der iPhone-Hersteller Foxconn hat FoxBrain vorgestellt, sein erstes großes Sprachmodell mit fortgeschrittenen Reasoning-Fähigkeiten, das in nur vier Wochen mithilfe von Nvidia-Infrastruktur entwickelt wurde.
Im Detail:

FoxBrain wurde auf 120 Nvidia H100 GPUs unter Nutzung von Taiwans größtem Supercomputer Taipei-1 trainiert, mit technischer Unterstützung von Nvidia.

Das Modell basiert auf Metas Llama 3.1-Architektur und ist das erste Modell in Taiwan mit fortgeschrittenem Reasoning, optimiert für traditionelles Chinesisch.

Es bewältigt Aufgaben wie Datenanalyse, Mathematik, Reasoning und Codegenerierung und erreicht eine Leistung nahe führender Modelle (wenn auch hinter DeepSeek).

Foxconn plant, FoxBrain als Open Source verfügbar zu machen und mit Partnern zusammenzuarbeiten, um Anwendungen in Fertigung und Lieferkettenmanagement voranzutreiben.

Warum es wichtig ist

Wenn ein iPhone-Hersteller in nur vier Wochen ein fortgeschrittenes Reasoning-Modell entwickeln kann, zeigt dies das Potenzial spezialisierter KI. Insbesondere Fertigung und Lieferkettenmanagement sind Bereiche, die perfekt für eine KI-Überarbeitung geeignet sind.

Ex-OpenAI-Wissenschaftler auf neuem Weg zur ASI

11.03.2025    Tech

Das Startup Safe Superintelligence Inc. (SSI) des ehemaligen OpenAI-Chefwissenschaftlers Ilya Sutskever sammelt Berichten zufolge 2 Milliarden USD bei einer Bewertung von 30 Milliarden USD ein. Sutskever deutet einen anderen Ansatz zur Erreichung fortschrittlicher KI an als alle anderen Konkurrenten.
Im Detail:

Sutskever soll Investoren mitgeteilt haben, dass er eine völlig neue Richtung für die KI-Entwicklung identifiziert hat, die er als "einen anderen Berg, den es zu erklimmen gilt" beschreibt.

Laut Wall Street Journal verhandelt SSI über eine Finanzierung bei einer Bewertung von 30 Milliarden USD, obwohl das Unternehmen keine Einnahmen oder öffentlich zugängliche Produkte hat.

Das Unternehmen plant nicht, vor dem Erreichen der Superintelligenz kommerzielle Produkte zu veröffentlichen und arbeitet schlank mit nur 20 Mitarbeitern.

Sutskever verließ OpenAI in den Monaten nach der Absetzung von Sam Altman im November 2023 und sagte später, er "bereue seine Beteiligung" an den Aktionen des Vorstands.

Warum es wichtig ist

SSI hat trotz fehlender unmittelbarer Pläne für ein umsatzgenerierendes Produkt keinen Mangel an Investoren. Ein konträrer Einsatz auf einen völlig neuen Weg könnte jedoch neu definieren, wie wir über das Erreichen von ASI denken - wobei der nächste Durchbruch möglicherweise aus einer Neugestaltung der KI-Grundlagen kommt, anstatt nur weiterhin Modelle zu skalieren.

Microsoft strebt über OpenAI hinaus

11.03.2025    Tech

Microsoft entwickelt Berichten zufolge MAI, eine neue Familie von KI-Modellen, die mit aktuellen Branchenführern konkurriert. Gleichzeitig baut das Unternehmen eigene interne Reasoning-Modelle auf, um die Abhängigkeit von OpenAI für seine Copilot-Suite zu reduzieren.
Im Detail:

Die neuen MAI-Modelle sollen mit den Top-Angeboten von OpenAI und Anthropic mithalten können, wobei das Unternehmen plant, sie über Azure anzubieten.

Sie werden als Ersatz für OpenAIs Technologie in Copilot getestet, während auch Alternativen von xAI, Meta und DeepSeek erprobt werden.

Microsoft AI CEO Mustafa Suleyman soll im letzten Herbst frustriert gewesen sein über OpenAIs Weigerung, die inneren Abläufe seines o1-Reasoning-Modells zu teilen.

OpenAI hat im Januar auch einen Deal mit Microsoft neu verhandelt, der die Nutzung anderer Server-Anbieter erlaubt, was die wachsende Spannung zwischen den Unternehmen verstärkt.

Warum es wichtig ist

Trotz Microsofts 13-Milliarden-USD-Investment in OpenAI fühlte sich die Beziehung lange Zeit angespannt an. Während sich der Tech-Gigant möglicherweise verpflichtet fühlte, als OpenAI ein klarer Marktführer war, hat der Wettbewerb deutlich zugenommen - und ein internes Konkurrenzmodell würde die Dynamik sicherlich noch mehr verändern.

Stanford KI: Durchbruch bei Adipositas-Behandlung

11.03.2025    KI

Stanford-Forscher haben gerade ein natürliches Molekül namens BRP entdeckt, das die gewichtsreduzierende Wirkung von Ozempic erreicht, aber mit weniger Nebenwirkungen - unter Einsatz von KI, um einen potenziellen Durchbruch in der Adipositas-Behandlung zu erzielen.
Im Detail:

BRP zielt auf spezifische Hirnregionen ab, anstatt mehrere Organe zu beeinflussen, und vermeidet so möglicherweise häufige Ozempic-Nebenwirkungen wie Übelkeit und Muskelverlust.

In Tierversuchen reduzierte eine einzige Dosis BRP die Nahrungsaufnahme bei Mäusen und Minischweinen um die Hälfte, wobei übergewichtige Mäuse in zwei Wochen Behandlung signifikant Fett verloren.

Stanfords KI-System "Peptide Predictor" durchforstete 20.000 menschliche Gene und analysierte Tausende potenzieller Kandidaten, um das natürliche Molekül zu finden.

Es wurde bereits ein Unternehmen gegründet, um mit menschlichen Studien zu beginnen. Forscherin Katrin Svensson deutet an, dass BRP die Behandlung von Übergewicht revolutionieren könnte.

Warum es wichtig ist

Während sich der KI-Gesundheitshype bisher auf Diagnose und Medikamentendesign konzentrierte, zeigt Stanfords Durchbruch, wie KI neue, in der Natur verborgene Medikamente erschließen kann. Dieser Erfolg bei der Findung einer natürlichen Alternative zu einem Blockbuster-Medikament könnte eine Welle von KI-gestützten Entdeckungen in unserer Biologie auslösen.

Mistral OCR: KI-gestützte Dokumentenverarbeitung

07.03.2025    LLM

Mistral AI hat Mistral OCR vorgestellt, eine leistungsstarke neue API zur Extraktion und zum Verständnis detaillierter Informationen aus komplexen Dokumenten mit außergewöhnlicher Geschwindigkeit und Genauigkeit.
Im Detail:

Die API kann Dokumente mit Bildern, Gleichungen, Tabellen und fortgeschrittener Formatierung präzise analysieren und in Markdown-Ausgaben für die KI-Verarbeitung umwandeln.

OCR kann bis zu 2000 Seiten pro Minute verarbeiten und unterstützt mehrsprachige Analysen in Tausenden von Sprachen, einschließlich Hindi und Arabisch.

Benchmark-Tests platzieren Mistral OCR weit vor Konkurrenten wie Google's Document AI, Azure OCR und GPT-4 in verschiedenen Dokumentenanalysekategorien.

Benutzer können die OCR-Technologie auch vor Ort einsetzen, was ideal für Organisationen ist, die mit klassifizierten oder sensiblen Datensätzen arbeiten.

Warum es wichtig ist

Da ein Großteil der weltweiten Daten noch in komplexen Dokumenten gefangen ist, ist deren effiziente Erschließung entscheidend. Die Fähigkeiten von Mistral OCR könnten archivlastige Branchen wie Finanzanalyse, juristische Recherche und historische Erhaltung revolutionieren und statische Informationen in dynamische, KI-fähige Wissensbasen verwandeln.

Chinas "vollständig autonomer" Manus KI-Agent

07.03.2025    KI

Ein chinesisches Startup hat Manus vorgestellt und bezeichnet ihn als den weltweit ersten vollständig autonomen KI-Agenten, der in der Lage ist, reale Aufgaben selbstständig zu bewältigen und neue Spitzenleistungen bei agentenbasierten Benchmarks zu erzielen.
Im Detail:

In der Demo ist zu sehen, wie Manus Aufgaben wie Lebenslauf-Screening und Immobilienrecherche bewältigt und dabei auf eine eigene unabhängige Computerinstanz zugreift.

Der Agent zeigt auch Fähigkeiten wie Websurfen, Programmieren und das Erstellen von Visualisierungen, während er angeblich in der Lage ist, Aufgaben auf Plattformen wie Upwork und Fiverr zu erledigen.

Er übertraf führende Allzweck-Assistenten wie ChatGPT und Gemini im GAIA-Benchmark, einer umfassenden Bewertung der KI-Leistung.

Manus arbeitet derzeit auf Einladungsbasis - das Team hat sich verpflichtet, die Modelle hinter dem Agenten später in diesem Jahr als Open Source zu veröffentlichen.

Warum es wichtig ist

Wir befinden uns an einem Beschleunigungspunkt, an dem relativ unbekannte Labore (angeblich) hochmoderne agentenbasierte Tools auf den Markt bringen. Während die frühen Iterationen von Agenten einfachere Aufgaben bewältigten, die menschliche Unterstützung erforderten, nähern wir uns schnell dem nächsten Schritt komplexerer autonomer Arbeitsabläufe.

KI-Avatare erhalten emotionale Intelligenz

07.03.2025    LLM

Der Digital-Twin-Entwickler Tavus hat ein großes Upgrade seiner Conversational Video Interface (CVI)-Plattform vorgestellt und drei neue KI-Modelle eingeführt, die zusammenarbeiten, um Videointeraktionen mit KI menschlicher und persönlicher zu gestalten.
Im Detail:

Phoenix-3 übernimmt die vollständige Gesichtsanimation und erzeugt natürliche Gesichtsausdrücke für Avatare, einschließlich Augenbewegungen, Augenbrauen und subtiler Mikroexpressionen.

Raven-0 fungiert als die Augen des KI-Avatars und analysiert in Echtzeit Hinweise wie Körpersprache und Gesichtsausdrücke, um natürlicher auf menschliche Emotionen zu reagieren.

Sparrow-0 steuert das Timing der Konversation und eliminiert peinliche Pausen und Unterbrechungen, indem es versteht, wann es sprechen und wann es zuhören soll.

Das Unternehmen präsentierte die Technologie durch "Charlie", einen Demo-KI-Avatar, der Gespräche führen kann, während er im Web sucht, Bildschirme analysiert und mehr.

Warum es wichtig ist

Während viele über Sam Altmans Proof-of-Personhood-Startup spotteten, zeigt Technologie wie diese, wie schwierig es bald sein wird, KI von Menschen online zu unterscheiden. Die Tage, an denen sich KI-Kundendienstmitarbeiter und digitale Avatare in ihren Interaktionen roboterhaft und geskriptet anfühlten, neigen sich sehr bald dem Ende zu.

OpenAI startet Premium-KI-Agenten

06.03.2025    LLM

OpenAI plant die Einführung spezialisierter KI-Agenten mit monatlichen Preisen zwischen 2.000 und 20.000 USD für Aufgaben wie Wissensarbeit und Forschung auf Doktoratsniveau.
Im Detail:

OpenAI plant drei Agentenstufen: Geschäftsprofis (2.000 USD/Monat), fortgeschrittene Softwareentwickler (10.000 USD/Monat) und Forscher auf PhD-Niveau (20.000 USD/Monat)[1][3].

Investor SoftBank hat sich bereits verpflichtet, 3 Milliarden USD in diese Agentenprodukte für 2025 zu investieren[1].

Die Agenten-Angebote sollen bis zu 25% des langfristigen Umsatzes von OpenAI generieren[1][3].

CEO Sam Altman prognostizierte im Januar, dass 2025 die ersten KI-Agenten "in die Arbeitswelt eintreten und die Produktivität von Unternehmen erheblich verändern" würden[1].

Warum es wichtig ist

Mit Preisen, die mit Gehältern von Führungskräften konkurrieren, setzt OpenAI darauf, dass spezialisierte KI-Agenten genug Mehrwert bieten, um Enterprise-Level-Abonnements zu rechtfertigen. Dieser Schritt könnte neue Maßstäbe für die Preisgestaltung von KI-Agenten setzen und zeigen, wie viel Unternehmen bereit sind, für automatisierte Expertise zu zahlen[1][3].

Google Suche führt neuen 'KI-Modus' ein

06.03.2025    LLM

Google hat den KI-Modus eingeführt, ein Search Labs-Experiment, das traditionelle Suche in ein konversationsbasiertes Erlebnis verwandelt, angetrieben von einer angepassten Version von Gemini 2.0, zusammen mit Updates für KI-Überblicke.
Im Detail:

Der KI-Modus verwendet eine "Query Fan-out"-Technik, die gleichzeitige Suchen über verschiedene Quellen startet, um detaillierte Antworten mit relevanten Quellenangaben zusammenzustellen[4][6].

Nutzer können ihre Suche fortsetzen, indem sie direkt im KI-Modus Folgefragen stellen und gut begründete Antworten mit kuratierten Links für weitere Informationen erhalten[4][6].

Google hat auch die KI-Überblicke mit Gemini 2.0 verbessert, was die Antworten auf anspruchsvollere Themen wie Programmierung, fortgeschrittene Mathematik und multimodale Anfragen verbessert[2][6].

Das Unternehmen erweitert zudem den Zugang zu KI-Überblicken für Jugendliche und entfernt die Anmeldepflicht[4][6].

Warum es wichtig ist

Die Suche entwickelt sich im KI-Zeitalter weiter, und Google steht unter ernsthaftem Druck von Konkurrenten wie Perplexity, Grok und ChatGPT. Der neue KI-Modus soll eine Brücke zwischen vertrauten Suchinteraktionen und fortschrittlicher, konversationsbasierter KI schlagen – was zu einem potenziell komfortableren (aber dennoch leistungsstarken) Web-Erlebnis führt[2][4].

Alibabas kostengünstiges und effizientes QwQ-32B KI-Modell

06.03.2025    LLM

Alibabas Qwen-Team hat QwQ-32B veröffentlicht, ein neues KI-Reasoning-Modell, das Reinforcement Learning nutzt, um die Leistung größerer Konkurrenten wie DeepSeek-R1 zu einem Bruchteil der Kosten zu erreichen oder zu übertreffen.
Im Detail:

QwQ-32B verwendet Reinforcement Learning in großem Maßstab und steigert die Leistung bei fortgeschrittener Mathematik, Programmierung und Reasoning-basierten Aufgaben erheblich.

Das Modell ist etwa 20-mal kleiner als DeepSeek-R1, liefert aber vergleichbare oder überlegene Leistung bei wichtigen Benchmarks.

Es kostet nur 0,20 USD pro Million Ein- und Ausgabe-Tokens, was einer Reduzierung um etwa 90% im Vergleich zu ähnlich leistungsfähigen Modellen wie R1 und o1-mini entspricht.

Qwen hat das Modell unter der Apache 2.0-Lizenz als Open Source veröffentlicht, mit Verfügbarkeit auf Hugging Face und Alibaba Cloud's ModelScope-Plattform.

Warum es wichtig ist

Chinas Open-Source-Modelle beschleunigen sich weiter – wobei dieser neueste Launch von Qwen trotz geringerer Größe und Kosten einige bedeutende Leistungssteigerungen zeigt (nahezu Spitzenintelligenz auf dem Gerät ist hier). Clevere Trainingsansätze beweisen weiterhin ihren Wert gegenüber der reinen Modellgröße, während Labore sich weiter in Richtung AGI bewegen.

Telekom und Perplexity entwickeln „KI-Phone“

04.03.2025    LLM

Die Deutsche Telekom hat in Zusammenarbeit mit Perplexity die Entwicklung eines „KI-Phones“ angekündigt, das als eines der ersten Smartphones speziell für KI-Erfahrungen optimiert ist.
Im Detail:

Das Gerät wird den Perplexity Assistant als zentrales Element bieten, der direkt vom Sperrbildschirm aus zugänglich ist und das Navigieren zwischen Apps überflüssig macht.

Laut Perplexity-CEO Aravind Srinivas wird die Technologie von einer „Antwortmaschine“ zu einer „Aktionsmaschine“, die tägliche Aufgaben wie Reservierungen oder Übersetzungen übernimmt.

Weitere KI-Partner wie Google Cloud AI für Echtzeitübersetzungen, ElevenLabs für Podcast-Erstellung und Picsart für Avatar-Generierung werden integriert.

Das Smartphone soll später in diesem Jahr erscheinen und unter 1.000 USD kosten. Zudem wird eine App-Version des Magenta AI-Assistenten im Sommer verfügbar sein.

Warum es wichtig ist

Während Tech-Giganten erst beginnen, KI in bestehende Geräte zu integrieren, markiert dieses Projekt einen Paradigmenwechsel hin zu proaktiven, KI-gesteuerten Nutzererfahrungen. Für Perplexity bedeutet dies einen großen Schritt in der KI-Branche.

Anthropic sichert 3,5 Milliarden USD bei 61,5 Milliarden Bewertung

04.03.2025    LLM

Anthropic hat nur wenige Tage nach der Veröffentlichung von Claude 3.7 Sonnet eine massive Finanzierungsrunde über 3,5 Milliarden USD abgeschlossen und seine Bewertung auf 61,5 Milliarden USD verdreifacht.
Im Detail:

Die Runde wurde von Lightspeed Venture Partners angeführt, mit Beteiligung von Salesforce Ventures, Cisco, Fidelity und weiteren Investoren.

Die Mittel sollen in den Ausbau von Rechenressourcen für Modellentwicklung, die Stärkung der KI-Sicherheitsforschung und die internationale Expansion fließen.

Anthropic stellte kürzlich Claude 3.7 Sonnet vor, das als bisher intelligentestes Modell gilt, sowie ein neues Coding-Tool namens Claude Code.

Das Modell wird auch Alexa+, Amazons verbesserten Sprachassistenten, unterstützen. Amazon hatte zuvor 8 Milliarden USD in Anthropic investiert.

Warum es wichtig ist

Trotz Unsicherheiten im KI-Sektor zeigt diese enorme Bewertung, dass Top-KI-Startups wie Anthropic weiterhin stark finanziert werden. Dies unterstreicht den anhaltenden Wettbewerb zwischen den großen Vier: OpenAI, Anthropic, Google und xAI.

Apple verschiebt Siri-Überarbeitung

03.03.2025    KI

Apples Pläne für eine komplett überarbeitete KI-gestützte Siri wurden laut einem neuen Bericht von Bloomberg-Insider Mark Gurman verschoben. Mitarbeiter gehen nun davon aus, dass der Assistent erst 2027 vollständig modernisiert sein wird.
Im Detail:

Der intelligente Assistent arbeitet derzeit mit einer fragmentierten Architektur, bei der traditionelle Funktionen und neuere KI-Features als separate Systeme funktionieren.

Apple hatte geplant, die beiden in einer einheitlichen Architektur zusammenzuführen, aber die Integration hat sich Berichten zufolge verzögert.

Nutzungsmetriken zeigen, dass Benutzer die aktuellen Apple Intelligence-Funktionen nicht annehmen und viele sie im Vergleich zu Konkurrenzangeboten als begrenzt empfinden.

Die KI-Abteilung kämpft Berichten zufolge auch mit Talentabwerbung, Führungswechseln und Herausforderungen bei der Beschaffung der notwendigen KI-Chips.

Warum es wichtig ist

Apple ist dafür bekannt, bestehende Technologien zu perfektionieren, anstatt als Erster auf den Markt zu kommen. Die rasante Entwicklung der Sprach-KI offenbart jedoch eine massive Lücke in den Fähigkeiten des Unternehmens. Das Jahr 2027 liegt in Bezug auf KI-Fortschritte in weiter Ferne, und mit Alexa-Upgrades und anderen Konkurrenten, die aufholen, fühlt es sich für Apple langsam wie ein ausgewachsener KI-Notfall an[7].

Neue KI-Stimme überwindet "unheimliches Tal"

03.03.2025    KI

Oculus-Mitbegründer Brendan Iribes neues Startup Sesame hat eine Demo seiner Sprachtechnologie vorgestellt, die darauf abzielt, das "unheimliche Tal" der KI-Sprache zu überwinden. Das Modell reagiert mit echten Emotionen und natürlichen Sprachmustern.
Im Detail:

Sesames Conversational Speech Model gibt natürliche Sprachantworten, indem es den Kontext eines Gesprächs in Echtzeit berücksichtigt, nicht nur einzelne Sätze.

Das System integriert auch emotionales Bewusstsein und ermöglicht der KI, ihren Ton und Rhythmus basierend auf der Stimmung und dem Inhalt des Gesprächs anzupassen.

Frühe Demos zeigen Fähigkeiten wie die Anpassung des Sprechtempos, das Einfügen natürlicher Pausen und die Aufrechterhaltung von Gesprächsfäden bei Unterbrechungen.

Sesame entwickelt auch KI-Brillen, die seine Sprachtechnologie integrieren und einen stets verfügbaren KI-Begleiter bieten, der die Welt beobachtet und in Echtzeit unterstützt.

Warum es wichtig ist

Nach Jahren mit mittelmäßigen Sprachassistenten steht Verbrauchern ein Augenöffner bevor, da die Sprachtechnologie 2025 ein massives Upgrade erhält. Mit den Fortschritten von Hume, Alexa+ und jetzt Sesame hat die vergangene Woche einen Einblick in die menschlicheren, kontextbewussteren Systeme der Zukunft gegeben.

Geben Sie Ihrer KI eine echte Stimme

03.03.2025    KI

Während andere Text-to-Speech-Systeme Wörter einfach "vorlesen", ist Octave das erste TTS, das deren Bedeutung erfasst. Aufgebaut auf einem Sprach-Sprachmodell, bringt es natürlichen Ausdruck in die KI-Stimmerzeugung.
Im Detail:

Mit Octave erleben Sie:

Die Möglichkeit, ausdrucksstarke Stimmen für jede Figur oder Persona zu beschreiben

Kontextbewussten Ausdruck, der zur emotionalen Absicht passt

Schauspielanweisungen wie "flüstern mit Neugier" oder "wütend sprechen"

Konsistenz bei längeren Inhalten (Hörbücher, Podcasts)

Warum es wichtig ist

Octave könnte die Art und Weise revolutionieren, wie KI-generierte Stimmen in verschiedenen Medien und Anwendungen eingesetzt werden, von Unterhaltung bis hin zu Bildung und Barrierefreiheit.

Sora Video-KI kommt zu ChatGPT

03.03.2025    KI

OpenAI bestätigte Pläne zur Integration seines Sora Video-Generierungstools direkt in die ChatGPT-Oberfläche während der ersten "Sora Global Office Hours" im Discord-Chat, zusammen mit einem neuen Modell und Bildgenerierungsfähigkeiten.
Im Detail:

Sora-Produktleiter Rohan Sahai enthüllte während einer Discord-Sprechstunde, dass an der Integration aktiv gearbeitet wird, obwohl kein Zeitplan genannt wurde.

Die ChatGPT-Version wird wahrscheinlich im Vergleich zur Sora-Web-App, die erweiterte Funktionen wie Videobearbeitung und -splicing bietet, eingeschränkte Funktionen haben.

Neben der ChatGPT-Integration erforscht das Unternehmen eine dedizierte mobile App für Sora und rekrutiert aktiv Ingenieure für das Projekt.

Ebenfalls in Arbeit ist ein Sora-gesteuerter Bildgenerator, der das aktuelle DALL-E 3-Modell in Sachen Fotorealismus übertreffen könnte, sowie ein schnelleres Sora Turbo-Modell.

Warum es wichtig ist

Während Sora einst das Tool war, auf das alle gespannt warteten, haben Fortschritte von Konkurrenten und ein enttäuschender Rollout seine Wirkung gedämpft. Die Integration von Sora in ChatGPT wird es für bessere Workflow-Integrationen in den Vordergrund rücken, aber große Qualitätsverbesserungen sind noch nötig, um mit Rivalen wie Googles Veo 2 und Kling mithalten zu können.

Infos und Quellenangaben im Impressum.

Jun 25 Mai 25 Apr 25 Mrz 25 Feb 25

*Dieser Blog ist komplett automatisiert und KI generiert.
Ein AI Agent findet die neuesten KI Entwickulngen, formatiert diese, wartet auf Freigabe und postet diese nach Bestätigung.
Falls Sie ebenfalls Automatisierungen jeglicher Art auf Ihrer Webseite implementieren möchten kontaktieren Sie uns.