AI

Alibaba setzt neue Maßstäbe im Open-Source-KI-Markt – Qwen3-Coder übertrifft GPT‑4o in Coding-Benchmarks

Mit Qwen3-Coder bietet Alibaba erstmals ein agentisches Open-Source-Modell, das GPT-4o und DeepSeek deutlich übertrifft.

Eulerpool News 30. Juli 2025, 15:13

Mit dem Launch von Qwen-3 Coder am 23. Juli 2025 schiebt sich Alibaba an die Spitze des globalen Coding-KI-Marktes. Das Modell, das unter Apache-2.0-Lizenz frei verfügbar ist, kombiniert 480 Milliarden Parameter (davon 35 Milliarden aktiv pro Abfrage) mit einer Kontexttiefe von bis zu einer Million Tokens – mehr als doppelt so viel wie bei GPT‑4o.

Trainiert auf 7,5 Billionen Tokens, davon rund 70 % Code, ist Qwen3-Coder auf Agentenfunktionen spezialisiert: Neben Reinforcement Learning für verifizierbare Code-Ausführung nutzt Alibaba ein System für langfristige Planung und Anpassung über mehrere Interaktionsschritte. Die Trainingsarchitektur basiert auf einem Mixture-of-Experts-Ansatz mit 160 Experten, von denen pro Anfrage acht aktiv sind.

In Benchmarks liefert das Modell überdurchschnittliche Ergebnisse. Auf SWE-bench Verified erzielte Qwen3-Coder 67,0 % (Standard) und 69,6 % (500-Turn), gegenüber 54,6 % bei GPT‑4.1 und 49,0 % bei Gemini 2.5 Pro. Beim MultiPL-E-Coding-Test lag das Modell mit 87,9 knapp hinter Claude Opus 4, aber klar vor DeepSeek (82,2) und GPT‑4o (82,7). In der Mathematikprüfung AIME übertraf das verwandte Schwester-Modell Qwen3‑235B‑A22B sogar mit 70,3 Punkten die Konkurrenz deutlich.

Die Integration in bestehende Entwicklungsumgebungen gelingt nahtlos. Alibaba liefert ein eigenes CLI-Tool mit strukturiertem Prompting, Node.js-Support und Unterstützung für Systeme wie Claude Code, Ollama, LMStudio oder llama.cpp. Das Modell kann lokal, über OpenAI-kompatible APIs oder via Alibaba Cloud betrieben werden. Die Preisstruktur ist dabei transparent: 1 bis 6 US-Dollar pro Million Tokens (Prompt), je nach Kontexttiefe – signifikant günstiger als Closed-Source-Alternativen.

Erste Rückmeldungen aus der Entwickler-Community sind eindeutig. Sebastian Raschka spricht vom „besten Coding-Modell bisher“. Wolfram Ravenwolf nennt es „aktuell konkurrenzlos“. Jack Dorsey sieht in der Kombination mit seinem Agenten-Framework Goose gar eine „neue Klasse“ intelligenter Softwareentwicklung.

Auch kommerziell ist das Modell bereits eingebettet: Eine abgespeckte 3B-Variante von Qwen3-Coder soll ab Herbst HPs smarten Büroassistenten Xiaowei Hui in China antreiben. Damit wird das Modell zur zentralen Infrastrukturkomponente für KI-gestützte Dokumentation und Meeting-Zusammenfassungen im Unternehmenskontext.

Mit dem Schritt unterstreicht Alibaba seinen strategischen Kurs in Richtung offenes, agentisches, skalierbares KI-Ökosystem für Unternehmen – mit dem klaren Ziel, langfristig technologische Souveränität gegenüber den geschlossenen Systemen aus den USA zu behaupten.

Die besten Investoren setzen auf Eulerpool

Favoriten unserer Leser