DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...
China macht Ernst. Deepseek v4 soll in den kommenden Wochen erscheinen — und erstmals komplett auf Huawei-Chips laufen. Nvidia? Nicht eingeladen.
Chinas KI-Szene macht ernst. Deepseek bringt in den kommenden Wochen sein V4-Modell — und das läuft erstmals komplett auf Huawei-Chips.
DeepSeek hat seinen Chatbot aufgebohrt. Ab sofort gibt es "Instant" und "Expert" — das größte Interface-Update seit dem weltweiten R1-Hype.
Together AI stellt DeepSeek-V3.1 ab sofort auf seiner Plattform bereit. Ein Open-Source-Modell mit MIT-Lizenz, das zwischen Denken und Nicht-Denken umschalten kann.
Open-Source-Reasoning zum Turbo-Preis: Together AI hat einen neuen Inference-Engine vorgestellt, der DeepSeek-R1-0528 auf NVIDIA Blackwell-GPUs auf Höchstgeschwindigkeit bringt.
DeepSeek hat sein neues Flaggschiff-Modell V3.2 veröffentlicht. Wieder über ein US-Feiertagswochenende, wieder mit einem Knall. Das Ding spielt in Benchmarks auf dem Niveau von ...
Das chinesische KI-Wunderkind braucht plötzlich Geld. Viel Geld.
Schluss mit Cloud-Abhängigkeit. Unsloth Studio ist eine neue Web-Oberfläche, die Open-Source-Modelle wie Qwen3.5, Gemma 4 und DeepSeek direkt auf dem eigenen Rechner trainiert und ...
Die drei größten KI-Labs der USA machen gemeinsame Sache. Ziel: Chinesische Firmen wie DeepSeek sollen ihre Modelle nicht mehr einfach kopieren können.
Google hat am Donnerstag seine neuen Open-Weights-Modelle Gemma 4 losgelassen. Ziel: Die chinesische Open-Source-Konkurrenz stoppen — mit Apache 2.0, Multimodalität und über 140 ...
Google feuert zurück. Mit Gemma 4 bringt der Konzern seine stärksten Open-Weights-Modelle auf den Markt — direkt gegen DeepSeek, Qwen und Co.
Meta greift 49 Prozent von Scale AI ab — für rund 30 Milliarden Dollar Bewertung. Der Facebook-Konzern mit 100 Milliarden Dollar Jahres-Cashflow hat offenbar beschlossen, dass ...
Anthropic zieht die Daumenschrauben an. Seit der US-Konzern Klarnamen-Verifizierung für Claude einführt, explodiert in China der Schwarzmarkt für Workarounds.
Chinas KI-Szene baut nicht die größten Modelle — sondern die sparsamsten. Das sagt der Gründer von DeepWisdom im Interview mit Golem.
Manycore Tech hat das Listing-Hearing in Hongkong bestanden. Der IPO rückt damit in greifbare Nähe — und mit ihm ein neues Kapitel für Chinas KI-Szene.
Die Modell-Landschaft explodiert — und diesmal nicht wegen der üblichen Verdächtigen. Statt Qwen, DeepSeek oder Kimi dominieren plötzlich neue Namen die Open-Source-Charts. Von ...
Totgesagte leben länger. Die Mietpreise für NVIDIAs H100-GPUs klettern seit Dezember 2025 wieder nach oben — nachdem sie monatelang im freien Fall waren.
Together AI hat ein neues System vorgestellt, das LLM-Inference während der Nutzung beschleunigt. Der Name: ATLAS — AdapTive-LeArning Speculator System.
Sebastian Raschka hat seinen massiven Architektur-Vergleich großer Sprachmodelle aktualisiert. Von GPT-2 bis DeepSeek V3 und Llama 4 — alles in einer Übersicht. Neu dabei: ...