Meta AI hat ein neues Vision-Modell veröffentlicht, das den menschlichen Körper in all seinen Details verstehen soll. Pose, Segmentierung, Oberflächen-Normalen, Pointmaps und ...
Google droppt eine neue Open-Model-Familie: Gemma 4. Multimodal, mit Reasoning, frei verfügbar.
Google DeepMind droppt Gemma 4 — und das Ding liefert. Das 31B-Modell hängt Konkurrenten ab, die teilweise über eine Billion Parameter mitschleppen.
Google droppt Gemma 4 — und diesmal wird's multimodal. Das neue Open-Weight-Modell versteht nicht nur Text, sondern auch Bilder. Und das Beste: Es läuft direkt auf dem Gerät.
Microsoft droppt Harrier-OSS-v1 — eine Familie von drei multilingualen Embedding-Modellen, die auf dem Multilingual MTEB v2 Benchmark den Thron übernehmen.
Microsoft schmeißt drei neue Multilingual-Embedding-Modelle auf den Markt. Harrier-OSS-v1 heißt die Familie — und sie räumt den wichtigsten Benchmark ab.
Cohere droppt ein Open-Source-Modell nur für Transkription. Und das Ding läuft auf normalen Grafikkarten.
Google droppt Lyria 3 Pro — ein Musikmodell, das komplette Songs mit Strophen, Refrains und Bridges ausspuckt. Bis zu drei Minuten lang. Nicht nur Loops, nicht nur Beats. Ganze ...
Meta hat Llama 4 veröffentlicht. Die neue Modellgeneration setzt auf Mixture-of-Experts (MoE) und ist multimodal. Together AI bietet die Modelle ab sofort zum Einsatz an.