Berichten zufolge könnte Meta bereits nächste Woche die nächste Version seines großen Sprachmodells Llama 3 veröffentlichen.
Die Information behauptet, dass eine kleine Version von Llama 3 eine frühe Veröffentlichung erhalten wird, wobei das vollständige Open-Source-Modell noch im Juli herauskommt und mit Claude 3 und GPT-4 konkurrieren kann.
Der Instagram-Besitzer gibt Milliarden für den Aufbau fortschrittlicher KI-Systeme aus, darunter den Kauf Hunderttausender H100-GPUs von Nvidia, um Llama und andere Modelle zu trainieren.
Was ist Lama 3?

Llama 3 ist ein großes Sprachmodell, das in verschiedenen Größen erhältlich sein wird, von sehr klein, um mit Modellen wie Claude Haiku oder Gemini Nano zu konkurrieren, bis hin zu größeren, vollständig reaktions- und schlussfolgerungsfähigen Modellen wie GPT-4 oder Claude Opus.
Über Llama 3 ist wenig bekannt, abgesehen davon, dass es wie sein Vorgänger voraussichtlich Open Source sein wird und wahrscheinlich multimodal ist und sowohl visuelle als auch Texteingaben verstehen kann.
Es wird wahrscheinlich eine Reihe von Versionen und Größen für Llama 3 geben, die von nur 7 Milliarden Parametern bis hin zu mehr als 100 Milliarden Parametern reichen. Dies wäre immer noch kleiner als die über Billionen Parameter, die zum Trainieren von GPT-4 verwendet werden.
Llama 3 ist wahrscheinlich auch weniger vorsichtig als sein Vorgänger, der wegen übertriebener Moderationskontrollen und zu strenger Leitplanken kritisiert wurde.
Warum nur eine kleine Version von Llama 3?

Meta hat Llama 2 im Juli letzten Jahres veröffentlicht und es ist wahrscheinlich so einfach wie der Wunsch, sich an einen einheitlichen Veröffentlichungsplan zu halten.
Die frühzeitige Einführung einer kleinen Version der kommenden KI wird dazu beitragen, einen Hype um ihre Fähigkeiten zu erzeugen. Einige Funktionen des Anthropic-Kleinmodells Claude 3 Haiku sind mit dem Großmodell GPT-4 von OpenAI vergleichbar.
Der Bereich der KI-Modelle wächst schnell und wird wettbewerbsfähig, auch im Open-Source-Bereich mit neuen Modellen von DataBricks, Mistral und StabilityAI.
Auch kleinere Modelle werden für Unternehmen immer wertvoller, da sie günstiger im Betrieb, einfacher zu optimieren sind und in manchen Fällen sogar auf lokaler Hardware laufen können.
- Mit der neuen VLOGGER AI von Google können Sie aus nur einem Foto einen lebensechten Avatar erstellen
- Apple könnte Google Gemini für KI-Aufgaben auf das iPhone bringen
- Ich habe Claude, ChatGPT und Gemini ein Foto der Zutaten gegeben, um zu sehen, welches das beste Rezept hervorgebracht hat