Google hat zwei stabile Versionen seiner Gemini 1.5 Application Programming Interface-Modelle auf den Markt gebracht, die Entwicklern eine verbesserte Leistung und geringere Kosten für die App-Produktion bieten.
Gemini 1.5 Pro und Flash
Google hat die Veröffentlichung der stabilen Versionen Gemini 1.5 Pro und Gemini 1.5 Flash angekündigt.
Im Vergleich zu den Vorgängermodellen 001 haben diese produktionsreifen Gemini-Modelle enorme Fortschritte in den Bereichen Codegenerierung, Mathematik, Argumentation und Videoanalyse gemacht.
Billiger, aber besser
Google hat den Preis seines Gemini 1.5 Pro-Modells um mehr als 50 % gesenkt und behauptet gleichzeitig, dass es dreimal höhere Geschwindigkeitsgrenzen und geringere Latenzzeiten als die älteren experimentellen Modellversionen aufweist.
Today, we’re excited to release two new, production-ready versions of Gemini 1.5 Pro and Flash. 🚢
They build on our latest experimental releases and include significant improvements in long context understanding, vision and math. → https://t.co/C08ElHVE8e pic.twitter.com/DJsOsBwDmb
— Google DeepMind (@GoogleDeepMind) September 24, 2024
Beide Gemini 1.5 Modelle bieten nette Zuwächse bei der Faktizität, weniger Modellhalluzinationen, verbessertes Verfolgen von Anweisungen, verbessertes mehrsprachiges Verständnis in 102 Sprachen, bessere SQL-Generierung und besseres Audio- und Dokumentenverständnis.
Ein ganz schöner Update-Stapel, nicht wahr?
Google hat außerdem die Länge der Zusammenfassungen für beide Modelle reduziert und den Entwicklern von Chat-basierten Produkten geraten, Optionen zur Verbesserung der Konversationsfähigkeiten der API zu prüfen.
Ab dem 1. Oktober werden die Preise der Gemini 1.5 Pro API für Prompts mit weniger als 128.000 Token auf 64% für Eingabe-Token, 52% für Ausgabe-Token und 64% für inkrementelle, zwischengespeicherte Token gesenkt.
Darüber hinaus werden die Preislimits für 1.5 Flash auf 2.000 U/min und für 1.5 Pro auf 1.000 U/min angehoben, von 1.000 bzw. 360.
Experimentieren mit den neuen Modellen
Ein weiterer großer Schritt ist die Einführung von Gemini 1.5 Flash-8B, einer kleineren experimentellen Version von 1.5 Flash mit niedrigeren Benchmark-Zahlen.
Dieses Update beinhaltet enorme Leistungssteigerungen sowohl bei Text als auch bei multimodalen Anwendungsfällen.
Alle Versionen sind derzeit über Google AI Studio und die Gemini API verfügbar.
In der Zwischenzeit hat Googles wichtigster Konkurrent im Bereich der künstlichen Intelligenz, OpenAI, damit begonnen, seine neue Funktion Advanced Voice für ausgewählte ChatGPT-Nutzer einzuführen.
Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) September 24, 2024
Diese neue Funktion ermöglicht eine schnellere und intuitivere menschenähnliche Kommunikation mit der KI und umfasst fünf neue Stimmen: Arbor, Maple, SXol, Spruce und Vale, die die bestehenden Sprachoptionen Breeze, Juniper, Cove und Ember ergänzen.
Diese Verbesserungen der Gemini 1.5-Modelle von Google und der ChatGPT-Sprachfunktion von OpenAI könnten – und werden höchstwahrscheinlich – dazu führen, dass diese KI-Plattformen sowohl von Entwicklern als auch von Nutzern stärker angenommen und genutzt werden.
Haben Sie es schon gelesen? Welcher Memecoin wird als nächstes die Marke von 1 Milliarde Dollar erreichen?
Disclosure:This article does not contain investment advice or recommendations. Every investment and trading move involves risk, and readers should conduct their own research when making a decision.
Kriptoworld.com accepts no liability for any errors in the articles or for any financial loss resulting from incorrect information.