Der erweiterte Sprachmodus ist eine neue Funktion für ChatGPT, die es Benutzern ermöglicht, in Echtzeit menschliche Gespräche mit dem KI-Chatbot zu führen, ohne dass ein textbasiertes Eingabeaufforderungsfenster oder Hin- und Her-Audio erforderlich ist. Es wurde Ende Juli für ausgewählte Plus-Abonnenten veröffentlicht, nachdem es erstmals bei der Spring Update-Veranstaltung von OpenAI vorgeführt wurde.
Nach Angaben des Unternehmens ist die Funktion „bietet natürlichere Gespräche in Echtzeit, erlaubt Ihnen, jederzeit zu unterbrechen, und erkennt und reagiert auf Ihre Emotionen.„Es kann sogar Atempausen einlegen und menschliches Lachen während eines Gesprächs simulieren. Das Beste daran ist, dass der Zugriff bald verfügbar sein wird, falls Sie ihn noch nicht haben.
Wann erhalte ich den erweiterten Modus?
Letzte Woche, OpenAI endlich freigegeben seine mit Spannung erwartete Advanced Voice-Funktion nur einigen ausgewählten ChatGPT-Plus-Abonnenten zur Verfügung zu stellen. Es gibt also schon einige Leute, die es nutzen. Wir wissen jedoch nicht, wie groß diese erste Einführung ist oder wie schnell OpenAI neue Mitglieder einlädt.
Das Unternehmen verspricht, es in den kommenden Wochen für weitere Benutzer und bis zum Herbst für alle Plus-Abonnenten bereitzustellen, obwohl viele Benutzer es immer noch ungeduldig erwarten, es selbst auszuprobieren. Die einfache Antwort lautet also, dass Sie irgendwann zwischen jetzt und dem Herbst Zugriff darauf erhalten, sofern es keine weiteren Verzögerungen gibt. „Herbst“ kann vage sein, aber wenn wir bis Dezember keine vollständige Bereitstellung für alle Benutzer sehen, wäre dies eine Verzögerung.
In jedem Fall wissen Sie, dass Sie Zugriff haben, wenn Sie eine E-Mail mit der Einladung erhalten, es auszuprobieren. Sie sehen auch eine Benachrichtigung, wenn Sie die ChatGPT-App öffnen.
Was benötige ich, um den erweiterten Sprachmodus auf meinem Telefon auszuführen?
Zusätzlich zu einem Plus-Abonnement benötigen Benutzer ein Android-Handset mit App-Version 1.2024.206 oder höher oder ein iPhone mit iOS 16.4 oder höher und App-Version 1.2024.206 oder höher. Leider reicht die richtige Ausrüstung allein nicht aus, um Ihnen einen Platz in der Alpha-Release-Phase zu garantieren. Darüber hinaus hat OpenAI keine Details darüber veröffentlicht, wie oder warum es seine Benutzer auswählt.
Wenn Sie die Alpha-Release-Lotterie gewinnen und ausgewählt werden, sendet Ihnen OpenAI eine E-Mail darüber. Außerdem wird in der unteren rechten Ecke der ChatGPT-App für Mobilgeräte ein Tooltip angezeigt, mit dem Sie die neue Funktion auswählen können.
Wird OpenAI meine Gespräche zum Trainieren seines Modells verwenden?
Natürlich. Während der gesamten Alpha-Release-Phase hat OpenAI plant, Audio zu nutzen aus Gesprächen mit dem erweiterten Sprachmodus, um seine Modelle zu trainieren, vorausgesetzt, Sie haben die Datenfreigabeoption der App noch nicht deaktiviert.
Das geht eigentlich ganz einfach. Gehen Sie in Ihrer mobilen App zur Registerkarte Datenkontrollen im Menü „Einstellungen“ und deaktivieren Sie Verbessern Sie die Sprachqualität für alle.
Wie oft und wie viel kann ich den erweiterten Sprachmodus verwenden?
Laut OpenAI sind sowohl die Ein- als auch die Ausgaben von Advanced Voice mit täglichen Nutzungsbeschränkungen verbunden. Es gibt jedoch keine genauen Angaben dazu, wie lange diese gelten, und „genaue Beschränkungen können sich ändern“. Allerdings hat der Benutzer Himels Tech bereits ein Video gepostet, in dem er fast 10 Minuten lang mit der KI spricht.
Die KI benachrichtigt den Benutzer, wenn noch 3 Minuten zum Chatten übrig sind, beendet die Konversation und schickt den Benutzer zurück zur Standard-Sprachschnittstelle.
Was kann ich mit dem erweiterten Sprachmodus tun und was nicht?
Khan!!!!!! pic.twitter.com/xQ8NdEojSX
– Ethan Sutin (@EthanSutin) 30. Juli 2024
Der erweiterte Sprachmodus ist im Kern einfach eine neue Art, mit demselben GPT-4o-Sprachmodell zu interagieren, das die Leute bereits für ihre textbasierten Abfragen verwenden. Kurz gesagt, fast alles, was Sie mit ChatGPT tun können, können Sie mit Advanced Voice tun, aber mit lustigen Stimmen. Von Beatboxing über Storytelling bis hin zu Zählt wirklich, wirklich schnellerste Benutzer testen die neue Funktion bereits auf Herz und Nieren.
Es gibt jedoch Sicherheitsvorkehrungen und Funktionsbeschränkungen für das, was Benutzer vom neuen Modus verlangen können. Zum einen können Benutzer Advanced Voice nicht verwenden, um neue Erinnerungen zu erstellen, noch können sie benutzerdefinierte Anweisungen verwenden oder damit auf GPTs zugreifen. Und während sich die KI an frühere Advanced Voice-Gespräche erinnert und Details dieser Gespräche abrufen kann, kann sie noch nicht auf frühere Chats zugreifen, die über die Textaufforderung oder den Standard-Sprachmodus geführt wurden.
Darüber hinaus singt Advanced Voice nicht, egal wie Sie es verlangen. Laut dem Unternehmen „haben wir zum Respekt der Rechte der Urheber mehrere Abhilfemaßnahmen, darunter neue Filter, eingeführt, um zu verhindern, dass der erweiterte Sprachmodus mit musikalischen Inhalten, einschließlich Gesang, reagiert.“