Apples Siri kämpft im KI-Rennen: Eine Analyse von Nadeem Sarwar

Apples Siri kämpft im KI-Rennen: Eine Analyse von Nadeem Sarwar

Werbelogo für WWDC 2023.

Diese Geschichte ist Teil unserer vollständigen Berichterstattung zur Apple WWDC

Apple hat auf der WWDC 2023 mit der Vorstellung seines Mixed-Reality-Headsets Vision Pro eine neue Ära eingeleitet. Manche nennen es den nächsten iPhone-Moment. Und doch hinterließ Siri – eine ikonische iPhone-Innovation, die die Welt in den frühen Tagen der Apple-Smartphones begeisterte, bevor sie von Alexa und Google Assistant in den Schatten gestellt wurde – auf einer Konferenz, die ansonsten voller ehrgeiziger Ankündigungen war, kaum Spuren.

Apple hat Siri kaum Gelegenheit gegeben, zu glänzen, im Gegensatz zu Google und Microsoft, die in den letzten Monaten ihre KI-Dinger angepriesen haben. Mit der Einführung von iOS 17 und iPadOS 17 sind die einzigen beiden Änderungen, die Siri erfahren hat, ein kürzerer Aktivierungsbefehl und Konversationsfunktionen.

Anstatt „Hey, Siri“ zu sagen, können Benutzer jetzt einfach den Namen des Assistenten ohne „Hallo“ oder „Hey“ aussprechen und der KI-Assistent erledigt seine Arbeit. Als Nächstes haben wir Konversationsfunktionen erhalten, was bedeutet, dass Sie mit Siri sprechen und mehrere Sprachaufforderungen senden können, ohne zu Beginn jeder Folgeanfrage „Siri“ oder „Hey Siri“ sagen zu müssen.

Es ist ein Rätsel, warum ein KI-Assistent – ​​der auf über einer Milliarde Telefonen, Tablets und Smartwatches zu finden ist – den Code für fließende Konversationen noch nicht geknackt hat.

Siri ist eine leichte Beute im KI-Rennen

Siri-Sprachschnittstelle
Nadeem Sarwar / Moyens I/O

Ein „Hey“ abzuschneiden oder Siri weniger roboterhaft klingen zu lassen, ist nicht die Art von bahnbrechendem Upgrade, die Siri verdient. Sicherlich nicht im Jahr 2023, wenn KI-Chatbots, die von Open AIs GPT-4 oder Googles LaMDA-Modellen für natürliche Sprache angetrieben werden, versuchen, alles neu zu erfinden, von der Websuche und dem Schreiben von Forschungsarbeiten bis hin zum Agieren als virtuelle Partner, die Ihre Angst oder Einsamkeit lindern.

Mittlerweile ist Siri im Bereich der Sprachassistenten fast schon zur Lachnummer geworden. Noch enttäuschender ist die Tatsache, dass Siri wohl die beeindruckendste Suite zur Aufgabenautomatisierung bietet, wenn man sich mit Apples Shortcuts-App auskennt. Leider wird Apple nicht den nächsten logischen Schritt gehen und Siri in das Herzstück seiner eigenen Apps wie Notes oder Safari integrieren.

Nehmen wir zum Beispiel Bing Chat. Es begann als eigenständige Funktion, fand dann seinen Weg in den Edge-Browser und befindet sich jetzt in der Windows 11-Suchleiste auf Betriebssystemebene. Natürlich lädt es auch Office-Tools wie Word, Excel und PowerPoint auf, um nur einige zu nennen. Ebenso erscheint Google Bard in Workspace-Produkten wie Gmail, Docs und Slides. Siri hingegen ist in Apples eigenen Anwendungen nirgends zu sehen.

Ja, Apple bietet kein so umfangreiches und funktionsreiches Produktivitäts-Toolkit wie Google oder Microsoft. Aber irgendwo muss man ja anfangen. Die grünste Weide für diese Siri-Revolution? Die vielgerühmte iMessage.

Siri-Schnittstelle aktivieren
Nadeem Sarwar / Moyens I/O

Obwohl Google Millionen für Rich Communication Services (RCS) ausgibt und im Internet eine Welle auslöst, die viele Menschen dazu veranlasst, Apple um die Einführung von RCS zu bitten, ist Apple viel zu stolz auf sein Privileg der „blauen Blase“ und schützt es auch viel zu sehr, um jemals eine plattformübergreifende Harmonie beim Nachrichtenaustausch zuzulassen.

Es ist fast schon komisch, dass Google am selben Tag wie die WWDC ankündigte, dass Smart Compose – eine Funktion, die Ihnen beim Schreiben einer Nachricht intelligente Vorschläge unterbreitet – in Google Chat eingeführt wird. Diese Funktion ist bereits in Gmail und Google Docs verfügbar, zwei der weltweit am häufigsten verwendeten Apps dieser Art.

Verwandt :  Wie man Llama 2 lokal herunterlädt und installiert

Außerdem ist der KI-gestützte Trick zur Sprachvorhersage seit 2020 in Google Messages über Gboard verfügbar. Vor einigen Wochen hat Microsoft das gesamte Erlebnis direkt in seine mobile SwiftKey-Tastatur für Android und iOS integriert.

Eine ganze Welt voller Möglichkeiten

Bing-Chat in SwiftKey
Microsoft integriert Bing Chat direkt in die SwiftKey-Tastatur-App, die auf dem iPhone einwandfrei läuft. Nadeem Sarwar / Moyens I/O

Es wäre großartig, wenn Apple etwas Ähnliches mit Siri machen könnte. Zum Beispiel könnte Siri die Konversation kontextbezogen lesen und Ihnen ein paar Vorschläge unterbreiten. Es gibt bereits Apps wie Paragraph AI, die genau das für Sie tun, und das mit beeindruckender Finesse.

Vielleicht kann Siri Ihre Mail-App analysieren und Ihnen eine zusammengefasste Version Ihres Posteingangs präsentieren. Es gibt eine hervorragende App namens Shortwave, die das für Sie erledigt. Ich bin absolut begeistert davon. Vielleicht könnte Siri eines Tages, genau wie das KI-gestützte Microsoft Teams, Ihre Videoanrufe automatisch transkribieren und Ihnen auch eine Kurzfassung präsentieren, damit Sie diese schnell in der Telefon-App nachholen können.

Was wäre, wenn etwas wie Bing Chat und sein Text-zu-Foto-KI-Bildgenerator eines Tages mit Hilfe von Siri in eine Apple-App kommen könnten? Die beste Möglichkeit, diese Tricks anzuwenden, wäre Apples hervorragende Freeform-Kollaborations-App.

Apple muss nicht alles auf das KI-Rennen setzen, da für das Unternehmen nicht so viel auf dem Spiel steht wie für Microsoft oder Google, die derzeit um die Vorherrschaft bei Suchmaschinen und Produktivitätssuiten kämpfen. Apple muss eine schmale Lücke füllen, aber seine Abneigung gegen das Konzept der KI war auf der WWDC 2023 deutlich zu sehen.

Fragen an ChatGPT stellen
Nadeem Sarwar / Moyens I/O

Okay, lassen Sie uns nicht zu weit in das Gebiet der App-Integration vordringen und uns auf Siri, den Sprachassistenten, konzentrieren. Was er jetzt braucht, sind verbesserte Konversationsfähigkeiten, bei denen er nicht frustrierend roboterhaft klingt. Ihm ein paar KI-Fähigkeiten zu geben, mit denen er eine nuancierte Konversation führen und Antworten zurückgeben kann, die nicht nur Websuchweiterleitungen in Safari sind, würde Wunder bewirken.

Man könnte argumentieren, dass Google zu viele Funktionen in den Kern von Google Assistant gepackt hat – weit mehr, als viele Benutzer jemals nutzen könnten. Gleichzeitig ist aber auch die Funktionsdiskrepanz zwischen Google Assistant und Siri absurd unausgewogen. Und ich gehe noch nicht einmal darauf ein, was Googles KI-Chatbot Bard leisten kann.

Betrachtet man die Situation aus einer konträren Perspektive, ist die Situation für Apple tatsächlich einfacher, da das Unternehmen eine umfangreiche Suite von Tools wie Docs, Slides, PowerPoint, Excel usw. nicht ständig weiterentwickeln und verbessern muss.

Gleichzeitig ist es jedoch noch verwirrender, dass Apple trotz der geringen Palette an Produktivitätssoftware, die ihm zur Verfügung steht, diese weder mit KI aufgerüstet noch sinnvolle Siri-Integrationen hinzugefügt hat.

Wie sieht es von der anderen Seite aus?

Ahnungslose Siri
Nadeem Sarwar / Moyens I/O

Microsoft-Mitbegründer Bill Gates sinnierte kürzlich über den aktuellen Stand der KI-Entwicklung in der Branche und sagte, dass derjenige, der einen umwerfenden persönlichen Assistenten der Zukunft entwickelt, das Rennen gewinnen wird, und dieser Assistent könnte durchaus die Dinge für Giganten wie Google Search und Amazon auf den Kopf stellen. Auch dieses Mal fehlten Apple und Siri bei der Diskussion.

Verwandt :  Mardy Fish vergleicht die Saison 2011 von Novak Djokovic und die Saison 2005 von Roger Federer, um seinen GOAT auszuwählen

Google ist so optimistisch, dass es Berichten zufolge den Google Assistant abgebaut und sich mit aller Kraft an die Verbesserung von Bard und anderen KI-Produkten gemacht hat. Man kann sagen, was man will, aber es gibt endlich Fortschritte bei der KI, und im Mittelpunkt stehen Verbrauchergeräte. Wir befinden uns noch in den Anfängen dieses Wandels, aber die Produkte, die bisher auf den Markt gekommen sind, haben das tägliche Leben von Millionen von Menschen wirklich beeinflusst.

Was wäre, wenn Siri tatsächlich mit Bing Chat, Bard und ChatGPT konkurrieren würde? Oder zumindest, wenn es nur eine Handvoll ihrer Tricks kopieren und es dabei belassen würde? Es wäre immer noch ein ziemliches Spektakel. Aber all das liegt streng im Bereich der Möglichkeiten von Siri.

Geht man von Apples derzeitigem Kurs aus, würde es eine Weile dauern, bis das Unternehmen eine funktionale Überarbeitung durchführen und seine Präsenz spürbar machen kann. Google wurde zum Gespött, nachdem es auf seiner I/O 2023-Konferenz im Mai mehrere Dutzend Mal „KI“ gesagt hatte. Apples freche Führungskräfte auf der Messe haben das Wort KI auf der WWDC 2023 kein einziges Mal erwähnt. Stattdessen verwendete Apple wiederholt ein eher technisches Derivat – maschinelles Lernen.

Apples Siri kämpft im KI-Rennen: Eine Analyse von Nadeem Sarwar 1
Andy Boxall/Moyens I/O

Was Apple verpasst hat, treibt Microsoft eifrig voran. Cortana wurde endlich begraben, aber bevor es seinen von Halo inspirierten Sprachassistenten begrub, kam Microsoft mit Bing Chat.

Bing Chat nutzt die Konversationsfähigkeiten von GPT-4 und kann das Internet für Sie durchsuchen und Antworten finden. Es kann seine Antworten auch darauf abstimmen, wie formell oder lässig sie klingen sollen. Es verfügt über einen Promi-Modus, mit dem es wie jede berühmte Persönlichkeit sprechen kann, die Sie sich vorstellen können. Es kann sogar Bilder basierend auf ein paar Textwörtern generieren.

Vor allem wird es bald die Grundlage für die Office-Suite bilden, Ihre E-Mails schreiben, PowerPoint-Folien erstellen, Team-Meetings zusammenfassen und vieles mehr. Google ist bei ähnlichen Unterfangen nicht so weit fortgeschritten und steckt generative KI-Fähigkeiten in fast jedes einzelne Produktivitätstool seines Worksuite-Portfolios. Apple ist bei der gesamten Debatte auffällig abwesend.

Apples Vision blickt woanders hin

Siri auf einem iPad Pro
Nadeem Sarwar / Moyens I/O

Als OpenAI mit seinem disruptiven ChatGPT-Bot erstmals auf dem KI-Radar auftauchte, wäre es vernünftig gewesen, es als einen weiteren Betrug abzutun. Doch die Einführung von Flash durch Unternehmen wie Microsoft und Google – und in Produkten, die täglich von Hunderten Millionen Nutzern verwendet werden – vermittelte die Botschaft, dass KI, insbesondere die gesprächige und praktisch produktive Art, nicht mehr wegzudenken ist.

Und das wirft die Frage auf: Wo ist das wertvollste und innovativste Unternehmen der Welt im KI-Spiel? Und noch wichtiger: Wann werden wir erleben, wie Siri den nächsten großen Sprung macht und mit KI-Fähigkeiten der nächsten Generation aufwartet?

Mit dem Vision Pro-Headset hat Apple deutlich gemacht, dass es den Markt in Richtung Spatial Computing gehen sieht. Aber diese Revolution wird noch ein paar Jahre dauern, bevor sie wirklich zum „nächsten iPhone-Moment“ für XR-Wearables werden kann. Oder zumindest nicht, bis 3.500 Dollar der Mainstream-Preis werden, den Millionen gerne für ein Headset bezahlen.

Doch in der Zwischenzeit gibt es ein ganzes Universum, in dem Hunderte Millionen iPhone-, iPad-, Apple Watch- und Mac-Benutzer erfolgreich sind, und sie können ein paar neue Siri-Tricks wirklich gut gebrauchen, um ihr Leben ein klein wenig einfacher zu machen.

Bislang sieht es so aus, als ob Siri – in Ermangelung eines besseren Begriffs – funktional öde und enttäuschend schleppend vorankommt.

Moyens I/O-Personal. motivierte Sie und gab Ratschläge zu Technologie, persönlicher Entwicklung, Lebensstil und Strategien, die Ihnen helfen werden.