Deepseek's V3 und R1 Modelle: Chinas KI-Startup stört US-Ambitionen

Deepseek’s V3 und R1 Modelle: Chinas KI-Startup stört US-Ambitionen

Ein einjähriges Startup aus China erobert die KI-Branche im Sturm, nachdem er einen Chatbot veröffentlicht hat, der mit der Leistung von ChatGPT konkurriert und gleichzeitig einen Bruchteil der Strom-, Kühl- und Schulungskosten dessen, was OpenAI, Google und Anthropics Systeme verlangt, verwendet. Hier finden Sie alles, was Sie über Deepseeks V3- und R1 -Modelle wissen müssen und warum das Unternehmen die AI -Ambitionen Amerikas grundlegend verbessern könnte.

Was ist Deepseek?

Deepseek (technisch gesehen ist Hangzhou Deepseek Artificial Intelligence Basic Technology Research Co., Ltd. „) ein chinesisches KI Wurde in ein eigenes Unternehmen gesponnen (mit einem High-Flyer als Investor) und veröffentlichte auch sein Deepseek-V2-Modell. V2 bot eine Leistung an, die anderen führenden chinesischen KI -Unternehmen wie Bytedance, Tencent und Baidu, jedoch zu viel niedrigeren Betriebskosten entspricht.

Empfohlene Videos

Das Unternehmen folgte mit der Veröffentlichung von V3 im Dezember 2024. V3 ist ein 671 Milliarden Parametermodell, das Berichten zufolge hat es weniger als 2 Monate gedauert, um zu trainieren. Laut einer kürzlich durchgeführten Analyse von Jeffries sind Deepseeks „Trainingskosten von nur 5,6 Mio. USD (unter der Annahme von 2 USD/H800 -Stunden -Mietkosten). Das sind weniger als 10% der Kosten für das Lama von Meta. “ Das ist ein winziger Bruchteil der Hunderte von Millionen bis Milliarden Dollar, die US -Firmen wie Google, Microsoft, Xai und Openai damit verbracht haben, ihre Modelle auszubilden.

Einführung von Deepseek-V3!

Größter Sprung nach vorne:
60 Token/Sekunde (3x schneller als v2!)
Verbesserte Fähigkeiten
API -Kompatibilität intakt
Vollständige Open-Source-Modelle & amp; Papiere

1/n pic.twitter.com/p1dv9gj2sd

& mdash; Deepseek (@deepseek_ai) 26. Dezember 2024

Benchmark-Tests setzen die Leistung von V3 mit GPT-4O und Claude 3.5 Sonett auf. Ein Dezember 2024 OP-ed in Der Hügel Die Erfolgung von Deepseek als Amerikas „Sputnik -Moment“ kategorisierte.

Deepseek veröffentlichte im November 2024 sein R1-Lite-Präview-Modell und behauptete, das neue Modell könne die O1-Familie der Argumentationsmodelle von OpenAI übertreffen (und dies zu einem Bruchteil des Preises tun). Das Unternehmen schätzt, dass das R1 -Modell je nach Aufgabe zwischen 20 und 50 -mal kostengünstiger ist als von der O1 von OpenAI. Deepseek veröffentlichte anschließend Deepseek-R1 und Deepseek-R1-Null im Januar 2025. Das R1-Modell ist im Gegensatz zu seinem O1-Rivalen Open Source, was bedeutet, dass jeder Entwickler es verwenden kann.

Verwandt :  So machen Sie Ausnahmen für den Nicht stören-Modus auf Ihrem iPhone

Als solches sind V3 und R1 seit ihrer Veröffentlichung immer beliebter, mit Deepseeks V3-KI-Assistent Verschieben von Chatgpt oben in den App Stores. Risikokapitalgeber Marc Andresen in einem kürzlich veröffentlichten Social -Media -Beitrag, genannt Deepseeks Chatbot „Einer der erstaunlichsten und beeindruckendsten Durchbrüche, die ich je gesehen habe“ und ein „tiefes Geschenk für die Welt“.

Was kann Deepseek tun?

Als Open-Source-Modell mit großer Sprache können Deepseeks Chatbots im Wesentlichen alles tun, was Chatgpt, Gemini und Claude können. Dazu gehören Text, Audio, Bild und Videogenerierung. Außerdem ist Deepseeks neu veröffentlichte Familie multimodaler Modelle, die genannt werden Janus ProBerichten zufolge übertrifft Dall-e 3 sowie Pixart-Alpha, EMU3-Gen und Stable Diffusion XL auf zwei Branchen-Benchmarks. Deepseek-R1, mit dem O1 mithalten, wurde speziell für komplexe Argumentationsaufgaben entwickelt, während sie Schritt-für-Schritt-Lösungen für Probleme erzeugt und „logische Denkketten“ festlegt, wo es seinen Argumentationsprozess schrittweise erklärt, wenn sie ein Problem lösen .

Oh Junge #deepseek

& mdash; Alexios mantzarlis (@mantzarlis.com) 2025-01-27T16: 50: 40.640Z

Was Deepseeks Produkte nicht tun können, ist, über den Tienanmen Square zu sprechen. Oder der gelbe Regenschirmproteste. Oder Präsident Xi Jinpings Ähnlichkeit mit Winnie the Pooh. Wenn es sich um ein Thema handelt, das von der chinesischen Kommunistischen Partei, die von der chinesischen Kommunistischen Partei angesehen wird, wird Deepseeks Chatbots es nicht ansprechen oder sich auf sinnvolle Weise einsetzt.

Wer kann Deepseek benutzen?

Andrew Tarantola / Deepseek / Moyens i / o

Als Open-Source-LLM kann das Deepseek-Modell von jedem Entwickler kostenlos verwendet werden. OpenAI berechnet 200 US -Dollar pro Monat für das für den Zugriff auf O1 erforderliche Pro -Abonnement. Die Modelle von Deepseek sind im Internet, über die API des Unternehmens und über mobile Apps verfügbar. Sie müssen sich für ein kostenloses Konto bei der anmelden Deepseek -Website Um es zu verwenden, wie auch das Unternehmen hat vorübergehend neue Anmeldungen angehalten als Reaktion auf „groß angelegte böswillige Angriffe auf Deepseeks Dienste“. Bestehende Benutzer können die Plattform als normal anmelden und nutzen, aber es gibt noch kein Wort darüber, wenn neue Benutzer Deepseek selbst ausprobieren können.

Warum ist Deepseek plötzlich so eine große Sache?

Seit der Veröffentlichung von ChatGPT im November 2024 sind amerikanische KI-Unternehmen laserorientiert, um größere, leistungsfähigere, expansivere, Macht und ressourcenintensive Großsprachmodelle aufzubauen. Anstatt zu versuchen, kostengünstigere und energieeffizientere LLMs aufzubauen, sahen Unternehmen wie OpenAI, Microsoft, Anthropic und Google stattdessen geeignet, um die Weiterentwicklung der Technologie in der amerikanischen Tradition einfach zu erzwingen, einfach absurde Mengen an Geld und Ressourcen zu werfen Bei dem Problem. Allein im Jahr 2024 wurde erwartet, dass XAI -CEO Elon Musk persönlich über 10 Milliarden US -Dollar für KI -Initiativen ausgibt. OpenAI und seine Partner kündigten gerade eine Projektstargate -Initiative von 500 Milliarden US -Dollar an, die den Bau von grünen Energieversorgungsunternehmen und KI -Rechenzentren in den USA drastisch beschleunigen würde. Laut CEO Sundar Pichai plant Google, die Gemini -Plattform während des gesamten Jahres 2025 zu priorisieren, und wird voraussichtlich in diesem Jahr Milliarden für dieses Jahr verfolgen. Meta kündigte Mitte Januar an, dass es in diesem Jahr bis zu 65 Milliarden US-Dollar für die KI-Entwicklung ausgeben würde.

Verwandt :  Browser-Cache auf PC und Mac leeren: Schritt-für-Schritt-Anleitung

Deepseek hat der Welt nur gezeigt, dass nichts davon tatsächlich notwendig ist – dass der „KI Nichts weiter als eine Schein. Es stellt auch in Frage Wiederholtes Verbot von Sendungen mit führender GPUs nach China im vergangenen Jahr.

„Das Fazit ist, dass die US -Outperformance von Tech angetrieben wurde und die Führung, die US -Unternehmen in KI haben“, sagte Keith Lerner, Analyst bei Truist CNN. „Das Deepseek -Modell -Rollout führt die Investoren dazu, die Führung zu hinterfragen, die US -Unternehmen haben und wie viel ausgegeben wird und ob diese Ausgaben zu Gewinnen (oder Überausgaben) führen werden.“

Kurz gesagt, Deepseek hat die amerikanische KI -Industrie in ihrem eigenen Spiel besiegt und zeigt, dass das aktuelle Mantra des „Wachstums um alle Kosten“ nicht mehr gültig ist. „Deepseek hat eindeutig keinen Zugang zu so viel Berechnung wie US -Hyperscalers und hat es irgendwie geschafft, ein Modell zu entwickeln, das sehr wettbewerbsfähig erscheint“, Srini Pajjuri, Semiconductor -Analyst bei Raymond James. sagte CNBC. Wenn ein chinesisches Startup ein KI -Modell erstellen kann, das genauso gut funktioniert wie das neueste und größte Openai, und dies in weniger als zwei Monaten und für weniger als 6 Millionen US -Dollar tun, was nützt dann Sam Altman noch?

„Die Zeit wird zeigen, ob die Bedrohung von Deepseek real ist – das Rennen ist darauf, welche Technologie funktioniert und wie die großen westlichen Spieler reagieren und sich weiterentwickeln werden“, sagte Michael Block, Market Strategist bei Third Seven Capital, gegenüber CNN. „Die Märkte waren zu Beginn der Trump 2.0 -Ära zu selbstgefällig geworden und haben möglicherweise nach einer Ausrede gesucht, um sich zurückzuziehen – und sie haben hier eine großartige.“