Trotz Chipverboten aus den USA hat Chinas KI-Ökosystem die Erwartungen übertroffen und insbesondere die internationale Aufmerksamkeit der Entwickler auf sich gezogen, da Alibabas Open-Source-Qwen-Serie in der Community weithin angenommen und diskutiert wurde.
China hat aus verschiedenen Gründen ein völlig separates KI-Ökosystem geschaffen: 1) um die Abhängigkeit vom Westen zu verringern und 2) wegen der Zensurbeschränkungen durch die Große Firewall. Das heißt allerdings nicht, dass Innovationen dadurch unterdrückt werden.
In China gibt es derzeit eine äußerst dynamische Gruppe von Akteuren im gesamten KI-Ökosystem und heute werden wir uns eingehend mit der Rolle befassen, die Alibaba in diesem Bereich spielt.
Unternehmen | Infrastrukturebene | Modellebene | Anwendungsschicht |
Alibaba | Alibaba Cloud bietet eine robuste Cloud-Infrastruktur mit Unterstützung für Open-Source-Modelle und umfassende KI-Dienste. | Qwen-72B und Qwen-1.8B sind fortschrittliche LLMs, die von Alibaba Cloud entwickelt wurden und über Funktionen zur multimodalen Verarbeitung verfügen. | Dingtalk, Unternehmens-Chat-Plattform Alimama, KI-gesteuertes Anzeigenoptimierungs-Tool-Set für KMU, die auf Tmall und Taobao verkaufen. |
Tencent | Tencent verbessert seine KI-Fähigkeiten durch sein intelligentes Hochleistungsnetzwerk und optimiert die GPU-Nutzung für das LLM-Training. | Hunyuan ist Tencents unternehmensinterner LLM, der auf Unternehmensanwendungen ausgerichtet ist und den Schwerpunkt auf Effizienz und Kosteneffektivität legt. | Zu den KI-Diensten von Tencent gehören personalisierte Newsfeeds und Chatbot-Lösungen für alle bestehenden Apps. |
Huawei | Huawei Cloud bietet eine leistungsstarke Infrastruktur, die speziell auf KI-Anwendungen zugeschnitten ist und den Schwerpunkt auf technologischer Autarkie legt. | Pangu 3.0 besteht aus grundlegenden, branchenspezifischen und szenariospezifischen Modellen, die für vielfältige Anwendungen in verschiedenen Sektoren entwickelt wurden. | Die LLMs von Huawei werden in verschiedenen Branchen wie dem Finanz- und Gesundheitswesen eingesetzt, um die digitale Transformation voranzutreiben. |
ByteDance | ByteDance nutzt seine gesamte Cloud-Infrastruktur zur Unterstützung der Bereitstellung seiner LLMs und legt den Schwerpunkt auf die Kosteneffizienz bei KI-Diensten. | Doubao ist eine von ByteDance eingeführte LLM-Familie, die für verschiedene Anwendungen mit aggressiven Preisstrategien entwickelt wurde. | Anwendungen wie Doubao Chatbot und andere generative KI-Tools zielen darauf ab, die Benutzerinteraktion und die Inhaltsgenerierung zu verbessern. |
Baidu | Baidu Cloud bietet eine umfassende Infrastruktur für das Training und die Bereitstellung von KI-Modellen und konzentriert sich dabei auf technologische Fortschritte im Bereich KI. | Ernie ist das Flaggschiff-LLM von Baidu, bei dem im Laufe der Zeit erhebliche Verbesserungen hinsichtlich der Schulungseffizienz und der Anwendungsleistung erzielt wurden. | Die Anwendungen von Baidu nutzen Ernie für erweiterte Suchfunktionen, Konversationsagenten und andere KI-gesteuerte Lösungen. |
Joe Tsai spricht über die KI-Strategie von Alibaba, die sich auf die Unterstützung der KI-Infrastruktur durch Nutzung des bestehenden Cloud-Geschäfts konzentriert.
Alibabas KI-Spielbuch
Alibaba investiert mit einer Doppelstrategie auf fünf wichtigen Wegen in KI.
End-to-End-Tech-Stack-Strategie:
- Aufbau eines eigenen LLM – Qwen und Angebot seiner LLMs für KI-Entwickler
- Cloud-Computing-Dienst
- Entwicklung von Chips für die Verarbeitung von KI-Anwendungen.
Ökosystemstrategie:
- Implementierung von KI in bestehende kundenorientierte Anwendungen
- Finanzierung von KI-Unternehmen im gesamten Ökosystem
Alibaba ist mit Abstand das international bekannteste chinesische Technologieunternehmen mit einem führenden Cloud-Geschäft und seiner eigenen proprietären LLM-Technologie. Obwohl Baidu und Huawei in China jeweils ihre eigenen Modelle und Cloud-Dienste haben, war Baidus datenorientierte Strategie schon immer stärker auf seine autonome Fahrtechnologie ausgerichtet und Huawei war schon immer stärker auf Computer und Hardware fokussiert, während sein LLM eher als „nettes Extra“ für Unternehmenskunden angesehen wird.
Im Gegensatz dazu hat Alibaba wiederholt erklärt, dass es sein Ziel sei, „KI für alle zugänglich zu machen“. Auf der Apsara-Konferenz 2024 Alibaba-CEO Eddie Wu betonte, dass sich das Unternehmen der Unterstützung des Open-Source-Ökosystems von Chips, Servern und Netzwerken bis hin zu Speichern und Rechenzentren verschrieben habe.
Eigenständiger LLM: Tongyi Qianwen (Qwen)
An der Spitze von Alibabas KI-Angeboten steht Tongyi Qianwen, ein großes Sprachmodell, das einem „Super-Chatbot“ ähnelt. Dieses fortschrittliche Modell ist in der Lage, Text zu verstehen und zu generieren, wodurch es für eine breite Palette von Anwendungen geeignet ist, darunter Artikelerstellung, Konversationsantworten und Kundensupport.
Die Qwen-Serie – bietet unglaubliche Skalierbarkeit, Leistung in allen Benchmarks, multimodale Funktionen und ist für eine breite Benutzergruppe zugänglich. Alibaba hat diese Technologie öffentlich zugänglich gemacht, sodass andere Unternehmen sie kostenlos nutzen können, um ihren Kundenservice zu verbessern.
„Es ist das wettbewerbsfähigste chinesische LLM im Vergleich zu GPT4/4.o in Bezug auf die Gesamtleistung“, sagte Leo Jiang, Gründer von GroundAI und ehemaliger Chief Digital Officer von Huawei.
Er fügte hinzu, dass das Besondere an Qwen die beiden Formate seien: „Der API-gesteuerte LLM-Dienst bietet eine schnellere Markteinführungszeit und Kosteneffizienz. Die Open-Source-Version hingegen bietet den Kunden mehr Kontrolle und Privatsphäre.“
Alibaba brachte 2023 sein großes Sprachentwicklungstool Tongyi Qianwen auf den Markt. Es wird oft als Qwen bezeichnet und liegt nun in der 2,5. Iteration vor. Die Qwen-Modelle, darunter Qwen-72B und Qwen-1.8B, zeichnen sich durch ihre unterschiedlichen Parametergrößen aus – von 1,8 bis 72 Milliarden Parametern – und ihre multimodalen Fähigkeiten, die es ihnen ermöglichen, nicht nur Text, sondern auch Audio- und visuelle Daten zu verarbeiten.
Diese Flexibilität wird durch ihr Training mit über 3 Billionen Tokens verstärkt, wodurch sie viele andere Open-Source-Modelle in verschiedenen Benchmarks übertreffen können, darunter Multitask-Genauigkeit und Codegenerierungsfunktionen.
Qwen hat sich als umfassender KI-Assistent mit fünf wichtigen Anwendungsfällen positioniert:
1) Transkription und Zusammenfassung von Meetings in Echtzeit
2) Verarbeitung langer Inhalte und Bereitstellung von Zusammenfassungen, die ein kompliziertes Verständnis erfordern
3) Erstellung von KI-PowerPoint-Präsentationen
4) Simultanübersetzung in Echtzeit
5) Video-Chat mit einem KI-Agenten, der bei der Problemlösung helfen kann.
Quelle: Alibaba
Die Einzigartigkeit von Qwen liegt in seiner beeindruckenden Technologie und seinem starken Engagement für Open-Source-Prinzipien, da Alibaba verschiedene Versionen seiner Modelle auf Plattformen wie Hugging Face und ModelScope verfügbar macht. Manche Leute waren verwirrt, warum das Unternehmen sich entschieden hat, sein Modell für andere zugänglich zu machen, da es Kapital in KI gesteckt hat und seine Belohnung nun einfach kostenlos hergibt. Das Unternehmen hat jedoch darauf bestanden, es für alle zugänglich zu machen, da es betonte, dass dieser Ansatz eine kollaborative Umgebung fördert, in der Entwickler gemeinsam experimentieren und Innovationen entwickeln können. Die Monetarisierung kann später erfolgen und Alibaba wird sicherlich Wege dazu finden, aber bis jetzt hat es sich als Schlüsselspieler erwiesen, wenn es darum geht, den Zugang zu fortschrittlichen KI-Technologien für alle zu demokratisieren.
Alibaba trainiert seine Open-Source-KI-Modelle größtenteils mit öffentlich verfügbaren Daten aus seinen Anwendungen, wie etwa der E-Commerce-Marktplatz-App Taobao. Angesichts der monatlich über 930 Millionen aktiven Nutzer ist dies ein enormer Wettbewerbsvorteil. Durch die Veröffentlichung seiner proprietären Modelle hat das Unternehmen eine Debatte darüber ausgelöst, ob Open-Source-KI-Modelle – die normalerweise transparenter und kostengünstiger sind – tatsächlich auch anfälliger für Missbrauch sind.
Insbesondere Unternehmen mit weniger als 100 Millionen aktiven Nutzern pro Monat können diese Modelle kostenlos nutzen, was eine breitere Akzeptanz in allen Branchen fördert. Durch die Unterstützung des Wachstums der Open-Source-Community möchte Alibaba den Nutzern ermöglichen, KI-Funktionen effektiv zu nutzen und gleichzeitig die Abhängigkeit von proprietären Technologien zu verringern.
Jeff Ding von ChinaAI übersetzte den weit verbreiteten AItechtalk-Artikel über warum Qwen derzeit das weltweit beliebteste Open-Source-Großmodell ist, Darin heißt es: „Laut Hugging Face-Daten hat die Qwen-Serie/Blutlinie der Modelle mehr als 50.000 erreicht. Das heißt, Entwickler auf der ganzen Welt haben mehr als 50.000 abgeleitete Modelle auf der Grundlage der Qwen-Serie trainiert, nur übertroffen von der Llama-Serie mit etwa 70.000. Diese Daten sind der überzeugendste Indikator für die Beurteilung des Einflusses eines Modells auf Ökosystemebene.“
Beeindruckenderweise haben die Qwen-Modelle im vergangenen Jahr in verschiedenen Branchen, darunter Automobil, Gaming und wissenschaftliche Forschung, großes Interesse geweckt. Die Modelle wurden seit ihrer Einführung über 40 Millionen Mal heruntergeladen. Darüber hinaus ist das leichte Modell Qwen-1.8B für den Einsatz auf Edge-Geräten wie Smartphones konzipiert und stellt somit eine attraktive Option für Anwendungen dar, die weniger Rechenressourcen erfordern.
Das jüngste umfassende Upgrade von Qwen2.5 bedeutet einen größeren Parameterumfang, ein leistungsfähigeres Verständnis von Fotos und Videos, ein groß angelegtes Audiosprachenmodell und fortgesetzte Open-Source-Modelle. Es wurde nicht nur drastisch verbessert, sondern auch die Kosten für starke Inferenzfähigkeiten zur Unterstützung komplexer Aufgaben wurden sowohl für Qwen-Plus als auch für Qwen-Turbo gesenkt.
Mit Blick auf die Zukunft stellte CEO Eddie Wu fest, dass die Entwicklung der KI zwar rasch voranschreitet, die AGI (Artificial General Intelligence) sich jedoch noch in einem frühen Stadium befindet. Er betonte die Bedeutung der Zusammenarbeit und hob hervor, dass die API-Inferenzkosten für Tongyi Qianwen im Vergleich zum Vorjahr um 971 TP3T gesunken sind, ein wichtiger Faktor, der zu seiner wachsenden Popularität beiträgt. Tatsächlich wird dies von Leo, dem ehemaligen Huawei-Manager, bestätigt, der feststellte, dass die Qwen-Modelle im Vergleich zu den meisten anderen in China ansässigen Modellen eine höhere Genauigkeit und Sachlichkeit bieten. Es kann für Unternehmensanwendungsfälle angepasst werden, bei denen die Genauigkeit der Ergebnisse im Vordergrund steht und Modellhalluzinationen minimiert werden sollen. Zusätzlich, Der größte Vorteil von Qwen besteht derzeit darin, dass es Entwicklern eine leistungsstarke und dennoch kostengünstige Alternative bietet.
Wie nutzt man Qwen am besten?
Qwen zeichnet sich als wettbewerbsfähiges und kommerziell tragfähiges Large Language Model (LLM) aus. Seine weitverbreitete Akzeptanz in der Open-Source-Community sorgt für eine breitere Validierung und Unterstützung, während seine Bereitstellung durch die erstklassige Infrastruktur von Alibaba Cloud unterstützt wird. Diese Faktoren machen Qwen zu einer guten Wahl für Unternehmen. Im Folgenden finden Sie die vier wichtigsten Schritte für die Bereitstellung von Qwen in Ihrem Unternehmen.
- Definieren Sie Geschäftsziele und Anwendungsfälle: Konzentrieren Sie sich auf Anwendungsfälle mit großer Wirkung, etwa die Automatisierung des Kundensupports, die Verbesserung der Datenanalyse oder die Verbesserung der Inhaltserstellung.
- Datenaufbereitung und Einrichtung der Infrastruktur: Bewerten und bereiten Sie die Daten vor, die für das Training und die Feinabstimmung des Qwen-Modells erforderlich sind. Dazu gehört das Bereinigen, Strukturieren und Sicherstellen der Verfügbarkeit relevanter Datensätze, da in der Regel 60–70 % der Gesamtkosten in dieser Schicht liegen.
- Pilotprojekt und iterative Evaluation: Beginnen Sie mit einem kleinen Pilotprojekt, vergleichen Sie die Ergebnisse mit vordefinierten KPIs und führen Sie schnelle Iterationen durch, um Verbesserungen herbeizuführen.
- Skalierung und Integration: Integrieren Sie Qwen vollständig in Ihre vorhandenen Arbeitsabläufe, um sein volles Potenzial auszuschöpfen, und etablieren Sie gleichzeitig eine Governance-Struktur zur Überwachung und Optimierung seiner Leistung.
Alibaba Cloud
KI und das Cloud-Geschäft sind wie die linke und die rechte Hand, sagte Joe Tsai iein Podcast im Gespräch mit dem norwegischen Hedgefonds-Manager Nicolai Tangen. Wie bereits erwähnt, kann jeder Alibabas LLM über APIs nutzen oder direkt auf das Open-Source-Modell zurückgreifen. Wer Qwen einsetzen möchte, benötigt allerdings Cloud-Rechenleistung und Alibaba Cloud stellt diese zur Verfügung.
Tatsächlich laufen derzeit 801 Milliarden der chinesischen Technologieunternehmen und die Hälfte der großen Modellunternehmen des Landes auf Alibaba Cloud. Dieser Umfang ist einfach unübertroffen. Joe bekräftigte, dass Alibaba mit seinem Cloud-Service als größter Anbieter in der Region Asien-Pazifik einen enormen Vorteil bei der Beschaffung von Daten und Tests für sein Tongyi Qianwen hat. Der positive Zyklus ermöglicht es den beiden Unternehmen, sich über die KI-Ebenen hinweg kontinuierlich gegenseitig zu befruchten.
Darüber hinaus hat das Unternehmen die größte Open-Source-Community namens Modellumfang Das Unternehmen hostet viele andere Open-Source-Modelle auf dem Marktplatz, und wenn Entwickler diese Open-Source-Modelle verwenden, benötigen sie auch Rechenleistung, die zu einem der Haupttreiber für Alibabas Cloud-Umsatz geworden ist.
Indem der Technologieriese den Startups die Cloud-Infrastruktur zur Verfügung stellt, hofft er, sich abzusichern, indem er ihnen direkten Zugriff auf die beste verbraucherorientierte Anwendung ermöglicht. Die Bereitstellung der Cloud-Infrastruktur würde dem Unternehmen Zugriff auf einen vielfältigen Datenpool aus verschiedenen Domänen und Anwendungsfällen ermöglichen, den es mit entsprechender Genehmigung möglicherweise zur Feinabstimmung seiner eigenen Modelle nutzen könnte. Dies würde auch bedeuten, dass die Talentakquise und der Zugang zu Innovationen in diesem Bereich leichter möglich wären.
Alibabas KI-Anwendungen
Werfen wir also einen Blick auf die Anwendungsseite. Alibaba hat KI umfassend in seine eigenen Betriebsabläufe integriert und nutzt sie für Produktempfehlungen auf seiner E-Commerce-Plattform, intelligenten Kundenservice, KI-gestütztes Anzeigen-Targeting und KI-gesteuerte Lösungen in Cloud-Diensten. Darüber hinaus sucht das Unternehmen nach Möglichkeiten, KI besser zu nutzen, um die Logistikeffizienz und andere Anwendungsfälle zu verbessern. Schauen wir uns heute zunächst einige ausgereifte Lösungen an.
Das Online-Serving mit künstlicher Intelligenz (AI OS) ist eine Plattform, die vom Suchentwicklungsteam des Unternehmens entwickelt wurde. AI OS integriert personalisierte Suche, Empfehlungen und Werbung und unterstützt verschiedene Geschäftsszenarien auf Alibabas Plattformen, wobei der Schwerpunkt hauptsächlich auf Marktplatz-Apps wie Taobao liegt. Die Technologie, die ursprünglich auf die Suchfunktionen von Taobao ausgerichtet war, wurde um Deep-Learning-Technologien und verschiedene Suchmaschinen und Empfehlungen erweitert.
Dingtalk ist eine Chat-Software für Unternehmen, ähnlich wie Slack. Alle Produkte von Dingtalk sind KI-fähig und verfügen über einen eingebetteten KI-Agenten für den Unternehmens- und Privatgebrauch, der Anfang 2024 eingeführt wurde. Der KI-Agent ist ein virtueller Roboter, der Datenanalysen untersuchen kann und über Speicher-, Planungs- und Ausführungsfunktionen verfügt.
Die Interaktion mit dem Agenten erfolgt über einen Chatbot ähnlich wie ChatGPT. Zu den vom Unternehmen vorgeschlagenen Anwendungsfällen gehört der Einsatz des Roboters als Verkäufer, IT-, HR-Verwaltungs-, Finanz- oder Beschaffungsmitarbeiter. Er kann Unternehmen dabei helfen, viele der sich wiederholenden, langwierigen Aufgaben im Managementprozess zu automatisieren.
Alimama ist eine Plattform, die Marken bei der Anzeigenoptimierung auf Alibabas E-Commerce-Marktplatz-Apps – Tmall/Taobao – unterstützt. Alimama ist eine relativ unbekannte Geschäftseinheit von Alibaba, wurde aber bereits 2007 gegründet. Es handelt sich um eine digitale Marketingplattform für Unternehmen, die auf den Plattformen Taobao oder Tmall verkaufen. Die KI-gestützte Multimedia-LMA wurde im April dieses Jahres eingeführt und ist mittlerweile vollständig auf 2B-Anwendungen angewendet worden. Zu den Tools gehören KI-Verkaufsagenten, die Kundenanfragen bearbeiten und grundlegende Aufgaben der Anzeigengestaltung ausführen können, um Effizienz und Qualität zu verbessern. Darüber hinaus bietet Alimama Verkaufsanalysen für Budgetierung und Preisgestaltung, Bestandsverwaltungstools zur Steigerung des ROI und kostengünstige Text-zu-Bild- oder Videogenerierungsdienste für Anzeigen. Das Unternehmen behauptet, über 1 Million Händler auf der Plattform bedient und die Kosten für die Anzeigenproduktion deutlich gesenkt zu haben.
Investieren, um alle Möglichkeiten (Chancen) zu nutzen
Alibaba hat aktiv mehrere vielversprechende KI-Unternehmen auf allen Ebenen übernommen und in sie investiert, insbesondere solche, die auf die Entwicklung von KI-Chips und LLM-Entwickler spezialisiert sind. Diese strategischen Schritte zielen darauf ab, Alibabas Möglichkeiten in der sich rasch entwickelnden KI-Landschaft zu erweitern.
Und allein im Jahr 2024 hat Alibaba große Finanzierungsrunden für mehrere KI-Unternehmen geleitet, darunter eine Investition von 14 Billionen TP1 in Moonshot AI, wodurch die Bewertung des Unternehmens auf rund 14 Billionen TP2,5 Milliarden gestiegen ist; eine Finanzierungsrunde von 14 Billionen TP691 Millionen für Baichuan, wodurch die Bewertung des Unternehmens auf rund 14 Billionen TP2,8 Milliarden anstieg; und eine Zusage von über 14 Billionen TP600 Millionen für MiniMax, drei von vier der sogenannten „Tiger“.
Die derzeit vier wertvollsten KI-Startups in China werden als „Die vier KI-(kleinen) Tiger“ bezeichnet. Sie wurden alle in den letzten drei bis fünf Jahren gegründet und erzielen bereits enorme Erfolge mit Moonshot soll $3 Milliarden wert sein, Minimax im Wert von $2 Milliarden, Zhipu KI sammelt fast $800 Millionen ein Und Der Wert von Baichuan soll bei rund $2 Milliarden liegen.
Alibabas Chips: T-Head
Zuletzt und oft übersehen werden Alibabas Bemühungen in der Hardware-Entwicklung. Kurzmeldung: Huawei ist nicht das einzige große chinesische Technologieunternehmen, das Chip-Hardware entwickelt.
Alibabas Chip-Unternehmen, T-Kopf, macht bedeutende Fortschritte bei der Entwicklung der RISC-V-Architektur als Teil von Chinas umfassenderem Vorstoß zur Halbleiterautarkie trotz anhaltender US-Handelsbeschränkungen. T-Head hat sich auf die Entwicklung von Hochleistungschips konzentriert, die verschiedene Anwendungen unterstützen können, darunter künstliche Intelligenz (KI), Big-Data-Analyse und Online-Transaktionen.
Eines der bemerkenswertesten Produkte von T-Head ist der Zhenyue 510, ein Controller-Chip für Solid-State-Laufwerke (SSDs) für Unternehmen. Dieser Chip wurde auf Alibabas Apsara-Cloud-Computing-Konferenz vorgestellt und verspricht eine Leistungssteigerung in den Rechenzentren von Alibaba Cloud, indem er die Latenzzeit für Eingabe- und Ausgabevorgänge im Vergleich zu bestehenden Lösungen um 30% reduziert. Diese Innovation ist von entscheidender Bedeutung, da sie es Alibaba ermöglicht, seine Cloud-Dienste zu optimieren und die Effizienz bei der Abwicklung groß angelegter Datenverarbeitungsaufgaben zu verbessern.
Während China weiterhin mit Beschränkungen für US-Technologie zu kämpfen hat, stellt T-Heads Fokus auf RISC-V einen strategischen Schritt in Richtung einer potenziell größeren Unabhängigkeit bei Chipdesign und -herstellung dar.
Was wir wissen, ist, dass Alibaba bei seiner KI-Strategie einen ganzheitlichen Ansatz verfolgt. Das Unternehmen umfasst einen umfassenden Technologie-Stack und hat sich als Schlüsselspieler im Ökosystem positioniert. Dies sind alles wichtige Grundlagen, um die Qwen-Modelle deutlich weiter voranzutreiben. Qwen-Modelle basieren auf Skalierbarkeit auf Infrastrukturebene bis hinunter auf Chipebene und sind darauf ausgelegt, verschiedene Anwendungen in Alibabas umfangreichem E-Commerce-, App- und Investment-Ökosystem zu unterstützen. Dieser strategische Fokus verbessert nicht nur die Fähigkeiten der Modelle, sondern stellt auch ihre Relevanz und Wirksamkeit in verschiedenen unternehmensorientierten Anwendungsfällen sicher, bei denen Genauigkeit im Vordergrund steht und Modellhalluzinationen minimiert werden. Das Unternehmen hat sich erfolgreich als einer der wichtigsten, wenn nicht sogar DER WICHTIGSTE, Akteure im chinesischen KI-Ökosystem positioniert.
##
Quellen: Interviews, Branchenberichte, Experteneinblicke, Unternehmensankündigungen, Investor-Relations-Material, Transkripte der Aspara-Konferenz und Alizila.
Links
- Alibaba Cloud offizieller Link zu Qwen
- Qwen2.5-LLM-Anweisungen, zuletzt aktualisiert September 2024
- Github Qwen2.5: eine Reihe großer Sprachmodelle, die eine Vielzahl von Parameterskalen (von 0,5 B bis 72 B) unterstützen, mit verbesserten Funktionen zur Generierung langer Texte, zur Anweisungsverfolgung und zum strukturierten Datenverständnis und unterstützt 29 Sprachen. Seine Anwendungen eignen sich für die Codegenerierung, Textgenerierung und komplexe Datenverarbeitung. Qwen2.5 bietet Funktionen wie Quantisierung, Inferenz und lokale Bereitstellung, die mit verschiedenen Rechenframeworks wie Hugging Face, ModelScope und vLLM kompatibel sind.
- Github Qwen-VL: ist ein groß angelegtes visuelles Sprachmodell, das sowohl Bild- als auch Texteingaben unterstützt und über mehrsprachige Konversationsfunktionen verfügt, insbesondere bei der Bild-Text-Erkennung auf Chinesisch und Englisch. Das Modell unterstützt hochauflösende Bildverarbeitung und feinkörnige Erkennung und übertrifft damit die meisten Open-Source-Modelle.
- Github Qwen-Audio: kann verschiedene Audioeingaben (wie menschliche Sprache, natürliche Geräusche, Musik usw.) verarbeiten und Textausgaben generieren. Dieses Modell eignet sich für Aufgaben wie Audioerkennung, Audiobeschreibung, Szenenklassifizierung und Emotionserkennung.
- Github Qwen2.5-Mathe: Es unterstützt die Lösung mathematischer Probleme sowohl auf Chinesisch als auch auf Englisch und integriert Chain of Thought (CoT) und Tool-Integrated Reasoning (TIR).
- Github Qwen2.5-Programmierer: das neueste Open-Source-Programmiermodell, das ein Kontextfenster von 128 K unterstützt und 92 Programmiersprachen abdeckt.
Biografie des Autors
Grace schreibt über KI x Energie, KI x Geopolitik, KI x Bigtech auf Substack bei AI Proem.
Sie schreibt auch oft Kommentare für Vermögen, Der Diplomatund andere internationale Publikationen zu KI, Technologie und Corporate Governance. In ihrer früheren Tätigkeit als Journalistin hat Grace für CNBC aus Singapur über asiatische Technologie und Wirtschaft berichtet, und ihre Arbeiten wurden auch in SCMP, S&P Global Market Intelligence, Yahoo Finance und USA Today veröffentlicht.
Die 5 beliebtesten Lektüren von Grace:
- Das KI-Wettrüsten ist noch lange nicht vorbei: Chips sind nur die eine Hälfte des Spiels, die andere ist die Infrastruktur
- Warum Rechenzentren noch nicht vollständig auf erneuerbare Energien umsteigen können
- Gewinne der großen Technologieunternehmen: Alle Mann an Deck für KI
- Baidu, Alibaba, Tencent: KI-Showdown
- Eine ganz (neue) nukleare Welt
Der nächste große Deep Dive steht bevor: Huawei vs. Nvidia und Google
Abonnieren Sie, um die neuesten Blogbeiträge zu erhalten
Hinterlassen Sie Ihren Kommentar: