Qwen
![]() Logo programu | |
![]() | |
Autor | Alibaba Cloud |
---|---|
Pierwsze wydanie | kwiecień 2023 |
Aktualna wersja stabilna | 3 |
Rodzaj | Duży model językowy |
Licencja | Apache 2.0 |
Strona internetowa |
Qwen (chiń. upr. 通义千问; chiń. trad. 通義千問; pinyin Tōngyì Qiānwèn; dosł. „aby zrozumieć znaczenie [i odpowiedzieć] na tysiące rodzajów pytań”) – rodzina dużych modeli językowych opracowanych przez Alibaba Cloud. W lipcu 2024 był uważany za jeden z najlepszych modeli na świecie i najlepszy model wytworzony w Chinach[1][2].
Modele
[edytuj | edytuj kod]Pierwsza wersja modelu Qwen została zaprezentowana w kwietniu 2023[3]. Model został oparty na architekturze transformatora. Model został upubliczniony we wrześniu 2023 po uzyskaniu zgody przez rząd chiński[4], a w grudniu modele Qwen 72B i 1.8B zostały opublikowane jako open source, wraz z ponad 100 innymi modelami[5].
W listopadzie 2024 został wydany model QwQ-32B-Preview, skupiający się na rozumowaniu podobnym do modelu o1 firmy OpenAI, wydany na licencji Apache 2.0[6]. QwQ ma długość kontekstu tokenów wynoszącą 32 000[7].
28 kwietnia 2025 Alibaba wydała modele z serii Qwen 3, wszystkie wydane na licencji Apache 2.0[8].
Przypisy
[edytuj | edytuj kod]- ↑ Alibaba’s open-source AI model tops Chinese rivals, ranks 3rd globally [online], South China Morning Post, 11 lipca 2024 [dostęp 2025-04-21] (ang.).
- ↑ Dallin Grimm , Chinese AI models storm Hugging Face’s LLM chatbot benchmark leaderboard – Alibaba runs the board as major US competitors have worsened [online], Tom’s Hardware, 27 czerwca 2024 [dostęp 2025-04-21] (ang.).
- ↑ Sheila Chiang , Alibaba to roll out its rival to ChatGPT across all its products [online], CNBC, 11 kwietnia 2023 [dostęp 2025-04-21] (ang.).
- ↑ Alibaba opens Tongyi Qianwen model to public as new CEO embraces AI [online], South China Morning Post, 13 września 2023 [dostęp 2025-04-21] (ang.).
- ↑ Arjun Kharpal , China’s Alibaba launches over 100 new open-source AI models, releases text-to-video generation tool [online], CNBC, 19 września 2024 [dostęp 2025-04-21] (ang.).
- ↑ Ben Dickson , Alibaba releases Qwen with Questions, an open reasoning model that beats o1-preview [online], VentureBeat, 29 listopada 2024 [dostęp 2025-04-21] (ang.).
- ↑ Kyle Wiggers , Alibaba releases an ‘open’ challenger to OpenAI’s o1 reasoning model [online], TechCrunch, 27 listopada 2024 [dostęp 2025-04-21] (ang.).
- ↑ Qwen Team , Qwen3: Think Deeper, Act Faster [online], Qwen, 29 kwietnia 2025 [dostęp 2025-05-01] (ang.).
Linki zewnętrzne
[edytuj | edytuj kod]- Qwen na GitHub-ie
- Qwen na Hugging Face