Cuộc chiến AI Trung Quốc - Khi "pháp sư" làm rung chuyển thị trường toàn cầu
Tháng 3/2026, dữ liệu từ OpenRouter ghi nhận một sự kiện chưa từng có: thị phần token của các mô hình AI Trung Quốc đạt 32% — tăng từ 5% chỉ 11 tháng trước. Cùng lúc đó, thị phần mô hình Mỹ giảm từ 58% xuống còn 19%.
Điều đáng nói: đây không phải nhờ "đốt tiền khuyến mãi". Đây là kết quả của một hệ sinh thái được tối ưu từ gốc rễ — từ kiến trúc MoE, chip nội địa, cho đến chiến lược định giá quyền lực.
Bài viết này giúp bạn hiểu toàn cảnh cuộc chiến AI Trung Quốc: tại sao họ rẻ hơn phương Tây 5-10 lần, báo cáo Morgan Stanley nói gì, 6 "Tiểu Hổ" đang ra sao, và developer Việt Nam nên chọn gì.
Phần 1: AI đang rẻ đi hay đắt lên? Sự thật đằng sau "giá niêm yết"
Làn sóng tăng giá Q1-Q2/2026
Nếu bạn chỉ nhìn vào "giá niêm yết" (list price), ngành AI Trung Quốc đang trong làn sóng tăng giá mạnh:
| Hãng | Model | Mức tăng | Thời gian |
|---|---|---|---|
| Zhipu (GLM) | GLM-5 → GLM-5.1 | +83% (Q1), thêm +10% (T4) | 3 lần调价 trong năm |
| Tencent | HY 2.0 | +463% | Tháng 3/2026 |
| Baidu | ERNIE series | +5-30% | Tháng 3/2026 |
| Alibaba | Qwen | +5-34% | Tháng 3/2026 |
| Moonshot | K2 → K2.6 | +58% | Lần tăng đầu tiên |
Nghe có vẻ "AI đắt lên"? Không. Thực tế phức tạp hơn nhiều.
Tại sao tăng giá mà khách hàng vẫn tăng vọt?
Zhipu AI tăng 83% giá API trong Q1/2026 — nhưng lượng gọi API tăng 400%. Điều này nói lên gì? Định giá quyền lực (pricing power): khách hàng sẵn sàng trả nhiều hơn vì giá trị mô hình mang lại vượt xa chi phí.
Nhưng DeepSeek thì ngược lại — và đây mới là câu chuyện thực sự
Trong khi cả ngành tăng giá, DeepSeek giảm giá xuống còn 1/10 lúc mới ra mắt. Không phải "khuyến mãi" — đây là kết quả của kiến trúc MoE thế hệ mới + chip nội địa, giúp chi phí thực tế trên mỗi token rẻ hơn hẳn.
Lưu ý: Giá cache hit (token đã được cache từ prompt trước) là công nghệ thực tế, không phải "khuyến mãi". Khi bạn chat với cùng một codebase hoặc prompt template, 70-90% token thường hit cache.
Phần 2: Báo cáo Morgan Stanley — "More Bang For The Buck"
Tháng 4/2026, Morgan Stanley (MS) phát hành báo cáo "China's AI Path: More Bang For The Buck" — nhận định lạc quan nhất từ một ngân hàng đầu tư phương Tây về AI Trung Quốc.
3 luận điểm chính
1. Chi phí suy luận chỉ bằng 15-20% so với Mỹ — chất lượng tương đương
Các mô hình Trung Quốc đạt 50-54 điểm trên Artificial Analysis Intelligence Index — gần ngang bằng mô hình Mỹ. Nhưng chi phí suy luận (inference cost) chỉ bằng 15-20%.
2. Khoảng cách Mỹ - Trung chỉ còn 3-6 tháng
MS kết luận: khoảng cách công nghệ AI giữa hai nước đã thu hẹp từ 2-3 năm xuống còn 3-6 tháng. Báo cáo Chỉ số AI 2026 của Đại học Stanford thậm chí ghi nhận chênh lệch hiệu suất chỉ còn 2.7%.
3. Dự báo ARR "khủng": 10-15 tỷ USD/công ty vào cuối 2026
| Công ty | ARR hiện tại | Dự báo cuối 2026 | Dự báo cuối 2027 |
|---|---|---|---|
| MiniMax | $1.5 tỷ (T2/2026) | $10-15 tỷ | $25-50 tỷ |
| Zhipu | $2.5 tỷ (T3/2026) | $10-15 tỷ | $25-50 tỷ |
| Moonshot | $0.1+ tỷ | Chưa công bố | Chưa công bố |
MS đồng thời nâng giá mục tiêu cổ phiếu MiniMax từ 990 HKD lên 1.100 HKD.
Phần 3: Vì sao AI Trung Quốc rẻ hơn? 3 trụ cột công nghệ
Không phải "đốt tiền". Không phải "khuyến mãi". Chi phí rẻ đến từ 3 trụ cột công nghệ được tối ưu từ gốc:
Trụ cột 1: MoE — Kiến trúc "chọn đúng chuyên gia"
Toàn bộ mô hình hàng đầu Trung Quốc — Kimi K2 (1.000B params), MiniMax M2.5 (230B), DeepSeek V3 (671B), GLM-5.1 — đều dùng MoE (Mixture of Experts).
Ví dụ MiMo-V2.5-Pro: 309 tỷ tham số tổng, chỉ kích hoạt ~15 tỷ mỗi token — chi phí suy luận chỉ bằng 2.5% so với mô hình闭源 quốc tế cùng đẳng cấp.
Trụ cột 2: Chip nội địa — Thoát khỏi CUDA, giảm chi phí 30%
Dưới áp lực cấm vận chip từ Mỹ, Trung Quốc đã buộc phải tự chủ — và kết quả vượt kỳ vọng:
Trụ cột 3: Token Economy — Scale để giảm chi phí
Trung Quốc có lợi thế scale cực lớn:
- 1.4 tỷ dân → dữ liệu tiếng Trung khổng lồ, đa dạng
- 100+ triệu developer → nhu cầu API cực cao
- Hệ sinh thái ứng dụng phong phú (WeChat, Douyin, Xiaohongshu) → token consumption tăng theo cấp số nhân
DeepSeek V4 tiêu thụ 140 nghìn tỷ token/ngày (đầu 2026) — tăng 1.400 lần trong 2 năm. Scale lớn → chi phí cố định分摊 nhỏ → giá unit giảm.
Phần 4: "AI Lục Tiểu Hổ" — 6 startup làm thay đổi cục diện
"AI Lục Tiểu Hổ" (六小虎) là biệt danh cho 6 startup AI hàng đầu Trung Quốc, nổi lên sau cơn sốt ChatGPT. Đến 2026, bức tranh đã phân hóa rõ rệt:
Bảng tổng quan
| Công ty | Tên EN | Founder | Định hướng | Trạng thái (T4/2026) |
|---|---|---|---|---|
| Trí Phổ AI (智谱) | Zhipu AI | Trương Bằng, Đường Kiệt (Thanh Hoa) | "OpenAI của Trung Quốc" | ✅ IPO (HKEX: 02513). Định giá ~$3.4B |
| MiniMax (稀宇) | MiniMax | Diêm Tuấn Kiệt (cựu SenseTime) | Đa phương thức, ToC | ✅ IPO (HKEX: 00100). Định giá ~$4.2B |
| Nguyệt Chi Ám Diện | Moonshot AI | Dương Thực Lân (Thanh Hoa) | Kimi, AI Agent, premium | 📋 Đang gọi vốn. ARR >$100M. Kế hoạch IPO |
| Giai Dược Tinh Thần | StepFun | Khương Đại Hân (cựu Microsoft) | AI Agent, hạ tầng phức tạp | 📋 Chuẩn bị IPO Hồng Kông |
| Bách Xuyên Trí Năng | Baichuan AI | Vương Tiểu Xuyên (cựu Sogou) | Chuyển hướng: AI y tế | 🔀 Rời AGI, tập trung healthcare |
| Linh Nhất Vạn Vật | 01.AI | Lý Khai Phục (Innovation Works) | Chuyển hướng: ToB, SMB | 🔀 Rời AGI, focus enterprise solutions |
3 nhóm sau phân hóa
Áp lực từ "cú sốc DeepSeek"
DeepSeek — không thuộc nhóm "Lục Tiểu Hổ" — với hiệu năng vượt trội và mã nguồn mở, đã gây áp lực lớn lên định giá của cả 6 công ty. Kết quả:
- Zhipu, MiniMax: IPO nhanh để củng cố vị thế
- Moonshot, StepFun: Đẩy mạnh premium positioning
- Baichuan, 01.AI: Rời cuộc đua AGI, tìm ngách an toàn
Phần 5: Developer Việt Nam nên chọn gì?
Không phải mô hình nào "rẻ nhất" cũng là lựa chọn tốt nhất. Đây là guide thực tế:
Theo use case
| Use case | Model khuyên dùng | Chi phí ước tính (1M token) | Lý do |
|---|---|---|---|
| Coding hàng ngày | MiniMax M2.5 | $0.1 input / $0.3 output | SWE-Bench 80.2%, MoE 4.3% active |
| Coding complex | MiniMax M2.7 | $0.2 input / $0.6 output | Self-evolution, 200K context |
| Chat/assistant | DeepSeek V4-Flash | $0.0028 input (cache) / $0.28 | Rẻ nhất thị trường |
| Multimodal | Kimi K2.6 | ~$1-3 (ước tính) | Xử lý ảnh + text + voice tốt |
| Vietnamese NLP | Qwen / GLM | ~$2-5 | Hỗ trợ tiếng Việt tốt hơn |
| Premium/enterprise | Claude/GPT | $3-15 | Ecosystem, compliance, support |
Theo budget
Trong OpenCode
Kết nối nhanh trong OpenCode:
/connect minimax # Kết nối MiniMax (M2.5/M2.7)
/connect deepseek # Kết nối DeepSeek V4
/connect kimi # Kết nối Kimi K2
Hoặc cấu hình thủ công trong opencode.json:
{
"provider": {
"minimax": {
"apiKey": "sk-minimax-...",
"models": {
"coding": "minimax/m2.5",
"agent": "minimax/m2.7"
}
},
"deepseek": {
"apiKey": "sk-deepseek-...",
"models": {
"coding": "deepseek/deepseek-v4-pro"
}
}
}
}
Phần 6: Tương lai — AI sẽ còn rẻ hơn nữa
1. Chip quang học — Bước ngoặt cuối 2026
Các công ty như Lightmatter, Neurophos, Q/C Technologies đang phát triển chip quang học cho AI:
- Tiết kiệm năng lượng gấp 10 lần GPU A100 cho tác vụ inference
- Khi quy trình sản xuất trưởng thành, chi phí mạch tích hợp quang học sẽ giảm mạnh
- Đây là xu hướng tất yếu: điện tử → quang tử cho AI inference
2. Ascend 950 +专用推理 ASIC
Cuối 2026, Huawei Ascend 950 và các专用推理 ASIC từ 8 hãng chip Trung Quốc sẽ ra mắt:
- Chi phí suy luận dự kiến giảm thêm 40-50%
- Toàn bộ ecosystem đã适配: DeepSeek V4, MiniMax M2, Qwen
- Khi các hãng này scale, chi phí unit sẽ giảm theo quy luật Moore's Law cho AI
3. Self-Evolution — Model tự train model
MiniMax M2.7 đã chứng minh khả năng tự tham gia vào quá trình huấn luyện chính mình. Khi kỹ thuật này phổ biến, chi phí train model mới sẽ giảm mạnh — và chi phí đó sẽ được truyền xuống giá API cho end user.
4. Làn sóng IPO — vốn dồi dào hơn
Moonshot (Kimi) và StepFun đang chuẩn bị IPO. Sau khi lên sàn:
- Vốn dồi dào hơn → đầu tư hạ tầng mạnh hơn → chi phí unit giảm
- Cạnh tranh khốc liệt hơn → giá sẽ tiếp tục giảm hoặc chất lượng tăng
Tổng kết
| Khía cạnh | Tóm tắt |
|---|---|
| Giá AI đang tăng hay giảm? | Giá niêm yết tăng (Zhipu +83%, Tencent +463%) nhưng chi phí thực tế giảm sâu (DeepSeek -90%) |
| Tại sao Trung Quốc rẻ hơn? | 3 trụ cột: MoE (3-5% active), chip nội địa (Ascend 37% thị phần), token economy (scale 1.4B dân) |
| Báo cáo MS nói gì? | Chi phí inference 15-20% Mỹ, khoảng cách 3-6 tháng, ARR dự báo $10-15B/công ty cuối 2026 |
| Lục Tiểu Hổ ra sao? | Phân hóa 3 nhóm: IPO (Zhipu, MiniMax), Premium (Moonshot, StepFun), Thực dụng (Baichuan, 01.AI) |
| Tương lai chi phí? | Còn giảm: chip quang học (10x tiết kiệm), Ascend 950, self-evolution, IPO vốn dồi dào |
| Developer nên chọn gì? | Budget thấp: DeepSeek Flash. Coding: MiniMax M2.5/2.7. Enterprise: Claude/GPT + MiniMax daily |
Trung Quốc không chỉ "phá giá" — họ đang định nghĩa lại cấu trúc chi phí của toàn ngành AI. Và developer Việt Nam là người hưởng lợi trực tiếp.
Bài viết tổng hợp từ: báo cáo Morgan Stanley "China's AI Path: More Bang For The Buck" (T4/2026), dữ liệu OpenRouter, báo cáo Stanford AI Index 2026, và các nguồn tin chính thống Trung Quốc (eastmoney.com, 36Kr, IT之家, 证券时报).
Đọc tiếp
Một vài bài liên quan có thể bạn sẽ thích
GLM-5.1 HighSpeed vs MiniMax HighSpeed vs Flash vs GPT-5.3 Codex Spark: Cuộc Đua Tốc Độ AI Coding 2026
Phân tích tốc độ 400 token/s của GLM-5.1 HighSpeed, so sánh với MiniMax HighSpeed, Gemini Flash và GPT-5.3 Codex Spark, rồi rút ra cách chọn model cho OpenCode và AI coding agent.
MiniMax M3 ra mắt: 1M context, multimodal, agent coding và cú nhảy từ M2.7
Phân tích MiniMax M3 cho developer dùng OpenCode: 1M context, MiniMax Sparse Attention, native multimodal, model id, cách dùng qua API/OpenRouter/Vercel và khi nào nên nâng từ M2.7.
Vibe Coding Cho Người Mới: Cách Dùng OpenCode + DeepSeek + OpenCode Go Không Cháy Ví
Hướng dẫn vibe coding cho người mới với OpenCode, OpenCode Go và DeepSeek: cách viết PLAN.md, AGENTS.md, chia workflow orchestrator-worker và tối ưu chi phí token.