Cuộc chiến AI Trung Quốc - Khi "pháp sư" làm rung chuyển thị trường toàn cầu

Name: OpenCode
Author: OpenCode

Tháng 3/2026, dữ liệu từ OpenRouter ghi nhận một sự kiện chưa từng có: thị phần token của các mô hình AI Trung Quốc đạt 32% — tăng từ 5% chỉ 11 tháng trước. Cùng lúc đó, thị phần mô hình Mỹ giảm từ 58% xuống còn 19%.

Điều đáng nói: đây không phải nhờ "đốt tiền khuyến mãi". Đây là kết quả của một hệ sinh thái được tối ưu từ gốc rễ — từ kiến trúc MoE, chip nội địa, cho đến chiến lược định giá quyền lực.

Bài viết này giúp bạn hiểu toàn cảnh cuộc chiến AI Trung Quốc: tại sao họ rẻ hơn phương Tây 5-10 lần, báo cáo Morgan Stanley nói gì, 6 "Tiểu Hổ" đang ra sao, và developer Việt Nam nên chọn gì.

Phần 1: AI đang rẻ đi hay đắt lên? Sự thật đằng sau "giá niêm yết"

Làn sóng tăng giá Q1-Q2/2026

Nếu bạn chỉ nhìn vào "giá niêm yết" (list price), ngành AI Trung Quốc đang trong làn sóng tăng giá mạnh:

Hãng	Model	Mức tăng	Thời gian
Zhipu (GLM)	GLM-5 → GLM-5.1	+83% (Q1), thêm +10% (T4)	3 lần调价 trong năm
Tencent	HY 2.0	+463%	Tháng 3/2026
Baidu	ERNIE series	+5-30%	Tháng 3/2026
Alibaba	Qwen	+5-34%	Tháng 3/2026
Moonshot	K2 → K2.6	+58%	Lần tăng đầu tiên

Nghe có vẻ "AI đắt lên"? Không. Thực tế phức tạp hơn nhiều.

Tại sao tăng giá mà khách hàng vẫn tăng vọt?

Zhipu AI tăng 83% giá API trong Q1/2026 — nhưng lượng gọi API tăng 400%. Điều này nói lên gì? Định giá quyền lực (pricing power): khách hàng sẵn sàng trả nhiều hơn vì giá trị mô hình mang lại vượt xa chi phí.

"Tăng giá" ≠ "AI đắt lên"

Tăng giá vì lý do XẤU

Chi phí GPU tăng, phải bù lỗ

Cắt giảm features để giảm chi phí

Khách hàng bỏ đi, volume giảm

Tăng giá vì lý do TỐT (AI Trung Quốc)

Model thông minh hơn, khách hàng trả nhiều hơn cho giá trị cao

Volume TĂNG mạnh (Zhipu: +400%, MiniMax: 4-6x)

Khách hàng "dùng chân bỏ phiếu" — không có lựa chọn nào rẻ hơn mà vẫn đạt chất lượng

Nhưng DeepSeek thì ngược lại — và đây mới là câu chuyện thực sự

Trong khi cả ngành tăng giá, DeepSeek giảm giá xuống còn 1/10 lúc mới ra mắt. Không phải "khuyến mãi" — đây là kết quả của kiến trúc MoE thế hệ mới + chip nội địa, giúp chi phí thực tế trên mỗi token rẻ hơn hẳn.

Bảng giá API mới nhất (T4/2026)

DS V4-Flash$0.0028/1M$0.28128K

DS V4-Pro$0.0036/1M$0.87128K

GLM-5.1~$3-5/1M~$15-25128K

Claude Sonnet 4$3.00/1M$15.00200K

GPT-4o$2.50/1M$10.00128K

Claude Opus 4$15.00/1M$75.00200K

Lưu ý: Giá cache hit (token đã được cache từ prompt trước) là công nghệ thực tế, không phải "khuyến mãi". Khi bạn chat với cùng một codebase hoặc prompt template, 70-90% token thường hit cache.

Phần 2: Báo cáo Morgan Stanley — "More Bang For The Buck"

Tháng 4/2026, Morgan Stanley (MS) phát hành báo cáo "China's AI Path: More Bang For The Buck" — nhận định lạc quan nhất từ một ngân hàng đầu tư phương Tây về AI Trung Quốc.

3 luận điểm chính

1. Chi phí suy luận chỉ bằng 15-20% so với Mỹ — chất lượng tương đương

Các mô hình Trung Quốc đạt 50-54 điểm trên Artificial Analysis Intelligence Index — gần ngang bằng mô hình Mỹ. Nhưng chi phí suy luận (inference cost) chỉ bằng 15-20%.

Chi phí suy luận cho cùng 1M token

Mô hình Mỹ

~$10-30/1M token

Mô hình Trung Quốc

~$0.28-3/1M token

Chênh lệch 5-20x. Cùng độ thông minh, chi phí khác nhau 1 bậc.

2. Khoảng cách Mỹ - Trung chỉ còn 3-6 tháng

MS kết luận: khoảng cách công nghệ AI giữa hai nước đã thu hẹp từ 2-3 năm xuống còn 3-6 tháng. Báo cáo Chỉ số AI 2026 của Đại học Stanford thậm chí ghi nhận chênh lệch hiệu suất chỉ còn 2.7%.

3. Dự báo ARR "khủng": 10-15 tỷ USD/công ty vào cuối 2026

Công ty	ARR hiện tại	Dự báo cuối 2026	Dự báo cuối 2027
MiniMax	$1.5 tỷ (T2/2026)	$10-15 tỷ	$25-50 tỷ
Zhipu	$2.5 tỷ (T3/2026)	$10-15 tỷ	$25-50 tỷ
Moonshot	$0.1+ tỷ	Chưa công bố	Chưa công bố

MS đồng thời nâng giá mục tiêu cổ phiếu MiniMax từ 990 HKD lên 1.100 HKD.

Phần 3: Vì sao AI Trung Quốc rẻ hơn? 3 trụ cột công nghệ

Không phải "đốt tiền". Không phải "khuyến mãi". Chi phí rẻ đến từ 3 trụ cột công nghệ được tối ưu từ gốc:

Trụ cột 1: MoE — Kiến trúc "chọn đúng chuyên gia"

Toàn bộ mô hình hàng đầu Trung Quốc — Kimi K2 (1.000B params), MiniMax M2.5 (230B), DeepSeek V3 (671B), GLM-5.1 — đều dùng MoE (Mixture of Experts).

MoE trong các mô hình Trung Quốc

Kimi K21.000B total · 32B active · 3.2% (8/380 exp)

MiniMax M2.5230B total · 10B active · 4.3%

DeepSeek V3671B total · 37B active · 5.5% (8/256 exp)

GLM-5.1Tương tự

Ví dụ MiMo-V2.5-Pro: 309 tỷ tham số tổng, chỉ kích hoạt ~15 tỷ mỗi token — chi phí suy luận chỉ bằng 2.5% so với mô hình闭源 quốc tế cùng đẳng cấp.

Trụ cột 2: Chip nội địa — Thoát khỏi CUDA, giảm chi phí 30%

Dưới áp lực cấm vận chip từ Mỹ, Trung Quốc đã buộc phải tự chủ — và kết quả vượt kỳ vọng:

Hệ sinh thái chip AI Trung Quốc (T4/2026)

Huawei Ascend

37%

NVIDIA

19%

Cambricon

12%

Moore Threads

10%

Hygon, Biren...

22%

Ascend 910DChiplet 4-chip, rẻ hơn H200 ~30%

DeepSeek V4Train hoàn toàn trên Ascend, không cần CUDA

Ascend 950 (cuối 2026)Chi phí -40-50%, hiệu suất +2-3x

Trụ cột 3: Token Economy — Scale để giảm chi phí

Trung Quốc có lợi thế scale cực lớn:

1.4 tỷ dân → dữ liệu tiếng Trung khổng lồ, đa dạng
100+ triệu developer → nhu cầu API cực cao
Hệ sinh thái ứng dụng phong phú (WeChat, Douyin, Xiaohongshu) → token consumption tăng theo cấp số nhân

DeepSeek V4 tiêu thụ 140 nghìn tỷ token/ngày (đầu 2026) — tăng 1.400 lần trong 2 năm. Scale lớn → chi phí cố định分摊 nhỏ → giá unit giảm.

Phần 4: "AI Lục Tiểu Hổ" — 6 startup làm thay đổi cục diện

"AI Lục Tiểu Hổ" (六小虎) là biệt danh cho 6 startup AI hàng đầu Trung Quốc, nổi lên sau cơn sốt ChatGPT. Đến 2026, bức tranh đã phân hóa rõ rệt:

Bảng tổng quan

Công ty	Tên EN	Founder	Định hướng	Trạng thái (T4/2026)
Trí Phổ AI (智谱)	Zhipu AI	Trương Bằng, Đường Kiệt (Thanh Hoa)	"OpenAI của Trung Quốc"	✅ IPO (HKEX: 02513). Định giá ~$3.4B
MiniMax (稀宇)	MiniMax	Diêm Tuấn Kiệt (cựu SenseTime)	Đa phương thức, ToC	✅ IPO (HKEX: 00100). Định giá ~$4.2B
Nguyệt Chi Ám Diện	Moonshot AI	Dương Thực Lân (Thanh Hoa)	Kimi, AI Agent, premium	📋 Đang gọi vốn. ARR >$100M. Kế hoạch IPO
Giai Dược Tinh Thần	StepFun	Khương Đại Hân (cựu Microsoft)	AI Agent, hạ tầng phức tạp	📋 Chuẩn bị IPO Hồng Kông
Bách Xuyên Trí Năng	Baichuan AI	Vương Tiểu Xuyên (cựu Sogou)	Chuyển hướng: AI y tế	🔀 Rời AGI, tập trung healthcare
Linh Nhất Vạn Vật	01.AI	Lý Khai Phục (Innovation Works)	Chuyển hướng: ToB, SMB	🔀 Rời AGI, focus enterprise solutions

3 nhóm sau phân hóa

Phân hóa "Lục Tiểu Hổ" 2026

🏆 Nhóm dẫn đầu — Vươn ra biển lớn

Zhipu AI: IPO thành công, GLM-5.1 cạnh tranh trực tiếp GPT-4

MiniMax: M2.7 self-evolution, ARR $1.5B, target $15B cuối '26

⭐ Nhóm ngôi sao — Chinh phục người dùng

Moonshot (Kimi): Premium positioning, AI Agent mạnh mẽ

StepFun: Phần cứng + phần mềm, giải pháp doanh nghiệp

🔧 Nhóm thực dụng — Lối thoát dọc

Baichuan: All-in AI healthcare, "Bác sĩ AI"

01.AI: Solutions cho SMB, AI Agent ứng dụng

Áp lực từ "cú sốc DeepSeek"

DeepSeek — không thuộc nhóm "Lục Tiểu Hổ" — với hiệu năng vượt trội và mã nguồn mở, đã gây áp lực lớn lên định giá của cả 6 công ty. Kết quả:

Zhipu, MiniMax: IPO nhanh để củng cố vị thế
Moonshot, StepFun: Đẩy mạnh premium positioning
Baichuan, 01.AI: Rời cuộc đua AGI, tìm ngách an toàn

Phần 5: Developer Việt Nam nên chọn gì?

Không phải mô hình nào "rẻ nhất" cũng là lựa chọn tốt nhất. Đây là guide thực tế:

Theo use case

Use case	Model khuyên dùng	Chi phí ước tính (1M token)	Lý do
Coding hàng ngày	MiniMax M2.5	$0.1 input / $0.3 output	SWE-Bench 80.2%, MoE 4.3% active
Coding complex	MiniMax M2.7	$0.2 input / $0.6 output	Self-evolution, 200K context
Chat/assistant	DeepSeek V4-Flash	$0.0028 input (cache) / $0.28	Rẻ nhất thị trường
Multimodal	Kimi K2.6	~$1-3 (ước tính)	Xử lý ảnh + text + voice tốt
Vietnamese NLP	Qwen / GLM	~$2-5	Hỗ trợ tiếng Việt tốt hơn
Premium/enterprise	Claude/GPT	$3-15	Ecosystem, compliance, support

Theo budget

Guide chọn model theo budget

DeepSeek V4-Flash (cache hit gần như free)

Chat hàng ngày, tra cứu, brainstorm

MiniMax M2.5 (coding) + DeepSeek (chat)

Dev daily, refactor, debugging

MiniMax M2.7 (coding complex) + Kimi K2.6 (multimodal)

Large refactors, multi-file projects, code review

Claude/GPT enterprise + MiniMax daily coding

Team, compliance, production-critical code

Trong OpenCode

Kết nối nhanh trong OpenCode:

/connect minimax    # Kết nối MiniMax (M2.5/M2.7)
/connect deepseek   # Kết nối DeepSeek V4
/connect kimi       # Kết nối Kimi K2

Hoặc cấu hình thủ công trong opencode.json:

{
  "provider": {
    "minimax": {
      "apiKey": "sk-minimax-...",
      "models": {
        "coding": "minimax/m2.5",
        "agent": "minimax/m2.7"
      }
    },
    "deepseek": {
      "apiKey": "sk-deepseek-...",
      "models": {
        "coding": "deepseek/deepseek-v4-pro"
      }
    }
  }
}

Phần 6: Tương lai — AI sẽ còn rẻ hơn nữa

1. Chip quang học — Bước ngoặt cuối 2026

Các công ty như Lightmatter, Neurophos, Q/C Technologies đang phát triển chip quang học cho AI:

Tiết kiệm năng lượng gấp 10 lần GPU A100 cho tác vụ inference
Khi quy trình sản xuất trưởng thành, chi phí mạch tích hợp quang học sẽ giảm mạnh
Đây là xu hướng tất yếu: điện tử → quang tử cho AI inference

2. Ascend 950 +专用推理 ASIC

Cuối 2026, Huawei Ascend 950 và các专用推理 ASIC từ 8 hãng chip Trung Quốc sẽ ra mắt:

Chi phí suy luận dự kiến giảm thêm 40-50%
Toàn bộ ecosystem đã适配: DeepSeek V4, MiniMax M2, Qwen
Khi các hãng này scale, chi phí unit sẽ giảm theo quy luật Moore's Law cho AI

3. Self-Evolution — Model tự train model

MiniMax M2.7 đã chứng minh khả năng tự tham gia vào quá trình huấn luyện chính mình. Khi kỹ thuật này phổ biến, chi phí train model mới sẽ giảm mạnh — và chi phí đó sẽ được truyền xuống giá API cho end user.

4. Làn sóng IPO — vốn dồi dào hơn

Moonshot (Kimi) và StepFun đang chuẩn bị IPO. Sau khi lên sàn:

Vốn dồi dào hơn → đầu tư hạ tầng mạnh hơn → chi phí unit giảm
Cạnh tranh khốc liệt hơn → giá sẽ tiếp tục giảm hoặc chất lượng tăng

Tổng kết

Khía cạnh	Tóm tắt
Giá AI đang tăng hay giảm?	Giá niêm yết tăng (Zhipu +83%, Tencent +463%) nhưng chi phí thực tế giảm sâu (DeepSeek -90%)
Tại sao Trung Quốc rẻ hơn?	3 trụ cột: MoE (3-5% active), chip nội địa (Ascend 37% thị phần), token economy (scale 1.4B dân)
Báo cáo MS nói gì?	Chi phí inference 15-20% Mỹ, khoảng cách 3-6 tháng, ARR dự báo $10-15B/công ty cuối 2026
Lục Tiểu Hổ ra sao?	Phân hóa 3 nhóm: IPO (Zhipu, MiniMax), Premium (Moonshot, StepFun), Thực dụng (Baichuan, 01.AI)
Tương lai chi phí?	Còn giảm: chip quang học (10x tiết kiệm), Ascend 950, self-evolution, IPO vốn dồi dào
Developer nên chọn gì?	Budget thấp: DeepSeek Flash. Coding: MiniMax M2.5/2.7. Enterprise: Claude/GPT + MiniMax daily

Trung Quốc không chỉ "phá giá" — họ đang định nghĩa lại cấu trúc chi phí của toàn ngành AI. Và developer Việt Nam là người hưởng lợi trực tiếp.

Bài viết tổng hợp từ: báo cáo Morgan Stanley "China's AI Path: More Bang For The Buck" (T4/2026), dữ liệu OpenRouter, báo cáo Stanford AI Index 2026, và các nguồn tin chính thống Trung Quốc (eastmoney.com, 36Kr, IT之家, 证券时报).

Cuộc chiến AI Trung Quốc — Khi pháp sư làm rung chuyển thị trường toàn cầu