MiniMax M2: Từ Startup 400 Người Đến "AI Giá Rẻ Nhất Thế Giới" Cho Coding
MiniMax là một trong những nhà cung cấp LLM có giá rẻ nhất thị trường hiện nay, đặc biệt phù hợp cho các developer sử dụng OpenCode. Với kiến trúc MoE (Mixture of Experts) + Linear Attention độc quyền, MiniMax mang lại hiệu năng coding ấn tượng với chi phí chỉ bằng 1/10 so với GPT-4o hay Claude Sonnet.
Bài viết này tổng hợp toàn bộ hành trình của MiniMax: từ startup 400 người đến IPO kỷ lục, kiến trúc MoE đứng sau các model M2 đột phá, và cách dùng MiniMax để coding với OpenCode.
Tổng quan: 4 năm từ startup lên IPO
Thông tin cơ bản
| Thông tin | Chi tiết |
|---|---|
| Tên đầy đủ | MiniMax (上海稀宇科技有限公司) |
| Mã chứng khoán | 0100.HK (Hong Kong) |
| Thành lập | Cuối 2021 bởi Yan Junjie (闫俊杰) |
| Nhân sự | ~400 người, tuổi trung bình 29 |
| R&D | 73,8% là kỹ sư nghiên cứu |
Yan Junjie là cựu Phó Chủ tịch kiêm Phó Viện trưởng Viện Nghiên cứu của SenseTime - một trong những công ty AI hàng đầu Trung Quốc.
Hành trình IPO kỷ lục
Ngày 9 tháng 1 năm 2026, MiniMax chính thức lên sàn Hong Kong với giá phát hành 165 HKD/cổ phiếu. Ngay trong ngày đầu giao dịch:
- Tăng 109,09% lên 345 HKD/cổ phiếu
- Vốn hóa thị trường vọt lên 1.054 tỷ HKD
- Phần công khai được đăng ký mua vượt mức 1.837 lần
- Các quỹ đầu tư châu Âu, Mỹ, Trung Đông đều tham gia
MiniMax chính thức phá vỡ kỷ lục "AI company IPO nhanh nhất thế giới" - chỉ 4 năm từ khi thành lập.
Cổ đông lớn
| Nhà đầu tư | Tỷ lệ nắm giữ (IPO) |
|---|---|
| Alibaba | ~13,66% |
| miHoYo (Genshin Impact) | ~6,4% |
| Tencent | (tham gia vòng sau) |
| Sequoia China | 3,81% |
| IDG Capital, Hillhouse, Matrix | Top-tier VC |
Hiệu quả kinh doanh
| Chỉ số | Giá trị |
|---|---|
| Doanh thu 2025 | $7.903,8 triệu USD (+158,9% YoY) |
| Doanh thu quốc tế | >70% |
| ARR (tháng 2/2026) | >$150 triệu USD |
| API Gross Margin | 69,4% |
| Vị thế | 1 trong 4 công ty full-modality tier 1 toàn cầu (cùng OpenAI, Google, ByteDance) |
Kiến trúc cốt lõi: MoE + Linear Attention
MoE (Mixture of Experts)
Chia model thành nhiều "chuyên gia" nhỏ, mỗi lần chỉ kích hoạt một phần nhỏ tham số → tiết kiệm tính toán khủng. Mỗi token chỉ "đánh thức" 3-5% bộ não, compute giảm 20-30x.
Linear Attention
Thay thế cơ chế Attention O(n²) truyền thống bằng O(n) → xử lý context dài siêu nhanh.
Kết hợp 2 kỹ thuật này, MiniMax giảm hơn 90% chi phí tính toán so với Transformer thuần túy ở độ dài 128K token.
Full-modality
| Lĩnh vực | Model đại diện | Đặc điểm chính |
|---|---|---|
| Text | M2.5 / M2.7 | MoE, giá rẻ, hiệu năng coding cao |
| Video | Hailuo series | >600 triệu video đã tạo |
| Voice | Speech 2.6 | Tổng hợp giọng nói chất lượng cao |
| Music | Music 2.6 | Tạo nhạc AI, latency dưới 20s |
Dòng M2: Agent Coding Flagship ⭐
Toàn bộ dòng M2 dùng kiến trúc MoE với 230B tổng tham số, chỉ kích hoạt 10B (tỷ lệ 4,3%). Đây là dòng model chuyên cho coding, phù hợp nhất với OpenCode.
M2 → M2.1 → M2.5 → M2.7: Hành trình đột phá
| Model | Ngày | Điểm nhấn |
|---|---|---|
| M2 | 10/2025 | MoE Agent model đầu tiên, giá rẻ |
| M2.1 | 12/2025 | Đa ngôn ngữ (Rust, Java, Go, C++), VIBE 88,6 |
| M2.5 🚀 | 02/2026 | Forge RL 40x, SWE-Bench 80,2%, Open Source |
| M2.7 💎 | 03/2026 | Tự tiến hóa, SWE-Pro 56,22%, 200K context |
M2.5 - Khuyên dùng cho coding hàng ngày
| Thông số | Giá trị |
|---|---|
| Kiến trúc | MoE (230B tổng, 10B active) |
| Context | 128K |
| SWE-Bench | 80,2% |
| Open Source | Có (ngay hôm sau ra mắt) |
Điểm đột phá: Forge Native Agent RL Framework - framework tự học do MiniMax tự phát triển, tăng tốc đào tạo agent lên ~40 lần.
M2.7 - Model tự tiến hóa (Self-Evolution)
| Thông số | Giá trị |
|---|---|
| Tổng tham số | 230 tỷ (active 10B) |
| Context | 200K |
| SWE-Pro | 56,22% |
| Open Source | 12/04/2026 |
Đây là model đầu tiên trên thế giới có khả năng tự tham gia vào quá trình huấn luyện chính nó:
- Model tự xây dựng Agent Harness và Skills
- Sử dụng RL để liên tục tự cải thiện
- Trong một số tác vụ, model đảm nhận 30-50% khối lượng công việc
Benchmark so sánh
| Benchmark | M2.5 | M2.7 |
|---|---|---|
| SWE-Bench Verified | 80,2% | - |
| SWE-Pro | - | 56,22% |
| VIBE-Pro | - | 55,6% |
| GDPval-AA ELO | - | 1495 (#1 open models) |
So sánh chi phí: MiniMax rẻ đến mức nào?
| Model | Input (1M token) | Output (1M token) |
|---|---|---|
| MiniMax M2.5 | $0,10 | $0,30 |
| MiniMax M2.7 | $0,20 | $0,60 |
| DeepSeek V3 | $0,50 | $2,00 |
| GPT-4o | $2,50 | $10,00 |
| Claude Sonnet 4 | $3,00 | $15,00 |
| Claude Opus 4 | $15,00 | $75,00 |
MiniMax M2.5 rẻ hơn GPT-4o ~25 lần, rẻ hơn Claude Sonnet ~25 lần - trong khi SWE-Bench đạt 80,2%.
Cách dùng MiniMax với OpenCode
Bước 1: Đăng ký tài khoản
Truy cập MiniMax Coding Plan để đăng ký.
Bước 2: Lấy API Key
Vào MiniMax Console → Tạo API Key → Copy key.
Bước 3: Kết nối với OpenCode
/connect minimax
Hoặc cấu hình trong opencode.json:
{
"provider": {
"minimax": {
"apiKey": "sk-minimax-...",
"models": {
"coding": "minimax/m2.5",
"agent": "minimax/m2.7"
}
}
}
}
Bước 4: Chọn model
/models
Chọn minimax/m2.5 hoặc minimax/m2.7.
Lộ trình tương lai
| Sản phẩm | Thời gian | Kỳ vọng |
|---|---|---|
| M3 | H2/2026 | Kiến trúc thế hệ mới, nâng cấp self-evolution |
| Hailuo 3 | H2/2026 | Đột phá video generation |
| abab 7 | Đang phát triển | Multimodal, 245K context |
Yan Junjie trong cuộc họp báo cáo kết quả:
"Chúng tôi chuẩn bị ra mắt M3 và Hailuo 3 trong nửa cuối năm nay, để tiếp tục phá vỡ ranh giới thông minh và tạo nên sự khác biệt cho model của chúng tôi."
Tổng kết
- ✅ Giá cực rẻ: 1/25 so với GPT/Claude
- ✅ Hiệu năng coding cao: SWE-Bench 80,2% (M2.5)
- ✅ Open Source: Tự host được, không lock-in
- ✅ Context dài: 128K-200K tokens
- ✅ Self-Evolution: M2.7 là hướng đi mới của AI
Bài viết tổng hợp từ báo cáo Morgan Stanley, 上海证券报, 36氪, IT之家 và các nguồn chính thống Trung Quốc, cập nhật đến tháng 4/2026.
Đọc tiếp
Một vài bài liên quan có thể bạn sẽ thích
Kimi K2.6 (Moonshot AI) — Model Coding Open Source Số 1 Thế Giới
Khám phá Kimi K2.6: model #1 open source toàn cầu (Artificial Analysis), cụm Agent 300 phân thân, code 13h liên tục 4.000+ dòng. So sánh chi tiết K2.6 vs MiniMax M2.7 và hướng dẫn dùng Kimi với OpenCode.
MiniMax M3 ra mắt: 1M context, multimodal, agent coding và cú nhảy từ M2.7
Phân tích MiniMax M3 cho developer dùng OpenCode: 1M context, MiniMax Sparse Attention, native multimodal, model id, cách dùng qua API/OpenRouter/Vercel và khi nào nên nâng từ M2.7.
Vibe Coding Cho Người Mới: Cách Dùng OpenCode + DeepSeek + OpenCode Go Không Cháy Ví
Hướng dẫn vibe coding cho người mới với OpenCode, OpenCode Go và DeepSeek: cách viết PLAN.md, AGENTS.md, chia workflow orchestrator-worker và tối ưu chi phí token.