MiniMax M2: Từ Startup 400 Người Đến "AI Giá Rẻ Nhất Thế Giới" Cho Coding

Name: OpenCode
Author: OpenCode

MiniMax là một trong những nhà cung cấp LLM có giá rẻ nhất thị trường hiện nay, đặc biệt phù hợp cho các developer sử dụng OpenCode. Với kiến trúc MoE (Mixture of Experts) + Linear Attention độc quyền, MiniMax mang lại hiệu năng coding ấn tượng với chi phí chỉ bằng 1/10 so với GPT-4o hay Claude Sonnet.

Bài viết này tổng hợp toàn bộ hành trình của MiniMax: từ startup 400 người đến IPO kỷ lục, kiến trúc MoE đứng sau các model M2 đột phá, và cách dùng MiniMax để coding với OpenCode.

Tổng quan: 4 năm từ startup lên IPO

Thông tin cơ bản

Thông tin	Chi tiết
Tên đầy đủ	MiniMax (上海稀宇科技有限公司)
Mã chứng khoán	0100.HK (Hong Kong)
Thành lập	Cuối 2021 bởi Yan Junjie (闫俊杰)
Nhân sự	~400 người, tuổi trung bình 29
R&D	73,8% là kỹ sư nghiên cứu

Yan Junjie là cựu Phó Chủ tịch kiêm Phó Viện trưởng Viện Nghiên cứu của SenseTime - một trong những công ty AI hàng đầu Trung Quốc.

Hành trình IPO kỷ lục

Ngày 9 tháng 1 năm 2026, MiniMax chính thức lên sàn Hong Kong với giá phát hành 165 HKD/cổ phiếu. Ngay trong ngày đầu giao dịch:

Tăng 109,09% lên 345 HKD/cổ phiếu
Vốn hóa thị trường vọt lên 1.054 tỷ HKD
Phần công khai được đăng ký mua vượt mức 1.837 lần
Các quỹ đầu tư châu Âu, Mỹ, Trung Đông đều tham gia

MiniMax chính thức phá vỡ kỷ lục "AI company IPO nhanh nhất thế giới" - chỉ 4 năm từ khi thành lập.

Cổ đông lớn

Nhà đầu tư	Tỷ lệ nắm giữ (IPO)
Alibaba	~13,66%
miHoYo (Genshin Impact)	~6,4%
Tencent	(tham gia vòng sau)
Sequoia China	3,81%
IDG Capital, Hillhouse, Matrix	Top-tier VC

Hiệu quả kinh doanh

Chỉ số	Giá trị
Doanh thu 2025	$7.903,8 triệu USD (+158,9% YoY)
Doanh thu quốc tế	>70%
ARR (tháng 2/2026)	>$150 triệu USD
API Gross Margin	69,4%
Vị thế	1 trong 4 công ty full-modality tier 1 toàn cầu (cùng OpenAI, Google, ByteDance)

Kiến trúc cốt lõi: MoE + Linear Attention

MoE (Mixture of Experts)

Chia model thành nhiều "chuyên gia" nhỏ, mỗi lần chỉ kích hoạt một phần nhỏ tham số → tiết kiệm tính toán khủng. Mỗi token chỉ "đánh thức" 3-5% bộ não, compute giảm 20-30x.

Linear Attention

Thay thế cơ chế Attention O(n²) truyền thống bằng O(n) → xử lý context dài siêu nhanh.

Kết hợp 2 kỹ thuật này, MiniMax giảm hơn 90% chi phí tính toán so với Transformer thuần túy ở độ dài 128K token.

Full-modality

Lĩnh vực	Model đại diện	Đặc điểm chính
Text	M2.5 / M2.7	MoE, giá rẻ, hiệu năng coding cao
Video	Hailuo series	>600 triệu video đã tạo
Voice	Speech 2.6	Tổng hợp giọng nói chất lượng cao
Music	Music 2.6	Tạo nhạc AI, latency dưới 20s

Dòng M2: Agent Coding Flagship ⭐

Toàn bộ dòng M2 dùng kiến trúc MoE với 230B tổng tham số, chỉ kích hoạt 10B (tỷ lệ 4,3%). Đây là dòng model chuyên cho coding, phù hợp nhất với OpenCode.

M2 → M2.1 → M2.5 → M2.7: Hành trình đột phá

Model	Ngày	Điểm nhấn
M2	10/2025	MoE Agent model đầu tiên, giá rẻ
M2.1	12/2025	Đa ngôn ngữ (Rust, Java, Go, C++), VIBE 88,6
M2.5 🚀	02/2026	Forge RL 40x, SWE-Bench 80,2%, Open Source
M2.7 💎	03/2026	Tự tiến hóa, SWE-Pro 56,22%, 200K context

M2.5 - Khuyên dùng cho coding hàng ngày

Thông số	Giá trị
Kiến trúc	MoE (230B tổng, 10B active)
Context	128K
SWE-Bench	80,2%
Open Source	Có (ngay hôm sau ra mắt)

Điểm đột phá: Forge Native Agent RL Framework - framework tự học do MiniMax tự phát triển, tăng tốc đào tạo agent lên ~40 lần.

M2.7 - Model tự tiến hóa (Self-Evolution)

Thông số	Giá trị
Tổng tham số	230 tỷ (active 10B)
Context	200K
SWE-Pro	56,22%
Open Source	12/04/2026

Đây là model đầu tiên trên thế giới có khả năng tự tham gia vào quá trình huấn luyện chính nó:

Model tự xây dựng Agent Harness và Skills
Sử dụng RL để liên tục tự cải thiện
Trong một số tác vụ, model đảm nhận 30-50% khối lượng công việc

Benchmark so sánh

Benchmark	M2.5	M2.7
SWE-Bench Verified	80,2%	-
SWE-Pro	-	56,22%
VIBE-Pro	-	55,6%
GDPval-AA ELO	-	1495 (#1 open models)

So sánh chi phí: MiniMax rẻ đến mức nào?

Model	Input (1M token)	Output (1M token)
MiniMax M2.5	$0,10	$0,30
MiniMax M2.7	$0,20	$0,60
DeepSeek V3	$0,50	$2,00
GPT-4o	$2,50	$10,00
Claude Sonnet 4	$3,00	$15,00
Claude Opus 4	$15,00	$75,00

MiniMax M2.5 rẻ hơn GPT-4o ~25 lần, rẻ hơn Claude Sonnet ~25 lần - trong khi SWE-Bench đạt 80,2%.

Cách dùng MiniMax với OpenCode

Bước 1: Đăng ký tài khoản

Truy cập MiniMax Coding Plan để đăng ký.

Bước 2: Lấy API Key

Vào MiniMax Console → Tạo API Key → Copy key.

Bước 3: Kết nối với OpenCode

/connect minimax

Hoặc cấu hình trong opencode.json:

{
  "provider": {
    "minimax": {
      "apiKey": "sk-minimax-...",
      "models": {
        "coding": "minimax/m2.5",
        "agent": "minimax/m2.7"
      }
    }
  }
}

Bước 4: Chọn model

/models

Chọn minimax/m2.5 hoặc minimax/m2.7.

Lộ trình tương lai

Sản phẩm	Thời gian	Kỳ vọng
M3	H2/2026	Kiến trúc thế hệ mới, nâng cấp self-evolution
Hailuo 3	H2/2026	Đột phá video generation
abab 7	Đang phát triển	Multimodal, 245K context

Yan Junjie trong cuộc họp báo cáo kết quả:

"Chúng tôi chuẩn bị ra mắt M3 và Hailuo 3 trong nửa cuối năm nay, để tiếp tục phá vỡ ranh giới thông minh và tạo nên sự khác biệt cho model của chúng tôi."

Tổng kết

✅ Giá cực rẻ: 1/25 so với GPT/Claude
✅ Hiệu năng coding cao: SWE-Bench 80,2% (M2.5)
✅ Open Source: Tự host được, không lock-in
✅ Context dài: 128K-200K tokens
✅ Self-Evolution: M2.7 là hướng đi mới của AI

Bài viết tổng hợp từ báo cáo Morgan Stanley, 上海证券报, 36氪, IT之家 và các nguồn chính thống Trung Quốc, cập nhật đến tháng 4/2026.

MiniMax M2 — AI Giá Rẻ Nhất Cho Coding: Từ Startup 400 Người Đến IPO Kỷ Lục