Nội dung chính
DeepSeek V4 sẽ ra mắt vào dịp Tết Nguyên đán
DeepSeek – công ty khởi nghiệp AI có trụ sở ở Hàng Châu, Trung Quốc – đang chuẩn bị tung phiên bản V4 vào giữa tháng 2, trùng với ngày 17/2 – ngày đầu năm Âm lịch. DeepSeek V4 hứa hẹn sẽ thay đổi cục diện lập trình AI.

Tiến độ và mục tiêu ra mắt
The Information đưa tin rằng DeepSeek đã đặt mục tiêu công bố V4 vào ngày 17/2, đồng thời sẽ phát hành một phiên bản “code‑focused” dành riêng cho các tác vụ lập trình. Nếu các thử nghiệm nội bộ là đúng, V4 sẽ có khả năng xử lý prompt chứa mã dài hơn và phức tạp hơn hẳn so với các mô hình hiện tại.
Hiệu năng so sánh với các đối thủ
- Claude (Anthropic) – hiện đang dẫn đầu trong các benchmark lập trình nhưng vẫn chưa đạt mức ổn định khi xử lý mã dài.
- GPT‑4 (OpenAI) – mạnh về ngôn ngữ tự nhiên, nhưng thường gặp giới hạn token khi phải tạo ra đoạn mã lớn.
- DeepSeek V4 (dự kiến) – theo nguồn tin nội bộ, mô hình này đã vượt qua cả Claude và GPT trong các bài test nội bộ, đặc biệt khi độ dài prompt > 4.000 token.
Đánh giá chuẩn MATH‑500 và SWE‑bench
V3 của DeepSeek đã đạt 90,2% trên bộ kiểm tra MATH‑500 (giải đúng 451/500 câu), trong khi Claude đạt 78,3%. V4 sẽ tiếp tục cải thiện, đồng thời nhắm tới tỷ lệ hoàn thành >80,9% trên SWE‑bench Verified – tiêu chuẩn đo lường năng lực kỹ sư phần mềm AI.
Vũ khí bí mật: Manifold‑Constrained Hyper‑Connections (mHC)
Ngày 31/12/2025, Lương Văn Phong (CEO DeepSeek) cùng các cộng sự công bố nghiên cứu về Manifold‑Constrained Hyper‑Connections (mHC). Phương pháp này mở rộng luồng thông tin trong mạng nơ‑ron thành nhiều “đường song song”, giảm thiểu nút cổ chai khi mở rộng quy mô mô hình. Wei Sun, phân tích viên của Counterpoint Research, gọi mHC là “đột phá đáng chú ý” giúp DeepSeek “vượt qua giới hạn tính toán” ngay cả khi tiếp cận chip AI tiên tiến bị hạn chế.
Phản hồi cộng đồng và các quan điểm tranh cãi
Reddit đã chứng kiến sự sôi động trên các subreddit r/DeepSeek và r/LocalLLaMA, nơi người dùng tích trữ tín dụng API và chia sẻ dự đoán về V4. Tuy nhiên, một số lập trình viên trên Reddit và một bài viết trên Medium tiêu đề “DeepSeek tệ hại và tôi không giả vờ ngược lại nữa” cho rằng các mô hình trước đây của DeepSeek thường tạo ra “đoạn mã rập khuôn, đầy lỗi”.
Triển vọng thị trường và thách thức địa chính trị
The Reuters báo cáo DeepSeek đã hoãn phát hành mô hình R2 từ tháng 5/2025 sang tháng 8/2025, nhưng vẫn duy trì kế hoạch ra mắt V4 vào tháng 2. Nếu V4 thực sự đáp ứng được hứa hẹn, DeepSeek có thể mở rộng mạnh mẽ vào thị trường doanh nghiệp phương Tây, dù vẫn phải đối mặt với các rào cản về kiểm duyệt và quyền riêng tư ở một số quốc gia.
Sơn Vân