Thẻ: sparse_attention
MiniMax M3: Mô hình mở 1 triệu token với Sparse Attention
Cột mốc mới cho xử lý ngữ cảnh siêu dài MiniMax M3 ra mắt dưới dạng trọng số mở (open-weight) hỗ trợ native đa phương thức cho cả văn bản, hình ảnh và video. Khả năng xử lý cùng lúc 1 triệu token mở ra cơ hội phân tích toàn bộ kho mã nguồn lớn…