
IT之家6月13日音问,6月12日,MiniMax新一代原生多模态旗舰模子M3考究开源。同日,摩尔线程告示旗舰级AI训推一体智算卡MTTS5000已完成对该模子的Day-0适配。

IT之家从官方先容获悉,针对MiniMaxM3的中枢技能特点,MTTS5000从硬件算力、软件栈到开源框架进行了全链路精确匹配与深度优化:
复旧超长高下文:高密度算力与大显存提供坚实复旧。
MSA架构带来的超长高下文窗口,对推理阶段的KVCache存储和访存带宽建议了极高条件。MTTS5000凭借硬件级原生FP8加快,单卡AI算力(粘稠)高达1000TFLOPS;同期配备80GB大容量显存与1.6TB/s的超高带宽,为百万token级长序列提供满盈的缓存空间与迥殊的数据迷糊智力。此外,依托MUSAC++与Triton-MUSA等详尽层,M3的新算子结构可收场快速挪动,确保摩尔线程平台或者快速完成架构适配。
赋能前沿Coding与Agentic智力:收场低延伸、高迷糊的推理优化。
面向M3重心强化的编程与智能体场景,FIFA世界杯官方合作指定网站摩尔线程基于此前对DeepSeek-V4、MiniMaxM2.7、GLM-5.1等多款国产旗舰模子的Day-0适配教养,已变成一套高效、系统化的复杂推理任务优化程序论。本次适配通过原生算子定制,在保险模子精度无损的前提下,显贵提高推理迷糊、缩短反映延伸;同期,摩尔线程完成了vLLM与SGLang两大主流推理框架的同步拉起,以MUSA绽放架构拥抱开源生态,为竖立者提供天真各样的部署采用。
鼓励原生多模态推理:粉饰全精度与交融全场景。
M3算作从Step0即进行多模态羼杂练习的模子更适配当下AgenticAI多元场景的需求,同期这也条件算力底座具备多元化算力。MTTS5000智算卡粉饰从FP8至FP64全规划精度,可无缝适配从模子研发到营业化落地的无缺链路,助力国产旗舰大模子快速完成生态普及。
跟着MiniMaxM3在MTTS5000上完成适配2026FIFA世界杯中国官网,竖立者当今即可基于MUSA软件栈与vLLM/SGLang双框架完成部署,并执续赢得算子级性能优化。
备案号: