谁在闷头做中国的Mythos 速度暴涨4倍【今日】

发布日期：2026-06-20 23:02:40 来源：互联网作者：56之窗网浏览次数：2

别再只盯着“AO”两家的新模型大战了！谷歌刚刚发布了一款名为DiffusionGemma的新模型，这款模型将生成图片的扩散模型应用到了文字生成上，并实现了4倍加速。

谁在闷头做中国的Mythos

DiffusionGemma抛弃了传统的自回归模式，即逐个token生成的方式，而是采用类似“印刷机”的工作方式。它一次铺开256个token的“画布”，从随机噪声出发，通过多轮去噪，使整段文字同时浮现。这种新模式在生成速度方面表现出色：单块H100上每秒可生成1000多个tokens，在消费级RTX 5090上也能达到700多个tokens，比同规格自回归模型快了4倍。此外，这个26B参数的MoE模型在推理时只需激活3.8B参数，量化后仅需18GB显存即可运行，一张4090显卡就能本地跑。

谁在闷头做中国的Mythos 速度暴涨4倍

目前，DiffusionGemma采用了允许商用的Apache 2.0开源协议，权重可在Hugging Face直接下载。

谁在闷头做中国的Mythos 速度暴涨4倍

DiffusionGemma的最大优势在于其生成速度。在同一块H100上（fp8，batch size=1），DiffusionGemma的速度达到了1000+ tokens/s，而标准自回归的Gemma 4 26B A4B加上MTP加速也只有300+ tokens/s，速度差距近4倍。

关键词： 谁在闷头做中国的Mythos

　　以上就是【谁在闷头做中国的Mythos 速度暴涨4倍【今日】】全部内容，更多资讯请关注56之窗网。

本文地址:http://hot1.ffsy56.com/newsdetail2120047.html

版权与免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。56之窗网对此不承担任何直接责任及连带责任，56之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

推荐图文

车中4万多现金被盗民	亚洲球队为何能在本届
印度极端高温单日或	这块“试验田”，产业
上海水警立体护航北外	无缘决赛！U20女足中
爸爸回应4岁男孩对着	铁路“票根经济”了解

最新新闻

»挪威将禁止小学生使用生成式AI 教育新规引关注【今日】

»教育专家黄玉峰点评上海中考作文题探讨愿望实现后的心境与努力【今日】

»澳洲男篮阵容详解热身赛前揭秘【今日】

»姆巴佩感谢球迷支持团队配合赢胜利【今日】

»葡萄牙围绕C罗踢能夺冠吗最后的冲锋【今日】

»广东揭阳特色“龙舟抱桩”庆端午独特民俗魅力展【今日】

»中国女排零封法国队取两连胜重返世界前六【今日】

»商场回应地下一层突然烟雾弥漫烤箱故障所致【今日】

点击排行