Kimi爆火,国产大模型突然开始“卷”长文本。
接连两日,阿里巴巴、360等互联网大厂相继官宣1000万字、500万字的长文本处理能力,另有消息称,百度也将开放长文本能力,文字范围会在200万字-500万字。
一场围绕着Kimi的“围剿战”正在上演。
在上述已经官宣具备长文本能力的三款明星产品上,就目前公测版本而言,新浪科技分别做了三个样本试验:在总结《三体2:黑暗森林》和《未来简史》时,Kimi只能解读52%和66%文本内容,而另两家分别达到100%解读。这也意味着,在最常见的解读小说、畅销书环节,目前Kimi并没有优势,甚至在某些功能上与大厂大模型仍有差距。
有AI大模型行业投资人向新浪科技直言,“长文本在技术圈里并不稀奇,并没有想象中那么难”。此前受限于长文本对算力消耗极大且成本较高,导致入局者较少,“资本关注,现在不得不入局开卷”。
此外他透露,目前Kimi投放广告的获客成本约在10元,如果算上拉新后用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。根据第三方平台的下载量预估,近一个月来,Kimi在苹果端和安卓端的日均下载量为17805。按此计算,Kimi每天的获客成本将烧掉至少20万元。
长文本解析,哪家强?
事实上,长文本处理这项技术也许并不稀缺。在短时间内,阿里和360相继宣布开放这一功能,就可佐证。
根据阿里巴巴官方消息,阿里通义千问向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。几小时后,360宣布智脑正式内测500万字长文本处理功能,该功能入驻360AI浏览器。
就目前公测版本而言,Kimi、360、阿里,谁的长文本处理能力更强?新浪科技分别进行了三组试验:
样本一:畅销书《未来简史》;
样本二:畅销书《三体2:黑暗森林》;
样本三:Sora英文论文《大型视觉模型背景、技术、局限性和机遇综述》。
(Kimi总结《三体2:黑暗森林》,只能阅读52%)
(通义千问总结《三体2:黑暗森林》)