发布日期:2026-05-28 21:01 点击次数:103

5月27日,旗下MiMo大模子团队公告称,对V2.5系列模子API进行长久性降价,最高降幅达99%,不再远离坎坷文窗口长度。同期优化Token Plan计费体系,同等价钱下用量升迁至蓝本的5-8倍。随后雷军转发此音尘作念出同等现实回话。
小米技巧官方微博暗意,本次价钱支持背后,离不开团队在推理系统上的抓续优化。基于SGLang HiCache无缺维持SWA(Sliding Window Attention),kaiyun集团(中国)有限公司将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量裁减至优化前的近1/7,并将可缓存token数目升迁至优化前的近5倍,显贵升迁了缓存掷中率和推理效果。
快乐飞艇app2026世界杯中国官方下载降价音尘前一天晚间,小米集团发布一季度功绩:营收991亿元,经支持净利润61亿元;智能电动汽车及AI等蜕变业务收入199亿元,当季新车寄托80856辆;研发干与90亿元,同比增长33.4%。雷军同期晓喻,改日三年在AI界限干与600亿元,展望全年研发干与超400亿元。当今,MiMo-V2.5-Pro已在Artificial Analysis榜单抽象智能指数、Agent指数上位列全国开源模子比肩第一。