Kimi似乎节奏和DeepSeek同步起来了，上次发kimi1.5时间和deep

蚁工厂 2025-02-19 09:19:01

Kimi似乎节奏和DeepSeek同步起来了，上次发kimi1.5时间和deepseek撞车，而在昨天DeepSeek发布提升提升长文本处理的效率的NSA技术后，Kimi在几小时后也发布了类似的技术MOBA。而且同时公布了训练、推理用的代码。

github.com/MoonshotAI/MoBA

两者的相同点：

1. 两者都采用了稀疏注意力机制，即并非所有 tokens 都需要互相 attention，而是有选择地关注部分 tokens，以减少计算量。

2. 两者都基于块 (block) 的概念进行操作，将长文本分成多个块，并以块为单位进行稀疏选择或计算。

3. 两者都兼容 Transformer 架构，可以作为标准注意力机制的替代品，嵌入到现有的 Transformer 模型中。

不同点如图3.

0 阅读：3

感谢大家的关注

作者最新文章

1

将开源项目域名里的 github.com 改为 uithub.com 可以获得一

2

这张图和下面的内容是推友 novasarc01 绘制的MoE知识截图。混合专家模

3

krep - 一个C写的高性能的字符串搜索工具github.com/davide

4

论文《大型语言模型的后训练综述》arxiv.org/pdf/2503.06072

5

电子书《Modern C》inria.hal.science/hal-02383

6

今天是植树节。转发这棵红黑树，可以让你找东西、存东西、删东西都挺快。转发这棵B+

7

emulsiV，这是一个用于教学的可视化模拟器，专门用于模拟一种名为Virgul

8

Hugging Face 团队发布的关于 Open R1 项目的第三期更新。hu

9

All the math in Attention Paperwww.k-a.i

10

腾讯发布了 Hunyuan-TurboS ，比较有意思的是这是个混合 Trans

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

哈哈哈昨晚三星发布会我是真的看爽了！三星折叠屏比直板更轻薄GalaxyZF

3

小米又搞大动作啦！6月24日雷军透露小米YU7支持车外小爱语音。车外配备8个麦克

4

小米首款智能眼镜AIGlasses发布，支持拍照录像和超级小爱同学。1999起

5

朝鲜的单摄奥利奥，虽然只是一个很low的后摄单摄，但是也要凑够两个假的组成奥利奥

6

小米深圳总部今日正式开园都说小米之家只有60米高是“矮楼”，但是没人觉得造型很像

7

雷军估计不会再直播了！他怎么也想不到，网友居然在他直播间里干起来了！甚至把雷

8

陈震再次质疑小米YU7到底极限在哪里？到现在为止，他已经连续发了四篇专门的文

9

不得不说，这老头也太幸福了吧！国外的科技都这么先进了吗？这两位美女机器人做的

10

一万买的华为pura80pro+还没捂热夫妻吵架给砸了一个老主顾半夜联系我

科技最新文章

1

绝了，国产中端机真的牛，10000mAh大电池即将出场，续航霸王实锤了。苹果彻底

2

第二款骁龙8Elite2也来了，一加15比想象中的要强大！索尼大底长焦方

3

荣耀Magic6，刚升级完最新版本，这次主要是相机和AI办公的升级。刚升

4

感觉手机买早了，肠子悔青了，荣耀X70早点发布该有多好两千以内可以买到8300

5

还是自研芯片有底气，采用了玄戒O1的小米15SPro手机给芯片性能面板

6

重大消息，荣耀Magic7系列迎来了又一次重磅系统更新这次的182版本主要加入

7

小米深圳总部今日正式开园都说小米之家只有60米高是“矮楼”，但是没人觉得造型很像

8

荣耀X70在千元机档位有三大特性是领先的，确实超出我个人预期：1.设计耐看；2.

9

吊打苹果，吊打三星，华为也要加油了！你以为8300毫安荣耀X70是电池终点？

10

说实话，荣耀X70手机，8300的电池挺吸引人的。不过，骁龙6Gen4芯片让人纠