DeepSeek下一代技术提前曝光梁文锋署名论文获ACL2025最佳论文奖在AC

量子位看科技 2025-07-31 12:24:15

DeepSeek下一代技术提前曝光梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上，由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。

这是在总投稿量翻倍至8360篇的情况下脱颖而出，技术硬实力可见一斑。【图1】

这项NSA机制最大的亮点是：让大模型处理长文本的速度提升11倍，性能还更强。

一作袁境阳在会上发表演讲，透露这项技术可以把上下文长度扩展到1百万tokens，将被应用到下一个前沿模型中。

结合论文发表于DeepSeek-R1推出之后，实验设置中也提到使用了DeepSeek-R1的蒸馏数据来微调了新的模型。

大家纷纷猜测，这项技术将被用于下一代DeepSeek-V4以及DeepSeek-R2。【图2】

技术上，他们提出了原生稀疏注意力（NSA）机制，通过算法与硬件的协同优化，直接把长文本处理速度提升了11倍。

更厉害的是，性能不仅没降反而还超越了传统的全注意力模型。

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

ChatGPT耳机将支持中文耳机能接入ChatGPT了耳机，不止能用来听歌，现在

2

全球首座可控核聚变电厂开建奥特曼与微软押注可控核聚变全球首座可控核聚变电厂，正式

3

DeepSeek下一代技术提前曝光梁文锋署名论文获ACL2025最佳论文奖在AC

4

WPS出手AI办公WPS灵犀上线重构办公流喜大普奔，打工党、学生党注意了～你使用

5

无需配依赖直接运行Python用uv运行Python脚本有多方便运行有依赖的Py

6

首届全球无线感知竞赛SSC2025正式启动 AI大模型正以前所未有的速度和深度重

7

我在WAIC看见十大趋势WAIC背后趋势总结太热了，实在太热了。你能想象吗？一个

8

死亡搁浅骗过人脸识别游戏角色竟能过人脸据TheVerge报道，英国刚上线的网络实

9

这家公司狂拿大模型明星订单93年清华系创始人搞计算公司不靠囤算力，拿下数家大模型

10

陶哲轩谈AI正确用法AI更适合挑刺而非创作陶哲轩：有些人感觉AI不好用，是因为用

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

追觅造车了！造扫地机器人的那个追觅没想到啊，造车牌桌上一个接一个退场…这时候竟然

4

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

5

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

6

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

7

罗永浩拉黑俞敏洪王自如对话任何一位，流量肯定爆炸。但聊不到一起，也没必要。甚至都

8

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

科技最新文章

1

iPhone17系列国行版的电池容量曝光了（靠谱版），具体如下：iPhone

2

【荣耀彻底杀疯！】Magic8系列这次真的不讲武德——配置堆到天花板，连吐槽

3

k80至尊版天马屏vs华星屏。可以直观的看出，屏幕发绿的是天马屏，通透的是华星屏

4

能够和小米16相抗衡的国产旗舰，估计也就只有华为Mate80了。小米16已

5

即将上市的四大机器，这里面我还是会选择oppo，因为已经习惯了ColorOS系统

6

马斯克全球封杀李雪晨！这李雪晨本来只是马斯克底下子公司的骨干开发人员，这下出

7

Magic6用户要哭了，赶紧换Magic8吧！消息已经确定，MagicOS10

8

近日，AI圈惊爆一则重大消息：Anthropic发表声明，明确规定但凡由中国

9

华为发布新品最惨的不是苹果，也不是友商而是专门拆手机的博主杨长顺。他怎么

10

目前已知的信息：全新外观设计ProMax电池容量超过5000mAh全系A19全