天脉网 | 天脉新媒体中心主办！
手机版
二维码

时事快闻

DeepSeek新论文：NSA机制能否引领AI长文本训练新潮流？

时间：2025-02-18 20:17 来源：天脉网作者：江紫萱

近期，DeepSeek在知名社交平台X上发布了一篇技术论文报告，引起了广泛关注。该报告详细介绍了NSA（Natively Sparse Attention，原生稀疏注意力）机制，这是一种专为超快速长文本训练与推理设计的、硬件友好且可原生训练的稀疏注意力机制。

NSA机制的核心优势在于其针对现代硬件的优化设计。通过这一设计，NSA不仅能够显著加速推理过程，还能有效降低预训练成本，同时不牺牲任何性能表现。这一机制在多个领域展现出了强大的潜力，包括通用基准测试、长文本任务以及基于指令的推理等。在这些场景中，NSA的表现均能达到或超越传统的全注意力模型。

DeepSeek的这篇报告迅速引发了业界的热烈讨论。一位X用户在DeepSeek的帖子下留言称：“NSA机制无疑改变了游戏规则。超快速长上下文训练对于推动教育领域AI的发展至关重要，这与我们追求的个性化学习愿景不谋而合。”还有网友幽默地调侃道：“Nvidia或许要感到紧张了。”

NSA机制的推出，标志着稀疏注意力在提高AI模型效率的同时，还能保持甚至提升模型的能力。这一创新为解决当前AI领域面临的计算资源瓶颈提供了新的思路。随着DeepSeek等企业的不断探索和实践，稀疏注意力机制有望在更多领域得到广泛应用，进一步推动AI技术的快速发展。

点赞 0反对 0举报 0 收藏 0

更多>同类天脉资讯

多力多滋重启广告大赛：老IP如何借社交媒体东风再起飞？

在社交媒体上，多力多滋针对冲击超级碗大赛的每一条博文，都打上了#DoritoCrash和#SBLIX（Super Bowl LIX）的标签；在品牌Youtube账号发表的视频中，超级碗广告相关视频的观看量远…

02-18

动漫游戏板块走低，中证动漫游戏指数跌3.49%，完美世界等权重股表现如何？

金融界2月18日消息，上证指数低开低走，中证动漫游戏指数 (动漫游戏，930901)下跌3.49%，报1870.89点，成交额437.37亿元。数据统计显示，中证动漫游戏指数近一个月上涨34.18%，近三个…

02-18

《弥助模拟器》恶搞上线，与《刺客信条：影》同日对决江户时代？

在育碧大作《刺客信条：影》即将发售之际，一款名为《弥助模拟器》（Yasuke Simulator）的游戏也于近日宣布将和《刺客信条：影》同一天（3月20日）上线。从本作的名字相信玩家们就能看出端倪，这是一款嘲…

02-18

《黑神话》之后，国产游戏新星何处寻？多款大作蓄势待发，谁能脱颖而出？

目前国产开发中的动作游戏多是走的暗黑系风格，同一种美术风格玩家们见多了难免会审美疲劳，因此，将二次元结合类魂的动作游戏《无限机兵》，成为了国产类魂游戏中独树一帜作品。与其它类魂游戏不同的是《万物契约》中玩…

02-18

江户恶搞大战！《弥助模拟器》挑战《刺客信条：影》同日上线

02-18

《上古卷轴5》全屏设置不求人，轻松玩转天际世界！

在视频设置中，有一个很重要的选项叫做“窗口模式”。有些玩家在调整了全屏模式后，可能会遇到游戏画面不如预期的问题，比如画面模糊、卡顿等。总而言之，把《上古卷轴5》调成全屏模式并不复杂，主要就是在选项菜单中…

02-18

《守望先锋》大改版来袭，威能系统与角斗领域能否重燃玩家热情？

威能是建立在《守望先锋》经典玩法基础上的全新技能系统，即将在第15赛季实装到游戏中。这也是一个制作组在英雄设计之初就想要实装、却未能如愿的设计，威能系统终于让它和玩家们见面了。这个模式中还加入了“初始搭配”…

02-18

2025游戏盛宴开启：暴雪回归与国产开放世界公测同步来袭！

采用虚幻5引擎制作，以北欧神话的粗犷神秘氛围为题材的韩式神话游戏作品《尤弥尔传奇》将于2月20日韩服上线。黑曜石新作《宣誓》即将于2月19日正式发售，预购高级版的玩家已可抢先体验了本作，目前根据抢先体验的…

02-18

PVP服务器转账全攻略：如何安全高效地进行游戏内交易？

为了避免这种情况，很多玩家会选择在游戏的公会或者团队中进行转账。同时，提供一些安全保障，比如在交易前约定好交易的时间和地点，或者通过公会的官方渠道进行交易，这样可以大大降低风险。当你看到好友在游戏中遇到困难…

02-18

《黑神话》之后，国产游戏新星何在？多款大作蓄势待发，谁能脱颖而出？

02-18

皇城之巅荣耀战纪：首届争霸落幕，江湖新传奇待续！

随着赛事的深入，不少顶尖联盟和帮主脱颖而出，以一场场精彩的打斗决战，树立起了黄金服的武林标杆，促使了江湖新传奇的诞生！恭喜对酒当歌联盟获得后勤神助荣誉奖项，他们兵强马壮，是黄金服后勤最富有的联盟；此外，…

02-18

DeepSeek引领AI新变革：大模型时代，银行业未来何在？

新网银行副行长李秀生，西南财经大学管理科学与工程学院计算金融系主任、教授王俊，新网银行风控科学部负责人卫浩为我们揭示了DeepSeek背后的技术奥秘及其在银行业的应用前景。王俊指出，“在制造业中，大模型能监测…

02-18

《奇异贤伴：爱达之歌》凉凉？上线月余在线不足两千，玩家直呼赛博劳改

不仅如此，《奇异贤伴：爱达之歌》中还不支持玩家之间互相交易道具，游戏中的一切道具都需要大伙亲手一个个去游戏中捡出来，关键这个破机甲每次还装不下几个玩意就满了，再加上游戏中各种离谱的任务，让玩家玩起来纯粹像是…

02-18

暴雪总裁访华，与网易共商大计，《守望先锋》国服重磅回归！

2月18日消息，在上任满一年之际，暴雪总裁乔汉娜·法里斯首次来访中国，并与合作方网易的团队共进晚宴。此行乔汉娜主要到了上海，与暴雪中国团队进行交流，接下来将到杭州与网易相关团队会面并与《守望先锋》的玩家与…

02-18

三国杀于吉：娱乐至上的老神仙，你能否玩转这个“大骗子”？

在三国杀的对局中，军八可以说曾经有过一个娱乐性非常强的武将，像是左慈这样的属于娱乐与强度参半，化身强了可以体验拉满，化身不强也可以娱乐拉满，自然就有比较好的对局体验；而对于另一个老神仙于吉来说，属于是强度与娱…