首页
智能设备
数据安全
绿色科技
栏目分类

数据安全

你的位置:未来探索网 > 数据安全 > 过年亲戚不聊成亲聊AI,DeepSeek为啥有这样大的魔力?

过年亲戚不聊成亲聊AI,DeepSeek为啥有这样大的魔力?

发布日期:2025-03-21 14:44    点击次数:196

过年亲戚不聊成亲聊AI,DeepSeek为啥有这样大的魔力?

这个春节,有一款国产 AI 大模子成了科技新闻里“最靓的仔”,甚而回故土过年,不少亲戚在饭桌上聊的“下饭话题”王人造成了 AI。我们这些在北上广互联网公司打工过的牛马,动作家东说念主眼中独逐一个懂“修电脑”的东说念主才,天然不免要被问到多样关联问题。

图库版权图片,转载使用可能激励版权纠纷

若何跟不了解科技行业的九故十亲浅易易懂地讲澄澈 DeepSeek,颇破耗了我一番脑汁,但恶果还可以,比如我妈听完后一拍大腿暗示:或者懂了!(咳咳,有一说一,呈报这个问题照旧比“为什么不可亲/生小孩”,浅易多了……ㄟ(▔,▔)ㄏ )接下来我就把我跟我妈讲的空洞一下,但愿能够帮你揭开DeepSeek的玄妙面纱。

先总结一下,DeepSeek 有三宝:

开源普惠,东说念主东说念主可复制嫁接

资本大幅镌汰

西席模式突破性革新

其中每一条王人为东说念主类通往构建 AGI 创造了故意条目——所谓 AGI,指的是能够像东说念主类通常完成多样不同任务的东说念主工智能。它不仅能作念一件事,还能学习、安妥并处置多种问题。接下来,我们就浅易聊聊 DeepSeek 先进在哪儿,有什么脾气。

DeepSeek R1 强在哪儿?

DeepSeek 之前,最为东说念主熟知的大模子家具是 ChatGPT,全球月活跃用户约 4 亿。关联词大部分用户体验到的 ChatGPT 免费版块仍有许多不及。

比如,以前你问 ChatGPT 这样的问题:

“小好意思上昼 9 点的心率是 75bpm,下昼 7 点的血压是 120/80。她于晚上 11 点升天。她中午还在世吗?”

Chatgpt 就会被绕晕,给出不靠谱的谜底。这证明彼时 ChatGPT 并不睬解数字和数理之间,以及事物之间的逻辑关联,它呈报对了可能是瞎蒙,可能是言传身教。

注:由于咫尺的 AI 仍是能处置这类问题,这里专门让 ChatGPT 饰演更老的版块以展示可能出现的造作

但 DeepSeek R1 在展示扫尾同期,骄慢了竣工的念念维力(Cot)推理流程,把问题一步步拆解分析,何况在学习数学题流程中,骄慢出了索求总结数理公式的才能。

这即是 DeepSeek R1 在计较性质上不同于 ChatGPT 和 GPT-4/4o 的根底离别——R1 是推理模子,后者不是。

我们为了考验它是否真实学会了数理逻辑,而不是靠积攒的语料数据“瞎蒙”,派他去零丁处置各种数学和编程竞赛的问题,扫尾十分亮眼——在MATH基准测试中的得分为 97.3,在AIME上的得分为 79.8,高出了 OpenAI 的 o1 预览版。而在中科院物理所的竞赛比拼中,也得到了优异的收货(参见 我们用最近很火的 DeepSeek 挑战了物理所出的竞赛题,扫尾……)

天然,这些测试仅仅从一个方面测度了 DeepSeek R1 的才能,其他复杂的任务,可能会波及不同的评估步谐和主义。

为什么说 R1-Zero 是

AI 界的“野生学霸”

如若说传统 AI 是“补习班量产的勤学生”,成才主要靠指挥老诚天天耳提面命,那 R1-Zero 即是靠自学的“天才少年”。

R1-Zero 的“自学”流程依赖于强化学习(RL)算法,而非传统的东说念主类标注数据。通过反复西席和优化,尽管莫得东说念主工搅扰,它仍在特定的响应机制下自我优化,临了在数学题目中展示出了迥殊的推理才能。

这个步调跟 ALPhaGo 有些雷同,对,即是阿谁也曾慑服过东说念主类最强棋手的“硅基棋王”——它并莫得左证东说念主类的围棋教程学习,全程也莫得接受过任何东说念主类输入的信号指示,透澈依赖我方和我方“亿局局”棋战、赢输归纳总结,产生了宽绰的棋战计谋。

更绝的是,DeepSeek 的解题流程一步步推演,可以长达成百上千字,甚而上万,堪比《三体》里罗辑的面壁有计划——每一步王人充满“如若……那么……”的逻辑推演,而且连中学生王人能看懂它的念念维流程。

同期,它的西席步调还带来了效率进步,西席周期更短,资源阔绰镌汰,由于省去了 SFT 和复杂的赏罚模子,计较量减少。

开源:工夫界的“东说念主民干戈”

需要指出的是,DeepSeek R1 并不是咫尺独一的推理模子。OpenAI 的 o1 模子在推理任务上进展也很出色,关联词 DeepSeek 有个显赫的不同。

那即是,OpenAI 的 o1 模子像米其林三星餐厅——菜品惊艳,但厨房拦阻参不雅。而 DeepSeek 平直把菜谱开源,邀请全寰宇极客来窜改——有东说念主往模子里塞《五年高考三年模拟》,西席出秒杀奥数冠军的 AI;有东说念主用 R1 给女一又友写情书,扫尾因为逻辑过于严谨被骂“直男癌”。这种“群殴式革新”,让 AGI 酌量从高冷学术圈造成了全民参与的“黑客马拉松”(指截止时间内巨匠通过编程、绸缪等技正巧作,作念出敬爱或实用的方法。)。

版权图库图片,转载使用可能激励版权纠纷

更迫切的是,模子开源,让全寰宇的科技东说念主才,王人有可能站在 R1 的基础上,进行窜改再创造。科技的历史进度仍是一次次告诉我们:基础工夫的传播扩散,会激励更大量、更先进的前沿突破和本体愚弄的泄漏。

科技树的点亮,没观念仅靠一个东说念主或者一家公司,DeepSeek 的开源,就相当于一次开枝散叶的迫切流程,而这也会提高 DeepSeek 的声望和影响力。

省钱鬼才:资本仅用十分之一

大模子领域的研发其实是很“烧钱”的,好多闻明的大模子,西席一次资本就高达数百万好意思元。

而 DeepSeek 最为东说念主称说念的,是它把资本抹了个零——是的,它平直把资本金额的末尾砍掉了一个“0”。浅易地说,DeepSeek罗致了一系列架构、算法和任务拆分等方面的优化和革新,这样就能只用较低的资本就完成西席任务,而这些方面的创造力恰是 DeepSeek 的迥殊之处。

更反知识的是,资本暴降的同期,性能反而飙升:它能够在一个苦求中处理多达 128000 个 Token、一次最多可以生成 32000 个 Token(注:1 个 token 视情况相当于 1 个词语或 1 个汉字),相称相宜编写深度叙述或瓦解大量数据集,动作坐蓐力器具效力极大进步,活生生把 AI 从“吞金兽”造成了“招财猫”,利东说念主自私。

用推理已矣环保

最新的酌量和报说念骄慢,跟着东说念主工智能行业的鸿沟和影响力急剧扩大,防守东说念主工智能增长所需的计较才能梗概每 100 天翻一番。咫尺,ChatGPT 每天需要阔绰梗概 564 兆瓦时的电能。

同期,撑握大模子运算的数据中心职业器会需要阔绰大量的水资源来散热。有酌量骄慢,ChatGPT-3 在西席时间耗水近 700 吨,后来每呈报 20 至 50 个问题,就需阔绰 500 毫升水。

耗能、耗水、增多碳排放,也曾是我们担忧通往 AGI 之路的迫切阻力,关联词,DeepSeek 的告捷向我们揭示了——或然我们有其他更好的说念路。

曩昔十年,AI 界千里迷于“数目碾压”:堆算力、冲数据量、比谁烧钱多。但 DeepSeek 独辟路子——与其让 AI 死记硬背《百科全书》,不如教它“何如像福尔摩斯通常念念考”。扫尾在 ARC-AGI 测试(AGI 中枢才能基准)中,R1 系统与东说念主类进展不相高下。

这讲明:也许推理才能才是掀开 AGI 之门的钥匙,而钥匙孔里透出的光,正在被开源社区的手电筒照得越来越亮。

DeepSeek 不是别传

是团队一步步创造的火种

天然 DeepSeek 的故事听起来像一部科幻爽文:它用纯强化学习冲破了数据把持,用开源点火了全球极客的厚谊,再用资本暴降,让 AI 能更好地从施行室走进我们的生计,但它毫不像某些流量自媒体为了博眼球说的那样横空出世,更不是什么抄袭了其他厂家 AI 的扫尾。

曩昔一年,DeepSeek 团队一直面面俱到,从 V2 模子(2024 年 5 月发布),到 V3 模子(2024 年 12 月发布),到最近的 R1 和 R1-zero 模子,每一步王人得到了显赫的跳动, 走得很塌实,而且其革新有开源的信息为证。

因此,不要搭理那些逆袭开挂爽文或是抹黑文,我们要敬佩的是,从东说念主类集体跳动的角度讲,插足时间、灵敏和着实能点火东说念主的信念,突破式革新一定会泄漏。

当我们惊叹于 R1 的优异进展时,也别忘了——它省下的每一度电、洞开的每一滑代码,王人在为 AGI 莅临积蓄能量。或然翌日某天,当着实具备通用智能的AI归来历史时,会像东说念主类牢记火种与轮子通常,为 DeepSeek 当前一块里程碑。

参考文件

[1]《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》 https://arxiv.org/abs/2501.12948

[2]DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language ModelDeepSeek-V3 Technical Report https://arxiv.org/abs/2405.04434

[3]DeepSeek-V3 工夫叙述 https://arxiv.org/html/2412.19437v1

[4]《酌量东说念主员发现算法可将东说念主工智能能耗镌汰 95%》

https://oilprice.com/Energy/Energy-General/Researchers-Discover-Algorithm-to-Slash-AI-Energy-Consumption-by-95.html

[5]DeepSeek R1-Zero与R1的扫尾与分析. 腾讯云缔造者社区.

https://cloud.tencent.com/developer/article/2493328

[6]GPT-4 Can't Reason https://arxiv.org/abs/2308.03762

筹备制作

作家丨木木 北京师范大学数学专科 资深家具司理 东说念主工智能创业者

审核丨于乃功 北京工业大学机器东说念主工程专科认真东说念主,北京东说念主工智能酌量院机器东说念主酌量中心主任,博士生导师

筹备丨丁崝

责编丨丁崝

审校丨徐来、林林