伯克利团队仅30好意思元复制DeepSeek AI

发布日期：2025-03-11 06:07 点击次数：144

伯克利团队以30好意思元复制DeepSeek AI的中枢功能，推出开源面容TinyZero，讲明AI探究不再是高本钱领域，裁汰了过问门槛，鞭策了更闲居的技艺诳骗。

东谈主工智能探究经常是巨头企业的专属游戏，这些公司领有深厚的财力救助。关系词，伯克利加州大学的一支探究团队却破损了这一场合。他们仅以30好意思元复制了DeepSeek R1-Zero的中枢功能。他们的面容名为TinyZero，讲明先进的东谈主工智能推理模子并不需要奢靡无数资金。更紧迫的是，东谈主工智能探究比以往任何时候齐更容易接近。

在潘佳乂的指导下，该团队旨在通过强化学习(Reinforcement Learning，RL)再行构建DeepSeek的推理模子。与依赖上流的云奇迹或雄壮的缱绻才智不同，他们使用了一个基本的话语模子、一个通俗的辅导和一个奖励系统来教诲TinyZero。

Jiayi Pan在X平台上共享了他的开心之情，暗示：“你不错切身履历那一刻，只需不到30好意思元。”他还将TinyZero形色为第一个开源的推理模子复现面容，强调了它奈何学会考证和完善我方的谜底。

奈何建筑TinyZero

为了测试模子，探究东谈主员选拔了一个名为Countdown的游戏，玩家需要通过基本的数学运算来达到目标数字。尽管TinyZero领先是赶紧揣度，但跟着期间的推移，它学会了考证我方的谜底、寻找更好的贬责决策并相应地进行诊疗。

他们尝试了不同鸿沟的模子，从50亿参数到700亿参数。后果是什么？参数鸿沟较小的模子(50亿参数)只是赶紧揣度谜底然后罢手。而参数鸿沟较大的模子(150亿参数及以上)则学会了自我考证、完善贬责决策并显贵进步了准确率。

TinyZero信得过引东谈主堤防的地点在于，与传统的东谈主工智能模子比较，它的本钱低得惊东谈主。望望这些对比：

* OpenAI的API：每百万tokens收费15好意思元

* DeepSeek-R1：每百万tokens收费0.55好意思元

* TinyZero的总本钱：一次性教诲本钱30好意思元

这意味着任何东谈主(不单是是大型科技公司)齐不错在无需烧钱到收歇的情况下执行东谈主工智能推理模子。

可用性

TinyZero是开源的，何况不错在GitHub上找到，因此任何东谈主齐不错尝试革命它。尽管它现在仅在Countdown游戏中进行了测试，但潘佳乂但愿这个面容能够使强化学习探究愈加普及。

诚然，这仍然是一个早期阶段。“诚然，其中一个过错是，它仅在Countdown任务中赢得了考证，但尚未在一般推理领域中赢得考证。”Pan承认。但即便如斯，其影响仍然是不言而喻的：东谈主工智能的发展并不一定要上流。有了像TinyZero这么的面容，低本钱、开源的东谈主工智能梗概将成为曩昔的趋势。

本文译自 Gizmochina，由 BALI 裁理发布。

上一篇：奇瑞瑞虎5x高能版，外不雅个性，1.5T发动机，年青东谈主买它若何样？

下一篇：超等小爱，智能新体验，操作节略又好玩

智能设备

伯克利团队仅30好意思元复制DeepSeek AI