首页
智能设备
数据安全
绿色科技
栏目分类

智能设备

你的位置:未来探索网 > 智能设备 > 伯克利团队仅30好意思元复制DeepSeek AI

伯克利团队仅30好意思元复制DeepSeek AI

发布日期:2025-03-11 06:07    点击次数:144

伯克利团队仅30好意思元复制DeepSeek AI

伯克利团队以30好意思元复制DeepSeek AI的中枢功能,推出开源面容TinyZero,讲明AI探究不再是高本钱领域,裁汰了过问门槛,鞭策了更闲居的技艺诳骗。

东谈主工智能探究经常是巨头企业的专属游戏,这些公司领有深厚的财力救助。关系词,伯克利加州大学的一支探究团队却破损了这一场合。他们仅以30好意思元复制了DeepSeek R1-Zero的中枢功能。他们的面容名为TinyZero,讲明先进的东谈主工智能推理模子并不需要奢靡无数资金。更紧迫的是,东谈主工智能探究比以往任何时候齐更容易接近。

在潘佳乂的指导下,该团队旨在通过强化学习(Reinforcement Learning,RL)再行构建DeepSeek的推理模子。与依赖上流的云奇迹或雄壮的缱绻才智不同,他们使用了一个基本的话语模子、一个通俗的辅导和一个奖励系统来教诲TinyZero。

Jiayi Pan在X平台上共享了他的开心之情,暗示:“你不错切身履历那一刻,只需不到30好意思元。”他还将TinyZero形色为第一个开源的推理模子复现面容,强调了它奈何学会考证和完善我方的谜底。

奈何建筑TinyZero

为了测试模子,探究东谈主员选拔了一个名为Countdown的游戏,玩家需要通过基本的数学运算来达到目标数字。尽管TinyZero领先是赶紧揣度,但跟着期间的推移,它学会了考证我方的谜底、寻找更好的贬责决策并相应地进行诊疗。

他们尝试了不同鸿沟的模子,从50亿参数到700亿参数。后果是什么?参数鸿沟较小的模子(50亿参数)只是赶紧揣度谜底然后罢手。而参数鸿沟较大的模子(150亿参数及以上)则学会了自我考证、完善贬责决策并显贵进步了准确率。

TinyZero信得过引东谈主堤防的地点在于,与传统的东谈主工智能模子比较,它的本钱低得惊东谈主。望望这些对比:

* OpenAI的API:每百万tokens收费15好意思元

* DeepSeek-R1:每百万tokens收费0.55好意思元

* TinyZero的总本钱:一次性教诲本钱30好意思元

这意味着任何东谈主(不单是是大型科技公司)齐不错在无需烧钱到收歇的情况下执行东谈主工智能推理模子。

可用性

TinyZero是开源的,何况不错在GitHub上找到,因此任何东谈主齐不错尝试革命它。尽管它现在仅在Countdown游戏中进行了测试,但潘佳乂但愿这个面容能够使强化学习探究愈加普及。

诚然,这仍然是一个早期阶段。“诚然,其中一个过错是,它仅在Countdown任务中赢得了考证,但尚未在一般推理领域中赢得考证。”Pan承认。但即便如斯,其影响仍然是不言而喻的:东谈主工智能的发展并不一定要上流。有了像TinyZero这么的面容,低本钱、开源的东谈主工智能梗概将成为曩昔的趋势。

本文译自 Gizmochina,由 BALI 裁理发布。