沿途基于国产算力,科大讯飞发布首个深度推理大模子X1
【大河财立方 记者 陈薇】1月15日,科大讯飞发布了刻下寰宇产算力平台上独一的深度推理大模子——讯飞星火X1。讯飞星火X1在解答高考题、竞赛题时,不仅准确给出了这些题方针谜底,还对解题想路和技艺进行了醒目拆解。

与通用大模子比较,其解题经由更接近东说念主类的“慢想考”状貌。该模子现在汉文数学能力国内第一,将率先控制于训诲、医疗等场景。

不仅给出谜底,
更有想考经由
一直以来,讯飞星火坚握走寰宇产化阶梯。尽管在寰宇产算力平台上训诲深度推理模子际遇诸多挑战,但科大讯飞联袂华为,告捷攻克了训诲推理强交互、高隐约推理优化以及国产算子优化等一系列贫困,训诲出具备深度想考和推理能力的大模子。
发布会上,科大讯飞探讨院的探讨员们次序展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的阐发。
讯飞星火X1不仅准确给出了这些题方针谜底,还对解题想路和技艺进行了醒目拆解。大模子不错将复杂问题分步拆解简化,还不错进行自我探索和反想考据,并基于谜底正确与否的优质反应信息进行强化训诲。与通用大模子比较,其解题经由更接近东说念主类的“慢想考”状貌。
讯飞星火X1在近期参预的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“锻练”中收获超越亮眼,用更少的算力,末端了业界一流的成果,多状貌标国内第一。
慢想考的能力,让讯飞星火X1率先在训诲场景中末端了控制落地。
2024年,科大讯飞联络中国训诲科学探讨院发布了基于“问题链”的高中数学智能教师助手。体验过的淳厚们暗意,X1在一题多解、教学常识干系、拓展学生高阶想维等方面阐发出色。跟着干系技巧的深度融入,科大讯飞AI学习机学习保举和会诊将变得愈加精确,解题想路和常识链条将愈加了了。
在医疗范畴,讯飞星火X1可使专业补助会诊和复杂病历内涵质控的准确率均达90%。本年上半年,科大讯飞还将发布基于讯飞星火X1的医疗大模子升级版,确保其深脉络会诊推理成果和质控能力业界当先。

摒除大模子幻觉助力大模子更好落地行业
同期,讯飞星火4.0 Turbo底座能力也对标OpenAI最新版的GPT-4o进行了升级。这次升级主若是围绕行业、企业需求,在数学能力、行业常识、图文识别、长文本等能力上进行晋升。

数学能力一直是讯飞星火的强硬,这次基于讯飞星火X1的高质地合成数据,讯飞星火4.0 Turbo不错在数学教学、金融分析和科研推演等职责中更好地匡助用户。
面临五行八作复杂图文识别需求,比如医疗的体检申报、法院的布告、企业条约等,不仅有翰墨还有复杂长表格、杂沓板式、图章手写条约等,讯飞星火4.0 Turbo图文识别能力升级,大幅晋升高价值数据的取得能力。
在企业常识问答这类严谨的控制场景中,用户对大模子幻觉的容忍度真是为零。这次讯飞星火推出了基于智能体的全新长文本框架,并行业首发了句子级溯源功能,显贵缓解了问答搜索就业中控制落地贫困。
按捺2024年底,讯飞星火在大模子动力、金融、汽车、运营商等行业,与客户共同打磨了近百个智能体控制。讯飞星火4.0 Turbo的行业能力全面晋升,金融、油气、动力、电力、钢铁、航司等范畴详尽能力晋升沿途越过10%,不错说是最懂行业的大模子。
责编:陶纪燕 | 审校:张翼鹏 | 审核:李震 | 监审:万军伟