
2月11日,科大讯飞发挥发布基于世界产算力老师的星火X2大模子。从X1.5到X2,升级有两大亮点:
1、通用身手全面升级,星火X2全体身手对标海外顶尖模子水平,在数学、推理、话语意会、智能体等身手上忘形海外最优;130+多话语综称身手不息普及,拉好意思、东盟等地区重心语种效能保握业界率先水平。
2、依托星火X2的算法松弛、行业高质地数据集以及专科想维链的强化学习,星火行业大模子握续升级,家具期骗决策获得权臣高出。
这次面向关键行业落地的实用化升级,秀雅着我国基于世界产算力老师的大模子底座在算法和工程转变方面迈入新阶段。星火X2在兑现通用身手全面升级的同期,愈加专注于造就、医疗、汽车、智能体等高专科性、高体验性场景,起劲于于为这些领域提供率先、可靠的时刻决策与援手。
赋能医疗,专科身手握续普及并保握业界率先,个东说念主健康助手各项身手在业界率先通过巨擘评测考据,“讯飞晓医”APP全面升级;
赋能造就,步伐级改动、错因定位等时刻进一步扩大全球率先上风,业界首发错因王人集的个性化学习身手,让启发式训诲更契合学生想路,股东AI学习机等家具兑现更精确的自主学习闭环,进一步普及孩子学习酷好与学习效能;
面向汽车智能座舱的星火中小尺寸模子同步升级,智能交互实车评测行业全面率先,拖拉意图效能从弥散不可用达到基本好用,让汽车像老一又友聊天雷同精确听懂你的“潜台词”;
星辰Agent平台全新升级,进一步强化了“会想考能实行”的宏构智能体构建身手。智能体数目仍是高出130万,行为企业级智能体平台,在复杂行业场景任务上进一步处理用户关键刚需。
据「TMT星球」了解,即日起,星火X2的最新身手可径直在讯飞星火网页版和APP体验,全新API也已上线讯飞盛开平台,握续解放分娩力;星火APP5.2.0新版块同步上线,进一步强化了更懂你的AI助手。
星火X2来了,多项中枢身腕发挥握续凸起
这次星火X2通用身手全面升级,全体身手对标海外顶尖模子水平,在数学、推理、话语意会、智能体等身手上忘形海外最优;同期,星火X2的130+多话语综称身手不息普及,拉好意思、东盟等地区重心语种效能保握业界率先水平,为跨话语造就、医疗与产业期骗提供可靠援手。
星火X2通过量化单台昇腾就业器即可开动。星火X2采纳293B MoE稀零架构,勾通权分量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通讯等多种工程化转变,兑现了国产大EP并行部署,推感性能比较X1.5普及50%。
星火大模子多尺寸中小模子同步升级,在办公本、翻译机、汽车座舱交互等场景的中枢效能权臣普及。
通用大模子中枢身手效能对比
外部公开高难任务效能对比
*测试聚会开始:基础身手测试集(泛动刷新),来自海量真实大模子恳求任务脱敏数据,包括讯飞星火APP、API真实诞生者场景、以及造就、医疗等行业中枢任务。公开测试集以数学、答题、推理、代码、智能体等外部典型Benchmarks为主。
照旧用一齐题来试试效能:
这是2025年11月哈佛-麻省理工数学锦标赛(HMMT)里的一齐英文题目,难倒国内主流模子,但星火X2在分析想考后,不仅给出了正确谜底,还给出了详备的解题过程。
再来望望星火X2能不成解答西班牙语数学题:
依旧是快速给出注意解题过程以及正确谜底。
星火X2身手的权臣升级离不开时刻的握续转变松弛,典型责任包括:
训推采样校准强化学习算法
针对MoE大模子RL老师中的训推分散不一致问题,提议老师与推理概率重采样自稳当校准算法,大幅普及强化学习老师准确率和踏实性。
递归式高难数据合成时势
针对高难任务数据稀缺问题,狡计多轮迭代式推导的数据合成决策,兑现推理舛误逐步修订与敛迹,握续构建稀缺型高质地数据,普及模子深度推理准确率。
多阶段RL高模糊采样时势
狡计P/D(Prefill/Decoder)两阶段分歧的多阶段推理采样决策,处理国产化平台强化学习高模糊采样情况下的效能干豫问题,老师效能普及10%。
就业高性能部署优化算法
通过模子轻量化压缩,完成国产机器的单机大EP并行部署,推感性能比较星火X1.5普及50%,兑现大模子在国产平台的轻量化落地与高效推理双重松弛。
股东行业大模子升级更懂你的Al再高出
实用性是查考大模子身手的硬范例。依托星火X2的算法松弛、行业高质地数据集以及专科想维链的强化学习,星火行业大模子握续升级,在造就、医疗、王法、汽车交互、企业智能体期骗等关键场景发挥一新,在功能和效能层面兑现全面升级,“更懂你的AI”再进一步。
赋能医疗 各项身手握续保握权臣率先
星火X2底座赋能医疗,助力星火医疗大模子中枢身手全面普及并握续保握业界率先。基于住户健康档案的智能健康分析、智能文牍解读、通酣饮食建议、辅助养息、智能用药审核等关键任务上,模子身手均权臣超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。
*测试聚会开始:按照《医疗健康行业大模子期骗时刻条目》,基于脱敏真实用户数据及住户健康档案,构建全新测试聚会MedLLM-EHR-EVAL-V2。
星火医疗大模子围绕个东说念主健康助手的各项身手已率先通过上海市医疗大模子期骗检测考据中心评测考据。(备注:上海市医疗大模子期骗检测考据中心为国内首个面向医疗大模子期骗评测和考据的平台,由上海AI施行室牵头打造,华山病院、中山病院、瑞金病院等12所医疗机组成为中心首批考据单元。)
在此基础上,“讯飞晓医”APP各项身手全面升级,多轮主动问诊、多轮咨推测答、问用药、查验查考单解读、体检文牍单解读等健康参谋任务在业界握续保握权臣率先。
*测试聚会开始:测试聚会基于线上个东说念主健康参谋的真实场景脱敏数据立时抽样。
另外,讯飞晓医的语音交互对话身手亦然本次升级的一个遑急特点,迎接群众体验。
面向用户的健康刚需,讯飞晓医因为更专科是以更让东说念主定心~
赋能造就 率先兑现错因王人集个性化学习身手
新版块的星火X2底座全面赋能造就,步伐级改动、错因定位等时刻进一步扩大全球率先上风。勾通率先的多学科答题及推理身手,业界率先发布错因王人集的个性化学习身手。数学步伐级改动效能进一步普及,同期支握更精确的错因定位,在答疑上兑现契合学生本东说念主想路的启发式训诲,关连时刻握续保握业界率先,并股东期骗见效权臣普及。
*测试聚会开始:测试聚会基于备讲课、考试、功课、学习等真实场景脱敏数据立时抽样。
面向学生自主学习场景,科大讯飞AI学习机在1对1精确学、答疑指点和互动课等效能握续普及。依托更精确的步伐级改起程手,会诊精确率、有计划合理率和辅学启发性效能率先行业,兑现个性化、启发式、有计划性教化,进一步普及孩子学习酷好与学习效能。
赋能汽车 智能座舱交互系统全面升级
基于星火X2升级,在汽车领域,2B、7B、30B-A3等多尺寸中小模子同步升级,助力汽车智能座舱交互系统全面普及,在东说念主东说念主/东说念主机对话判断、拖拉意图意会、高情商回报等方面交互体验权臣普及。特等是拖拉意图交互效能兑现跨越式松弛,从弥散不可用普及至基本好用水平,实车评测业内全面率先,勾通星火多模态大模子感知意会身手,真确兑现座舱内解放、当然的东说念主机交互体验。
星辰Agent平台和宏构智能体 效能全新升级
星火X2的智能体身手,在永劫复杂任务有计划、多用具组合调用以及长高下文等方面均兑现了权臣普及。
星辰Agent平台全新升级,进一步强化了“会想考能实行”的宏构智能体构建身手。面前智能体数目仍是高出130万,行为企业级智能体平台,已整合语音交互、语音识别、图像意会等百余种宏构盛开平台身手,丰富企业级场景期骗用具生态,援手快速构建企业场景中的更复杂、更实用的宏构智能体。
面向企业采购场景的招采智能体,在招标文献合规检测、供应商禀赋核验、投标额外行动检测等中枢场景,效能普及超3倍。同期,支握企业像搭积木雷同极速定制专属招采群众,专用智能体诞生从原本的几天压缩至分钟级,助力企业精确风控、高效降本。
面向行业深度分析的星火行业行家家具,针对动力、农粮等行业的专科商情分析领域进行深度会通,勾通产业图谱推理和分析,权臣裁汰幻觉。商情信息瞻念察及辅助决策时代从“周”裁汰到“天”,为客户快速决策提供实时的时刻援手。
联袂诞生者,握续共开国产化大模子闹热生态
讯飞星火已上线最新的星火X2,握续打造更懂你的AI助手。一键开启语音对话,快速反馈你的需求。特等是面向年青东说念主求职和学习普及需求,本次重心升级了科研助手和求职助手,全经由辅助用户找责任和写论文。
讯飞盛开平台已发挥上线星火X2 API。讯飞盛开平台新注册诞生者不错领取最多100万Tokens免费额度,让模子身手以更低资本干预真实诞生与鸿沟化考据。从模子进化到API鸿沟化盛开,再到真实场景的握续落地,星火X2面向全球超1000万诞生者分享更强意会力与实行力的深度推理身手。
星火X2升级,不仅是一次算法和工程的转变,更是基于世界产算力老师的大模子在处理行业刚需问题上的跃升。
咱们诚邀每一位用户、诞生者、行业伙伴共同体验开yun体育网,在真实的业务场景中查考实用价值,握续将全栈自主可控的国产大模子推向安全果然、高效踏实的鸿沟化期骗。






