科大讯飞发布基于国产算力平台的大模型 训练推理效率翻番
近日,科大讯飞公布了一系列关于大模型与算力平台的最新技术进展。
近日,科大讯飞公布了一系列关于大模型与算力平台的最新技术进展,该公司10月24日午后触及跌停,截至收盘,该股报46.7元,成交额超58亿元。
10月24日科大讯飞发布了讯飞星火认知大模型3.0版本,以及讯飞星火医疗大模型,并联合华为发布“飞星一号”大模型算力平台。
科大讯飞董事长刘庆峰介绍称,“飞星一号”是科大讯飞基于华为昇腾生态开发的大模型算力平台。“这是首个真正在国产算力平台上训练出来的大模型。”
科大讯飞方面没有公布更新版大模型的具体参数,不过表示,讯飞和华为“联合特战队”半年内就将星火大模型训练和推理效率翻番。“飞星一号”平台的发布意味着讯飞正式启动对标GPT-4更大参数规模的星火大模型训练。
刘庆峰预计,这一目标有望于2024年上半年实现,届时星火4.0大模型将会发布。“星火4.0将会完全基于国产算力平台。”他在接受媒体采访时对第一财经记者表示。
他还称,国产大模型必须正视和GPT-4的差距,尤其是在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上与GPT-4还有差距。
刘庆峰承认,使用国产算力平台意味着大模型在起步阶段可能需要更长的训练时间,但这是中国发展自主可控大模型的必经之路。“生态的繁荣要一个过程。”他告诉第一财经记者,“我们最早期会使用一部分英伟达的算力,但现在正在逐步将算力完全替换成国产平台。”
基于星火大模型,科大讯飞还发布了首个“大模型+具身智能”的人形机器人,在视频中,这款机器人可以在草坪、石板路、塑胶跑道等复杂地形下自适应行走,并能保持稳定。
刘庆峰表示,科大讯飞将以人形机器人为牵引,推进“视觉、语言、动作”多模态的具身大模型。去年科大讯飞曾发布了机器人超脑平台AIBOT,该平台能够把认知智能、运动智能和具身智能的多模态感知能力结合起来。
0