核心提示:新浪科技讯4月23日晚间消息,在商汤科技SenseTime技术交流日活动上,商汤发布“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,同时宣布升级“日日新SenseNova5.0”...
新浪科技讯 4月23日晚间消息,在商汤科技SenseTime技术交流日活动上,商汤发布“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,同时宣布升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。
据介绍,基于超过10TB tokens训练、覆盖大量合成数据,全新的“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。
本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。在多模态能力上,商汤多模态大模型的图文感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista,AI2D,ChartQA,TextVQA,DocVQA,MMMU 取得领先成绩。
商汤科技董事长兼CEO徐立表示:“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”(文猛)