商汤科技在中国北京举行新品发布会,正式发布人工智能大模型“日日新5.0”。
日日新5.0大模型采用了先进的MOE(Mixture of Experts)混合专家架构,这一架构的引入,使得模型在处理复杂任务时能够表现出更高的效率和准确性。
同时,该模型基于超过10TB的数据tokens进行深度学习训练,还拥有高达200K的推理上下文窗口。这一特性使得模型在处理长文本或复杂推理任务时,能够更好地捕捉上下文信息,从而做出更准确的判断。
此外,该模型在知识、推理、数学、代码等多个方面全面对标GPT-4 Turbo,展现了其强大的综合实力。
日日新作为商汤科技推出的大模型体系,不仅包含了自然语言处理模型“商量”(SenseChat),还涵盖了文生图模型“秒画”以及数字人视频生成平台“如影”(SenseAvatar)等多个模块。这些模块的协同工作,使得日日新大模型能够为用户提供更加丰富和全面的服务。
该大模型体系于2023年4月由商汤科技董事长兼首席执行官徐立宣布推出,并于同年8月获批上线。自上线以来,日日新大模型已经在多个领域得到了广泛应用,并取得了显著成效。
日日新大模型的主要功能包括自然语言生成、文生图、感知模型标注以及模型研发功能。用户可以通过自然语言输入,利用大模型的意图识别、逻辑理解与代码解释器的能力,实现自动数据转化为有意义的分析和可视化结果。这一功能在智能客服、智能写作、智能设计等领域具有广泛的应用前景。