设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

2024/4/24 19:30:24 来源:IT之家 作者:清源 责编:清源
感谢IT之家网友 华南吴彦祖Louis9998Diixx飞翔的企鹅哈風見暉一袁山野人 的线索投递!

IT之家 4 月 24 日消息,4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。

该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力

文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅助;理科能力方面,其数理、代码及推理等方面能力也进行了增强,官方表示可为金融、数据分析等场景落地提供基础。

目前,日日新 5.0 大模型已经正式面向全网用户开放,点此直达

商汤方面表示,在小米汽车 SU7 的智能座舱内也应用了商汤大模型技术,小爱同学采用了基于商汤端云大模型的解决方案,可为车主提供智能化交互体验。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关文章

软媒旗下网站: IT之家 辣品 - 超值导购,优惠券 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 魔方 酷点桌面 Win7优化大师 Win10优化大师 软媒手机APP应用