商汤发布日日新V6大模型,徐立与马云共话AI融入日常生活

   时间:2025-04-11 17:54 来源:天脉网作者:朱天宇

在人工智能领域,多模态大模型正逐渐成为行业发展的新风向。继DeepSeek凭借卓越的文本推理能力和高性价比脱颖而出后,业界对于多模态推理领域的下一个领军者充满期待。

近日,商汤科技在2025技术交流日上震撼发布了日日新SenseNova V6(简称“日日新V6”)大模型体系,其在多模态推理能力上堪称国内翘楚,与OpenAI的o1相媲美,同时在数据分析能力上远超GPT-4。更令人瞩目的是,从性价比角度来看,其多模态训练和推理成本刷新了业界最低记录。

2025年被视为大模型应用的关键之年。在这场交流日上,两位行业大佬不约而同地强调了AI应深入百姓生活的理念。商汤科技董事长兼首席执行官徐立表示:“AI之道,在于百姓之日用。”无独有偶,马云也在阿里云新财年启动会上提出,高科技不仅要仰望星空,更要脚踏实地,服务于人们的日常生活。科技人员的使命不是让AI取代人类,而是让AI更加理解人类,更好地为人类服务。

日日新V6作为一款拥有超过6000亿参数的MoE原生多模态通用大模型,在长思维链、数理能力、多模态推理以及全局记忆等方面实现了重大技术突破。其数据分析能力遥遥领先GPT-4,多模态深度推理能力更是位居国内首位,与OpenAI的o1不相上下。

基于超过200B的高质量多模态长思维链数据,商汤通过多智能体协作,成功合成了长思维链,并进行了验证。这使得日日新V6具备了出色的多模态推理能力,能够支持最长64K的多模态长思维链,让模型具备了长时间的思考能力。在处理真实世界的复杂问题时,日日新V6展现出了卓越的混合图文理解推理能力,一个模型就能应对文本、多模态等各类任务。

日日新V6还打破了市面上大模型只能解析短视频的限制,实现了对10分钟视频的全帧率解析,与Gemini 2.5 Turbo相比,达到了同类型最强。例如,输入一段《黑神话:悟空》的游戏录屏,日日新V6就能自动剪辑出游戏高光时刻,并生成解说文案,完成一段精彩的游戏解说。

商汤是如何实现如此惊人的记忆和理解能力的呢?原来,它能够将画面、语音、音效、字幕、口语和时间轴逻辑进行对齐,形成多模态统一时序表征。通过细粒度级联信息压缩和内容敏感的动态过滤,实现了长视频的高比例压缩,10分钟视频可以压缩到16K tokens,同时保留关键语义。

去年,商汤大模型的实时交互能力就曾引起广泛关注。此次,商汤推出了全新的轻量级全模态交互模型SenseNova V6 Omni,带来了国内顶尖的多模态交互体验。当你将手机对准一本英文周刊或论文时,它能实时翻译你手指所指的内容,让你享受自然直观的指读交互体验。当你忙于工作时,孩子缠着你讲故事,你就可以把讲故事的任务交给日日新V6。它还能担任文旅导游、数学老师,甚至扮演各种角色。

SenseNova V6 Omni已经在多个行业和场景中得到了应用,成为国内首个商业化的全模态实时交互模型。在现场,《IT时报》记者见证了傅利叶等多品牌的机器人搭载商汤大模型后,具备了更加自然、类人的实时交互能力,让人形机器人拥有了眼睛、嘴巴、耳朵和大脑。

商汤在此次发布会上还带来了一个惊喜,推出了搭载日日新V6的商量App。通过这个入口,C端用户将能够体验到文字、图像、视频等多种模态的流式交互。不过,目前商量App还处于内测阶段,用户可以在商量网页端体验日日新V6的强大功能。只有更加懂人、更像人的AI,才能更快地融入人们的日常生活,成为不可或缺的“日用品”。

 
反对 0举报 0 收藏 0
 
更多>同类天脉资讯
全站最新
热门内容
媒体信息
新传播周刊
新传播,传播新经济之声!
网站首页  |  关于我们  |  联系方式  |  版权隐私  |  网站留言  |  RSS订阅  |  违规举报