AI大模型新突破：豆包上线图片理解功能，引领实用化浪潮-天脉网

近期，国内AI大模型应用领域迎来了一场“多元化”的变革。

据业内消息，字节跳动旗下的豆包应用近期上线了一项名为“图片理解”的新功能。无论是通过豆包APP还是PC端，用户只需上传图片，即可让应用识别并理解图片中的内容。这一功能突破了传统OCR识别技术的局限，不再局限于文字识别，而是能够全面解析图片信息。

举例来说，用户询问某个景点的位置或动漫人物的身份，豆包都能够迅速给出准确的回答。这一功能的强大之处在于其对于图片内容的深度理解，而不仅仅是简单的文字识别。

不仅如此，豆包还能够解析复杂的图像内容，如四格漫画。以一幅描绘物理学家发现牛顿发明重力的幽默漫画为例，豆包能够准确解读出漫画中的文字与图像信息，进而解析出漫画所表达的笑话含义。漫画中，物理学家在战场上看到士兵倒地，不是考虑士兵的死活，而是思考其背后的科学原理，最终得出牛顿发明了重力的结论，讽刺了物理学家有时不切实际的思考方式。

豆包的这一功能并非孤例。此前，马斯克的人工智能公司xAI也曾为其产品Grok增加了图像理解功能，并展示了Grok理解并解释笑话的能力。这些案例表明，AI大模型在图像理解领域取得了显著的进展。

随着AI技术的飞速发展，越来越多的企业开始将AI大模型应用于更实用的场景中。图片理解功能正是其中之一，它能够满足用户在搜索、查找评估、文本写作等多个场景中的需求，使AI大模型更加贴近实际应用。

数据显示，2024年10月，AI原生应用行业的月活跃用户规模已达到8976万，同比增长373%。这些应用广泛应用于情感陪伴、职场办公、趣味休闲、文案写作、教育学习、生活助手、图像生成、行业顾问等多个领域。其中，字节跳动的豆包App凭借其强大的功能和丰富的应用场景，已成为中国日活用户最高的AI大模型产品之一。

在网页端和移动端，AI原生应用同样表现出强劲的增长势头。Kimi智能助手、文心一言、豆包、通义千问等应用均拥有庞大的用户群体。其中，豆包在移动端的月活跃用户数量更是高达4839万，遥遥领先于其他竞争对手。

AI技术的快速发展不仅推动了相关应用的普及，也为全球科技创新带来了新的契机。据预测，到2030年，全球AI领域的市场规模将超过1.8万亿美元。这一巨大的市场潜力将吸引更多的企业和投资者进入AI领域，推动AI技术的不断创新和应用。

对于中国厂商来说，智能体或许是一个对国外 AI 巨头弯道超车的好机会——面向一般用户的 GPTs 和 GPT Store，在今年都遇到了" 减速带 "，在应用生态上几乎 " 自断一臂 "。 9 月的内部会…

事实上，这并非Meta首次涉足海底光缆项目，早在2017年，Meta、微软和电信基建公司Telxius就联手在大西洋铺设了一条6600公里的海底光缆。要知道，消耗掉全球10%固定宽带和22%移动通信流量的…

和GENN-3 alpha（Web）相比，腾讯混元视频生成模型的持续时间少一秒，文本对齐高14.1个百分点，运动质量高11.8个百分点，视觉质量持平。目前，腾讯混元已开源旗下文生文、文生图和3D生成大模型。业…

余轶南做机器人相关创业，也得到了余凯博士（地平线创始人兼 CEO）的支持。 2015 年，他加入地平线机器人，是地平线最早创始人团队之一，负责自动驾驶技术的研发工作，研发了雨果自动驾驶平台，并在多重传感器融合…

再见，人人网！

据微信公众号“腾讯云”消息，12月3日，腾讯正式发布了腾讯混元文生视频大模型，支持中英文双语输入、多种视频尺寸及多种清晰度。我们用该模型生成了一段小视频。提示词为：两只小猫在打闹，写实风格。目前，该…

12月3日，中国互联网协会今日发布声明称，近日，美国以国家安全为借口，进一步加大了对华半导体出口的限制措施。美国频繁调整管制规则，持续升级贸易壁垒，无视国际贸易规则，对我国互联网产业的健康稳定发展造成了实质…

为支持人形机器人产业的发展，华为在东莞投资72亿元建设产业园区，并计划于2025年实现一定规模量产。在ETF成份股中，岩山科技、广汽集团、利欧股份涨停，南大光电涨幅超过7%，小商品城、张江高科、许继电气等…

以公司类智能体为例，它相当于AI时代的公司官网，能够为客户提供主动推荐、及时响应和服务能力，成为企业展示形象和拓展业务的新窗口。为了推动AI应用的普及和发展，百度还发布了基于大模型的100大产业应用，涵盖了…

这份报告深入剖析了家具、二手奢侈品、宠物用品、私密护理、留学服务以及装饰装修等多个行业的成功案例，为从业者提供了宝贵的内容创作灵感。“2023年设计师精选高颜值沙发”等笔记，通过精心设计的封面和标题，成功吸引…

更为重要的是，仅退款在驱逐劣质商品和无良商家方面也能够发挥一定的正面作用，从某种程度来说也是对“七天无理由退货”的一种补充。而对于在淘宝之后才行动起来的电商平台，既然淘宝已经先发制人选择了优化这一服务，那…

在中国接入互联网30周年这一重要节点上，今年与会的互联网圈大佬们不约而同指出：AI已成当前全球创新最活跃的领域，并在持续赋能千行百业，重塑全球的生产力和生产方式。阿里CEO吴泳铭，去年峰会首度亮相就提…

传统实体店要想实现成功转型，适应互联网时代的商业要求，就要具备互联网思维，借助互联网思维来引流，提高经营效率。百度、谷歌、搜狗、360、微信搜索等都是搜索工具，商家可通过行业内容、关键词设置用户搜索的关键词，…

华为深圳全球具身智能产业创新中心正式宣布生态伙伴名单，标志着华为正式进军人形机器人领域。相关ETF方面，中证A500指数ETF（代码：159357）早盘低开，盘中持续震荡，截至10：02分，微跌0.2%，…

亚马逊作为跨境电商的老牌巨头，其政策调整同样影响了卖家的物流策略。随着FBA（亚马逊物流）入仓政策收紧及费用调整，加之SPN（ServiceProvider Network）服务的重新开放，越来越多的卖家…