生成式AI
一、李飞飞空间智能新成果,3D世界生成进入无限探索时代?
1. 李飞飞创业公司World Labs发布空间智能模型Marble,能仅用一张图片或文本提示生成持久存在的大规模3D世界;
2. 相比之前产品,Marble生成的3D世界规模更大、风格更多样化、几何结构更干净,且支持浏览器中自由视角导航;
3. 用户可将生成世界导出为高斯点云并集成到Three.js中,实现在桌面、移动设备和VR头显上的高效运行,已开放白名单测试。
https://mp.weixin.qq.com/s/-hw_l9Pk72IIify0WUYZJA
二、Agent进入支付时代?谷歌联手60+巨头官宣AI支付协议
1. 谷歌联合美国运通、PayPal、Mastercard等60多家机构推出代理支付协议(AP2),旨在创建AI代理支付的安全标准框架;
2. AP2通过"授权书"(Mandates)构建信任,使用加密签名的数字合同作为用户指令证明,允许用户预授权AI代理在特定条件下自动完成购买;
3. 该协议支持实时购买和无人工参与的委托任务,加密版本A2A x402还支持稳定币支付,目前已开放GitHub仓库供开发者探索。
https://mp.weixin.qq.com/s/FHfnpECZu-5ZNJ7JAgTe9Q
三、OpenAI和Anthropic进入新战场:训练AI操作企业软件
1. Anthropic计划投资10亿美元创建企业应用克隆体,OpenAI预计到2030年在数据相关成本上支出80亿美元;
2. 两家公司正在使用"强化学习环境"(模拟企业应用)训练AI模型操作各种专业软件,如Salesforce、Zendesk、Cerner;
3. 或将聘请领域专家示范任务执行,通过训练AI成为"虚拟同事",开辟新的盈利渠道。
https://mp.weixin.qq.com/s/wL3msfp0dRavNcKuMZq6_g
四、腾讯云宣布智能体开发平台3.0(ADP3.0)面向全球上线
1. 腾讯云ADP3.0全面升级RAG、Multi-Agent、WorkFlow和应用构建工具链,近3个月完成近600个功能上线;
2. 平台升级包括完善知识库管理运维、支持多方式配置Agent协同、工作流全局Agent视野和即时指令等技术;
3. 已针对性推出智能质检、媒体内容处理等行业Agent,优图实验室将开源Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架。
https://mp.weixin.qq.com/s/ECFXRpHGsQDbFLNFtLcOWQ
五、迪士尼、华纳等指控MiniMax将蜘蛛侠等素材用于训练
1. 迪士尼、华纳兄弟和环球影业联合起诉中国AI公司MiniMax,指控其海螺AI产品未经授权使用蜘蛛侠等IP进行AI训练;
2. 三大公司要求返还侵权所得并索赔每项侵权最高15万美元,甚至请求法院颁布永久禁令切断MiniMax使用相关IP的可能性;
3. MiniMax此前已在国内面临爱奇艺关于《苍兰诀》的类似指控,这次诉讼揭示了AIGC在IP模仿上的巨大风险。
https://mp.weixin.qq.com/s/jJVdEHn3E87HcgCFXGdFKg
六、ima支持上传音频文件了!新版本更新三项「效率法宝」
1. ima更新支持上传MP3、M4A、WAV、AAC格式音频文件,AI自动生成原文、速览和纪要,方便处理培训录音等内容;
2. 更新增加电脑端快捷键截图功能,用户可设置截图后直接提问、加入知识库或记笔记;
3. 手机端笔记支持离线编辑与新建,无网络状态下也能记录灵感,联网后自动同步。
https://mp.weixin.qq.com/s/VFrUqlcZOiEDrrA1dVxAvg
七、YouTube 引入Veo3定制版为短视频创作者推出 AI 工具
1. YouTube推出面向Shorts创作者的生成式AI工具,将谷歌文本转视频模型Veo 3的定制版"Veo 3 Fast"引入短视频创作;
2. 新版可以480p分辨率低延迟生成内容,同步添加声音,还能将视频动态效果应用到静态图片上;
3. YouTube还推出基于谷歌Lyria 2的"语音转歌曲"混音工具和"AI编辑"功能,后者可自动整理精彩片段,添加音乐与转场效果。
https://mp.weixin.qq.com/s/CYWmr-UQ9apv1lPWWzyvTA
前沿科技
八、390亿美元,全球具身智能第一估值,英伟达持续加注中
1. 人形机器人公司Figure完成C轮融资,获得超10亿美元承诺资本,投后估值高达390亿美元,创下具身智能赛道最高估值纪录;
2. 融资由Parkway Venture Capital领投,英伟达、英特尔资本等参与,资金将用于扩大BotQ工厂生产规模、搭建GPU基础设施和数据采集;
3. Figure自与OpenAI分道扬镳后进展迅速,推出Helix端到端"视觉-语言-动作"模型,其机器人已实现叠衣服、分拣快递等复杂任务。
https://mp.weixin.qq.com/s/kapdi5jwtFcwO_GrF0ShGA
报告观点
九、华为发布《智能世界2035》面向未来十年十大技术趋势
1. 华为发布《智能世界2035》和《全球数智化指数2025》两大研究报告,展望未来十年关键技术趋势及其对行业影响;
2. 报告预测十大趋势:AGI将成最具变革性驱动力量、AI智能体从执行工具演进为决策伙伴、人机协同编程成为主流、交互方式向多模态演进等;
3. 报告预测2035年全社会算力总量将增长10万倍、AI存储容量需求将比2025年增长500倍、可再生能源发电占比将突破50%。
https://mp.weixin.qq.com/s/LzAcSqeda1Sj4XXT1Im53Q
十、Shopify 经验贴:如何搞出一个生产级 AI Agent 系统?
1. Shopify分享其AI助手Sidekick的架构演进经验,建议保持架构简单、工具边界清晰,并采用模块化设计如"即时指令";
2. 提出用反映真实生产环境的"基准真相集"替代"黄金数据集",将大语言模型裁判与人类评估结果高度对齐;
3. 警告"奖励作弊"问题(如退出式作弊、标签式作弊),建议提前构建检测机制,并结合程序化验证和语义评估构建多层奖励系统。
https://mp.weixin.qq.com/s/32YB5LxskrGHKmYiraQIPA