生成式AI
一、OpenAI发布GPT-5-Codex:可独立连续工作超7小时
1. OpenAI发布GPT-5-Codex专为智能体编程优化,可自主连续工作超7小时,已在Codex所有使用场景上线并整合ChatGPT账号体系;
2. 该模型在SWE-bench Verified和代码重构两大基准测试中性能超越GPT-5(high),可根据任务复杂度动态调整思考时间;
3. GPT-5-Codex具备代码审查能力,能主动发现漏洞,上线仅两小时半流量已占Codex总量40%,支持多种工具调用并计划API开放。
https://mp.weixin.qq.com/s/f6zSmd2no70eAk_hu-hfmA
二、腾讯混元3D 3.0来了,多指标提升,真人手办建模自由!
1. 腾讯发布混元3D 3.0模型,建模精度提升3倍,几何分辨率达1536³,支持36亿体素超高清建模,解决整体结构与局部细节生成难点;
2. 新模型针对人物生成专项优化,实现精细面部重塑,告别"抽象脸"问题,大幅提升人物真实感与美观度,达到真人手办级别效果;
3. 同步上线腾讯云API和专业级混元3D Studio工作台,覆盖3D管线七大核心环节,已成为全球下载量超260万的最受欢迎开源3D模型之一。
https://mp.weixin.qq.com/s/XzJIt8glOd82pVs_YXjf6w
三、昆仑万维上线「Agent Studio」功能,私人音乐工作室
1. 昆仑万维旗下AI音乐创作平台Mureka上线"Agent Studio"功能,免除复杂prompt,用户只需说出想法,由Agent自动生成合适歌词、匹配音乐风格;
2. 目前已上线六个不同Agent场景:Make Album(创作专辑)、Tarot Tunes(塔罗音愈)、Buzz Tracks(热点写歌)、Diss Tracks(Diss制造机)、Gift a Song(以歌致礼)和Spicy Song(撩人情歌);
3. Agent Studio支持基于热门话题创作、结合网络实时搜索生成个性化音乐,让音乐创作融入日常生活,成为人人可用的创作伙伴。
https://mp.weixin.qq.com/s/LNjbrW6yNoKFmnPnywxiVg
四、宇树开源世界模型-动作架构,名叫UnifoLM-WMA-0
1. 宇树科技开源机器人世界模型-动作架构UnifoLM-WMA-0,拥有理解机器人和环境相互作用物理规律的世界模型,可适配多种机器人本体;
2. 该模型支持决策模式(预测交互关键信息)和仿真模式(生成环境反馈)两种核心功能,可实现精准动作预测,在真机测试中预测与实际操作高度吻合;
3. 模型使用Open-X数据集微调视频生成能力,基于5个开源数据集完成全流程训练,GitHub发布后迅速获得100+星标,推理代码和模型检查点均已开源。
https://mp.weixin.qq.com/s/z4IQi1hSi7_LAg5_g3mXOQ
五、魅族AI眼镜1999元起售:拍照翻译付款全都会,39g
1. 魅族发布AI拍摄眼镜StarV Snap,首发价1999元,仅重39g,搭载高通第一代骁龙AR1平台,支持12国语言同声传译、AI识物和语音转写;
2. 眼镜配备1200万像素镜头,支持109°超广角视野、720P长时间录制、1080P高清拍摄,具备EIS防抖等多项算法优化,提供Live图功能记录前后几秒动态;
3. 产品已与支付宝、蚂蚁国际达成战略合作,可直接通过眼镜完成扫码支付,并在安全方面设计有明显拍摄提示灯和防遮挡检测机制。
https://mp.weixin.qq.com/s/wO-4FSshD6rV7xgPYEGDlA
六、Meta全新AI眼镜在Connect大会前被泄露,外观曝光
1. Meta即将发布的AI眼镜宣传片在Connect大会前被泄露,显示新眼镜将由Meta AI驱动,配备单眼抬头显示器(HUD)和神经腕带交互系统;
2. 新品预计以Ray-Ban品牌发布,传闻起售价800美元,主要用于Meta AI和步行导航,腕带支持手指滑动字母回复消息;
3. 泄露视频展示了Meta与EssilorLuxottica合作的完整智能眼镜产品线,包括Ray-Ban Meta眼镜、Oakley Meta HSTN眼镜和Oakley Meta Sphaera眼镜。
https://mp.weixin.qq.com/s/SHOCR8S-CLbbRvAttfxcgw
前沿科技
七、宇树机器人被「虐」视频火出圈,背后是哪家的算法?
1. 南方科技大学主动智能系统实验室发布的宇树G1机器人"受虐"测试视频在全球走红,展示机器人在遭受推搡仍能保持平衡,即使倒地也能迅速起身;
2. 该视频在B站获25万播放量,并在X、Instagram、Reddit等海外平台病毒式传播,众多国外网友误以为是CGI特效,震惊于机器人的稳定性;
3. 实验室由南科大研究员孔贺领导,除抗干扰测试外,团队还研发声音"画地图"技术Acoustic Mapping和声源可视化系统Acoustic Camera,曾在全球首届世界人形机器人大赛单机舞蹈项目获季军。
https://mp.weixin.qq.com/s/ZJlgIRk7mraneLhCpP8Ogg
报告观点
八、每周180亿条消息!OpenAI首次揭秘ChatGPT最火用途
1. OpenAI与杜克、哈佛联合发布首份ChatGPT使用报告,截至2025年7月周活跃用户超7亿(全球成年人口10%),每周消息总量达180亿条,非工作类使用从53%增至70%;
2. 实用建议、信息查询、文书写作是三大主要使用场景,占对话80%,而编程使用比例从12%骤降至5%;高学历用户工作相关使用比例更高,研究生48%、本科46%、无本科学历37%;
3. 同期Anthropic报告显示Claude主战场是代码编写(36%),用户将完整任务交给Claude的比例从27%提升到39%,企业API用户更"激进",77%对话呈自动化模式。
https://mp.weixin.qq.com/s/UYoZ1UqnCQCZ1Gb4zUsTTQ
九、腾讯汤道生:打造智能化、全球化双引擎助力企业稳增长
1. 腾讯集团高级执行副总裁汤道生表示"向智能化要产业效率,向全球化要收入规模"是企业增长核心动力,同时正式发布腾讯云智能体战略全景图;
2. AI已成为腾讯"新业务基因",腾讯元宝成为国内DAU排名前三AI原生应用,IMA知识库文件数量突破1亿,QQ浏览器AI月活比4月增长17.8倍,助力广告、游戏等业务实现双位数增长;
3. 腾讯云国际业务持续高双位数增长,服务全球客户数同比翻番,90%以上中国互联网企业和95%以上头部游戏公司出海选择腾讯云;三年给伙伴带来商机规模同比增长330%。
https://mp.weixin.qq.com/s/B5r2-clUQ5zfYHm0giFYhA