AI速递0917-人工智能学院

AI速递0917

作者: 信息来源: 发布时间: 2025-09-17

生成式AI

一、OpenAI发布GPT-5-Codex：可独立连续工作超7小时

1. OpenAI发布GPT-5-Codex专为智能体编程优化，可自主连续工作超7小时，已在Codex所有使用场景上线并整合ChatGPT账号体系；

2. 该模型在SWE-bench Verified和代码重构两大基准测试中性能超越GPT-5(high)，可根据任务复杂度动态调整思考时间；

3. GPT-5-Codex具备代码审查能力，能主动发现漏洞，上线仅两小时半流量已占Codex总量40%，支持多种工具调用并计划API开放。

https://mp.weixin.qq.com/s/f6zSmd2no70eAk_hu-hfmA

二、腾讯混元3D 3.0来了，多指标提升，真人手办建模自由！

1. 腾讯发布混元3D 3.0模型，建模精度提升3倍，几何分辨率达1536³，支持36亿体素超高清建模，解决整体结构与局部细节生成难点；

2. 新模型针对人物生成专项优化，实现精细面部重塑，告别"抽象脸"问题，大幅提升人物真实感与美观度，达到真人手办级别效果；

3. 同步上线腾讯云API和专业级混元3D Studio工作台，覆盖3D管线七大核心环节，已成为全球下载量超260万的最受欢迎开源3D模型之一。

https://mp.weixin.qq.com/s/XzJIt8glOd82pVs_YXjf6w

三、昆仑万维上线「Agent Studio」功能，私人音乐工作室

1. 昆仑万维旗下AI音乐创作平台Mureka上线"Agent Studio"功能，免除复杂prompt，用户只需说出想法，由Agent自动生成合适歌词、匹配音乐风格；

2. 目前已上线六个不同Agent场景：Make Album（创作专辑）、Tarot Tunes（塔罗音愈）、Buzz Tracks（热点写歌）、Diss Tracks（Diss制造机）、Gift a Song（以歌致礼）和Spicy Song（撩人情歌）；

3. Agent Studio支持基于热门话题创作、结合网络实时搜索生成个性化音乐，让音乐创作融入日常生活，成为人人可用的创作伙伴。

https://mp.weixin.qq.com/s/LNjbrW6yNoKFmnPnywxiVg

四、宇树开源世界模型-动作架构，名叫UnifoLM-WMA-0

1. 宇树科技开源机器人世界模型-动作架构UnifoLM-WMA-0，拥有理解机器人和环境相互作用物理规律的世界模型，可适配多种机器人本体；

2. 该模型支持决策模式（预测交互关键信息）和仿真模式（生成环境反馈）两种核心功能，可实现精准动作预测，在真机测试中预测与实际操作高度吻合；

3. 模型使用Open-X数据集微调视频生成能力，基于5个开源数据集完成全流程训练，GitHub发布后迅速获得100+星标，推理代码和模型检查点均已开源。

https://mp.weixin.qq.com/s/z4IQi1hSi7_LAg5_g3mXOQ

五、魅族AI眼镜1999元起售：拍照翻译付款全都会，39g

1. 魅族发布AI拍摄眼镜StarV Snap，首发价1999元，仅重39g，搭载高通第一代骁龙AR1平台，支持12国语言同声传译、AI识物和语音转写；

2. 眼镜配备1200万像素镜头，支持109°超广角视野、720P长时间录制、1080P高清拍摄，具备EIS防抖等多项算法优化，提供Live图功能记录前后几秒动态；

3. 产品已与支付宝、蚂蚁国际达成战略合作，可直接通过眼镜完成扫码支付，并在安全方面设计有明显拍摄提示灯和防遮挡检测机制。

https://mp.weixin.qq.com/s/wO-4FSshD6rV7xgPYEGDlA

六、Meta全新AI眼镜在Connect大会前被泄露，外观曝光

1. Meta即将发布的AI眼镜宣传片在Connect大会前被泄露，显示新眼镜将由Meta AI驱动，配备单眼抬头显示器(HUD)和神经腕带交互系统；

2. 新品预计以Ray-Ban品牌发布，传闻起售价800美元，主要用于Meta AI和步行导航，腕带支持手指滑动字母回复消息；

3. 泄露视频展示了Meta与EssilorLuxottica合作的完整智能眼镜产品线，包括Ray-Ban Meta眼镜、Oakley Meta HSTN眼镜和Oakley Meta Sphaera眼镜。

https://mp.weixin.qq.com/s/SHOCR8S-CLbbRvAttfxcgw

前沿科技

七、宇树机器人被「虐」视频火出圈，背后是哪家的算法？

1. 南方科技大学主动智能系统实验室发布的宇树G1机器人"受虐"测试视频在全球走红，展示机器人在遭受推搡仍能保持平衡，即使倒地也能迅速起身；

2. 该视频在B站获25万播放量，并在X、Instagram、Reddit等海外平台病毒式传播，众多国外网友误以为是CGI特效，震惊于机器人的稳定性；

3. 实验室由南科大研究员孔贺领导，除抗干扰测试外，团队还研发声音"画地图"技术Acoustic Mapping和声源可视化系统Acoustic Camera，曾在全球首届世界人形机器人大赛单机舞蹈项目获季军。

https://mp.weixin.qq.com/s/ZJlgIRk7mraneLhCpP8Ogg

报告观点

八、每周180亿条消息！OpenAI首次揭秘ChatGPT最火用途

1. OpenAI与杜克、哈佛联合发布首份ChatGPT使用报告，截至2025年7月周活跃用户超7亿(全球成年人口10%)，每周消息总量达180亿条，非工作类使用从53%增至70%；

2. 实用建议、信息查询、文书写作是三大主要使用场景，占对话80%，而编程使用比例从12%骤降至5%；高学历用户工作相关使用比例更高，研究生48%、本科46%、无本科学历37%；

3. 同期Anthropic报告显示Claude主战场是代码编写(36%)，用户将完整任务交给Claude的比例从27%提升到39%，企业API用户更"激进"，77%对话呈自动化模式。

https://mp.weixin.qq.com/s/UYoZ1UqnCQCZ1Gb4zUsTTQ

九、腾讯汤道生：打造智能化、全球化双引擎助力企业稳增长

1. 腾讯集团高级执行副总裁汤道生表示"向智能化要产业效率，向全球化要收入规模"是企业增长核心动力，同时正式发布腾讯云智能体战略全景图；

2. AI已成为腾讯"新业务基因"，腾讯元宝成为国内DAU排名前三AI原生应用，IMA知识库文件数量突破1亿，QQ浏览器AI月活比4月增长17.8倍，助力广告、游戏等业务实现双位数增长；

3. 腾讯云国际业务持续高双位数增长，服务全球客户数同比翻番，90%以上中国互联网企业和95%以上头部游戏公司出海选择腾讯云；三年给伙伴带来商机规模同比增长330%。

https://mp.weixin.qq.com/s/B5r2-clUQ5zfYHm0giFYhA