人工智能学院欢迎您!

当前位置: 首页   >   AI速递   >   正文

AI速递0903

作者:    信息来源:    发布时间: 2025-09-03

一、 这次真不一样,谷歌Gemini解锁「详解网页」新技能

1. 谷歌Gemini API全面上线"URL Context"功能,使模型能深度访问并处理来自URL的内容,包括网页、PDF和图像等;

2. 该功能采用两步检索流程,可深度解析PDF中的表格、文本结构、脚注等,处理容量上限达34MB,单次请求最多处理20个URL;

3. URL Context被评价为"RAG的又一颗棺材钉",无需提取、分块、矢量化和存储等繁琐流程,直接解析特斯拉50页PDF并精准提取数据。

https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ

二、 混元世界模型上新,综合能力问鼎WorldScore排行榜

1. 腾讯发布混元3D世界模型系列最新成员HunyuanWorld-Voyager,业界首个支持原生3D重建的超长漫游世界模型;

2. 混元Voyager突破传统视频生成限制,能生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式,且与混元世界模型1.0高度适配;

3. 该模型在斯坦福大学李飞飞团队发布的WorldScore基准测试中位居综合能力首位,支持视频场景重建、3D物体纹理生成等多种应用。

https://mp.weixin.qq.com/s/vCkFWwV5vUQhjMRfMQB2XA

三、 Runway跨界机器人领域,世界模型成模拟训练新引擎

1. 视觉生成AI公司Runway获英伟达、谷歌和General Atlantic等投资者超5亿美元融资,估值达30亿美元,正式跨界机器人领域;

2. Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟,实现高效、低成本的虚拟测试环境;

3. 相比真实场景训练,Runway的模型能让用户更精细地控制特定变量测试,尤其适合评估不同操作在相同环境下的表现。

https://mp.weixin.qq.com/s/VrJOttdmvr-EgD5b_PC6-A

四、 腾讯优图开源智能体框架Youtu-Agent,开箱即用!

1. 腾讯优图实验室开源Youtu-Agent智能体框架,具备开源友好、成本低、灵活架构和自动智能体生成等特点;

2. 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA,在GAIA文本子集达到72.8%,无需充值闭源模型;

3. 框架采用DITA原则,提供四个典型应用案例:本地文件管理、数据分析、论文分析和广域综述,支持一键生成配置和启动测试。

https://mp.weixin.qq.com/s/ODLHcZnEqAwxJ0fB0K_pjQ

五、 flowith 团队发布了一款全新平行世界小游戏 flolife.me

1. flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me,玩家可捏造角色后由AI接管整个人生模拟;

2. 游戏流程简单:玩家输入角色名字、性别、出生地并分配属性,再设置人格描述,系统便自动生成完整人生线和分支选项;

3. flolife会为用户生成各种人生关键节点的不同可能性,展现离奇故事,还能从中挑选四个高光瞬间制作分享海报。

https://mp.weixin.qq.com/s/r5YPiYvUcViA8qkr_SSzpA

六、 Aivilization 深度体验: AI 社畜不睡觉不恋爱卷生卷死

1. 来自香港科技大学的Aivilization小镇项目可让用户创建自定义AI人物,设置MBTI性格与目标,再看它们在虚拟小镇生活成长;

2. 游戏评价体系单一,以金钱排名为唯一衡量标准,导致玩家优化策略趋向"剥夺人性"——不睡觉不休息只赚钱,打造冷血工具人;

3. 顶尖玩家发现,通过挖矿积累初始资金、升级房子后制造芯片,可实现每天67680金币的被动收入,远超读书、休闲等生活方式的收益。

https://mp.weixin.qq.com/s/OVzHdohWLFt2NnmplxYvLw

七、 GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%

1. 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1,运行相同任务的成本仅为对手的1.4%;

2. 该模型使用MoE架构,在涵盖六大开发领域、52个实际编程任务的CC-Bench评测体系中表现强劲,尤其在任务完成效果和工具调用可靠性方面;

3. GLM-4.5不仅推理速度比Opus 4.1快3倍、比GPT-5快5倍,已接入Claude Code、Cline、Gemini CLI等多款主流编程工具,价格仅为Claude的1/7。

https://mp.weixin.qq.com/s/ykuuGhq0vqdOhcRDtsDzPQ


人工智能学院     地址:山东省潍坊市寿光市金光街1299号 E17楼

邮编:262700