生成式AI
一、 马斯克谈AI5 和 AI6 芯片的最新进展,称其为史诗般的芯片
1. 马斯克在X平台透露特斯拉AI5芯片设计团队完成评审,称其将是"史诗级"芯片,下一代AI6有望成为"迄今为止最好的AI芯片";
2. 特斯拉决定从两种芯片架构切换到一种,所有芯片人才将专注于同一目标,马斯克形容为"理所当然的选择";
3. AI5预计2025年下半年推出,初期代工会在中国台湾,到后期会在美国,算力将是前代的10倍;AI6芯片或将由三星在美国工厂生产。
https://mp.weixin.qq.com/s/XivsL8vf15x5BrcUx_yTQA
二、 Meta超级智能实验室的首篇论文来了,重新定义了RAG
1. Meta超级智能实验室推出REFRAG框架,提出重新定义RAG技术,最高将首字生成延迟(TTFT)加速30倍,突破长上下文计算冗余瓶颈;
2. REFRAG通过"压缩、感知、扩展"三步流程,使用轻量级编码器将长文本压缩为紧凑表征,再智能判断关键内容,最终结合压缩表示和原始文本形成混合序列;
3. 该技术不仅保持性能无损,还能使上下文窗口等效扩大16倍,适用于RAG、多轮对话、长文档摘要等多种长上下文应用场景。
https://mp.weixin.qq.com/s/ftP3-qoUcO5hNEdmwjFZVw
三、 光刻机巨头ASML杀入AI!豪掷15亿押注「欧版OpenAI」
1. 光刻机巨头ASML斥资15亿美元领投Mistral AI,成为这家成立仅两年的法国AI初创公司最大股东,此轮融资总额约20亿美元;
2. 融资完成后Mistral AI估值达140亿美元,将成为欧洲最有价值的AI公司,ASML还将获得其董事会席位;
3. Mistral AI秉承开源理念,由Meta和DeepMind前员工创立,曾发布多款开源模型,并推出聊天助手Le Chat、AI音频模型Voxtral和编码模型Devstral等产品。
https://mp.weixin.qq.com/s/ay0nTvxTWqevXBxLczyLYA
四、 微软开源3大突破AI Agent模型,140亿参数超越DS-R1?
1. 微软研究院开源推理模型rStar2-Agent,仅有140亿参数却在多项基准测试中超越拥有6710亿参数的DeepSeek-R1;
2. 该模型通过三大技术突破:隔离式高吞吐代码执行基础设施、动态负载均衡调度器,以及融合Resample-on-Correct的GRPO-RoC算法;
3. 模型采用"非推理微调+多阶段强化学习"的高效训练流程,只需64台MI300X GPU,一周内完成510步强化学习迭代即达到性能峰值,大大降低了算力成本。
https://mp.weixin.qq.com/s/Lu_k1UnLo-tcrVH67-15wA
五、 刚刚结束的OpenAI黑客松上,全球共有六支团队冲进榜单
1. OpenAI在旧金山举办GPT-5黑客马拉松,邀请500多位开发者挑战GPT-5极限,韩国AI初创公司Gentoo团队获得冠军;
2. 获奖项目包括:营销活动模拟系统、AI时尚搭配、Excel电子表格智能辅助、知识视频生成工具、AI电脑使用智能体、AI电网优化系统;
3. 参赛团队利用GPT-5强大的思考能力和工具调用功能,开发出多种实用场景应用,展示了AI在各行业落地的创新可能性。
https://mp.weixin.qq.com/s/whBNr0pTomNAKhIrfkUYYQ
六、 OpenAI 首部 AI 电影曝光!GPT-5 加持,明年戛纳首映?
1. OpenAI正为动画长片《Critterz》提供工具和算力支持,预计明年5月在戛纳电影节首映;
2. 该片由伦敦Vertigo Films与专注AI与传统影像融合的Native Foreign工作室合作制作,预算控制在3000万美元以内;
3. 制作团队将邀请真人演员配音,由艺术家绘制概念草图,再用OpenAI的GPT-5等工具进行AI处理,制作周期仅9个月,远低于传统动画电影的3年制作周期。
https://mp.weixin.qq.com/s/HRdHTl1PBw_Mqmsacz2uTg
七、 港科大发布3D 场景表征与大规模重建新方法 SAIL-Recon
1. 香港科技大学谭平团队与地平线联合发布SAIL-Recon,通过锚点图建立构建场景全局隐式表征,突破现有模型对大规模视觉定位与3D重建的处理瓶颈;
2. 该技术采用全局隐式场景表征、统一Transformer架构和渐进式2D-3D编码等创新方法,实现万帧级场景重建;
3. 在TUM-RGBD、CO3Dv2和Tanks & Temples等权威基准数据集上,SAIL-Recon在相机位姿估计与新视角合成精度均显著超越现有方法。
https://mp.weixin.qq.com/s/5CZFIhy-mAia8gIw0SsDug
前沿科技
八、 开放全栈!超越π0,具身智能基础大模型WALL-OSS开源
1. 自变量机器人开源WALL-OSS具身智能基础大模型,4.2B参数规模下融合超大规模真机数据,能在单张RTX 4090完成从训练到部署全流程;
2. 该模型实现了语言、视觉、动作多模态端到端统一生成能力,具备跨场景迁移与执行能力,各项指标超越π0;
3. 通过模型架构设计、训练策略优化、高质量数据和统一跨层级思维链四方面创新,突破具身智能"模态统一、动作精度、能力泛化"三难困境。
https://mp.weixin.qq.com/s/w_76I2DuNdMneyjN6IMCEQ
报告观点
九、 AI「画饼」画不动了吗?从狂热到冷静,行业或迎来大消化
1. AI行业正从过度炒作走向理性回归,用户对新模型如GPT-5的反应逐渐平淡,标志着AI进入"不过如此"时代;
2. 研究显示只有5%的受访公司成功将AI技术转化为实际收入,虽然AI已在部分岗位替代方面产生影响,但尚未转化为宏观经济生产力提升;
3. 专家认为AI发展正进入"iPhone 4时刻":从颠覆性突破转向持续迭代、小步快跑阶段,这实际是行业走向成熟和健康的标志,迫使从天马行空的幻想回到解决实际问题上。
https://mp.weixin.qq.com/s/zf2-WHw0Mz1nkqK3gKaDxQ