生成式AI
一、 Meta和Scale AI刚合作就闹翻!砸143亿买的高管跑路
1. Meta和Scale AI合作出现裂痕,仅两个月后随Scale AI前CEO进入Meta的高管Ruben Mayer已离职;
2. Meta内部研究人员抱怨Scale AI数据质量太低,Meta转向与Scale AI竞争对手Mercor和Surge合作;
3. Meta这一波天价挖人后已多次重组AI部门,而Scale AI失去Meta支持后也丢失OpenAI和谷歌等大客户,经历大规模裁员。
https://mp.weixin.qq.com/s/-1wg9-_Vv165qaa_vidonw
二、 Claude Opus 4.1白天退化,Anthropic承认并回滚更新
1. 多位用户反馈Claude Opus 4.1在上午10-11点期间性能显著下降,处理文稿任务频繁出错,且只在白天出现;
2. 分析认为可能是Anthropic在白天采用1.58位量化(仅用-1、0、1三个值表示参数)导致模型丢失关键信息;
3. Anthropic官方承认是推理堆栈出问题,本意是提升模型效率却影响了响应质量,已将Claude Opus 4.1和4.0版本回滚。
https://mp.weixin.qq.com/s/IRD_K4OAuivBVsh59GfUQg
三、 拿下30个第1名的翻译模型腾讯Hunyuan-MT-7B开源
1. 腾讯混元开源7B参数翻译模型Hunyuan-MT-7B,支持33个语种和5种民汉语言/方言互译,在WMT2025比赛31个语种中拿下30个第一;
2. 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B,能根据原文和多个翻译模型的结果生成更优翻译;
3. 模型采用AngelSlim压缩工具进行FP8量化,推理性能提升30%,已接入腾讯会议、企业微信、QQ浏览器等多个腾讯业务。
https://mp.weixin.qq.com/s/rKcf7jXAYlCKcwan0o756Q
四、 阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini
1. 阶跃星辰发布端到端语音大模型Step-Audio 2 mini,统一建模语音理解、音频推理与生成,并支持语音原生Tool Calling能力;
2. 模型在多个基准测试中表现突出,MMAU得分73.2位列开源端到端语音模型榜首,中英互译和语音识别任务大幅领先其他模型;
3. 采用真端到端多模态架构,引入链式思维推理与强化学习联合优化,可精细理解情绪、语调、音乐等副语言和非语音信号。
https://mp.weixin.qq.com/s/aiJe0286r-oN2AFeXmcRLQ
五、 书生·万象3.5发布,通用、推理能力与部署效率升级
1. 上海AI实验室开源发布书生·万象InternVL3.5系列模型,包含10亿至2410亿参数九种尺寸,通用能力、推理能力和部署效率全面升级;
2. 旗舰模型InternVL3.5-241B-A28B在多项基准上超越GPT-5,MMMU获77.7分(开源最高),通过级联式强化学习将推理性能较上代提升16.0分;
3. 创新引入动态视觉分辨率路由与解耦部署框架,单次推理延迟由369ms缩短至91ms(提升约4倍),并增强GUI智能体、具身空间推理等智能体核心能力。
https://mp.weixin.qq.com/s/28l0HdFv7baHk2UfReUHtg
六、 韩国给数万名独居老人发AI玩偶,24h陪伴+健康监测
1. 韩国政府向数万名独居老人分发由初创公司Hyodol开发的AI玩偶,该玩偶不仅能陪伴聊天,还能提醒吃饭服药并监测健康状况;
2. 玩偶内置基于ChatGPT的对话系统,颈部红外传感器可检测动作,胸部麦克风会记录老人对日常问题的回答,并可在紧急情况下通知护工;
3. 已有1.2万多台Hyodol玩偶在韩国独居老人家中提供服务,每台售价约8160人民币,远低于护理人员成本,有效缓解韩国养老护理人员缺口问题。
https://mp.weixin.qq.com/s/uC5zLM_khbxe8HceXywFJg
七、 今起实施!AI生成内容必须带"身份证",多平台已公告
1. 9月1日起,《人工智能生成合成内容标识办法》正式实施,AI生成的视频、语音、文字、图片必须添加"身份标签";
2. 生成合成服务提供者(如大模型企业)需添加显式和隐式标识,传播服务提供者(如内容平台)需核验元数据并加注提示;
3. 腾讯、抖音、快手、B站、DeepSeek等平台已发布细化规则和公告,并为AI内容添加明显标识,提供标识功能,且禁止用户删除或篡改标识。
https://mp.weixin.qq.com/s/UzEUDAxeW8EqjD1iO98UQg
前沿科技
八、 具身智能也能强化学习了?清华等开源训练框架RLinf
1. 清华大学、北京中关村学院、无问芯穹联合发布RLinf,首个面向具身智能的"渲训推一体化"大规模强化学习框架;
2. 提出全新的混合式执行模式和宏工作流到微执行流的映射机制(M2Flow),在具身智能训练场景下实现超120%系统提速;
3. 集成Megatron+SGLang/vLLM和FSDP+HuggingFace两套后端,专为大小脑不同训练需求设计,还搭载自适应通信库和自动调度模块。
https://mp.weixin.qq.com/s/Xtv4gDu3lhDDGadLrzt6Aw
报告观点
九、 新规首日,DeepSeek最新发文!V3/R1训练细节全公开
1. DeepSeek发布官方公告,响应网信办《人工智能生成合成内容标识办法》,承诺给AI生成内容添加标识并警示用户勿删改;
2. 首次公开《模型原理与训练方法说明》,介绍DeepSeek-V3/R1训练细节,包括6850亿参数规模、预训练与优化训练流程;
3. 详细披露数据治理体系,采用过滤器自动剔除有害内容,并对用户提供知情权、选择权与控制权,同时承认模型"幻觉"仍是全行业难题。
https://mp.weixin.qq.com/s/_XctwzNPa2-Ifxka06kbRg