生成式AI
一、高通史上最强AI芯片来了,NPU算力暴涨到80TOPS
1. 高通发布第五代骁龙8至尊版手机芯片,采用3nm工艺,CPU性能提升20%、GPU性能提升23%、NPU性能提升37%;
2. 推出骁龙X2 Elite系列PC处理器,NPU算力达80TOPS,首次实现Arm架构5GHz稳定运行,AI性能是英特尔竞品的5.7倍;
3. 重点布局AI智能体技术,支持跨设备协同处理,实现手机、眼镜、手表等设备间无缝协作和个性化智能体验。
https://mp.weixin.qq.com/s/IeGATRYiNEhMD8OkJwkL-g
二、LeCun团队开源首款代码世界模型!像程序员一样思考
1. Meta发布首款代码世界模型CWM,创新性地将世界模型引入代码生成任务,能预测代码执行效果来优化生成质量;
2. 该32B参数模型在SWE-bench Verified测试中获得65.8%成绩,属开源阵营第一梯队,接近闭源Gemini-2.5-Thinking性能;
3. CWM目前仅为概念验证Demo,通过模拟Python程序执行和Agent交互,验证世界模型能否显著改善代码生成效果。
https://mp.weixin.qq.com/s/50HTD10ULpU0yQ-t0GAYag
三、谷歌推出“神经操作系统”原型,Gemini 2.5 Flash驱动
1. 谷歌推出由Gemini 2.5 Flash驱动的"神经操作系统"原型,界面完全由AI实时生成,无需预编码,根据用户交互动态调整;
2. 核心技术采用"UI章程+UI交互"双重输入机制,结合交互追踪和流式生成技术,实现几乎瞬间的响应体验;
3. 通过生成式UI图谱解决无状态问题,提供会话专属内存缓存,为智能化人机交互界面开辟新的研究方向。
https://mp.weixin.qq.com/s/rN67A6uJ3DK8ctJXRAYZtg
四、走进演技生成时代,生数科技Vidu全球发布Vidu Q2
1. 生数科技发布Vidu Q2图生视频模型,实现从"视频生成"到"演技生成"的跨越,能精准表现复杂细微表情和武打动作场景;
2. 新模型在镜头语言和语义理解方面显著提升,支持复杂运镜切换和精准提示词遵从,实现"指哪打哪"的创作体验;
3. 提供2-8秒时长自由选择和闪电模式20秒生成5秒1080P视频,兼顾创作灵活性与极速生产效率。
https://mp.weixin.qq.com/s/jZLoHyclAGpgFDTecEHOUQ
五、京东企业级智能体JoyAgent更新,还包括一揽子开源
1. 京东全面开源AI技术栈,包括企业级智能体JoyAgent 3.0、多智能体框架OxyGent和医疗大模型京医千询2.0等核心项目;
2. JoyAgent 3.0新增DataAgent数据分析能力,在GAIA评测中验证集准确率达77%,GitHub已获10.1k Star;
3. 京东通过系统性开源构建技术生态,降低企业AI落地门槛,推动行业标准化和协同发展。
https://mp.weixin.qq.com/s/DyNIzSfKHoVSZIM_mJv4FA
六、夸克发布AI创作平台「造点AI」,基于MJ V7+Wan2.5
1. 夸克发布造点AI创作平台,集成Midjourney V7和通义万相Wan2.5,MJ V7半价提供,Wan2.5提供7天免费体验;
2. 平台支持AI生图和生视频功能,MJ V7保持原生效果并降低使用门槛,夸克图像1.0专长亚洲人像和中文内容生成;
3. Wan2.5升级支持音画同步生成、10秒1080P视频输出和音频驱动功能,显著提升人物一致性和创作实用性。
https://mp.weixin.qq.com/s/tDCb8Pj20TVmGs6GDiQSag
七、阶跃发布 AI 桌面伙伴,常驻桌面右上角,时刻在线
1. 阶跃AI推出桌面伙伴"小跃",常驻桌面右上角,支持多任务并行执行和本地文件操作,可通过"妙计"功能复用操作步骤;
2. 小跃具备自主任务规划能力,能处理面试准备、电商追踪、发票整理等复杂任务,支持定时任务和系统提醒功能;
3. 目前仅开放Mac版本邀请测试,Windows版本开发中,用户可通过官网下载并申请邀请码体验。
https://mp.weixin.qq.com/s/BHl59Z1BtxaFM9Pu_07fPw
八、边听边说,智源开源全双工语音大模型RoboBrain-Audio
1. 智源研究院发布RoboBrain-Audio,首个支持原生全双工语音对话的大模型,实现"边听边说"交互,响应延迟降至80ms级别;
2. 创新采用"自然独白对齐"机制替代词级对齐,结合双训练范式(后训练+有监督微调),仅用100万小时数据达到业界先进水平;
3. 在ASR、TTS和全双工对话任务中表现领先,将与RoboBrain系列整合,推动具身智能体语音交互能力发展。
https://mp.weixin.qq.com/s/TWCTjICOXZquFNRjUmmL5g
前沿科技
九、Skild AI新推出Skild Brain,机器狗腿被锯了也能继续走
1. 估值45亿美元的Skild AI发布Skild Brain机器人控制系统,在包含十万种机器人形态的虚拟环境中训练千年,可适应各种故障和未见过的机器人;
2. 该系统具备强适应性,能处理肢体断裂、马达故障等突发情况,通过上下文学习快速调整控制策略,记忆窗口比传统系统长100倍;
3. 公司由两位CMU教授创立,已完成4.14亿美元融资,投资者包括软银、英伟达、红杉资本等知名机构。
https://mp.weixin.qq.com/s/b2MDnQ7jiVjBhf1Q7Rbn9g
报告观点
十、 陶哲轩:从一个协作式数学项目,引发的社群现象思考
1. 陶哲轩提出现代社会四层分析框架,认为当前技术与激励机制在赋能个体和大型组织的同时,严重削弱了小型组织的生态位;
2. 小型组织能提供真实的社交情感连接和个体影响力,而大型组织虽有经济优势,却让个体感到疏离和无力感;
3. 他建议重视新兴草根组织的价值,认为这些小型组织能为个体提供归属感,并成为连接个体与大型系统的有意义渠道。
https://mp.weixin.qq.com/s/2pPI_RfMFXohRMp4js-ymg