生成式AI
一、 Nano Banana首款官方应用Mixboard,谷歌全新AI画板
1. 谷歌发布由Nano Banana提供支持的AI画板工具Mixboard,可让用户用自然语言编辑图板,实现任何想法即时可视化;
2. Mixboard支持批量编辑图片、组合不同区块、调整风格,且能客观描述画板内容,无需拖入编辑框直接选中即可操作;
3. 该工具首创"面板"概念,提供一键式操作,包括重新生成图片、生成更多类似图片、消除背景等功能,已开启公测。
https://mp.weixin.qq.com/s/oh7kCahGzjwTF6GCg-Dcrw
二、 通义万相Wan2.5系列模型发布,可生成音画同步视频
1. 阿里在杭州云栖大会发布通义万相Wan2.5 Preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大功能;
2. 新版实现音画同步的视频生成能力,输入提示词可生成与画面匹配的人声、环境音效和背景音乐,支持24帧/秒的1080P高清视频;
3. 技术架构全面更新,采用原生多模态架构,在同一框架下支持文本、图像、视频、音频多模态输入输出,已在官网和百炼平台开放使用。
https://mp.weixin.qq.com/s/bAxeOBnY6saIB-oXpZBjcg
三、 可灵2.5 Turbo30%成本暴降+效果飞跃,可生成体操动作
1. 快手发布可灵2.5 Turbo视频生成模型,在体操动作、足球篮球等体育场景生成效果有突破性提升,AI角色四肢不再鬼畜;
2. 高品质模式(1080p)下生成5秒视频仅需25灵感值,比2.1模型便宜近30%,同时在文本响应、动态效果、风格保持和美学效果都有提升;
3. 可灵AI团队对比测试显示,2.5 Turbo在多项关键指标上优于Veo3-fast和Seedance模型;据统计,可灵系列模型自发布以来已迭代30余次。
https://mp.weixin.qq.com/s/IUNIREg3r_EG6oB1Y6JYgQ
四、 秘塔AI最新推出「Agentic Search」模式,边想边搜边做
1. 秘塔AI推出"Agentic Search"模式,采用"边想边搜边做"的全新搜索范式,一次搜索能自主完成5-15步工具调用;
2. 系统内置20余种常见工具,基础模型参数规模提升10倍,具备多模态能力,可分析图片、美化输出,调用代码解决专业问题;
3. 新模式能实现搜索即生产,可直接生成邮件并发送、制作海报文案、创建互动网页,甚至能生成音乐和漫画等多种创意内容。
https://mp.weixin.qq.com/s/GiisE2reT7DSUp4yZlwMQg
五、 AI 音乐平台 Suno正式迎来重大更新: V5 模型全新上线
1. Suno发布V5模型,宣称是"迄今为止最强大的音乐基础模型",提供录音室级别音质,媲美专业混音成品;
2. 新模型实现更精细的风格控制和更高的完成度,从灵感demo直接跨越到可发行歌曲质量;
3. 模型采取"静默空降"策略毫无预告即上线,或代表其产品力自信度,可用性提升。
https://mp.weixin.qq.com/s/HmHUPnLqZXhn0ulmvWk4pg
六、 传奇游戏制作人下场做AI眼镜游戏,AR版《死亡搁浅》?
1. 传奇游戏制作人小岛秀夫与Niantic Spatial合作开发基于AR眼镜的游戏,发布概念预告片展示一名玩家穿越类似《死亡搁浅》的景观;
2. 小岛秀夫透露这将是一款基于地理位置的多人AR游戏,类似"现实中的《死亡搁浅》",玩家可与他人互动或与城市环境连接;
3. 项目由《Pokemon Go》创作者John Hanke主导,强调社交与叙事性,但目前尚未公布发布日期或平台目标,因市场上还没有针对消费者的成熟AR设备。
https://mp.weixin.qq.com/s/HFfllBPtkZFNRVQCscPtxg
前沿科技
七、 王兴兴:通用机器人技术路线差异大,正在制约发展速度
1. 宇树科技创始人王兴兴在高通骁龙峰会上表示,通用机器人已能完成复杂固定动作,下一阶段核心目标是"根据人类指令实时完成任意动作";
2. 机器人发展面临三大技术瓶颈:线缆问题(占故障60-70%)、终端AI芯片功耗限制(需控制在100瓦以内)及各家技术路线差异大;
3. 王兴兴主张通过开放协作打破技术僵局,宇树已完全开源其基于视频生成的世界模型及数据集,并呼吁行业共同建立安全协议和系统架构。
https://mp.weixin.qq.com/s/sNaVoiZsB_RLGtv_YiufWQ
报告观点
八、 Google Cloud 最新 AI 创业者报告:速度和认知才是壁垒
1. 创业者应以"动作快"和"创新"为核心竞争力,在AI时代具备前瞻视角,不迷信传统壁垒理论;
2. 应用公司不需自研模型,因为现今云模型生态日趋完善,专注于业务价值而非技术堆砌更为明智;
3. 融资时应选择能长期陪伴的投资人,不过度融资以保持专注,与其着眼通用AI,不如深耕细分领域解决特定难题。
https://mp.weixin.qq.com/s/E-gIPW5OL56p3dWDHtuNTA
九、 英伟达、华为与AI算力的未来: a16z+分析专家谈芯片竞赛
1. 英伟达投资英特尔50亿美元是一步妙棋,将重塑PC和数据中心市场格局,对AMD和ARM构成巨大压力;
2. 华为在AI芯片领域逆势崛起,尽管面临美国制裁,其在7纳米芯片和定制HBM方面的进展使其成为英伟达在非美国市场最强有力的竞争对手;
3. AI算力支出将从预测的3600亿美元增至约5000亿美元,甲骨文因灵活战略和雄厚资本抓住OpenAI等大客户,成为云计算市场重要赢家。
https://mp.weixin.qq.com/s/Qq4d_FIs4y0MBIeCabi4Xw
十、 Sam Altman最新长文博客:《丰盛的智能》智能将人人可及
1. Sam Altman发布《丰盛的智能》愿景文章,认为随着AI变得更智能,获取AI将成为经济基本驱动力,甚至可能成为人类基本权利;
2. 提出创建每周能产出一吉瓦新AI基础设施的工厂,认为也许10吉瓦算力就能找出治愈癌症的方法或为地球上每个学生提供个性化辅导;
3. 强调增加算力是增加收入的关键,计划在美国建设大量AI基础设施,未来几个月将公布具体计划和合作伙伴,今年晚些时候将讨论融资方案。
https://mp.weixin.qq.com/s/UPCGNnWnZkbHqnrr0LXFRA