人工智能学院欢迎您!

当前位置: 首页   >   AI速递   >   正文

AI速递0916

作者:    信息来源:    发布时间: 2025-09-16

生成式AI

一、Google Gemini 凭Nano Banana登顶 App Store 免费榜

1. Google Gemini通过爆火的Nano Banana图像编辑功能一举超越ChatGPT登顶App Store免费榜;

2. Gemini成为完整AI工具集,包含画布、Veo3视频生成、Storybook故事板及Deep Research等多功能;

3. Google AI全家桶还包括NotebookLM知识库(最多可上传300个文件)、Flow视频生成(支持1080p高清)、AI Mode搜索和Gemini CLI本地助手。

https://mp.weixin.qq.com/s/gdSkrm95Mq1RORe-sIoK4A

二、马斯克的最快AI模型,75 token/秒,比标准版快10倍!

1. xAI发布Grok 4 Fast模型,生成速度高达每秒75个token,比标准版快10倍,具有明显的实时交互优势;

2. 网友测试显示,新模型在编程题、初中数学题等任务上准确且速度惊人,能在不到2秒内解决LeetCode题目;

3. 尽管速度领先,Grok 4 Fast仍有准确性妥协,适合简单查询或工具使用场景,体现了xAI近期专注速度的战略。

https://mp.weixin.qq.com/s/5TRim0q2ZI-b-LFXGJaKmA

三、可灵发布可以聊一分钟的数字人,精控表演接近业内底价

1. 可灵AI推出新版数字人功能,支持最长60秒单次输出,1080P/48帧规格,大幅提升面部识别和口型精度;

2. 新功能支持提示词控制角色情绪和动作,使数字人呈现更丰富的表情和肢体语言,能准确执行"看提词卡"等特定动作;

3. 可灵数字人在720P标准下价格为0.12元/秒(黑金会员),约为Heygen同类产品三分之一,接近业内最低价。

https://mp.weixin.qq.com/s/na-dTVcNwKLc-UNDsEbFfQ

四、腾讯混元升级AI绘画微调范式,真实感和美学评分升3倍

1. 腾讯混元提出新方法优化AI绘画,通过Direct-Align和语义相对偏好优化(SRPO)技术改进扩散模型训练;

2. Direct-Align在整个扩散轨迹上进行优化,避免传统方法只优化后期步骤造成的"奖励作弊"问题;

3. SRPO将奖励重定义为文本条件信号,经该方法训练的FLUX1.dev模型真实感和美学评分提高3倍以上,且仅需32块H20训练10分钟。

https://mp.weixin.qq.com/s/535bmvdYuxiZEQVGzIXNhw

五、这个国家任命AI为「部长」?手握实权,招标100%透明

1. 阿尔巴尼亚成为全球首个任命"AI部长"的国家,命名为Diella的AI系统将全面负责公共采购项目;

2. Diella将作为政府透明改革试金石,负责评估招标和选聘人才,以实现"公共招标100%廉洁"的目标;

3. 此举旨在解决阿尔巴尼亚长期困扰的公共招标腐败问题,同时推动该国数字政府转型,强调AI决策的客观公正性。

https://mp.weixin.qq.com/s/w7hsIF5cg4f0MuH4GGNuYw

六、曝xAI最大部门1/3员工一夜被裁,扩10倍专业AI导师

1. 马斯克旗下xAI据报道已裁撤数据标注团队约500名员工,占该团队约三分之一,受影响员工将获得薪资支付至11月底;

2. 公司宣布战略调整,减少通用型AI导师,将专业AI导师团队规模扩大10倍,招聘STEM、金融、医学等领域人才;

3. 裁员前,xAI曾要求员工参加决定岗位去留的测试,测试内容涵盖多个专业领域,有员工质疑程序合理性后账号被停用。

https://mp.weixin.qq.com/s/Y5yMxHaNNBsVmpsFeCaJ0w

前沿科技

七、用光学生成图像,几乎0耗电,浙大校友一作登Nature

1. 加州大学洛杉矶分校研究团队在Nature发表论文,开发几乎不消耗电能的光学生成模型,第一作者为浙大校友Shiqi Chen;

2. 该系统利用数字编码器生成静态噪声,通过空间光调制器将噪声模式刻印到激光束上,再用第二台设备将噪声转化为图像;

3. 系统能生成手写数字、时尚商品、梵高风格艺术作品等图像,因其超高速、超低能耗特性,适用于VR、AR显示和可穿戴设备。

https://mp.weixin.qq.com/s/94s3MtZ815etYqcvdvmR2w

报告观点

八、15年大佬深夜痛哭半小时!95%程序员沦为「AI保姆」?

1. 资深开发者Carla Rover使用"氛围编程"(Vibe Coding)后发现bug成山,不得不推翻项目重来,痛哭半小时;

2. Fastly报告显示95%开发者需额外时间修复AI生成代码,"氛围编程清理专家"成为新兴职业,年薪可达10万美元;

3. 多位资深开发者表示,AI编程像"带6岁小孩",缺乏系统性思维,容易引入安全漏洞,50%时间写需求,30-40%在修复AI代码。

https://mp.weixin.qq.com/s/pmwOfsgrubj1T8pRneNXyQ

九、Anthropic 发布首个美国 AI 经济指数报告,配交互式网站

1. Anthropic发布首份全面分析AI使用情况的经济指数报告,发现用户完整任务交给Claude的比例从27%增至39%;

2. 报告揭示AI使用与地区经济特点密切相关:华盛顿特区和犹他州人均使用最多,夏威夷侧重旅游规划,马萨诸塞用于科学研究;

3. 数据显示GDP越高的地区AI使用率越高,富裕国家使用场景更多样化,而企业用户自动化率达77%,远高于个人用户。

https://mp.weixin.qq.com/s/D68Yjxir6Bukms4aOHoF8g


人工智能学院     地址:山东省潍坊市寿光市金光街1299号 E17楼

邮编:262700