AI大观日报 | 23.06.17

 

(AI大观日报会为您推送每日的AI热点新闻,其中所有的概述及要点都由AI自动总结生成。若想查看详细内容,可点击标题进入原文)

语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务

文章来源:机器之心

概述

Meta 发布了一种名为 Voicebox 的生成式语音系统,它可以合成六种语言的语音,并执行多种语音生成任务,如噪声消除、内容编辑、风格转换等。Voicebox 基于流匹配模型,可以从原始音频和转录文本中学习,并泛化到没有训练过的任务。Meta 称之为最通用的语音生成 AI。

要点

  • 🎙️ Voicebox 是一种生成式语音系统,可以创建高保真、多样化的语音输出。
  • 🌐 Voicebox 支持六种语言的语音合成和风格迁移,包括英语、法语、德语、西班牙语、波兰语、葡萄牙语。
  • 🎛️ Voicebox 可以执行多种语音生成任务,如噪声消除、内容编辑、风格转换等,无需专门的训练数据。
  • 🚀 Voicebox 基于流匹配模型,可以从原始音频和转录文本中学习,并泛化到没有训练过的任务。

线上购物被革命!谷歌最新模型AI一键试衣,细节不变姿势随意换

文章来源:新智元

概述

本文介绍了谷歌的一种新的AI模型,TryOnDiffusion,可以实现虚拟服装试穿的功能。该模型采用了基于扩散的框架,将两个UNet结合起来,能够在保留服装细节的同时,适应不同模特的姿势和形状。该模型使用了谷歌的购物图数据集进行训练,生成了逼真的试穿效果图像。本文还介绍了该模型的技术细节、优势和局限性。

要点

  • 🛍️ TryOnDiffusion是一种虚拟服装试穿的AI模型,可以让用户看到自己穿上某件衣服后的样子。
  • 🎨 TryOnDiffusion采用了基于扩散的框架,将两个Parallel-UNet结合起来,能够在保留服装细节的同时,适应不同模特的姿势和形状。
  • 📊 TryOnDiffusion使用了谷歌的购物图数据集进行训练,生成了高质量、逼真的试穿效果图像。
  • 🚧 TryOnDiffusion存在一些局限性,比如分割图和姿势估计的错误、身体特征的缺失、背景复杂度的影响、服装合身度的不确定性等。

GPT-4满分通过MIT本科数学考试!这套提示词火了

文章来源:量子位

概述

这篇文章介绍了GPT-4在MIT数学和EECS本科考试中的惊人表现,它经过调优后得到了100%的满分,而且是自己给自己打分。文章分析了这一结果的背景、方法和争议,以及对大语言模型的思考。

要点

  • 🚀 GPT-4是目前最先进的大语言模型,它拥有1.5万亿个参数,比上一代GPT-3.5强大得多。
  • 🎓 GPT-4参加了一个由MIT和其他大学研究团队策划的数据集,其中包含4550个问题和解决方案,来自MIT数学系和EECS的本科课程。
  • 🏆 GPT-4经过调优后,在这个数据集上表现出了完全满足毕业要求的能力,而且是自动评分,得到了100%的满分。
  • 🤔 GPT-4的这一成绩引发了不少争议,有人质疑它的训练数据集是否包含了考题,以及它是否真的理解了数学问题,还有它是否需要“好的提示”才能做出正确答案。
  • 💡 GPT-4的表现也让人对大语言模型的规模与能力之间的关系产生了一些思考,以及它们在数学领域的应用前景。

给TA打赏
共{{data.count}}人
人已打赏
AI资讯

AI大观日报 | 23.06.16

2023-6-16 16:31:44

AI资讯

AI大观日报 | 23.06.18

2023-6-18 17:12:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索