AI大观日报 | 23.05.29

 

(AI大观日报会为您推送每日的AI热点新闻,其中所有的概述及要点都由AI自动总结生成。若想查看详细内容,可点击标题进入原文)

面壁智能联合知乎开源 CPM-Bee 并发布智能对话助手“露卡”(Luca),联网论文查找摘要功能太炸裂了!

文章来源:  量子位

概述

面壁智能联合知乎发布了最新的大语言模型成果,包括开源百亿参数的CPM-Bee模型和推出智能对话助手“露卡”(Luca)产品。

要点

  • 🐝 CPM-Bee是面壁智能自研的中英双语大模型,拥有百亿量级参数、万亿级高质量语料,可以在中文和英文的多个评测基准上超越其他模型,全面开源并允许商用。
  • 🗣 “露卡”(Luca)是基于CPM-Bee的对话类模型产品,可以与用户进行多轮对话,帮助用户了解知识、处理逻辑、编写代码、激发创作等,还具备多模态理解和联网摘要的能力。
  • 🚀 面壁智能称“露卡”(Luca)是他们开启AGI征途的起点,目前将先邀请部分用户试用并提供反馈,待产品成熟后再对公众开放测试

OpenAI联合创始人亲自上场科普GPT,让技术小白也能理解最强AI

文章来源:  机械之心

概述

这篇文章介绍了 OpenAI 联合创始人 Andrej Karpathy 在微软开发者大会上的演讲,主要内容是科普 GPT 的训练流程和使用方法,以及展示了一些最新的研究成果和应用案例。

要点

  • 🧠 GPT 的训练流程分为四个阶段:预训练、监督式微调、奖励建模、强化学习。预训练阶段是最耗时耗力的,需要大量的互联网数据和超级计算机。后续的微调阶段则是针对具体的下游任务进行优化。
  • 🎨 GPT 的使用方法主要是通过设计 prompt 来诱导模型完成任务。prompt 是一种虚假的文档,可以包含一些示例或约束条件,让模型模仿或遵循。不同的 prompt 可能会影响模型的输出质量和风格。
  • 🧩 GPT 的性能可以通过使用工具或插件来提升。比如使用检索工具来增加模型的工作记忆,或者使用计算器、代码解释器等工具来辅助模型完成复杂的任务。
  • 🚀 GPT 的研究前沿包括让模型表现出更多的推理能力和创造性,以及让模型更好地理解自己的优势和局限。一些研究者尝试了使用树搜索、反思、自我一致性等技术来增强模型的思维过程。

老黄携「超级GPU」炸场!E级AI超算性能飞升,买越多越划算,谷歌微软Meta抢先试用

文章来源:  新智元

概述

英伟达CEO黄仁勋在COMPUTEX大会上发布了新一代的超级GPU GH200,宣布谷歌云、Meta和微软将率先使用。GH200是一种将Grace CPU和H100 GPU结合在一起的超级芯片,能够提供高达900GB/s的带宽,适用于大规模的生成式AI负载。英伟达还推出了DGX GH200人工智能超级计算平台,以及MGX模块化架构,为系统制造商提供快速、低成本的解决方案。此外,黄仁勋还展示了基于ACE的实时语音聊天的NPC角色,以及对AI时代的展望。

要点

  • 🚀 GH200超级芯片:将Grace CPU和H100 GPU结合在一起,提供高达900GB/s的带宽,适用于大规模的生成式AI负载。
  • 💻 DGX GH200人工智能超级计算平台:由256块GH200组成,拥有高达1 exaflop的AI性能,以及144TB的共享内存。
  • 🛠 MGX模块化架构:为系统制造商提供快速、低成本地构建100多个服务器变体的参考架构。
  • 🎮 ACE实时语音聊天的NPC角色:使用生成式AI根据玩家的语音输入实时生成NPC角色的回答、面部动画和声音。
  • 🌎 AI时代的展望:黄仁勋强调了AI对计算机产业的革命性影响,以及掌握AI技术的重要性。

给TA打赏
共{{data.count}}人
人已打赏
AI资讯

AI大观日报 | 23.05.28

2023-5-28 17:32:00

AI资讯

AI大观日报 | 23.05.30

2023-5-30 21:40:36

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索