(AI大观日报会为您推送每日的AI热点新闻,其中所有的概述及要点都由AI自动总结生成。若想查看详细内容,可点击标题进入原文)
苹果封神头显Vision Pro竟暗藏「脑机接口」!苹果前员工疯狂揭秘读心操控
文章来源: 新智元
概述
本文介绍了苹果发布的头显Vision Pro的一些黑科技,包括暗藏的脑机接口、强大的手势和眼球追踪、一键生成3D形象等。文章还分析了Vision Pro对苹果未来计算平台的意义,以及它面临的挑战和机遇。
要点
- 🧠 Vision Pro可以通过监测用户的眼睛行为和身体数据,预测用户的大脑行为和心理状态,实现初级的脑机接口 。
- 🖐️ Vision Pro完全依赖手势追踪和眼球追踪实现丝滑的控制效果,无需手柄 。
- 🤳 Vision Pro可以使用设备上的相机设置自己的3D头像,并在虚拟环境中展示。
- 🎨 Vision Pro可以将周围空间作为无限画布,随意使用任何APP,并把它们调成喜欢的任意尺寸。
- 💰 Vision Pro是苹果首次创建了一个新的计算平台,可以取代现有的大部分主要产品,但要实现这一目标,至少需要5年的时间。
效果达OpenAI同规模模型96%,发布即开源!国内团队新发大模型,CEO上阵写代码
文章来源: 量子位
概述
TigerBot是一款国产自研的多模态大语言模型,支持多种任务和插件功能,发布即开源。它由虎博科技团队在几个月内快速开发,创新了训练算法、生成可控、并行训练等方面,达到了OpenAI同规模模型的96%的综合表现。
要点
- 🚀 发布即开源:TigerBot包含70亿参数和1800亿参数两个版本,均对外开源,还提供了预训练数据和代码。
- 🤖 多模态多任务:TigerBot覆盖生成、问答、编程、画图、翻译等15大类能力,支持子任务超过60种,还能联网获取新数据。
- 💡 创新算法:TigerBot采用指令完成监督微调方法提升模型可学习性,运用ensemble和概率建模方法实现可控事实性和创造性。
- 🚀 并行训练:TigerBot突破了deep-speed等主流框架中的内存和通信问题,实现了千卡环境下数月无间断训练,降低成本。
- 🇨🇳 中文优化:TigerBot针对中文语言的特点,从tokenizer到训练算法上都做了更适合的优化。
ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定
文章来源: 量子位
概述
本文介绍了一种新的玩法,利用Stable Diffusion结合LoRA和ControlNet,生成可以扫码的插画,内容链接任意指定。文章展示了不同风格的二维码图像,如二次元、立体、水墨、浮世绘等,并介绍了背后的技术原理和作者团队。
要点
- 🎨 Stable Diffusion是一种生成图像的技术,可以控制图像的风格和内容。
- 🧠 LoRA是一种低秩适应大语言模型的技术,可以实现少样本学习,对Stable Diffusion的图像风格生成进行更精准的控制。
- 📱 ControlNet是一种控制二维码位置和有效性的技术,可以将二维码嵌入到Stable Diffusion生成的图像中。
- 👩🎨 作者团队来自中国传媒大学和北京航空航天大学,主要研究方向是图形学和交互艺术,已经开发了多个AI模型,并在Civitai和Hugging Face等平台上开源了部分模型。