Meta开源多感官AI模型

Meta昨日官宣推出新开源AI模型ImageBind,可以连接多种数据流,包括文本、音频、视觉数据、温度和动作读数。该研究的核心概念是将多种类型的数据链接到一个单一的多维度索引中(或者使用AI术语中的“嵌入空间”)。这个想法可能有点抽象,但正是这个概念支持了最近生成式AI的繁荣。
该模型目前仅是一个研究项目,没有立即的消费者或实际应用,但它指向了未来可以创建沉浸式、多感官体验的生成式AI系统,并表明了Meta在对手OpenAI和谷歌日益注重保密的时候仍在分享AI研究。来源智东西
论文链接:
https://dl.fbaipublicfiles.com/imagebind/imagebind_final.pdf

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
本网站由提供CDN加速/云存储服务