首页 >最新资讯 > 正文

Meta 开源多感官人工智能模型 ImageBind,整合文本、音频等数据

admin 2025-07-16 16:23最新资讯 68 0

近日,Meta 公开一个新的开源人工智能模型ImageBind,该模型能够将六种类型的数据整合在一起,包括视觉(以图像和视频形式呈现);热量(红外图像);文本;音频;深度信息;以及最有趣的——由惯性测量单元(IMU)生成的运动读数。

Meta 开源多感官人工智能模型 ImageBind,整合文本、音频等数据


发表评论 取消回复

暂无评论,欢迎沙发
关灯顶部