Transformer一作Ashish Vaswani所在的创业公司Adept,开源了一款名为Fuyu-8B的多模态大型模型,参数量达到80亿。该模型具备强大的图像理解能力,能够理解照片、图表、PDF和界面UI等多种形式的图像,并且处理速度非常快,研究团队表示可以在100毫秒内返回大图像处理结果。同时,该模型还非常轻巧,模型规模不超过百亿,并且没有使用图像编码器。目前,该模型已经开源,用户可以在线上试玩Demo,提供了看图问答和图像概述两种功能。据了解,Adept由Transformer一作和前OpenAI工程副总裁等业内知名人士共同创立,成立于2022年4月,已经完成了B轮融资,总融资额达到4.15亿美元,公司估值超过10亿美元。
暂无讨论,说说你的看法吧