在2024世界经济论坛的一次对话中,图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)提到生成式模型不适合处理视频的观点。当主持人问如何让机器理解视频时,杨立昆称,目前最有希望的是图像识别,并不是生成式的。
最有效的模型不是图像生成模型,不是重建,也不是直接预测。它做的是在一个抽象的表征空间中进行预测……我们需要在抽象表征空间中预测,而不是具体的像素空间。这就是为什么像素空间的预测都失败了,因为它太复杂了。
在2024世界经济论坛的一次对话中,图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun)提到生成式模型不适合处理视频的观点。当主持人问如何让机器理解视频时,杨立昆称,目前最有希望的是图像识别,并不是生成式的。
最有效的模型不是图像生成模型,不是重建,也不是直接预测。它做的是在一个抽象的表征空间中进行预测……我们需要在抽象表征空间中预测,而不是具体的像素空间。这就是为什么像素空间的预测都失败了,因为它太复杂了。
之前
AI生成灵感就上AISCK
全球优质素材持续更新
隐龙殿 · 荣誉合作单位
携手打造AIGC前端品牌
亲爱的同学, AISCK不支持网页右键喔!
你可以鼠标左键选择内容后,按Ctrl+C复制