文本到图像生成模型的兴起催生了新的市场,用户可通过提示词生成图像,但创建高质量图像过程繁琐且成本高,因此提示工程师开始在平台上出售提示词。现有提示词交易模式存在价格由卖家单方面决定、收益分配固定且未全面考虑各方利益等问题。
复旦大学多媒体与智能安全团队提出了一种创新的提示词交易(PBT)场景和在线定价机制,以实现消费者、平台和卖家的利润最大化。PBT 系统包含平台、消费者和提供各种类别提示词的卖家,平台作为数据交易经纪人聚合提示包,消费者付款后,平台收取部分奖励作为服务补偿,剩余支付给卖家。
选择质量未知的提示词类别问题建模为组合多臂老虎机(CMAB)问题,通过贪婪搜索策略选择最高质量的类别,目标是在 T 次迭代中最大化所选类别的总估计质量。引入三阶段层级 Stackelberg(HS)游戏来找到最优激励策略,将消费者、平台和卖家分别视为一、二、三级领导者,通过逆向推导得出最优激励策略。定义了各方的利润函数,并通过定理和证明得出各方的最优策略。更好地适应未来的买方市场。研究人员认为这一模式有望重塑AI内容创作生态,提高创作效率。