arXiv 2018发表的论文《What is wrong with style transfer for texts?》的翻译
文章中总结了文本风格迁移的三种思路:
Ad-hoc defined style classes
样式概念是从给定的训练数据集中严格逆向工程出来的, 所以将这种对文本风格的理解称为临时的(Ad-hoc)
NMT approaches
将两种不同的风格定义为两种不同的语言,从而将风格转换的问题转化为神经机器翻译的问题(NMT)
Post-NMT approaches
风格表示不应该像Ad-hoc方法那样被分离,而应该从语料库中自动地抽取出来。
于是, 文章提出了风格迁移的两个准则:
- 风格是文本的一个整体属性,它可以被标记为一个特定类别或一个子语料。这种类别或子语料的选择是任务相关的。
- 风格必须通过以下方式与语义“正交”:任何与语义相关的信息都可以任何风格表示
文章翻译&原文下载
最后把下载放这儿吧:
Published by