科学家使用神经网络实现最佳域间数据传输

摘要 Skoltech和人工智能研究所(AIRI)的研究人员开发了一种新算法,用于使用神经网络在域之间进行最佳数据传输。与大多数类似技术不同,新方法不

Skoltech和人工智能研究所(AIRI)的研究人员开发了一种新算法,用于使用神经网络在域之间进行最佳数据传输。与大多数类似技术不同,新方法不需要成对的训练数据集,例如输入输出样本,并且可以在输入和输出域的独立数据集上进行训练。该算法产生比其他现有方法更具可解释性的结果,并且建立在坚实的理论基础之上。

为面部或语音识别和医学图像分析等应用设计的现代机器学习模型需要难以获得的大型训练数据集。正是出于这个原因,研究人员和工程师必须创建与现实中可用的数据相匹配的合成数据。生成模型在很大程度上促进了这项任务,这些模型最近在文本和图像质量方面取得了巨大进步。

生成模型有助于从其他数据中合成数据,换句话说,将一个域移动到另一个域。例如,神经网络可以根据人类绘制的草图创建数字图片,或者增强卫星图像中的精细细节。这些任务通常需要成对的训练样本和输入输出图像集,神经网络可以学习这些图像集以泛化和扩展到新的传入图像,这有助于处理不同质量的多个相同图像等。

由于配对数据通常非常昂贵或难以获得,研究人员不得不凑合使用独立数据集,这使得获得良好结果变得更加困难。

“为域迁移构建生成模型的标准方法在很大程度上是启发式的,并且依赖于影响训练结果且不容易选择的多个超参数。此外,这种方法缺乏严格的数学框架。因此,模型训练是一个不稳定的过程,你必须手动调整。不出所料,关于训练结果的严格理论结论也很难获得,”Skoltech的AI主任兼AIRI研究团队负责人EvgenyBurnaev教授评论道。

在研究中,该团队重新审视了苏联数学家和经济学家列昂尼德·康托罗维奇(LeonidKantorovich)的著作,并利用他关于最优货物运输的思想(最优运输理论)创建了一种用于规划域间最优数据传输的新算法。这种称为神经最优传输的新算法使用深度神经网络和独立数据集。

当在未配对的域传输上进行测试时,该算法在多项任务中优于现有方法,包括图像样式。此外,与其他技术不同,它需要更少的超参数(通常难以调整),产生更易于解释的结果,并建立在坚实的数学基础之上。

“多年来,最优传输数值方法已被广泛用于构建生成神经网络。我们的探索性研究表明,这些模型计算的最优传输具有非常高的误差。我们不仅设法找到了错误的原因,而且还AIRI研究科学家兼Skoltech研究团队负责人AlexanderKorotin表示:“基于最优传输理论,进行分析并从根本上开发新的有效方法来构建未配对域传输的生成模型。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。