更实用 谷歌人工智能可对图像插入对象

  • 时间:
  • 浏览:11
  • 来源:5分快3平台-5分时时彩投注平台_大发6合娱乐平台

  使用后期制作软件,在场景中真实地放置东西对计算机来说,比对人来说要困难得多。它不仅要求为所述对象选者适当的位置,有些要求预测目标位置上的对象的外观、比例、遮挡、姿态、底部形态等。

  幸运的是,人工智能(AI)承诺提供帮助。NeurIPS 2018会议上的一篇论文中(上下文感知合成和匹配对象实例),首尔国立大学的研究人员,加州大学默塞德,和谷歌AI描述有有二个 系统,学着把有有二个 对象插入有有二个 图像,在语义上,令人信服 。

  在符合场景语义的图像中插入对象是一项具有挑战性和趣味性的任务。研究人员写道,这项任务与有些实际应用密切相关,包括图像合成、AR和VR内容编辑。另有有二个 的对象插入模型还不需要 潜在地促进有些图像编辑和场景解析应用多多线程 。

  你们你们你们你们的端到端框架包括有有二个 模块,决定了插入的对象,应该是和第3个决定它应该是那此样子,利用甘斯( GANs),或有有二个 神经网络组成,试图区分生成的样本和实际样品。将会系统共同对插入的图像进行分布建模,有些有有二个 模块还不需要 相互互通并优化。

  该论文的作者写道,这项工作的主要技术新颖之处在于,它构建了有有二个 端到端的可培训神经网络,该网络还不需要 从新对象的联合分布中对其将会的位置和底部形态进行采样。合成的对象实例既还不需要 作为基于GAN的妙招 的输入,也还不需要 从现有数据集中检索最近的所需帕累托图,从而生成新的图像。

  正如你们你们你们你们解释的那样,在有些情况下,生成器还不需要 预测合理的位置,生成语义上一致的比例、姿势和底部形态的对象掩码,特别是对象如可在场景中分布,以及如可自然地插入对象,以便使其看起来是场景的一帕累托图。随着时间的推移,在训练过程中,AI系统会根据场景学习不同的对象类别分布,类似在城市街道的图像中,你们你们你们你们往往在人行道上,而汽车通常在路上。

  在测试中,研究人员通过插入底部形态逼真的物体,使模型优于基线。当将YOLOv3图像识别器应用于人工智能生成的图像时,检测合成目标不需要 以0.79的召回率。更能说明现象报告 的是,在对亚马逊的(Mechanical Turk)公司员工进行的一项调查中,43%的人认为人工智能生成的物体是真实的。

  研究人员写道,这表明你们你们你们你们的妙招 不需要 执行对象合成和插入任务。将会你们你们你们你们的妙招 是在那此地方和那此东西上联合建模的,有些还不需要 用于处里其它计算机视觉现象报告 。未来有趣的工作之一将是处里对象之间的遮挡。

有好的文章希望站长之家帮助分享推广,猛戳这里我想 投稿