抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

副标题#e#

来源：雷锋网

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

传说中有一种电脑高手可以在一台电脑上按下 Ctrl+C，在另一台电脑上按下 Ctrl+V 就能进行跨设备粘贴复制。

虽然只是传说，但有无数的电脑极客为这个目标而努力。而现在利用机器学习 +AR 技术攻克了这个难题。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

利用这个技术只用一部手机就能将书上的图片直接复制到电脑上，全程用不到 10 秒钟。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

手写框架图自然也不在话下 ~

这个项目是一位自称艺术家的法国人创造，据在 reddit 提供的 github 地址，发现作者名为 Cyril Diagne，此外其还是一家 AI 公司的联合创始人。

项目地址：https://github.com/cyrildiagne/ar-cutpaste

虽然目前仅能用于 Photoshop，但作者相信未来可以处理更加不同类型的输出。从粘贴到复制，完成整个过程需要三个模块：移动 APP、本地服务器、背景移除。

其中，移动 APP 使用了 Expo 这个通用的 React 应用架构和平台搭建，本地服务器使用了 ScreenPoint 超早摄像头在屏幕上所指向的位置，背景移除使用的技术是基于被 Pattern Recognition 2020 收录的论文《U^2-Net: Going Deeper with Nested U-Structure for Salient Object Detection》。目前此论文尚找到下载版本，不过论文代码已经放出。

代码地址：

https://github.com/NathanUA/U-2-Net

部署步骤

根据作者 Github，整个部署可以分为四步：Photoshop 配置、设置外部显著对象检测服务器、配置和运行本地服务、配置和运行移动 APP。

Photoshop 配置：1. 进入 "Preferences>Plug-ins"，启用 " 远程连接 "，并设置稍后需要的密码。2. 确保 PS 文档设置与 server/src/ps.py 中的设置匹配，否则会粘贴空白。3. 确保文档有背景，如果背景空白 SIFT 可能无法进行正确的匹配。

设置外部显著对象检测服务器：1. 需要使用 BASNet-HTTP 作为外部 HTTP 服务部署 BASNet 模型；2. 将需要部署的服务 URL 来配置本地服务器。3. 如果在与本地服务相同的计算机上运行 Basnet，请务必配置不同的端口。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

配置并运行本地服务器的时候，按照上面的代码和说明。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

配置和运行 APP 则需要按照上面的设置。

另外，作者也提到直接在 APP 中使用像 DeepLap 此类的技术可能会简单的多，但是作者还没有尝试。

技术细节

该工具使用 U2-Net ( Qin et Al, Pattern Recognition 2020 ) 执行显著目标检测和背景移除。

然后，利用 OpenCV SIFT 找出手机在电脑屏幕上对准的位置。只需要一张手机照片和截图，就可以得到准确的 x, y 屏幕坐标系。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

U^2-Net 架构

据论文作者介绍，U^2-Net 与当前 20 余种 SOTA 方法进行对比实验后，无论是在模型尺寸还是结构测度等指标都获得了比较不错的成绩。

#p#副标题#e##p#分页标题#e#

U^2-Net 工作是对其 BASNet ( Qin et al, CVPR 2019 ) 工作的更新，论文暂时未放出，不过根据 BASNet，我们可以知道在边界的显著性检测方面，其对损失函数的设计进行了创新，使其不再像以前那样只关注区域精度。

#p#副标题#e#

上面是检测技术，而定位技术是使用的 SIFT 算法，全称是 Scale-invariant feature transform，翻译过来是：尺度不变特征转换。是一种不随图像尺度旋转变化而变化的特征，因此 SIFT 特征不会随着图像的放大缩小，或者旋转而改变，同时由于在提取特征时做的一些特殊处理，使得 SIFT 特征对于光照变化也有比较强的适应性。

SIFT 算法由加拿大英属哥伦比亚大学教授 David Lowe 于 1999 年发表于会议 ICCV ，原论文 Object recognition from local scale-invariant features ，David Lowe 是唯一作者。

广为人知的被引用更多的是 2004 年发表于期刊 IJCV 的完善版 Distinctive image features from scale-invariant keypoints。2020 年 3 月 6 日专利到期，可以免费试用，OpenCV 里就有。算法流程一般为：构建尺度空间、寻找极值点、筛选极值点、计算特征点的主方向、变换特征点维度。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

该工具使用 OpenCV SIFT 找出手机在电脑屏幕上对准的位置

作者：不会写程序的设计师不是好艺术家

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

前面也提到，这项工具的发明者是 Cyril Diagne，其自称是艺术家、设计师、程序员，现居住在法国。

2008 年毕业于法国巴黎的 Les Gobelins 学院，这所学校不仅仅是动画制作专业全球排名第一，还有图像专业和交互设计专业同样在国际上表现不俗。

毕业之后，他和其他五位学生共同创立了 LAB212 公司，并且其本人是谷歌文化学院实验室驻场艺术家，也是 CAL（瑞士洛桑）的媒体和交互设计负责人。

他的工作重点是将数字技术与非常规技术融合在一起，从而创造诗意版的互动体验。

他还曾经研究出一种人脸涂鸦工具，借助 Tensorflow.js、FaceMesh 和 Three.js 即可在网页浏览器上使用 AR 对脸部进行涂鸦。

#p#副标题#e#

还有一款可在 Instagram 个人主页图像上添加 3D 效果的 chrome 扩展程序，效果生成类似于 Facebook 3D 照片功能，让 2D 照片也能呈现多角度的景象。

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

热点

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

由 dawei

您错过了

C编程精髓与.NET框架实战深度指南

Linux实战：高效开发环境搭建与运用速览手册

PHP构造函数与析构函数详解

C编程宝典：精通.NET框架的高效开发技巧

抠图专家要失业了？CV 技术加持下的 AR，实现隔空抠图复制粘贴

由 dawei

相关文章

互联网巨头冲击下站长转型与业务拓展策略

互联网巨头AI转型下的站长策略调整与启示

5G技术驱动站长界面革新，重塑极致用户体验

您错过了

C编程精髓与.NET框架实战深度指南

Linux实战：高效开发环境搭建与运用速览手册

PHP构造函数与析构函数详解

C编程宝典：精通.NET框架的高效开发技巧