首页 > 人工智能 > 正文

开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程

2018-06-28 09:50:50  来源:今日头条

摘要:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。姿态估计的任务旨在将RGB图像或视频的人像素映射到人体的3D表面。
关键词: 人工智能 深度学习
  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。姿态估计的任务旨在将RGB图像或视频的人像素映射到人体的3D表面。姿态估计是一个多任务任务,并涉及其他几个问题:物体检测,姿态估计,分割等。姿态估计的应用包括需要超越简单地标定位的问题,如图形,增强现实(AR)或人机交互(HCI)。姿态估计还涉及基于3D的物体识别的许多方面。在这篇文章中,我们分享了几种开源深度学习模型和代码进行姿态估计。如果我们遗漏了您认为值得分享的实现,请将其留在下面的评论中。

  DensePose

\
  GitHub | 数据集

  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。这篇文章的灵感来自Facebook Research,他在上周 早些时候发布了DensePose的代码,模型和数据集。Facebook分享了DensePose-COCO,这是一款用于人体姿势估计的大型地面真实数据集。该数据集由在50K COCO(上下文中的通用对象) 图像上手动注释的图像到表面对应关系组成。这是深度学习研究人员非常全面的资源。它为姿态估计,零件分割等任务提供了良好的数据来源。

  DensePose论文提出了DensePose-RCNN,它是Mask-RCNN的一种变体,用于以每秒多帧的速度在每个人类区域内密集回归特定部分的UV坐标。它基于DenseReg。该模型的目标是确定每个像素的表面位置以及其 所属部分的相应2D 参数。

  DensePose采用Mask-RCNN的体系结构以及特征金字塔网络(FPN)功能和ROI对齐池。此外,他们在ROI池中引入全卷积网络。有关更深入的技术细节,请查阅DensePose论文。

  OpenPose

\
  GitHub | 数据集

  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。OpenPose是一个实时多人关键点检测库,用于CMU感知计算实验室的身体,脸部和手部评估。OpenPose提供二维和三维多人关键点检测,以及用于估计域特定参数的校准工具箱。OpenPose允许各种输入:图像,视频,摄像头,IP摄像头等。它还以各种格式生成输出:图像和关键点(PNG,JPG,AVI),以可读格式(JSON,XML,YML)保存关键点,甚至作为数组类。输入和输出参数也可以调整以适应各种需求。

  OpenPose提供了C ++ API,可以在CPU和GPU上工作 - 包括与AMD图形卡兼容的版本。

  实时多人姿态估计

\
  GitHub

  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。该实现与OpenPose高度相关,并且在各种框架中提供了与实现相关的模型。本文的作者提出 了一种实时多人姿态估计的自下而上方法,而不使用任何人检测器。该方法使用非参数表示(我们称之为部分相似性字段(PAF))来学习将身体部位与图像中的个体相关联。有关实施和理论的更多技术细节,请参阅论文。这种方法的最大特点之一就是已经在许多不同的框架中实现,并且代码和模型随时可用于您的选择框架:

  OpenPose C ++库

  TensorFlow实现

  Keras实现一和二

  PyTorch实现一, 二,三

  MXNet实现

  AlphaPose

\
  GitHub

  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。Alpha Pose 是一个准确的多人姿势估计器,并声称是第一个开源系统。AlphaPose对图像,视频或图像列表执行姿态估计和姿态跟踪。它产生各种输出,包括以PNG,JPEG和AVI格式的关键点显示的图像,以及JSON格式的关键点输出,使其成为更多以应用程序为重点的优秀工具。

  目前,有一个TensorFlow实现 和一个PyTorch实现。AlphaPose使用区域多人姿势估计(RMPE)框架来在存在不准确的人体边框时促进姿态估计。有三个组成部分:对称空间变换网络(SSTN),参数姿态非最大抑制(NMS)和姿态引导建议生成器(PGPG)。有关更多技术细节,请参阅该论文。

  人体姿势估计

  网站 | GitHub | 数据集 | ArtTrack纸 | 更深的纸张

  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。这个代码库提供了一个TensorFlow实现的人体姿态估计算法,在 ArtTrack 和 DeeperCut 论文中介绍。训练的模型利用MPII人体姿态数据库,这是丰富的图像集合,用于评估 明确的人体姿势估计。这个项目考虑了在现实世界的图像中多人的关联人类姿势估计的任务。他们的方法解决了检测和姿态估计的任务,这与先前 检测人员并随后估计他们的身体姿势的方法不同。在其实现中使用基于CNN的部分检测器和 整数线性程序。有关更多技术细节,请参阅 ArtTrack 和 DeeperCut 论文。

  DeepPose

\
  开源:深度学习模型和姿态估计代码开源代码推荐,人工智能教程(趣说人工智能编译,来源modelzoo)。DeepPose是从2014年开始的相对较老的论文,提出了一种基于深度神经网络(DNN)的人体姿态估计方法,该方法被制定为针对身体关节的基于DNN的回归问题。它以一种整体的方式推理姿势,并且具有简单而强大的表述。DeepPose似乎没有在线提供官方实施。但是,已经努力复制其结果:

  Chainer实施

  TensorFlow实现

  DeepPose很有趣,因为它是人类姿态估计的第一个深度学习应用,并且在开始时达到了最先进的结果,为许多其他更新的实现提供了基准。

  姿态估计是计算机视觉社区中日益流行的问题。随着 Facebook Research 等新型姿态估计数据集(如 DensePose-COCO)的发布,现在在这方面存在更多工作资源。在我看来,有很多方向可以进行姿态估计,而这些资源的发布肯定会激起该领域的新兴趣。希望很快我们会看到许多新的创新想法和实施。
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangxuefeng

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。