机器学习是AI领域最受关注的方向,从理论模型到产品化的过程中,如何提升模型训练的效率和精度,简化训练和验证数据集的处理,有效利用计算力资源来缩短产品化的周期,这些都是AI产品研发落地成功的关键因素。
为此,由中国新一代IT产业推进联盟主办,CIO时代APP承办的"第64期CIO时代信息化大讲堂"活动于2017年11月8日在北京CIO时代学院报告厅顺利举行。七牛云人工智能实验室首席架构师姚唐仁先生作为本次活动的特邀讲师,发表了题为《富媒体弹性机器学习平台》的主题演讲。本次公益讲座吸引了创业CEO、企业技术人员、业界CIO、高校学生等50多人参会,座无虚席,气氛活跃。本次讲座活动由CIO时代APP市场运营张林颖主持。
七牛云人工智能实验室首席架构师 姚唐仁
他主要围绕七牛云是如何构建弹性机器学习平台以及该平台在行业场景中的应用,做了全面而详细的深度分享。
什么是富媒体?
富媒体,即Rich Media的英文直译,本身并不是一种具体的互联网媒体形式,而是指具有动画、声音、视频或交互性的信息传播方法。富媒体包含流媒体、声音、Flash、以及Java、Javascript、DHTML等程序设计语言的形式之一或者几种的组合。富媒体可应用于各种网络服务中,如网站设计、电子邮件、BANNER、 BUTTON、弹出式广告、插播式广告等。
七牛云从富媒体的PaaS服务到AI
七牛云通过富媒体对象存储、数据处理、数据加速、点播&直播等主体内容与途径可以提供富媒体一站式服务。可围绕海量数据提供创新、灵活的组合场景,富媒体的PaaS服务融合了七牛云8大产品线:分布式海量存储系统、融合CDN、容器云、智能多媒体API、直播云、点播云、大数据平台、人工智能(机器学习),海量富媒体数据,每天超过10亿图像上传,超过万亿小时的音视频存储。正因为七牛在海量富媒体数据处理和企业服务方面的优势,从数据的基础服务跨越到数据认知领域。
七牛富媒体机器学习平台
机器学习包括数据、算法、模型三大模块,在实际商业场景中,真正构建产品竞争力和商业价值则需要的是端到端的业务场景交付能力,需要一个好的平台来支撑工程化落地能力。七牛机器学习云提供现代机器学习服务,通过专业化的数据预处理,先进的深度学习算法,提供预训练模型和高效分布式算法平台生成的定制化模型。通过机器学习和云计算技术的结合,洞悉七牛业界领先海量存储的非结构化数据背后深入的价值,为传统企业和互联网客户提供智能分析能力,成为客户的APP“魔法师”。
数据在AI能力构建方面举足轻重,如何有效地获取数据和管理数据非常重要。七牛积累了丰富的图片、视频素材,除此之外,增量数据的获取可以通过网络获取、应用收集、公开数据集以及行业积累,还有推理的结果反馈也可以作为数据集的来源。另外,管理好数据要通过标签分类管理和用户间分享。数据的质量一个重要的环节就是数据的标注,做好这件事表现在几个方面:团体的协同效率、标注任务的效率、标签的有效性、支持标的丰富性。
平台对于训练的支持体现在几个方面:首先,基础设施的支持,不仅需要支持海量的数据,还需要对算力资源能做到弹性地的调度和利用。以七牛在视频领域竞赛的平台为例,很好地实现了平台资源的充分利用,提升了资源使用率。其次,支持模型和框架的选择,算法工程师可以选择合适的模型和框架来进行训练。再有,训练调优工程中要有各项指标的监控和多样比较功能来提升模型评价的效率。最后,模型在应用到各个业务场景的领域时还要进行优化,模型的优化则要考虑场景要求、物理约束、成本来进行权衡。
模型研发后需要提供具有负载均衡大规模的服务能力。七牛的平台通过对AI服务进行原子服务和中间服务的分层实现模型服务的一键发布。另外,通过分布式log的收集,大数据分析,实现推理结果的反馈,不断迭代模型,完成模型流程的闭环。
公有云AI API服务
七牛在线上提供一系列的通用AI API服务,包括:内容审核(色情内容识别、暴恐识别)、通用场景识别(360+ 类)、通用物体识别(200+ 类)、OCR识别、燃气电表识别、人脸识别等。
1、内容审核:主要包括色情内容识别,暴力恐怖物品和场景的识别,敏感人物和敏感图片的识别。在此基础之上,提供图片内容的通用物品和场景识别。
2、OCR识别:其中包括身份证识别、银行卡、银行回单、增值税发票、增值税销货清单、定额发票、卷式发票、机打发票等。
3、燃气电表识别:支持在线学习新表、支持进位识别、支持液晶数字和罗盘等多种电表燃气表。
4、人脸识别:通过人脸检测、人脸相似度比对、人脸聚类、人脸特征提取、人脸检索等一系列过程,从而达到人脸识别的效果。
AI私有化案例
结合垂直行业的需求和AI技术,七牛提供丰富的私有化服务。通过分析客户的业务场景,结合AI的最新技术,助力客户拓展更加创新的服务,提升用户体验和降低成本。演讲中从传统行业到互联网领域,介绍了七牛在实践中的丰富案例。
关于七牛云
七牛云是国内领先的云计算厂商,围绕海量数据提供创新的云服务,帮助客户缩短想法到产品的距离。已创立6年,每年超过300%的业绩增长,现已完成5轮融资,累计超过2亿美金。其总部位于上海,在北京、深圳、广州、成都、杭州、厦门、武汉等设有研发团队和办事处,是一个拥有500人的服务团队,同时也拥有中国最大的go语言开发团队。致力于长期服务70多万企业用户和开发者,文件数超过2000亿,每日新增文件20亿。覆盖全球300个节点,间接服务全国超过80%网民。
活动现场
在交流互动环节中,姚唐仁先生对嘉宾们提出的问题和疑惑进行了一一解答,他们纷纷表示不虚此行,期待之后的更多交流。
“CIO时代信息化大讲堂”活动每隔周三下午19:00-20:30定期举办公开讲座,更多干货分享以及活动动态,请关注CIO时代APP。扫描下方二维码即可下载。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。