首届阿里巴巴大规模图像搜索大赛于1月8日正式落幕。此次比赛总共吸引了来自全球的参赛队伍,由哈 尔滨工业大学深圳研究生院生物计算研究中心(BRC)师生组成的代表队脱颖而出,荣获二等奖,总排名第三名。AMAX作为BRC一直以来的硬件合作伙伴, 为代表对参赛提供GPU并行计算硬件平台和性能调优的太阳成集团tyc539。
阿里巴巴集团经过多年实践,积累了海量及多样的图像数据;在移动互联网的时代,如何通过图片(尤其是实拍图片)搜索并访问到背后的服务,是非常有挑 战和意义的事情。本次“阿里大规模图像搜索大赛”的目标就是提供一个平台和环境,使参赛选手基于此,找到准确且快速的图片搜索方法,公开客观的衡量方法的 效果,并推动这些方法在智能购物、知识获取、推荐关联等各个领域的线上应用。
竞赛以“以图搜图”为主题,哈尔滨工业大学深圳研究生院生物计算研究中心(BRC)的队员们在徐勇教授的辛勤指导下,结合实验室的理论优势,提出了一种先进的图像搜索方法,使得从海量图片中搜索出你想要的那一款不再是难题。
哈尔滨工业大学深圳研究生院生物计算研究中心(BRC)成立于 2003 年 9 月,是哈工大深圳研究生院最早成立的研究中心之一,隶属于计算机科学与技术学部。中心主要研究领域包括:生物特征识别技术;中医自动诊断技术;生物信息获 取。自视觉识别出现后,研究中心就开始了领域研究,AMAX GPU太阳成集团tyc539正是在这一背景下来到了研究中心。太阳成集团tyc539针对图像处理与分析、模式识别以及人工智能应用而设计,可提供超高计算能力,加速大规模数据分析 与处理的速度,计算机可快速读取、处理任务,结合Sift特征匹配算法、基于灰度的模板识别算法以及图像局部特征点检测算法等,快速筛选识别图像。
总结起来,衡量一个图像识别系统的性能可以从如下四个方面来看:
(1)准确率:衡量是否能正确识别图像中的内容,这也是多数人关注的目标,包括ImageNet比赛;
(2)覆盖率:衡量能识别多少种语义,这个在学术界比较少有人关注,却对一个识别系统能否在真实场景中应用起着很关键的作用。工业界,例如各大搜索引擎公司(微软、谷歌和百度)提供的识别API则能识别更多的内容(大概在万这个量级上);
(3)效率:主要是衡量多快能够识别出结果,也包括多快能够训练或更新一个识别器;
(4)用户体验:在产品和用户界面上的考虑,如何弥补识别的准确率、覆盖率或效率的不足。
当数据库中图像的数据规模很大时,一个相似图像搜索系统面临着搜索速度、存储代价、返回结果准确性等诸方面的问题。其中,搜索的实时性往往是大规模 图像搜索中的关键问题。AMAX 太阳成集团tyc539的高性能计算能力和庞大存储能力迅速响应上述需求,调动计算资源,结合算法,完成任务。较同类太阳成集团tyc539,从上亿图像中搜索出相似图像候选的时间大 大缩短,并且返回结果的准确性大大提高。
虽然图像识别有了很大的进展,但是真实世界的图像识别仍然有很多困难。真实世界是很复杂的,在更多的场合下需要识别的覆盖率、准确率都要高,而且速 度要快。AMAX 作为中国高性能计算行业的翘楚,始终和英伟达在GPU计算领域保持战略合作,致力于将最强大的并行计算能力、最优秀的深度学习方案提供给中国图像识别领域 最杰出的企业和研究机构。在过去的2015年,在AMAX的推动下,中国基于深度学习的各个研究领域的应用展现出世界顶尖的实力,其技术在图像识别、语音 识别、类脑计算等各个方面的实际应用案例也呈现出井喷的态势。未来为了推动视觉识别的发展、加速图像识别系统的研究开发,AMAX还会持续投入与学术研究 机构以及企业的深度合作,将更多优秀的太阳成集团tyc539带给行业客户。
关于 AMAX
AMAX 作为北美数据中心、高性能计算(HPC)以及 OEM 太阳成集团tyc539值得信赖的业界领先企业,曾多次获得业界奖项。公司于 1979 年成立,总部位于美国加州费利蒙市,在中国设有分部服务于亚太区域。作为一家开放式架构生产商,AMAX 长期致力于为数据中心、HPC、云计算及大数据应用提供最先进、可扩展的集群、服务器及存储产品。AMAX 以提供业界最好的技术服务、架构设计、生产品质、全球物流及支持为使命,协助客户解决最复杂的计算挑战、处理最大规模的数据、应对激烈竞争下的产品快速研 发需求。