1.重要学术会议
AAAI、CVPR、ACL、NIPS、ICML及后来居上的ICLR 等,都是有关人工智能/机器学习的老牌学术会议,简单介绍如下。
(1)AAAI(American Association for Artificial Intelligence,美国人工智能协会)是1979年成立的世界范围的人工智能组织,该协会由计算机科学和人工智能的创始人Allen Newell,Marvin Minsky 和John McCarthy 等人发起,在全球有超过6000名会员。AAAI 也是人工智能顶级会议 AAAI 的组织者,会议的官方网址为:http://www.aaai.org/。
(2)CVPR(IEEE Conference on Computer Vision and Pattern Recognition,IEEE国际计算机视觉与模式识别会议)是由 IEEE 举办的一年一度的学术性会议,该会议的主要内容是计算机视觉与模式识别技术。CVPR 是世界顶级的计算机视觉会议(三大顶会之一,另外两个是 ICCV和 ECCV),近年来每年约有1500名参加者,收录的论文数量一般在300篇左右。会议每年都会有固定的研讨主题,而每一年都会有公司赞助该会议并获得在会场展示的机会。2017年度会议的官方网址为:http://cvpr2017.thecvf.com/。
(3)ACL(The Association for Computational Linguistics,国际计算语言学协会)是世界上影响力最大、最具活力的国际学术组织,该协会每年主办一届的 ACL 国际计算语言学会议是自然语言处理与计算语言学领域最高级别的学术会议。2017年度会议的官方网址为:http://acl2017.org/。
(4)NIPS(Conference and Workshop on Neural Information Processing Systems,神经信息处理系统大会),是一个关于机器学习和计算神经科学的顶级国际会议。该会议固定在每年的12月举行,由NIPS基金会主办。NIPS是CCF认定的人工智能、机器学习领域的A级会议。会议的官方网址为:https://nips.cc/。
(5)ICML(International Conference on Machine Learning,国际机器学习大会),是由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议,可以说代表了当今机器学习学术界的最高水平。2017年度会议的官方网址为:https://2017.icml.cc/。
(6)ICLR(International Conference on Learning Representations,国际学习表征会议),自2013年以来每年举办一届,已被学术研究者们广泛认可为“深度学习的顶级会议”,ICLR 有一点和其他的会议有非常大的不同,就是论文通过 Open Review(https://openreview.net/)进行投稿与评选,在评选过程中所有研究者均可对提交论文中的内容提出批评或赞同意见,而不仅仅局限于官方的程序委员会,这对于提高论文的质量来说,是一种非常好的方法。会议的官方网址为:http://www.iclr.cc。
(7)CCAI(中国人工智能大会),是由中国人工智能学会发起的国内级别最高、规模最大的人工智能大会,目前已成功举办两届。大会持续汇聚全球人工智能领域的顶级专家、学者和产业界优秀人才,打造中国人工智能领域产、学、研紧密结合的高端前沿交流平台。会议的官方网址为:http://ccai.caai.cn/。
(8)AI WORLD(世界人工智能大会)。1956年人工智能肇始于美国达特茅斯会议,2016年是“人工智能(AI)”概念提出60周年。60是一甲子,AI 也来到了新元年,随着2015年年末国内外科技巨头纷纷布局大AI领域,谷歌、Facebook、百度等企业掀起深度学习平台开源运动,2016年10月18日,在北京国家会议中心举办了 AI WORLD 2016世界人工智能大会,该会议的官方网址为:http://www.aiworld2016.com/。
2.国内大数据/人工智能创新创业比赛
(1)中国机器人及人工智能大赛,是国内首个提出在机器人及人工智能领域,将关键技术的研发与应用有机结合的比赛,由中国人工智能学会、教育部高等学校计算机基础课程教学指导委员会主办。顺应国内外人工智能研发应用的大趋势,大赛将围绕机器人技术研发和人工智能应用领域创新展开赛事,策划“机器人比赛”和“创新比赛”两大项比赛项目,同期举办中国智能产业高峰论坛等活动。大赛将以专业赛事、高峰研讨、企业评选等多种形式互联互通,众智汇聚,促进机器人及人工智能领域间合作交流。官方网址为:http://robot-aievent.com/。
(2)2017中国大数据人工智能创新创业大赛,由上海大数据联盟、上海大数据产业基地(市北高新)、中国信息通信研究院主办,华院数翼联合主办,聚焦智慧医疗、科技金融两大垂直领域,独创“创业赛”+“技术赛”交叉赛模式,以大数据人工智能作为核动力,旨在通过整合国内企业、科研机构、行业组织力量,根据市场真实需求,解决领域痛点,挖掘行业创新应用,将大数据人工智能引入到具体应用场景中。大赛特设高额创投基金及高额技术大赛奖金,挖掘该领域优秀创业团队和技术人才,掀起大数据与人工智能行业应用的高潮。官方网址为:http://www.datadreams.org/,在网站上有历年主题比赛的相关规则和训练、测试数据集可供下载。
3.AI 开源数据集
今天要构造 AI 或机器学习系统,相比于以往已经容易许多,我们不仅有许多最前沿的开源工具如 Caffe、TensorFlow、Torch、Spark 等,也有 AWS、Google Cloud 等云服务提供商提供强大的计算与存储服务,这意味着可以在咖啡厅用 Surface 在线训练属于个人的 AI 模型。重要的是,在数据集上表现得性能良好并不能保证机器学习系统在真实的产品场景中表现良好。许多做AI的人忘记了构建新AI解决方案或开发产品最难的部分不是 AI 本身或者算法,而是数据的收集和标记。标准数据集可以用于验证模型,或作为构建更加定制化解决方案的一个好的起点。
但要时刻记住,拥有充足的数据集是取得 AI 革命胜利的关键。得益于各大研究机构和企业的辛苦工作与开放观念(意识到数据民主化对 AI 发展的重大意义),现在有机会获取大量有标签和注释的优质数据。然而,大多数包含机器学习或 AI 的产品都更依赖于专有数据集,而这些数据集往往是不公开的。
网络资源 http://www.sohu.com/a/126913367_473283.html 中是 AI 爱好者精心收集的开源数据集,按照计算机视觉、自然语言处理、语音识别、地理空间数据等人工智能的子领域分类,每个数据集均附有下载链接,是做 AI 研究不容错过的资源。