难度 中高级
学习时间 共17周(每周8-10小时)
基础准备 掌握Python编程,机器学习基础
立即试听

如果你觉得小菜一碟

高手请转战这里

搭建企业级视觉系统

导师介绍
袁源
美国微软总部和美国亚马逊总部的资深推荐系统工程师、主导多款核心推荐系统的研发,是人工智能、分布式系统、云计算方面的专家。 博士毕业于美国新泽西理工,拥有14年人工智能、推荐系统、自然语言处理、数字图像和视频处理项目经验。曾师从中国科学院王守觉院士从事人脸识别研究、共同发表论文。在美国博士期间,主要研究NASA(美国航天局)支持的基于人工智能的空间天气预测项目。先后在AI相关会议和杂志上发表过15篇以上的论文。
课程研发团队
  • vince
    李文哲
    曾任凡普金科集团(爱钱进)的首席数据科学家、美国亚马逊和高盛的高级工程师,负责过金融知识图谱、聊天机器人、量化交易、自适应教育系统等核心项目。美国南加州大学博士,先后在AAAI、KDD、AISTATS、CHI、IAAI等国际顶会议上发表过15篇以上论文、并荣获IAAI、IPDPS最佳论文奖。
  • 大周
    大周
    技术领域、数据分析领域专家。曾任百度资深工程师、凡普金科和国美金融技术负责人。拥有8年以上、大数据和AI方面的实战经验,先后负责过金融风控、知识图谱、计算机视觉、聊天机器人等多个公司级的核心项目。多家在线教育平台的金牌讲师,拥有丰富的授课经验。
  • Henry
    史源
    美国人工智能基金管理人。拥有10多年人工智能领域相关研发和研究经历。美国南加州大学人工智能博士,卡耐基梅隆大学机器人系访问学者,先后在 ICML、AAAI、IJCAI、ICDM等国际顶级会议上发表数篇论文,引用次数高达1000。
  • Wenkel
    蓝振忠
    现任Google科学家,曾任美国智能监控公司的首席科学家,对视频和多媒体的智能分析有深入研究。美国卡耐基梅隆大学博士、先后在NIPS、CVPR、ICCV、IJCAI、ICDM等国际顶级会议上发表过25篇以上的论文,论文引用次数上千。
课程亮点

双师教学 顶级团队

一线技术专家亲自授课;同时为学员配备了经验丰富的助教团队,均毕业于美国顶尖高校。

最专业、最体系化的课程

在市面上能找到的最专业的、最有体系化的深度学习课程。从模型讲解、公式推导到实际案例实操、公司级项目实操;由浅入深的完成课程体系,帮助学员理解技术深层次的本质关系。

产学结合 真实案例

导师助教团队带领学员完成真实的工业级项目。整个课程涵盖4个大真实企业级项目,而且每个项目侧重的技能点不同,让学员的知识体系更加全面。

Capstone项目

学员有机会选择并完成自己感兴趣的课题,无论应用性的还是学术性的课题,导师助教团队都可以很好地指导你。或许这样的一个项目可以让你实现拥有顶会论文的目标。

金牌助教 24h辅导

博士助教团队提供在线答疑,代码审核,帮助学员快速解决问题,消灭“拦路虎”,消除盲点,不怕学不会!

就业面试指导,就业推荐

在课程的最后阶段,我们的导师助教团队会给学员提供个性化的就业面试指导。对于优秀毕业生,我们会帮你内推一线AI企业的岗位。
适合人群
1

有一定Python编程基础的学员,但不需要机器学习或深度学习相关基础

2

想找深度学习/计算机视觉方向算法相关工作的学员

3

自学深度学习,但缺乏正确指点学习效率低的学员

4

已经自主完成深度学习理论学习,但继续项目实操/代码经验的学员

5

想转型从事AI工作的学员

您将获得

精通深度学习、计算机视觉技术,掌握AI领域最核心技能!

完成AI小白到大神的逆袭!

可获得专业、权威的结业证书,证明自己!

优秀学员可获得名企就业/实习内推机会,甚至面试绿色通道!

什么是计算机视觉工程师?

计算机视觉工程师, 通常指代创建视觉算法以识别图像模式的软件开发人员,或者在其应用程序中使用该软件的工程师(自动化制造,质量控制,零件处理)等。 一图胜千言,人类生活中80%的信息是靠视觉的方式获取的,随着近些年深度学习在计算机视觉任务上面取得巨大进步,我们相信计算机视觉的应用将会大幅的提升。相对于普通的网站,服务器后端,手机APP开发人员,计算机视觉工程师的职位薪资更高,而且人才相对缺乏,最重要的是将来的成长空间巨大。

就业方向有哪几类?
1
世界一流大公司的AI实验室
谷歌,微软,脸书,苹果,华为,阿里,腾讯,百度都有专门做计算机视觉的研究室。
2
汽车制造商
几乎所有汽车公司都在做自动驾驶,计算机视觉是自动驾驶不可缺少的部分,自动驾驶方案提供商(Nuro,Aurora,百度,蔚蓝)。
3
图像应用公司
例如Adobe(生产Photoshop), 美图、图森、深鉴、商汤、云从、依图、旷视和格灵深瞳。
4
机器人公司
计算机视觉是机器人的核心技术,中国的机器人公司有地平线、大疆。将来机器人会被用于战争等紧急情况,所以国防、消防救援、核电站、挖矿等领域也会大有可为。
5
医疗器械公司
医学图像处理、核磁共振、断层扫描等等,医疗行业的利润率都非常高,著名的公司有飞利浦、西门子、通用、日立。现在中国也开始发展自己的医疗器械公司了,联影医疗2017年A轮融资33.33亿,阿里健康也投资了2.25亿到万里云。
6
工业级图像解决方案
包括高速路上的收费、执法摄像头,机场火车站安检摄像头,工业流水线上的摄像头,嵌入了人脸或次品识别的芯片,智能地识别罪犯、次品等等。
你将完成的项目
Project1:【经典CV】综合项目之Image Captioning
【项目介绍】Image Captioning是让计算机自动对图像的内容产生一段描述性的文字。Image Captioning结合了计算机视觉和自然语言处理的技术。首先需要计算机能够理解图像中包含的物体,然后需要计算机理解物体与物体,物体与环境之间的关系,最后要结合自然语言处理的技术将计算机“看”到的场景描述出来。
【技术应用场景】主要应用场景为将图像产生的文字描述用于图像搜索,搜索引擎中的图片搜索就是这个技术。此技术也可以用于为视频生成描述, 进一步可以支持视频检索。主要应用于安防监控系统,例如自动描述图像内容, 产生的描述为: 有一个中年男子正在偷东西。计算机可以自动报警。
Project2:【无人驾驶】交通指示牌识别之CNN
【项目介绍】给定一张包含交通指示牌的图片,例如:限速80,单行道等等。图片是在真实场景下面捕捉的, 有如下的问题: 光照不均衡,有积雪/树叶遮挡,分辨率非常低,夜间反光。我们需要在各种复杂场景下面达到98%以上的识别准确率。
【技术应用场景】这个项目是一个典型的深度学习在计算机视觉领域的应用,具有广泛的应用范围。根据汽车前方摄像头捕捉的画面控制汽车方向盘转动的方向和角度是自动驾驶要解决的核心问题。除了无人驾驶的应用场景,您还能够将掌握的知识用于人脸识别,商品识别(无人超市),鉴黄,安全监控,OCR等许多领域。
Project3:【无人驾驶】方向盘自动转向之CNN
【项目介绍】自动驾驶里面最需要解决的问题: 给定车载摄像头捕捉的画面,判断如何转动方向, 预测方向盘的方向和角度。这一个项目旨在向您介绍如何使用深度神经网络解决回归(Regression)的问题。不同于分类识别(Classification/Recognition)等场景, 回归问题场景中,神经网络输出的值是一个连续的值。
【技术应用场景】此技术是一个典型的回顾问题, 可以用于所有基于图像的回顾问题, 例如: 自动驾驶之油门的大小控制、无人驾驶的轮船、无人机的驾驶、预测图像中一个人的年龄、预测图像中的物体的尺寸、预测图像中物体离摄像头的距离等。
Project4:【无人驾驶】目标检测之SSD
【项目介绍】通过汽车前方摄像头捕捉的画面,定位其中的物体(行人、车辆、自行车等等)是保证自动驾驶汽车安全行驶不可缺少的技术。目标检测包含图像的定位和分类识别,需要同时解决回归(Regression)和分类(Classification)的问题。
【技术应用场景】此项目用到的技术是目标检测,同时包含了分类识别和回归的多任务,是计算机视觉要解决的一个根本性问题: 图像包含了什么物体,它们的位置在哪儿,大小是什么。这项技术可以用于多个场景,例如: 无人超市,判断是否货架缺货了,缺什么货,哪一个货架;军事里面需要做战场图片中的敌我识别,给定敌方的物体的位置;工业探伤: 自动从图像里面发现残次品, 把残次品从正品里面分离等。
Project5:【无人驾驶】交通指示牌识别之二值化神经网络
【项目介绍】传统的深度神经网络的权值都是浮点数。 二值化神经网络使用二进制的值来表示网络的权值。二值化神经网络有两个优点:1.训练出的网络模型小(理论上小32倍) 2.容易使用硬件做高效实现, 使得预测速度快。我们将通过重复交通指示牌识别的项目,看出BNNs这个网络结构的优势。
【技术应用场景】此技术可以任何深度学习场景,目标是减少模型的大小和预测的计算速度。我们常常需要将深度学习用于手机和其它IOT设备,这些硬件的内存小,电量有限,计算能力有限。直接使用的话效果不现实,二值化神经网络提供了一个比较好的解决方案,它使得我们可以牺牲一点性能的前提下在计算受限情况下使用深度神经网络。
Project6:【无人驾驶】方向盘转向之效率网络
【项目介绍】效率网络的目标是在不牺牲深度神经网络性能的前提下尽量减少网络模型的大小和计算量。自动驾驶需要在极短的情况下做出精准的预测, 效率网络可以在不牺牲性能的情况下做到这一点。
【技术应用场景】之前的效率网络为我们提供了一个提供了一个减少模型的大小和预测的计算速度解决方案。 效率网络对模型的大小的减少没有二值化网络那么明显,但是效率网络能够保持普通深度网络的性能, 适合对网络输出结果的准确性要求非常高的应用场景。
Project7:【经典CV】人脸识别之孪生网络
【项目介绍】对于办公室刷脸打卡的场景,每天都可能有新的员工到来或者离职. 增加/删除员工等价于增加/删除类别,传统的深度学习需要重新训练网络,开销非常大。如果做到一次训练, 增加/删除员工无需重新训练网络模型呢个,孪生网络是一个解决方案。
【技术应用场景】此项目用到的技术是One-shot learning(一次性学习)。One-shot learning可以极大的降低由于重新训练所需的工作量。没有One-shot learning,每增加一个类别就需要重新训练, 极大的限制了深度学习的应用场景。
Project8:【经典CV】手写字符识别之胶囊网络
【项目介绍】收集数据是一个非常费时费力的工作,而传统的深度学习需要大量的数据. 胶囊网络的目标是使用少量数据就能进行深度学习。这一个项目我们将使用胶囊网络进行手写字符识。
【技术应用场景】此技术可以任何深度学习场景, 目标是减少对训练数据的需要, 节约收集数据的开销。
课程大纲
第一章:课程介绍、编程环境配置、逻辑回归
第二章:神经网络
第三章:深度神经网络
第四章:递归神经网络LSTM
Project1-看图说话
第五章:深度学习的可解释性
第六章:图像处理和计算机视觉简介
Project2-图像识别之交通指示牌识别
第七章:用于视觉识别的卷积特征
第八章:物体检测
Project3(开放式项目)-自动驾驶之方向盘操纵
第九章:图像分割和合成
Project4-目标检测之道路行人车辆检测
Project5-二值化神经网络(BNNs)
Project6-效率网络EffNet(MobileNet的进步版本)
Project7-孪生网络(SiameseNet)
Project8-胶囊网络(Capsule Neural Networks)

获赞无数的训练营课程体系

优质的课程内容和强大的导师被学员们疯狂点赞

学员评价

人人都有技术产出,小论文发在知乎上被疯狂点赞,秒变知乎大V

常见问题

Q:参加本次课程有什么要求吗?

A:本次课程适合具备一定编程基础的开发人员,以及对自然语言处理和人工智能有兴趣的践行者。

Q:学员会有实际实操的机会?

A:这是本课程设计的核心,课程设计以理论+实践的方式,带你实战典型的行业应用。

Q:本课程怎么答疑?

A:本课程会配有专门助教团队,对于学员的问题,及时提供在线答疑。