难度 中级
学习时间 19周(每周6小时)
基础准备 Python
立即试听
讲师介绍

李文哲

自然语言处理、知识图谱领域专家

人工智能、知识图谱领域专家。曾任凡普金科集团(爱钱进) 的首席数据科学家、 北京会牛科技的首席科学家兼投资总监 、美国亚马逊和高盛的高级工程师,负责过金融知识图谱、聊天机器人、量化交易、自适应教育系统等核心项目,并兼任多家创业公司的技术顾问。美国南加州大学博士,荷兰阿姆斯特丹访问学生,先后在AAAI、KDD、AISTATS、CHI、IAAI等国际顶会议上发表过15篇以上论文、并荣获IAAI、IPDPS-Parlearning、CISC-W 的Best Paper Award。
课程研发团队
  • 大周
    课程研发团队
    袁源,美国微软总部和美国亚马逊总部的资深推荐系统工程师、主导多款核心推荐系统的研发,是人工智能、分布式系统、云计算方面的专家。 博士毕业于美国新泽西理工,拥有14年人工智能、推荐系统、自然语言处理、数字图像和视频处理项目经验。
  • 大周
    课程研发团队
    大周,技术领域、数据分析领域专家。曾任百度资深工程师、凡普金科和国美金融技术负责人。拥有8年以上、大数据和AI方面的实战经验,先后负责过金融风控、知识图谱、计算机视觉、聊天机器人等多个公司级的核心项目。多家在线教育平台的金牌讲师,拥有丰富的授课经验。
  • Henry
    课程研发团队
    史源,美国政府人工智能基金管理人。拥有10多年人工智能领域相关研发和研究经历。美国南加州大学人工智能博士,卡耐基梅隆大学机器人系访问学者,先后在 ICML、AAAI、IJCAI、ICDM等国际顶级会议上发表数篇论文,引用次数高达1000。
  • Wenkel
    课程研发团队
    蓝振忠,现任Google科学家,曾任美国智能监控公司的首席科学家,对视频和多媒体的智能分析有深入研究。美国卡耐基梅隆大学博士、先后在NIPS、CVPR、ICCV、IJCAI、ICDM等国际顶级会议上发表过25篇以上的论文,论文引用次数上千。
课程亮点

双师教学 顶级团队

一线技术专家亲自授课;同时为学员配备了经验丰富的助教团队,均毕业于美国顶尖高校。

最专业、最体系化的课程

在市面上能找到的最专业、最具有体系的课程。从传统NLP技术到基于深度学习的NLP技术,帮助学员理解技术深层次的本质关系。

产学结合 真实案例

导师助教团队带领学员完成真实的工业级项目。整个课程涵盖10个实习项目+Capstone项目,而且每个项目侧重的技能点不同,让学员的知识体系更加全面。

Capstone项目

学员有机会选择并完成自己感兴趣的课题,无论应用性的还是学术性的课题,导师助教团队都可以很好地指导你。或许这样的一个项目可以让你实现拥有顶会论文的目标。

金牌助教 24h辅导

博士助教团队提供在线答疑,代码审核,帮助学员快速解决问题,消灭“拦路虎”,消除盲点,不怕学不会!

小班精学,全称监督

小班授课,小群互动,班主任日日陪伴,全称督学,关注你点滴进步,不怕拖延症

就业面试指导,就业推荐

在课程的最后阶段,我们的导师助教团队会给学员提供个性化的就业面试指导。对于优秀毕业生,我们会帮你内推一线AI企业的岗位。

适合什么样的人群

有一定Python基础,但不需要NLP相关基础

想找自然语言处理/算法相关工作的学员

试图学好但缺乏正确指点的学员

想转型从事AI工作的学员

您将获得

精通自然语言处理技术,相当于掌握了AI领域最核心的技能!

完成AI小白到大神的逆袭!

可获得专业、权威的结业证书,证明自己!

优秀学员可获得名企就业/实习内推机会,甚至面试绿色通道!

项目列表

简易问答系统

针对百度问答数据集,利用词袋模型和检索引擎来搭建简易的问答系统。这是课程中的类似Hello World项目,迅速帮你了解NLP系统的基本工作原理。

从电商数据爬取到情感分析

通过爬虫抓取到的评论数据,搭建情感分析引擎。通过本项目加深对分布式爬虫设计、tf-idf算法、多种分类算法、贝叶斯优化技术的理解。

从零开始实现POS tagger系统

基于给定的数据集,通过编写FSA, EM算法来实现词性标注系统。 本项目帮助学员深入理解EM算法原理,有限状态机以及语言模型。

利用信息抽取技术搭建知识库

针对i给定的数据,利用NLP技术来构建小型知识图谱或者知识库。通过本项目的练习加深对信息抽取相关的技术。

语法分析在短文本中的应用

利用语法分析技术来判断两个短文本的相似度,并跟其他常见的方法做比较。通过此练习,学员对语法分析有个更深入的理解。

搭建作文自动批改系统

针对提供的训练数据,搭建作文自动评判系统。本项目涉及到Word2Vec,语言模型,分类算法,调参等知识点。

搭建中英机器翻译系统

针对提供的中英语料库,利用端到端的技术来搭建机器翻译系统。通过本项目深入理解Seq2Seq模型,调参技术以及GPU的使用。

利用深度学习搭建自适应系统中的学生学习模型

针对学生的学习数据(文本,日志,问题等)来搭建学生学习模型。此项目涉及到LSTM,Bidirectional-LSTM以及混合数据种类的处理等技术。

解释机器翻译系统

通过搭建一个可解释性引擎来理解深度学习模型的运行机理。本项目涉及到Seq2Seq模型,First-derivative, Layer-wise propagation等可视化技术。

从零开始搭建企业级聊天机器人

搭建一个完整的聊天机器人项目,主要模块包括意图识别,闲聊引擎和任务导向型聊天引擎,多伦对话引擎等。这是本课程中学员需要完成的最大的项目,涉及到各类NLP相关的知识点,具有一定的挑战性。通过此项目,学员有机会从零开始搭建一个完整的工业级系统,其中也会涉及到很多工程方面的技能(比如服务的开发等)。最后开发出一款可以承载小程序或者微信的聊天机器人。

开放式Capstone项目

这是一个开放性的项目,学员根据自己的兴趣可以选择方向以及题目,导师以及助教团队会全程指导你完成。选择的项目可以围绕自己所熟悉的任何NLP场景,也可以是纯学术性的,当然针对学术性的项目,如果有一定创新性,导师团队也可以协助你发表顶会论文。项目的中期和最后,会有简短的学员项目展示环节,导师和助教团队会提供建设性的意见。

课程大纲
第一章:介绍
第二章:基础知识
项目:搭建问答系统
第三章:搭建一个简单的问答系统
第四章:专家系统与朴素贝叶斯
项目:从电商数据爬取到情感分析系统
第五章:语言模型与逻辑回归
理论项目:最大似然以及凸优化
第六章:凸优化以及支持向量机
项目:基于非结构化数据来搭建知识图谱
第七章:自然语言处理关键技术
项目:搭建作文自动批改系统
第八章:主题模型
第九章:词向量
项目:搭建中英翻译系统
第十章:基于深度学习的自然语言处理
第十一章:高阶深度学习应用
项目:搭建深度学习的解释器
第十二章:深度学习的可解释性
项目:搭建聊天机器人
第十三章:基于深度学习的自然语言处理
Capstone项目
常见问题

Q:参加本次课程有什么要求吗?

A:本次课程适合具备一定编程基础的开发人员,以及对自然语言处理和人工智能有兴趣的践行者。

Q:学员会有实际实操的机会?

A:这是本课程设计的核心,课程设计以理论+实践的方式,带你实战典型的行业应用。

Q:本课程怎么答疑?

A:本课程会配有专门助教团队,对于学员的问题,及时提供在线答疑。