难度 中级
学习时间 17周(每周6小时)
基础准备 Python
立即试听 获取大纲
讲师介绍

李文哲

自然语言处理、知识图谱领域专家

人工智能、知识图谱领域专家。曾任凡普金科集团(爱钱进) 的首席数据科学家、 北京会牛科技的首席科学家兼投资总监 、美国亚马逊和高盛的高级工程师,负责过金融知识图谱、聊天机器人、量化交易、自适应教育系统等核心项目,并兼任多家创业公司的技术顾问。美国南加州大学博士,荷兰阿姆斯特丹访问学生,先后在AAAI、KDD、AISTATS、CHI、IAAI等国际顶会议上发表过15篇以上论文、并荣获IAAI、IPDPS-Parlearning、CISC-W 的Best Paper Award。
课程研发团队
  • 大周
    课程研发团队
    袁源,美国微软总部和美国亚马逊总部的资深推荐系统工程师、主导多款核心推荐系统的研发,是人工智能、分布式系统、云计算方面的专家。 博士毕业于美国新泽西理工,拥有14年人工智能、推荐系统、自然语言处理、数字图像和视频处理项目经验。
  • 大周
    课程研发团队
    大周,技术领域、数据分析领域专家。曾任百度资深工程师、凡普金科和国美金融技术负责人。拥有8年以上、大数据和AI方面的实战经验,先后负责过金融风控、知识图谱、计算机视觉、聊天机器人等多个公司级的核心项目。多家在线教育平台的金牌讲师,拥有丰富的授课经验。
  • Henry
    课程研发团队
    史源,美国政府人工智能基金管理人。拥有10多年人工智能领域相关研发和研究经历。美国南加州大学人工智能博士,卡耐基梅隆大学机器人系访问学者,先后在 ICML、AAAI、IJCAI、ICDM等国际顶级会议上发表数篇论文,引用次数高达1000。
  • Wenkel
    课程研发团队
    蓝振忠,现任Google科学家,曾任美国智能监控公司的首席科学家,对视频和多媒体的智能分析有深入研究。美国卡耐基梅隆大学博士、先后在NIPS、CVPR、ICCV、IJCAI、ICDM等国际顶级会议上发表过25篇以上的论文,论文引用次数上千。
课程亮点

双师教学 顶级团队

一线技术专家亲自授课;同时为学员配备了经验丰富的助教团队,均毕业于美国顶尖高校。

金牌助教 24h辅导

博士助教团队提供在线答疑,代码审核,帮助学员快速解决问题,消灭“拦路虎”,消除盲点,不怕学不会!

产学结合 真实案例

课程涵盖10个实习项目+Capstone项目,且侧重技能不同,学员的知识体系会更加全面。

小班精学,全程监督

小班授课,小群互动,班主任日日陪伴,全程督学,关注你点滴进步,不怕拖延症。

Capstone(付费项目)

学员有机会选择并完成自己感兴趣的课题,无论应用性的还是学术性的课题,导师助教团队都可以很好地指导你。或许这样的一个项目可以让你实现拥有顶会论文的目标。

最专业、最体系化的课程

从传统NLP技术到基于深度学习的NLP技术,帮助学员理解技术深层次的本质关系。

前沿顶会论文深度解读

我们将邀请国内外的AI博士与资深工程师,来对NIPS, ICML,ACL, EMNLP等AI顶级会议的热点paper进行详解与讨论。

就业面试指导,就业推荐

在课程末期,导师助教团队会给学员提供个性化就业面试指导。成绩优异者,还会帮你内推一线AI企业的岗位。

适合什么样的人群

有一定Python编程基础,但不要求NLP相关基础;

想要找自然语言处理/算法相关工作的学员;

想要体系化学习NLP完整知识的学员;

想要接触NLP前沿技术和提高学术能力的学员;

您将获得

掌握处理非结构化文本数据,完成知识抽取、NLU、多轮对话决策、逻辑推理等NLP核心技术;

深入理解分词、语义分析、语义表示、文本匹配、文本分类、主题识别等NLP主流领域;

掌握词向量如word2vec等以及NLP相关的深度学习(RNN、LSTM、Bert等)相关知识;

掌握NLP传统、机器学习及深度学习算法,完成QA系统、机器翻译、知识图谱、聊天机器人等实战项目。

项目列表

问答系统

从零开始搭建一个完整的问答系统。给定一个语料库(问题和答案对),对于用户的输入需要返回最适合的答案。涉及到的模块:1. 对于用户的输入需要做拼写纠错,这部分会用到语言模型 2. 之后对输入做文本的预处理,过滤等操作。 3. 把文本转换成向量形式,这里需要用到tf-idf, word2vec等相关的技术。 4. 针对于语料库,为了提升效率需要创建倒排表。 5. 基于相似度的计算来获得最优的答案。

情感分析系统

基于给定数据,来搭建一个完整的情感分析系统。项目涉及到的模块: 1. 数据的预处理 2. 特征工程,这部分是本项目的核心。 3. 监督学习模型的选择与调参。调参的过程需要尝试不同的优化策略。

知识图谱系统

利用非结构化数据来搭建知识图谱。项目涉及到的模块:1. 从非结构化数据中抽取实体,以及词典库的构建 2. 关系的抽取(指定的关系) 3. 实体统一以及实体消歧。 4. 知识图谱的构建以及查询

对话系统中的NLU

基于给定的对话数据来构建NLU识别部分,并结果用于聊天机器人中。 项目涉及到的模块: 1. 文本特征的提取 2. 搭建CRF模型来识别关键词 3. 搭建LSTM-CRF模型来识别关键词。

机器翻译系统

搭建一个完整的机器翻译系统。这里使用的方法论是端到端的方法。项目需要使用两种不同的方法: 1. 基于多层LSTM+Attention的方法。2. 基于多层Transformer, Bert的方法。

任务导向型聊天机器人

搭建一个完整的聊天机器人,用来服务搜索餐厅。项目涉及到的模块:1. 文本预处理 2. 意图识别和关键信息抽取 3. 对于每一个意图设计对话管理状态机 4. 设计上下文处理的方法 5. 对话生成模块 6. 处理一些常见的boundary case。

开放型Capstone项目(付费项目)

这是一个开放性的项目,学员根据自己的兴趣可以选择方向以及题目,导师以及助教团队会全程指导你完成。选择的项目可以围绕自己所熟悉的任何NLP场景,也可以是纯学术性的,当然针对学术性的项目,如果有一定创新性,导师团队也可以协助你发表顶会论文。项目的中期和最后,会有简短的学员项目展示环节,导师和助教团队会提供建设性的意见。

课程大纲
Part1:基础概论
Part2:问答系统
Part3:情感分析系统
Part4:知识图谱系统
Part5:对话系统中的NLU
Part6:机器翻译系统
Part7:任务导向型聊天机器人
Part8:职业规划以及面试指导
常见问题

Q:参加本次课程有什么要求吗?

A:本次课程适合具备一定编程基础的开发人员,以及对自然语言处理和人工智能有兴趣的践行者。

Q:学员会有实际实操的机会?

A:这是本课程设计的核心,课程设计以理论+实践的方式,带你实战典型的行业应用。

Q:本课程怎么答疑?

A:本课程会配有专门助教团队,对于学员的问题,及时提供在线答疑。