课程简介

自然语言处理(NLP)是近年来AI业界最火的方向之一。深度学习使得各类计算机视觉中各种曾经不可能完成的任务成为了可能,然而自然语言处理中还存在着各种各样深度学习无法完美解决的问题。机器翻译、问答系统、聊天机器人、文本归类、文本搜索,每一个问题的解决都价值万金。

有问题就有机遇,业界对于NLP的人才已经达到了求贤若渴的地步。在本NLP就业班中,BAT大咖小班教学,保证就业,带领大家深入学习自然语言处理中的各种经典与前沿问题,为大家找到理想的工作保驾护航。

为了更好的保证就业,本课程首先于五月底进行了第一次升级:

  • 内容升级:新增两个阶段,从四个阶段的内容增加到六个阶段的内容;
  • 项目升级:新增文本分类、机器翻译、问答系统、文本摘要、命名实体识别、聊天机器人等六大项目;
  • 就业升级:直接邀请BAT等一线互联网企业入驻七月在线招聘平台,且就业部辅助BAT大咖讲师做简历指导、就业内推。

然后很快,课程又进行了第二次更大的升级,把前六周中本来一周一次直播直接改成一周两次直播,相当于直接新增了如下六次直播(更重要的是课程没涨价):

  • 1. NLP基础技术梳理;
  • 2. 各种前沿神经网络模型在分类任务中的应用;
  • 3. 大规模无监督预训练语言模型与应用;
  • 4. GAN与VAE在NLP领域的应用;
  • 5. 贝叶斯方法在NLP中的应用;
  • 6. 实战项目的辅导与展示。

面向群体: 因为本课程采用严格筛选制(通过率不到1/3),需要具备一定的基础能力才能入营,故以下同学优先:

  • 高校CS,数学理工科相关专业的往届或应届研究生,985或211的同学优先
  • 有2年以上开发经验或数据分析经验的本科生
  • 已有一定的机器学习、深度学习基础,比如学过七月在线的ML、DL课程

课程安排

  • 第一部分 报名审核

    申请学员(以下简称学员)填写报名申请表并附上简历,电话或远程面试通过后,才视为报名成功,然后学员和七月在线(以下简称机构)双方签订培训合同。

  • 第二部分 内容安排

    课程开始前,提供预习视频预习,课程开始后,每周安排直播、录播、实训、答疑,然后每两周考试一次,顺利通过阶段考试的学员,才能进入下一阶段的学习。未能通过考核的重新学习,做查漏补缺。

    第一阶段 预习NLP基础

    在线视频:NLP基础技能

    • 1-NLP背景、意义与常见问题
    • 2-文本处理技能:中英文字符串处理、工具分词、基本统计、正则表达式

    在线实训:文本数据清洗、提取、分词与统计

    在线视频:从语言模型到朴素贝叶斯

    • 1-语言模型与计算
    • 2-朴素贝叶斯

    在线实训:文本情感分析案例与新闻分类

    在线视频:深度学习与NLP简单应用

    • 1-循环神经网络
    • 2-BPTT算法

    在线实训:模仿小四与李白写作的生成模型

    在线直播:NLP基础技术梳理

    • 1-NLP学习路线
    • 2-通过课程实例理解NLP中的关键技术点:预处理、特征提取等
    • 3-NLP常问面试题:如CRF,以及神经网络在nlp中的应用等

    在线直播:如何更好的做NLP

    • 1-浅谈找工作的策略
    • 2-"resume driven development"
    • 3-训练自己的沟通与面试技巧
    • 4-课程项目brainstorm
    • 5-在线答疑

    第二阶段 巩固深度学习与pytorch实战

    在线视频:深度学习回顾与PyTorch简介

    • 1-神经网络模型回顾(线性层、非线性激活函数、SoftMax),用PyTorch定义神经网络模型
    • 2-损失函数,用PyTorch定义计算损失
    • 3-反向传播算法,用PyTorch做反向传播
    • 4-优化模型,PyTorch optimizer

    在线实训:用PyTorch编写一个简单的分类器

    在线视频:语言模型

    • 1-循环神经网络(RNN)、LSTM、GRU
    • 2-语言模型

    在线实训:用PyTorch训练语言模型

    在线视频:自然语言分类任务

    • 1-词包模型
    • 2-循环神经网络
    • 3-卷积神经网络

    在线实训:用三种神经网络做文本分类

    在线直播:NLP应用之文本分类系统

    • 1-实训:CNN做文本分类
    • 2-在线答疑

    在线直播:各种前沿神经网络模型在分类任务中的应用

    • 1-CNN + RNN神经网络在分类任务中的应用
    • 2-attention神经网络在分类任务中的应用
    • 3-elmo神经网络在分类任务中的
    • 4-其他前沿技术在分类任务中的应用

    第三阶段 词向量与预训练模型

    在线视频:词向量与相关应用

    • 1-从one-hot到word2vec

    在线实训:借助词向量的机器学习/深度学习文本分类

    在线视频: 词向量实战

    • 1-词向量、word2vec
    • 2-negative sampling
    • 3-词向量的特性和应用

    在线实训:用PyTorch训练词向量

    在线直播:大规模无监督预训练语言模型与应用(上)

    • 1-预训练词向量
    • 2-预训练句子向量
    • 3-Contextualized Word Vectors
    • 4-ElMo、BERT
    • 5-在线答疑

    在线直播:大规模无监督预训练语言模型与应用(下)

    • 1-OpenAI GPT、GPT-2、Transformer XL、XLNet
    • 2-预训练语言模型在多任务上的强大表现及其未来
    • 3-在线答疑

    第四阶段 机器翻译模型

    在线视频: 基于统计的翻译系统

    • 1-语言模型与翻译模型
    • 2-对齐模型

    在线实训 :基于统计的翻译系统搭建

    在线视频: Seq2Seq与Attention机制及其应用

    • 1-机器翻译
    • 2-聊天机器人

    在线实训 :利用Seq2Seq+Attention模型训练一个翻译模型

    在线直播:再谈机器翻译与Seq2Seq

    • 1-Encoder Decoder架构和注意力机制
    • 2-不需要RNN的Transformer模型
    • 3-Subword与BPE
    • 4-Beam Search
    • 5-机器翻译应用
    • 6-文本摘要应用
    • 7-在线答疑

    在线直播:GAN与VAE在NLP领域的应用

    • 1-GAN模型及其应用
    • 2-VAE模型和应用
    • 3-文本情感迁移问题
    • 4-在线答疑

    第五阶段 结构化预测

    在线视频: 隐马尔科夫模型及其应用

    • 1-隐马尔科夫模型

    在线视频: 条件随机场与应用

    • 1-最大熵与词性标注
    • 2-条件随机场

    在线直播:结构化预测与问答系统

    • 1-结构化预测(structured prediction)相关问题
    • 2-SQuAD、CNNDM等几类流行的问答数据集
    • 3-基于Attention机制的问答模型
    • 4-在线答疑

    在线直播:贝叶斯方法在NLP中的应用

    • 1-LDA模型
    • 2-MCMC与Gibbs采样
    • 3-非参数模型
    • 4-在线答疑

    第六阶段 问答系统和聊天机器人

    在线视频: 问答系统

    • 1-问答系统
    • 2-文本摘要问题
    • 3-大规模预训练语言模型

    在线实训 :训练一个问答系统

    在线视频:简单易用的聊天机器人开发平台与展望

    • 1-简介Wit.ai、BotFramework等等框架

    在线实训 :打造真实场景中的deploy聊天机器人

    在线直播: 生成模型

    • 1-聊天机器人的构建方法
    • 2-句子生成与写稿机器人
    • 3-利用结构化数据生成语言
    • 4-在线答疑

    在线直播: 项目报告展示

    • 1-展示班内同学的项目成果
    • 2-在线答疑
  • 第三部分 实战项目

    在课程进行的后半段,学员根据自己的兴趣和求职的方向选择实战项目:
    • 课程第五周,每位学员需要提交项目proposal,讲师提供相关指导和反馈。
    • 课程第七周,学员上交项目中期报告,讲师提供指导。
    • 课程第九周,学员上交项目的报告和代码,讲师对项目成果进行打分和反馈。

    在线直播: FAQ问答机器人

    在线直播: 中文文本摘要系统

    在线直播: 基于文本的问答系统

    在线直播: 基于seq2seq的生成式聊天机器人

    可供选择的实战项目包括:
    • 实战项目一

      文本分类系统

      NLP的经典任务,但应用场景也非常广泛。情感分类被应用于利用网上评论打分,探究金融市场情绪。主题分类被应用于新闻分类,intent classification被用于构建聊天机器人。

    • 实战项目二

      机器翻译系统

      Seq2Seq+Attention最成功的应用。借用神经网络,如今的翻译系统已经远远不止是字面翻译,而是能够像人类一样翻译出连冠通顺地道的语言。

    • 实战项目三

      问答系统

      用深度学习模型自动回答问题。此类系统在搜索引擎,对话系统,智能客服中都被广泛应用。在传统搜索引擎上更进一步,问答系统能从返回的文本中提取最相关的部分用于回答问题。

    • 实战项目四

      文本摘要

      随着互联网上文本数据越来越多,对文本“降维”成为了一个关键需求。文本摘要系统的目标是对新闻,论文以及各类长文本化繁为简,归纳成短文章,以帮助读者迅速了解文本概要,此类模型可以大致分为抽取式和生成式两类。

    • 实战项目五

      命名实体识别

      从一篇长文章中提取出命名实体,是很多NLP任务的前置预处理步骤。例如在对话系统中,往往需要抽取出实习信息,用于记录聊天状态。从文本构建知识图谱,也会需要首先抽取出实体,然后再明确实体间关系。

    • 实战项目六

      聊天机器人系统

      NLP的终极目标。聊天机器人也分很多种,有任务式也有开放式的聊天机器人。由于构建聊天机器人是一个困难的问题,学员们也可以尝试解决其中的一些子问题,例如intent classification, dialogue state tracking等等。

    • 实战项目七

      评估近几年非常火的预训练模型

      ELMo和BERT是近年来NLP领域的新宠,此类模型能够在少量训练数据的情况下在各个NLP任务上达到极好的效果。

    • 同时,指导学员参加各种比赛,积累项目经验的同时还有机会赢取奖金。

  • 第四部分 面试求职

    针对特定方向的定制化项目(如聊天机器人项目),进行项目与简历的最终调整与完善。然后安排名企面试官模拟面试与内推,面试与反馈迭代,最终帮助学员成功拿到offer。

    第一阶段 简历与项目定制

    • 1-大型公司的招聘方向与需求分析,并选择方向,然后针对特定方向的定制化项目,进行简历调整与完善:一份优质简历的基本原则、你的简历是怎么进出人才资源池的、校招/社招面试官是怎么阅读简历的
    • 2-实用面试技巧若干

    第二阶段 面试辅导与内推

    • 1-名企面试官模拟面试与内推 (BAT大咖讲师会给班级里面的每一位学员电话面试,按照BAT中AI/推荐算法工程师岗位的要求来面试并且打分,并当场给予分数反馈和调整建议)
    • 2-面试与反馈迭代
    • 注:实战项目会根据市场环境,学员综合情况动态调整。
  • 第五部分 入职护航

    针对学员入职后工作上遇到的技术方面问题,进行一周的跟踪服务,为学员稳定就业保驾护航。

讲师介绍

  • 褚博士

    芝加哥大学计算机博士,研究方向为NLP,熟练当前深度学习在NLP领域的模型与应用,以及pytorch、pandas等python库,设计的jupyter notebook和作业备受学员称赞,主讲的七月在线《PyTorch的入门与实战》更是被学员誉为最好的PyTorch课。

时间安排

2019年7月29日开学,越早报名越早享受到BAT大咖的一对一个性化定制。

一个半月的学习周期(包括直播、录播、实训、答疑、考试),一个半月的项目和就业周期,且配备全职科学家、全职助教、全职就业老师辅助讲师进行课程答疑、项目辅导、简历指导、就业内推。

课程价格

收费:¥21000,包含课程费用、项目费用、就业费用,审核通过且报名后签订就业协议,了解详情或优惠,敬请咨询。

报名流程

报名本就业班的步骤如下

  • 1、点击此处,下载申请表
  • 2、填写好申请表后,和简历一并发送至邮箱: july@julyedu.com
  • 3、我们会在两个工作日之内沟通后续事宜

PS:申请表和简历不得造假(包括但不限于:学历不得造假、教育经历不得造假、工作履历不得造假,一经发现,立即取消入学资格,且相关后果自负)。

课程咨询

周老师:18910848502(微信同步)

email:july@julyedu.com

¥21000:课程全新升级,咨询可优惠

七月内报名加送:新VIP[包未来一年在线课程和全年GPU]

  • 课程 {{item.course_title}} {{item.simpledescription}}
    去使用 去使用 有效期{{item.expire_time}}天
    优惠券 {{item.price}} 元 全场通用 仅用于{{item.course_title}}
领取
领取成功