短视频推荐算法被MIT评为2021十大突破技术之一,推荐算法不仅催生短视频背后的各类新一代巨无霸字节跳动,更广泛应用于各大电商平台、视频平台、资讯平台,做推荐的薪资因此水涨船高。
本推荐高级班第十二期继续沿用七月在线推荐系统高级班的“BAT大咖小班教学”模式,以及已有的特色:
其次,相比上期,本期:
一切为更好的在职提升,或跳槽涨薪/升职加薪。
面向群体: 本课程适合已经在做AI的进一步在职提升,比如在职上班族跳槽涨薪/升职加薪,采用严格筛选制(通过率不到1/3),需要具备一定的基础能力才能报名通过,故以下同学优先:
企业项目
项目介绍:如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。
项目目标:通过本项目可以学习电商中经典的人货匹配问题,通过商品来找到购买意向强的人群,解决问题的重点是如何提取用户历史行为的变化情况,然后预测用户是否进行购买。此外,项目中也将尝试复杂的建模结构,使用包含transformer结构的深度学习模型,或者能够直接从序列中提取用户意图表示的模型,用以替代传统的xgboost等树模型。
项目时长:共4周
项目介绍:在电商场景中,推荐系统作为电商核心功能之一,对用户体验的提升有重要作用。预测用户的兴趣,为其做出合理的推荐是工业界与学术界长久以来研究的课题。经典方法包括基于内容的推荐、协同过滤等,一定程度上完成了推荐系统的任务。近年来,随着图神经网络研究的兴起,基于深度学习的GNN(Graph Neural Network)在推荐领域也逐渐称为研究热点。电商场景中, 用户、商品,以及两者之间的行为可以用一张二部图来表示。预测用户未来的行为, 转化为预测二部图中用户-商品边的概率,有更好的可解释性、可推理性。
项目流程:
1. 第一周: 项目介绍,发放计划书,熟悉推荐系统架构,准备数据,完成数据分析。
2. 第二周: 初步建模,使用召回完成基本推荐。
3. 第三周: 使用深度学习完成精排推荐。
4. 第四周: 基于GNN相关的推荐算法 ,业务评估、AB Test、项目回顾。
项目时长:共4周
项目介绍:众所周知,像用户年龄和性别这样的人口属性特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。这背后的假设是,用户对广告的偏好会随着其年龄和性别的不同而有所区别。许多行业的实践者已经多次验证了这一假设。然而,大多数验证所采用的方式都是以人口统计学属性作为输入来产生推荐结果,然后离线或者在线地对比用与不用这些输入的情况下的推荐性能。2020腾讯广告算法大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。
项目目标:提供一组用户在长度为 91 天(3 个月)的时间窗口内的广告点击历史记录作为训练数据集。每条记录中包含了日期(从 1 到 91)、用户信息(年龄,性别),被点击的广告的信息(素材 id、广告 id、产品 id、产品类目 id、广告主id、广告主行业 id 等),以及该用户当天点击该广告的次数。测试数据集将会是另一组用户的广告点击历史记录。要求同学们预测测试数据集中出现的用户的年龄和性别。
项目时长:共4周
项目介绍:多目标推荐已经成为工业界一个重要的任务,尤其像信息流式的平台,考虑点击率的同时还需要考虑其他更多指标,如观看时长、点赞、关注等。微信视频号则是需要预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率,如何将这些行为关联起来成为难点,也是极具实战意义的业务场景。
项目目标: 本次项目基于脱敏和采样后的数据信息,对于给定的一定数量到访过微信视频号“热门推荐”的用户, 根据这些用户在视频号内的历史n天的行为数据,通过算法在测试集上预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率。 本次比赛以多个行为预测结果的加权uAUC值进行评分。
项目时长:共4周
实训项目
对推荐系统召回、排序等各模块有着丰富的工程经验,阿里云天池数据科学家,在国内外各大公司举办的几千支队伍参赛的竞赛中已获得十余次冠亚军奖项。
多年BAT工作经验,在推荐系统、计算广告系统架构的搭建、实时流计算,以及相关算法技巧和运筹优化方面有丰富的经验。
就职于BAT的商业变现部门,在点击率预估、智能出价、投放策略等方面有丰富经验。
申请学员(以下简称学员)填写报名申请表并附上简历,电话或远程面试通过后,才视为报名成功,然后学员和七月在线(以下简称机构)双方签订培训合同。
课程开始前,提供预习视频预习,课程开始后,每周安排直播、录播、实训、答疑,然后每两周考试一次,顺利通过阶段考试的学员,才能进入下一阶段的学习。未能通过考核的重新学习,做查漏补缺。
在线视频:推荐业务、feed流产品及推荐算法策略架构解析
在线视频:召回算法和业界最佳实践
在线视频:搜索和推荐的matching技术
在线实训:改进版协同过滤算法实战
在线视频:用户建模(召回、排序都会用到)
在线实训:倒排索引项目实战
在线视频:用户特征和Item特征的常用方法
在线直播:召回算法进阶实战
在线视频:排序算法&深度学习模型
在线视频:Learn to Rank
在线实训:谷歌wide&deep模型实战
在线视频:商品推荐方案讨论、E&E算法以及deep learning如何作用于推荐系统中的排序
在线视频:CTR预估进阶实战(上)
在线视频:CTR预估进阶实战(下)
在线直播:2021排序算法发展趋势
在线视频:分布式机器学习系统及其在排序模型中的应用
在线视频:在线学习和相关技术
在线实训 :Online Learning 最新算法实现
在线视频:基于flink和scala的实时计算
在线视频:单机和分布式深度学习tensorflow实践
在线视频:学术界最新算法在BAT的应用
在线视频:掌握真实业务场景下的推荐算法
在线视频:多目标与多任务学习
在线视频:推荐系统最新技术、场景、方向解析
在线直播:学术界最新paper学习研究
在线直播:大厂落地新的技术点
在课程进行的后半段,学员根据自己的兴趣和求职的方向选择实战项目:
在线直播:项目1 商品购买预测的介绍与准备
在线直播:项目2 用户行为预测的介绍与准备
在线直播:项目3 2020腾讯广告算法大赛的介绍与准备
在线直播:项目4 微信视频号推荐的介绍与准备
在线直播:项目1 商品购买预测的特征工程与初步建模
在线直播:项目2 用户行为预测的特征工程与初步建模
在线直播:项目3 2020腾讯广告算法大赛的特征工程与初步建模
在线直播:项目4 微信视频号推荐的特征工程与初步建模
在线直播:项目1 商品购买预测的迭代与优化
在线直播:项目2 用户行为预测的迭代与优化
在线直播:项目3 2020腾讯广告算法大赛的迭代与优化
在线直播:项目4 微信视频号推荐的迭代与优化
在线直播:项目1 商品购买预测的评估与总结
在线直播:项目2 用户行为预测的评估与总结
在线直播:项目3 2020腾讯广告算法大赛的评估与总结
在线直播:项目4 微信视频号推荐的评估与总结
在线视频:项目5 真实场景下的文本推荐系统
在线视频:项目6 猜你喜欢场景下的推荐系统整体流程和核心技能点
在线视频:项目7 Netflix推荐竞赛整体流程和核心技能点
在线实训:项目8 基于多任务特征学习的知识图谱增强推荐
针对学员所选的实战项目,进行项目与简历的最终调整与完善。然后除了学员自己投简历找工作之外,增加内推,并跟踪每一次面试的结果,不断辅导迭代,最终拿到offer。
在线直播: 项目的总结与就业辅导
针对学员入职后工作上遇到的技术方面问题,进行一个月的跟踪服务,为学员稳定就业保驾护航。
为保护学员隐私利益,特隐晦部分敏感信息,且限于篇幅,只节选部分
“现在想想就业班这三个项目确实很好,和真实工作匹配度很高,项目三 电商平台的商品推荐系统(殷老师讲),让你了解建模构建特征过程,做项目复盘时才意识到这个只能推历史商品。而且这个比赛能拿到成绩,对面试机会有帮助。”
完整面经>“关于求职,我找工作近两个月的时间吧,前期一直被虐吧,各种被拒,也怪我自己准备的不够好,每次面试完群里的老师会帮忙复盘分析(进入就业阶段时,就业老师会根据需要帮建立多对一的就业辅导群),到了后面,开始慢慢熟悉,也变得顺手起来。”
完整面经>“本人双非计算机硕士,研究生期间接触过机器学习算法,不过都是皮毛,java开发觉得自己已经到了瓶颈期,开始萌生转推荐的想法,研究生期间july上过我们学校讲座过,第一时间就想到了七月在线报了推荐的就业班,因为平时工作忙听的是录播课程。老师们讲的都很好理论实践相结合。”
完整面经>“拿到的offer不是一线城市的,薪资自然有差距,但是培训前的3倍多近4倍(先报的机器学习集训营第十一期,学完之后再报的推荐高级班第7期)。”
完整面经>“写在最前:重要的事说三遍,推荐算法最最核心的一定一定是业务的理解程度、推荐算法最最核心的一定一定是业务的理解程度、推荐算法最最核心的一定一定是业务的理解程度。”
完整面经>“就业班对我而言,最大的帮助: 一是对整个推荐系统框架和结构有个清晰的了解,因为毕竟之前也没有接触过; 二是学习了三个推荐算法相关的项目,并写入简历,这样在面试的过程中跟面试官就有的聊了,这一点的收益应该是最大的,面试成功的几率也就大了。”
完整面经>“20年我考虑了一下自己的求职意愿,打算试试机器学习,当时选择的方向是推荐系统,于是报了推荐系统第五期就业班。后面拿到的offer有两个,一个50多万,一个60万,都是中厂,都是推荐系统方向,综合考虑选择了50多万的offer。”
完整面经>“关于就业班的情况,其他分享的面经也都有描述,比较客观:老师的能力和态度都是很好的,完全可以教给学员工作和面试中绰绰有余的东西”
完整面经>“做推荐基本都是要用到大数据,我之前没有用过spark,面试中也说了对大数据没有实际经验但是学了相关知识,实际经验也是入职后慢慢摸索的,其他的像hbase、hive、kafka、redis等等都是需要了解的。”
完整面经>“由于我报的比较早,找工作之前又听了一遍课,又重新做了一边作业和项目,老师讲得很好,有很多在校学生根本接触不到的东西,受益匪浅。”
完整面经>“最初我是想着自学,京东上排名靠前的几本书都买了,同时也跟着看大量的博客。不过这种学习方式有着巨大的问题:因为我近乎从零起步,对推荐系统领域完全没有认知,我判断不了【知识边界】。在学生时代我身上有些学霸属性,每学期期末考试之前我都能判断出老师会出哪些题。然而现在我却陷入了困境。”
完整面经>“我以前也是从事数据挖掘岗位的,由于平台相对比较小,虽然工作内容有很多推荐相关的事情,但是涉及到的算法模型也相对比较陈旧。”
完整面经>“中小公司比较希望候选人有落地算法的能力,而且最好有处理数据的能力,比如会sql,会写spark脚本,有些小型公司可能没有专门的算法人员,你是第一个,所以他们对你期望其实蛮高的,所以这种个人感觉谨慎进入,除非你对自己的算法,工程以及沟通和管理能力有足够自信”
完整面经>“5月份参加了七月在线的就业班,学了大概三个月的时间,做了两三个项目,通过与老师交流,也了解了工业界的算法落地流程和细节,所以建议没有实习经验的不了解工业界算法的同学可以报个就业班(除非你脑子非常聪明,数学和工程能力非常好),学习下工业界的实际项目,否则真的很难。”
完整面经>
“人算不如天算,2020年便开始了一场空前规模的疫情,导致三月份左右才开始大规模投简历找工作,根据自己找工作面试接近两个月以来主要有以下几点感悟:
1. 更侧重基础知识。
2. 侧重算法复现能力,代码能力要求更高。
3. 要求深刻理解业务场景,并针对业务场景解决一些问题。
4. 技能语言要求较多。”
“ 面试准备:
1. leetcode刷题,如动态规划、深度优先搜索等。
2. 七月在线的题库的推荐系统和nlp部分。
3. 常用机器学习算法推导,逻辑回归、xgboost、svm。
4. 大数据知识巩固,hdfs、hive、hbase、spark、kafka、kylin、flink等。
5. 论文研读,如YouTube、Airbnb推荐系统论文,FM、wide&deep、Deepfm等论文。”
“面试前准备:leetcode刷题1-2个月,7月在线上面试题库选择性做了一些。整理最近所做过的主要项目内容,梳理算法思路,将易错点记下来。上了七月在线推荐就业班4期。继续加强机器学习理论,复习经典算法,巩固加深理解,推荐看西瓜书。如果应聘推荐系统方向 同时最好看下推荐系统方面书籍 。”
完整面经>“还有机器学习,聚类、逻辑回归、线性回归、贝叶斯、决策树、神经网络,都需要明白原理,并用sklearn实现,最好可以用mllib也可以实现,需要知道什么情况下用什么模型,什么模型解决什么问题,最好能有实际建模经验。”
完整面经>“面试的题目我觉得都差不多,多刷7月在线的面试题,然后自己总结,多看面经。还有一定要多刷题,一定要对算法与数据结构特别熟悉,如果想进大厂的话,算法与数据结构要特别熟悉,题目多刷,什么动态规划、排列等常考的题。还有对时间复杂度、空间复杂度也要了解,我常常经历一道题,面试官要你做完了之后然后让你想还能怎么优化,从空间或者时间复杂度来想”
完整面经>“推荐项目一般会问有哪些评价指标。推荐系统一般有模型线下评价指标如召回率,准确率,覆盖率,AUC等等,线上看系统AB测试的点击率表现等。推荐系统的整个数据流程是如何处理的”
完整面经>“我觉得作为一个合格的算法工程师,首先要有扎实的基础功底,然后需要在一个方面有自己深度的理解,比如word2vec算法,知道怎么用,但也要知道他的内部原理和公式的一些推导,和在什么样的场景下使用”
完整面经>2022年4月11日开班,越早报名越早享受到BAT大咖的一对一个性化定制。
三个月的学习周期(包括直播、录播、实训、答疑、考试、项目),三个月的就业周期,且配备全职科学家、全职助教、全职就业老师辅助讲师进行课程答疑、项目辅导、简历指导、就业内推。
报名本就业班的步骤如下
PS:申请表和简历不得造假(包括但不限于:学历不得造假、教育经历不得造假、工作履历不得造假,一经发现,立即取消入学资格,且相关后果自负)。
{{blessingTip}}
{{seconds}}s