本期CV高级12,继续沿用上一期完整的“作业考试且批改”的教学机制,且在内容、项目、就业三个维度上做了全新升级:
一切为了学员学的更好,最终更好的在职提升、或跳槽涨薪/升职加薪。
面向群体: 本课程适合已经在做AI的进一步在职提升,比如在职上班族跳槽涨薪/升职加薪,采用严格筛选制(通过率不到1/3),需要具备一定的基础能力才能报名通过,故以下同学优先:
企业项目
项目介绍:多模态信息理解和检索是2021年学界和业界最热的技术和话题,尤其是当长短视频、新闻、视频号、朋友圈等PGC和UGC的内容以多模态(图片、视频、文本、音频等)形式呈现,加速了多模态信息理解和检索技术的升级,BAT、字节跳动、爱奇艺、美团点评、优酷等各大厂商都在布局和招聘多模态技术算法人才。
涉及技术:在技术阶段讲过的Transformer、Vision Transformer等内容基础上,本次项目将继续补充多模态信息检索的前沿技术,如自监督学习(Self-supervised Learning)技术、2021年OpenAI提出的CLIP(Connecting Images and Text)等最新技术内容。实战方面,我们将从零开始,实现一个图文检索系统,实战感受Transformer/BERT强大“编码”(Encode)能力。
项目介绍:“如果人工智能是一块蛋糕,那么蛋糕的大部分是自监督学习,蛋糕上的糖衣是监督学习,蛋糕上的樱桃是强化学习”。深度学习三巨头之一Yann Lecun在他的演讲中引入了“蛋糕类比”来阐述自监督学习(Self Supervised Learning)的重要性。虽然这个类比是有争论的,但最近一两年自监督学习技术在计算机视觉领域发展迅猛,无论是在学术界还是工业界都产出了大量高质量的工作。尤其是在工业界,自监督学习技术直接改变了原本在各个业务线上都各自独立花费昂贵的数据标注成本产出多个模型的局面,现在大多遵循着先Self Supervised Pretrain --> Finetuning的套路,不仅大大降低了对数据标注的成本,还在多个公开数据集和业务场景中比纯监督学习的效果更好。
涉及技术:在本次项目中,将详细介绍近一两年来视觉自监督学习技术的里程碑文献,梳理前沿技术发展路线。然后从Contrastive Loss、Dual Encoder、Projection Head等多方面的细节具体实现一个端到端的基于自监督学习的视觉编码系统。
项目介绍:近期 Transformer 在 CV 领域掀起了一股热潮,从图像分类的 ViT, 到目标检测的 DETR,再到图像分割的SETR 以及 3D 人体姿态的 METRO,预计在未来所有 CNN 能干的事情,都离不开Transformer的身影,其力量之雄厚,直接推进了AI 领域技术和方法的融合与发展。
涉及技术:2021 ICCV Best Paper:Swin Transformer
项目介绍:视觉是人类认知世界的重要途径之一,人类获取外部信息的80%来自视觉系统。计算视觉追踪就是在了解人类视觉基础上,用成像系统代替人类视觉器官,用计算级代替人脑完成对输入图像的处理与理解。通过对连续的图像序列进行运动目标检测、提取特征、行为识别,以获得目标准确的运动信息参数(如位置、速度等),并对其进行相应的处理分析,实现对目标的行为理解。其在安全防护、体育竞赛、无人驾驶等领域有着广泛地应用。
涉及技术:本项目将从目标检测之Anchor Free方向下大火的CenterNet入手,过渡到视觉追踪的Center Track(2021)。从视觉追踪系统的网络模型搭建、训练、优化及测试入手,深入挖掘视觉追踪系统的魅力。
项目介绍:医学图像信息 随着深度学习的发展,人工智能技术在医学领域取得了很多突破性进展,尤其体现在医学图像处理方面,前期主要包括CT、MRI和超声图像中病灶的智能识别、自动分割、三维重建和三维量化,以及后期的疾病智能诊断和预后评估。本项目将从半监督学习入手,探索人工智能在医学图像处理中的研究进展,构建医学图像分析系统, 并对今后的医学人工智能的研究方向进行展望。
涉及技术:在本次项目中,将详细介绍近一两年来基于人工智能在医学图像分析的里程碑文献,梳理前沿技术发展路线。从超声波数据入手,分析多方面的细节,具体实现一个端到端的一套基于Pytorch的医学图像分析系统。
项目介绍:行为识别与分析在视频监控、医疗康复、健身评估、人机交互等领域应用广泛,是计算机视觉研究的热点问题之一。行为识别与分析的主要目的是根据摄像头捕捉到的视频来具体地分析并预测人体行为。传统的实现方式主要基于捕捉人体所佩戴的传感器所发出的信号,因此使用不够灵活、操作复杂、扩展性不强、用户体验查。随着深度学习近年来的爆发性成长,基于计算机视觉的行为识别能够很好地获取视频中的空间和时间信息。由于其扩展性强、灵活度好、准确率高,因此成为现阶段及未来的主流方式。
涉及技术:在本次项目中,将详细介绍近一两年来基于人体骨骼点的行为识别与分析的里程碑文献,梳理前沿技术发展路线。从NTU-RGB-D数据入手,分析多方面的细节,具体实现一个端到端的一套基于Pytorch的行为识别与分析系统。
实训项目
博士毕业于国内TOP 5高校,目前在知名大厂担任资深技术专家以及CV算法团队负责人,在AI和CV领域发表了CVPR/ICCV/AAAI/IJCAI等多篇顶尖会议和期刊论文以及担任相关论文的审稿人。有深厚的学术背景和丰富的项目及业务落地经验,并长期担任技术面试官,授课风格深入浅出、诙谐幽默。
中科院CV博士毕业,中国图像图形学会三维视觉专委会委员,目前在百度做CV研发,之前在阿里达摩院做CV研发。
美国TOP 10学校博士毕业,长期从事多模态学习、图神经网络、计算机视觉等方面的研究工作,论文多次发表在AAAI、ICML、WWW、KDD等顶会上,同时也是多个期刊的审稿人。带领团队获得多项国际评测第一名和国际会议最佳论文,且与硅谷众多企业开展了广泛深入的科研合作。
申请学员(以下简称学员)填写报名申请表并附上简历,电话或远程面试通过后,才视为报名成功,然后学员和七月在线(以下简称机构)双方签订培训合同。
课程开始前,提供预习视频预习,课程开始后,每周安排直播、录播、实训、答疑,然后每两周考试一次,顺利通过阶段考试的学员,才能进入下一阶段的学习。未能通过考核的重新学习,做查漏补缺。
在线直播:开班宣讲
在线视频:传统图像处理基础
在线视频:计算机视觉基础
在线视频:机器学习基础
在线视频:深度学习图像处理基础
在线视频:神经网络原理与实践
在线视频:深度卷积神经网络原理与实践
在线视频:深度学习优化算法以及重点知识点梳理
在线视频:图像搜索技术:从Autoencoder到ConvNets
在线实训:使用Autoencoder和ConvNets构建图像搜索系统
在线视频:大规模车辆图片搜索/重识别(ReID)
在线实训:使用TensorFlow/Keras由浅入深搭建规模车辆图片搜索系统
在线视频:Two-Stage物体检测
在线视频:One-Stage物体检测
在线视频:Self-Attention和Transformer架构
在线直播:Anchor-Free物体检测
在线视频:目标检测及其在无人驾驶领域的作用
在线实训:使用TensorFlow/PyTorch在COCO数据集上进行目标检测
在线视频:深度学习在图像语义分割中的应用
在线实训:使用TensorFlow在COCO数据集上进行语义分割
在线视频:比目标检测难度更大的视觉目标跟踪技术
在线直播:图像分割的核心算法与工业应用
在线考试:第一次阶段考试
在线视频:RNN及其应用(image captioning and VQA)
在线实训:使用Keras/PyTorch 搭建一个Image Caption模型
在线视频:深度学习前沿:理解AlphaGo (强化学习) 和生成模型(GAN)背后的原理
在线实训:手把手教你如何使用TensorFlow/PyTorch实现GAN
在线直播:模型压缩与量化
在线直播:超大模型修剪与蒸馏实战
在线视频:模型部署
在线视频:Transformer在计算机视觉和多模态技术中的应用
在线视频:基于点的全新任务:深度探讨关键点检测
在线直播:基于图的信息交互与图神经网络
在线考试:第二次阶段考试
在线直播:项目1 多模态图文搜索:多模态+自监督学习前沿技术综述1
在线直播:项目2 视觉编码系统的业界前沿技术综述
在线直播:项目3 Transformer-based视觉特征提取系统介绍
在线直播:项目4 视觉跟踪系统的介绍
在线直播:项目5 基于半监督学习的医学图像分析系统的介绍
在线直播:项目6 行为识别与分析系统前言技术综述
在线直播:项目1 多模态图文搜索:多模态+自监督学习前沿技术综述2、图文搜索Data Loader
在线直播:项目2 视觉编码系统的整体框架实现
在线直播:项目3 Transformer-based视觉特征提取系统核心算法讲解
在线直播:项目4 视觉跟踪核心算法讲解
在线直播:项目5 基于半监督学习的医学图像分析系统核心算法讲解
在线直播:项目6 行为识别与分析系统的核心算法详解
在线直播:项目1 多模态图文搜索:Text/Image Encoder实现(代码授课)
在线直播:项目2 视觉编码系统中细节实现模型优化
在线直播:项目3 Transformer-based视觉特征提取系统构建
在线直播:项目4 视觉跟踪系统的模型构建
在线直播:项目5 基于半监督学习的医学图像分析系统模型构建
在线直播:项目6 行为识别与分析系统的的模型构建
在线直播:项目1 多模态图文搜索:Alignment、Loss和Training实现
在线直播:项目2 视觉编码系统的模型评估
在线直播:项目3 Transformer-based视觉特征提取系统整体实现
在线直播:项目4 视觉跟踪系统的整体实现
在线直播:项目5 基于半监督学习的医学图像分析系统的整体实现
在线直播:项目6 行为识别与分析系统的整体实现
在线视频:项目7 SLAM三维重建系统的整体流程和核心技能点
在线视频:项目8 跨镜追踪/重识别(ReID)的整体流程和核心技能点
在线视频:项目9 动态图链接预测系统的整体流程和核心技能点
针对学员所选的实战项目,进行项目与简历的最终调整与完善。然后除了学员自己投简历找工作之外,增加内推,并跟踪每一次面试的结果,不断辅导迭代,最终拿到offer。
在线直播:实战项目的总结与就业辅导
针对学员入职后工作上遇到的技术方面问题,进行一周的跟踪服务,为学员稳定就业保驾护航。
为保护学员隐私利益,特隐晦部分敏感信息,且限于篇幅,只节选部分
"面试的时候主要是看你简历上写的和你自我介绍说的内容往下问,所以写好简历,自我介绍引导面试官问问题十分重要,因为我是纯转行,基本上项目落地经验会被挑战,所以要做好预案,多和项目辅导老师、就业老师沟通(老师们的指导很有效,包括且不限于简历优化、面试辅导、就业内推等等,我是从拉就业辅导小群开始指导后一周内就拿到的offer)"
完整面经>"高级班的内容非常丰富,但是对于基础比较薄弱的同学而言确实是比较难听懂的,但是只要用心听就会发现老师讲的都非常详细,讲的都非常好,所以一定要多听多练,这个是非常重要的。高级班让我对CV有了更加深入的了解。"
完整面经>“面试的第一家公司是一个新能源车企,技术面试有两轮。 第一轮问的比较基础,包括基本网络的原理(vgg,resnet),优化算法,检测模型的细节。主要为基本知识的考查,这些知识在七月在在线的课中大都有涉及,所以难度不高。”
完整面经>“两段学习经历:20年暑假先报了七月在线机器学习集训营,21年暑假又报了七月在线的CV高级班(班上选的项目是:多模态、行人重识别)”
完整面经>“高级班的老师先从CV一些典型的技术讲起:机器学习的基础知识、RCNN、YOLO、Transformer、Centernet等等。然后再介绍项目,我参加了Seven老师和庞老师项目,Seven老师以一个从业者的角度介绍了很多实际的项目技巧,这方面我觉得是非常重要,很多书本上学习不到的宝贵知识让我收获颇丰,庞老师教会了我们从读论文查资料的技巧,为我们后续不断提升打下了坚实的基础。”
完整面经>“老师一步一步带着大家去做项目,不断的深入其中,还是很有意思的不管你有什么疑问,老师、助教都会细心帮你解答,我记得有一个问题,大家普遍都没听懂,老师还专门加了一节线上课,哈哈哈哈哈 白嫖,你受的了吗”
完整面经>“带我们的是王老师,授课的项目是目标检测和分割,从理论到代码框架,一步一步带我们梳理,最终输出项目报告也算是对项目的一个总结。但是和面试官需要看到的项目还是有一定的差距的。我们需要定向根据需求进行项目经验的更新,同样的框架和算法在不同场景下的训练,和模型调优衍生了工业项目的雏形。”
完整面经>“后来接受到七月在线专业的、系统的培训(报的CV高级班 第5期)。Seven老师手把手带我们做项目,王老师详细给我们讲一个强大的detectron2库,这些都对我加深对深度学习的认识及设计模型大有帮助。各位老师在培训中对于一些重要的知识点详细讲解,这些知识在自己做项目中都很有用,而且在面试中也经常会被问到。”
完整面经>“老师们也会对相关前沿技术进行深入地讲解,接下来就可以选择计算机视觉的高级班了,我个人比较喜欢Seven老师的授课风格,每一行代码都会带着大家敲,也会提出一些很有建设性的问题来供大家参考。”
完整面经>“就业班因为面向就业,除了更加详细的知识层面的学习之外,老师还会穿插一些面试中经常会遇到的面试题,以及工业界比较常用的计算机视觉方法以及目前热门的应用。最后的项目也会手把手教大家实现,并且指导大家如何通过手上的项目来回答面试官的问题。”
完整面经>“本科985,硕士211,非科班,硕士期间的研究方向涉及到一些AI方面的东西(研一还是在做控制相关的,真正开始自学CV算是在研二),导师放养(而且没有师兄师姐做AI相关的),实验室没资源,不让实习,没论文,属于啥啥都没有的小渣渣。拿到了一些小企业和一些国企研究所的offer,最终去了京东做算法,算是渣渣的救赎了吧。”
完整面经>“如果想面试大厂的话,以上问题是次要的,首先要代码能力过关,代码能力体现在算法与数据结构上,正常来说剑指offer搞的完全通透面试完全不成问题(阿里算法工程师学长给我的忠告),切记leetcode无脑刷题。”
完整面经>“本人2019年末流985硕士毕业,硕士期间做的是传统的机器学习算法,常用的是Matlab,对于工作来说基本用不上,而且目前大多数公司用到的AI算法还是偏向深度这一块的,再加上自己对深度学习相关算法了解的不多,因此想报个班学习下,在网上看到七月在线觉得挺好的,所以就报了七月的就业班。”
完整面经>“腾讯:CV岗。代码考察了DP(小偷问题)和回溯(DFS),顺利过关。深度学习算法,问了BN、drop out、label smoothing这些,回答得不是很好。划重点,对于自己简历里写的这些策略,一定一定要网上多看看一些相关博客的深入介绍,不能浮于表面,不然面试官换个角度问就会被问倒。”
完整面经>“seven老师的简历指导对我帮助巨大,不敢想象我曾在简历展示上犯了那么多错。简历上的项目是靠质量和深度取胜的,太多只会让人觉得你做的东西很浅很杂。”
完整面经>“此时临近五一眼看金三银四已过,内心焦虑,恶补了大量和项目相关的基础知识和细节,还是没有信心,于是报名了七月的1v1就业小班。经过笔试测验后,Seven老师同意对我进行辅导,当时心里踏实了很多”
完整面经>“想要改变最好的办法就是不断学习和更新自己的知识来适应这个不断变化的时代,于是报名了七月CV就业小班,下决心从之前的岗位离职了(离职原因也有很多,但是其中一个原因是想安心好好学习,当然不建议所有人都这样做,班上也有一边工作一边学习的,更建议转方向的同学骑驴找马),利用之后的三个月时间学习和更新CV领域的知识,主要是深度学习相关。”
完整面经>“我是CV就业第二期的学员,之前的工作是从事工业领域机器视觉检测的,在上一家公司,感觉自己遇到了发展瓶颈,也到看到行业内,有将深度学习应用在工业零件的缺陷检测中,就果断裸辞报班转CV就业班。找工作持续了差不多两个月左右,拿了两个offer,还有一家就是七月在线推荐的一家公司。”
完整面经>“多动手做项目:在正式的大项目开始前,自己最好能动手做1-2个项目,哪怕MNIST自己动手从头开始写,自己调几次参,CIFAR-10,CIFAR-100调参,kaggle上调一个项目,能动手做一下。否则等真正的大项目开始后,自己根本不知道如何下手,更别说跑出来一个较理想的结果。而且也不要为了验证trick而去调参,即不要为了调参而调参”
完整面经>“谨慎考虑报了七月在线的CV就业2,在讲师和助教的帮助下,我确实在深度学习方面有了很大的提升,从原理概念到推导,到训练方法和各种实用的思想和技巧;其中最深刻的感受是玩转了云计算的GPU,自己搭过、跑过、调过模型才算是真正的入行,相关的论文要看,一手的资料内容丰富程度和博客不在一个等级”
完整面经>“对于算法的应用场景也要有所思考,别只了解一些理论的东西,课程中老师闲扯的东西,尽量自己在做深入的思考(比如,车辆ReID的内容,可以不可以延伸到行人ReID),然后到姿态估计,然后两者结合增加模型的精确度,再进一步能不能对于视频的内容进行动态识别等等”
完整面经>“报班前3个月每天白天工作,晚上上课学习,开始很有激情,通过三个月时间把神经网络和CV的基础知识网络抓了一遍,还参加了一些Kaggle的图像分类比赛,整晚整晚的电脑训练模型,调整参数,再训练,下班了晚上回来看结果,调整,在训练…如此反复,有了对于使用CNN进行图像分类的基本概念”
完整面经>“一个人的学习过程中,知识体系通常很零散,虽然网上的教程很多,但是搜集教程并挑选出适合目前自己学习程度的课程也会花费比较大的精力,并且,网上的随处可见的教程、几个烂大街的项目对于简历过筛和面试还远远不够。3月份看到七月在线推出了CV就业第一期课程,于是立马就报名了。”
完整面经>“于是就下定决心上七月在线报班跟老师学,4月份报名,学习了两个月,主要是看视频直播,跟着老师做kaggle项目,修改简历,最后模拟面试。到了6月中旬有两个项目经历就开始在BOSS直聘上投简历。”
完整面经>“项目涉及的各种技术及其关联扩展的详解、为什么要用这种方法思考过程是怎样的、有哪些难点、遇到哪些困难、后期做了哪些优化等问题,都要准备好再去面试。”
完整面经>“今年四月初,正处于换工作阶段。由于有一阶段没有对前沿科技、技术的摄入,需要一段时间进行补充。正巧看到了七月cv就业班的第一期正在招生,相比于个人的集中复习,报班学习能够提供基础知识巩固、技术大牛讲解、实验平台的使用,自己只需要闷头学就好了。也是为了让自己的学习有个“抓手”,就报了CV就业班”
完整面经>三个月的学习周期(包括录播、实训、答疑、考试、项目),三个月的就业周期,且配备全职科学家、全职助教、全职就业老师辅助讲师进行课程答疑、项目辅导、简历指导、就业内推。
{{blessingTip}}
{{seconds}}s