2024/03/21 14:44

薪酬、人数上不封顶，这家互联网大厂正在疯抢超级毕业生

又是一年一度校园春招季。在生成式 AI 一路狂飙的时代浪潮下，人工智能、计算机领域的顶尖毕业生，成为各大厂热烈竞逐的对象。

华为 “天才少年计划”、蚂蚁集团 “蚂蚁星”、腾讯 “技术大咖”、阿里巴巴 “阿里星”、百度 “AIDU 计划”、美团 “北斗计划”，均是为了网罗前沿科技顶尖人才而设。

这些企业招揽的 “顶尖人才” 可谓百里挑一：他们基本都是海内外名校的应届博士生，获得过顶尖科研成果，在国际顶级会议和期刊发表过论文，在国际大学生程序设计竞赛（ICPC）等重要国际竞赛中拿过奖。

为签下这些超级毕业生，各家大厂使尽浑身解数 “抢人”。年度薪资包 100 万是普遍的 “起步价”，华为为 “天才少年” 提供的年薪最高达 200 万。腾讯、阿里则表示，“技术大咖” 和 “阿里星” 的待遇 “上不封顶”。蚂蚁集团为了 “锁人”，还为确认接 offer 的 “蚂蚁星” 一次性提供几万到几十万元不等的 “签约费”。

小编昨天和几位学霸聊了聊，因为杭州生活成本低，还宜居，今年新推出的 “蚂蚁星” 计划被大家重点关注！

今天，我们就重点为大家介绍一下 “蚂蚁星”。

从过去几年的入职情况来看，“蚂蚁星” 们主要集中在蚂蚁技术研究院、蚂蚁集团 AI 创新研发部门 NextEvo，从事 AI 领域前沿技术研发。

随着蚂蚁集团提出 AI First 的战略目标，持续加大对 AI 的投入，2024 年春招推出的 “蚂蚁星” 岗位也主要聚焦于 AI 算法、AI 工程以及数据处理等生成式 AI 关键领域。

蚂蚁的 HR 还说了，“蚂蚁星” 的薪酬待遇上不封顶，招募人数也上不封顶，“期待更多顶尖技术新生力量的加入，助力蚂蚁自研 AI 获得持续性的突破”。

以下是 2024 年招募 “蚂蚁星” 的岗位需求，供即将毕业的各位学霸、学神参考。有想投简历的，请发邮件至蚂蚁星招募咨询及投简历专邮： antstar@antgroup.com。

最后想说的是，作为 99% 的非学神毕业生们不要焦虑。AI 是一个系统性工程，除了算法，还有数据、工程、产品、商用化落地等，每一环都有不可取代的价值和巨大的机会，大家可以结合自身专业、长处，找到自己在这波 AI 大浪潮中的用武之地。也祝愿各位应届毕业生都能在今年找到自己理想的工作！

2024 春季校招蚂蚁集团 “蚂蚁星” 招聘岗位

AI 工程师

研发领域：深度学习和大模型
需求团队：平台技术事业群
岗位要求：

教育背景优秀，计算机相关专业研究生；
有较好的计算机科学和算法基础，编程能力强；
有自然语言 / 多模态大模型、深度序列模型、深度生成模型、图神经网络、知识图谱、数据挖掘、云计算系统、机器学习平台等相关技术或者落地经验者优先；
产出需在论文、开源、比赛成绩、项目上满足以下一条或者多条：

算法研究背景在诸如 ICML/ICLR/NIPS、ACL/EMNLP/KDD、CVPR/ICCV/ECCV 等会议有相关论文发表者优先；
应用系统研究背景在诸如 WWW、SIGMOD/VLDB、ICSE/ASE、ATC/OSDI/ASPLOS、MLSys 等会议有相关论文发表者优先；
在顶会组织或者行业组织且有广泛影响的比赛 KDDCup、Kuggle 并取得前三好成绩者优先；
有开源项目影响力或者参与过开源项目者优先；
有作为主力推动或者参与的有较大影响的项目结果产出；
在大厂有相关实习或工作经历者优先；
较强的表达和沟通能力，工作认真、严谨、敬业。有很强的分析问题和解决问题的能力，有强烈的责任心和自驱力。

软件工程师

研发领域：深度学习和大模型
需求团队：平台技术事业群
岗位要求：

教育背景优秀，计算机或相关专业，关注业界新技术，有技术热情和自驱力，善于沟通和协作；
在程序分析，软件工程，软件安全，编译语言等方向有学术成果（如 CCF A 类 paper）；
对 java 字节码，JVM 虚拟机等编译技术有经验；或有统计分析、机器学习、软件工程和人工智能结合的研究经验。等经验者优先；
有 CTF 等安全竞赛、智能化大赛等参赛获奖经历者优先。

算法工程师

研发领域：多模态
需求团队：平台技术事业群
岗位要求：

计算机或信息类相关专业，硕士及以上学历；
熟悉常见的 NLP 算法和 CV 算法，熟悉常用多模态处理算法和模型；
具有 Linux 环境研发能力，熟练使用常用深度学习框架；熟悉 Huggingface，DeepSpeed 和 LangChain 等；
具有多模态大模型应用开发经验，有 RAG/NL2SQL/Agent 等模块研发与应用落地经验者优先；
有较强的逻辑思维能力和学习能力，有顶会论文发表者优先。

算法工程师

研发领域：自然语言处理
需求团队：平台技术事业群
岗位要求：

计算机或信息类相关专业，硕士及以上学历；
熟悉常见的 NLP 算法和大模型 finetune 技术，能熟练使用数据挖掘、机器学习、深度学习算法模型；
具有 Linux 环境研发能力，熟练使用常用深度学习框架；
有数据清洗和高质量数据生成经验者优先，有知识图谱项目经验者优先；
有较强的逻辑思维能力和学习能力，有顶会论文发表者优先；
有大模型和 RAG 相关项目和研究背景者优先。

网络技术工程师

研发领域：研发 C/C++
需求团队：平台技术事业群
岗位要求：

熟练掌握 C/C++、多线程、网络通信、高性能优化，有 Unix/Linux 环境开发经验；
在 SIGCOMM、NSDI、CONEXT 等计算机网络顶会或期刊上发表过论文；
善于学习，有技术热情，有较好的逻辑思维和分析能力，拥有良好的沟通意识和团队协作精神；
我们希望你有以下一个或多个方向的研究和实践经验：

熟悉高性能网络协议相关技术，如 RDMA、RoCE、DCQCN、CXL、InfiniBand 等；
熟悉集合通信相关技术，如 NCCL、MPI、Gloo 等；
熟悉软硬件结合和网络可编程经验，如 DPU、SmartCard、SONiC、P4、DOCA 等。

5. 如果有以下方面的经验优先：

参加各项国际 ACM-ICPC 等竞赛并获奖；
有一线大厂实习经历，或者有国家重点实验室实习经历。

研究员

研究领域：计算机视觉
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
有丰富的计算机视觉和深度学习方向的科研经验；
学习能力强，热爱思考问题；动手能力强，工作效率高；
逻辑能力强，能够清晰表达自己的想法；
有在 CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/TPAMI/ICJV 等国际顶会顶刊发表论文经验者优先。

研究员

研究领域：自然语言处理方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
有丰富的计算机视觉和深度学习方向的科研经验；
学习能力强，热爱思考，动手能力强，工作效率高；
逻辑能力强，能够清晰表达自己的想法；
有在 CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/TPAMI/ICJV 等国际顶会顶刊发表论文经验者优先。

研究员

研究领域：密码学方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
熟悉至少 1 种密码学 / 隐私保护（包括但不限于全同态 FHE / 安全多方计算 MPC / 差分隐私 DP 等等）领域的技术，了解当前国内外业界在该领域的最新进展；
熟练掌握至少一种编程语言，具备快速复现四大顶会上该领域相关论文的能力，有相应开源库贡献最佳；在计算、通信等性能优化方面有独到的见解；
熟练掌握该领域相关技术的数学论证方法（如基于格的数学规约；或 MPC、DP 中的安全性证明），具备独立在无人区进行科研的能力，在 CCF-B 以上级别的国际会议上发表过论文。

研究员

研究领域：编译方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
在编程语言、体系结构、软件工程、系统软件等相关领域有高质量论文（CCF A 类学术会议或者期刊的论文）；
在编译技术领域具有显著成果，具有很强的研究和创新能力，跟踪领域内前沿的研究成果并能够将研究成果验证落地；
深入理解至少一种编译器架构，例如：GCC/LLVM 等，有 runtime 及虚拟机开发经验，例如：JIT/JVM 等，熟悉 CPU 指令集，例如：RISC-V/x86/ARM 等；
了解编译器优化技术，对数据流 / 控制流分析、循环优化、IPA 分析、GC 等有经验；
较强的表达和沟通能力，工作认真、严谨、敬业。有很强的分析问题和解决问题的能力，有强烈的责任心。

研究员

研究领域：形式化验证方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
有良好的研究背景和成果，在高水平国际会议或者学术期刊发表过形式化验证相关论文；
具备发现问题的能力和开发实现能力，能够把研究想法转化为 Demo 应用；
有良好的表达和沟通能力及协作精神，工作认真严谨，有强烈的责任心；
熟悉某种形式化工具，如 Coq, Isabelle, ProVerif, Tamarin, NvSMV, TLA+, KLEE, BMC, Astree, TrustInSoft 等。

研究员

研究领域：图计算方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
在系统软件 / 体系结构 / 数据库 / 高性能计算等领域的顶尖学术会议 / 期刊有相关论文发表者，以及相关竞赛获得优异成绩者优先；
有不错的问题发掘和开发实现能力；
有良好的表达和沟通能力及协作精神；工作认真严谨，有强烈的责任心。

研究员

研究领域：数据库方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
在高水平国际会议或者学术期刊发表过相关论文，有数据库领域相关工作经验；
有良好的研究背景和成果，对数据库研究兴趣浓厚，业务抽象能力强；具备创造性思维；
对研究工作充满热情，具备良好的团队合作精神和沟通能力，具有团队协作经验；
有一定的编程能力，能够把研究想法转化为 Demo 应用。

研究员

研究领域：计算系统方向
需求团队：蚂蚁技术研究院
岗位要求：

有相关研究背景的博士生，特别优秀的硕士生亦可；
从事过相关领域研究工作（如同态加密、安全多方计算、体系结构、性能优化、密码加速、加速芯片设计等）
精通 C/C++、Java、Python 等至少一门编程语言；
学习能力强，对新事物保有好奇心，并能快速适应新环境；
对所在领域有热情，相信方法总比困难多，善于独立思考并反思总结；
良好的沟通能力和团队协同能力。

AI 工程师

研发领域：大模型
需求团队：网商银行
岗位要求：

本科及以上学历，硕士博士优先，计算机、数学、信息管理等相关专业；
具备极佳的工程实现能力，精通 C/C++、Java、Python 等至少一门语言；
对目前主流的深度学习平台：tensorflow、pytorch、mxnet 等，至少对其中一个有上手经验；
熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验；
有强烈求知欲，对人工智能领域相关技术有热情；
具有良好的数学基础，良好的英语阅读能力；
学习能力强，对新事物保有好奇心，并能快速适应新环境；
良好的沟通能力和团队协同能力；能与他人合作，共同完成目标；
对所在领域有热情，相信方法总比困难多，善于独立思考并反思总结。
在 CVPR，ICCV，NeurIPS、ICML、ICLR、KDD 等国际顶会发表过论文优先。

AI 工程师

研发领域：机器学习
需求团队：天穹实验室
岗位要求：

扎实的机器学习与深度学习基础，了解其核心原理和算法
熟练掌握 Pytorch 等主流深度学习框架，了解 transformer 原理
有对抗样本攻击等 AI 对抗技术的实战研究经验
有本地模型部署、微调及智能体应用的实践经验，能够熟练进行模型的部署和优化
创新思维与解决问题能力：具备强烈的好奇心和创新能力，能够独立思考并解决复杂的问题
加分项：有一定传统信息安全领域的知识基础（如漏洞挖掘、网络渗透等）。

AI 工程师

研发领域：机器学习
需求团队：大安全
岗位要求：

本科及以上学历，硕士博士优先，计算机、数学、通信、自动化等相关专业；
极佳的工程实现能力，熟练掌握 C/C++、Java、Python 等至少一门语言；
学习能力强，对新事物保有好奇心，并能快速适应新环境；
良好的沟通能力和团队协同能力；能与他人合作，共同完成目标；
对所在领域有热情，相信方法总比困难多，善于独立思考并反思总结；
对图像与视频分类、目标检测、实例分割、图像增强、图像表征学习、图像生成、OCR、视频关键帧检测、目标跟踪、视频摘要等深度学习任务有了解；
加分项：

ACM/ICPC、topcoder 等编程比赛获奖者优先；
良好的科研能力，有成果发表在 ICCV、CVPR、NeurIPS、ICML、TPAMI 等国际顶级会议、期刊，担当一作 / 并列 / 二作；
作为重要角色参与领域内有含金量的比赛，如 ACM、Kaggle、阿里天池大赛。

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

计算机相关专业获得硕士学位，博士优先，在 NLP、人机对话交互、强化学习等领域有研究经验，有高质量的大模型相关研究 AI 顶会论文发表，研究方向延续深入，有相关工程落地经验者优先；
对 NLP 主流大模型如 chatGPT/LLaMA/GLM 等的原理和差异有深入的理解。有百亿 / 千亿 NLP 大模型训练调优经验优先，熟悉大模型训练与加速框架诸如 Deepspeed/Megatron-LM/vLLM 等优先，有能力使用 Lora/QLora 等方案进行大模型参数高效微调；
有良好的代码开发能力，精通 Python 或 java 等语言，熟练掌握主流深度学习框架 pytorch/tensorflow；
具有很好的表达能力，很好的抗压能力和团队合作能力。热衷于技术创新，善于突破既有框架做出改变，善于运用有限资源针对具体问题拿到结果。对于把大数据人工智能技术能够应用到实际业务场景产生商业价值具有强烈的热情。

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

拥有扎实的机器学习 / 深度学习基础和优秀代码能力；
熟悉业界前沿推荐算法技术；
有业界顶会论文发表和优秀公司实习经验的同学优先考虑

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

计算机或相关专业本科以上学历，硕士博士优先，优秀的工程能力，对推荐领域有极高的热情；
在推荐算法相关问题，包括序列建模、冷启动推荐、多任务学习等问题中有创新研究，在 KDD、SIGIR、The Web Conf、ICML、NeurIPS、CIKM、TKDE 等顶会顶刊有 2 篇以上一作 / 共同一作 / 学生一作论文发表；获得最佳论文 / Demo 奖项（包括提名）优先；
有工业界大规模推荐算法实战经验和业务效果、主导获得知名比赛 Top 3 名次、主导 / 核心贡献 GitHub 高影响力开源项目优先。

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

熟悉主流机器学习算法及原理。
熟练使用 TensorFlow、PyTorch 等主流深度学习框架。
良好的学习和沟通能力，有责任心，有钻研精神。
具备以下一个或者多个方向的经验优先：

在 NeurIPS、ICML、ICLR、KDD、SIGIR 等国际顶会发表过论文；
参加国际 ML 比赛等竞赛并获奖；
预训练大模型，迁移学习，多场景 / 多任务学习，小样本学习，序列建模等相关领域研究经历；
有大模型评测等相关经历。

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

具备 C/C++，Java，Python 等开发经验；
熟悉主流机器学习 / 深度学习相关算法及原理；
具有一定的 CUDA 编程基础；
良好的学习和沟通能力，有责任心，有钻研精神；
熟悉或者具备以下一个或者多个方向的经验优先：

在 NIPS、ICML、ICLR、KDD、ICDE、VLDB、AAAI、IJCAI、WWW、SIGIR、ICDM、CIKM 等顶会发表过论文；
参加各项国际 ML 比赛、ACM-ICPC 竞赛等并获奖；
有大模型相关的研究，以及应用经验，对于大模型的加速 / 蒸馏 / 剪枝 / 量化等方向有相关的研究结果；
有分布式系统开发经验，熟悉 Hadoop、Spark、Flink、Storm、HBase 等大数据技术。

AI 工程师

研发领域：机器学习
需求团队：平台技术事业群
岗位要求：

硕士及以上学历，计算机科学或相关专业背景；
熟练掌握机器学习、自然语言处理、大语言模型等相关领域的基本理论和算法；
扎实的算法工程能力，有大规模数据处理、大规模分布式训练等工程经验的优先；
具备扎实的算法编程能力，熟练掌握 python、TensorFlow、PyTorch 等；
熟悉图机器学习、知识图谱和大语言模型相关开源工作，如 PyG、DGL、OpenKG、Neo4j、ChatGLM、LLaMA 等；
具备良好的分析和问题解决能力、优秀的工程素养，能够独立思考和解决实际问题；
具备较强的团队合作能力和沟通能力，能够与业务团队、产品团队和其他技术团队紧密配合。

AI 工程师

研发领域：自然语言处理
需求团队：平台技术事业群
岗位要求：

计算机、电子信息、自动化、数学等相关专业优秀博士；
优秀的动手能力和良好的代码习惯，需要有顶会工作或优质 Github 开源项目；
对大模型预训练、微调对齐等技术有系统的认识，对某个细分场景有深入的理解和实践；
良好的沟通能力以及自驱的工作学习能力。

AI 工程师

研发领域：自然语言处理、语言大模型
需求团队：平台技术事业群
岗位要求：

对语言大模型的预训练、RLHF、llm-based agent 等方向有研究经验；
有相关论文发表在 AI 顶会，有开源模型研究和优化经验；
对语言大模型有热情，熟练掌握 pytorch 等深度学习框架。

AI 工程师

研发领域：计算机视觉
岗位要求：

计算机视觉、计算机图形学、数学、统计学或相关专业的博士或优秀硕士；
优秀的工程实践能力，熟悉 Pytorch/TensorFlow 等深度学习框架，掌握大规模并行训练技术，熟悉现代分布式计算系统及应用研发；
精通 C++/Python/Java 编程，熟练掌握基础数据结构；
一作顶会 / 顶刊论文发表，包括不仅限于 ICML，ICLR，NeurIPS，ACL, EMNLP，CVPR，ECCV，ICCV 等；
有跨领域工作经验，如 CV、NLP 等跨算法领域、工程与算法结合的工作经验等。

产业蚂蚁星蚂蚁集团

相关技术

机器学习物体识别深度学习人脸识别图像分割

深度学习技术

深度学习（deep learning）是机器学习的分支，是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习是机器学习中一种基于对数据进行表征学习的算法，至今已有数种深度学习框架，如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

来源：LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.

计算机图形技术

图像数据处理、计算机图像（英语：Computer Graphics）是指用计算机所创造的图形。更具体的说，就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

来源：维基百科

机器学习技术

机器学习是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

来源：Mitchell, T. (1997). Machine Learning. McGraw Hill.

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

参数技术

在数学和统计学裡，参数（英语：parameter）是使用通用变量来建立函数和变量之间关系（当这种关系很难用方程来阐述时）的一个数量。

来源：维基百科

剪枝技术

剪枝顾名思义，就是删去一些不重要的节点，来减小计算或搜索的复杂度。剪枝在很多算法中都有很好的应用，如：决策树，神经网络，搜索算法,数据库的设计等。在决策树和神经网络中，剪枝可以有效缓解过拟合问题并减小计算复杂度；在搜索算法中，可以减小搜索范围，提高搜索效率。

来源：Wikipedia

TensorFlow技术

TensorFlow是一个开源软件库，用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品，如语音识别、Gmail、Google 相册和搜索，其中许多产品曾使用过其前任软件DistBelief。

来源：维基百科

表征学习技术

在机器学习领域，表征学习（或特征学习）是一种将原始数据转换成为能够被机器学习有效开发的一种技术的集合。在特征学习算法出现之前，机器学习研究人员需要利用手动特征工程（manual feature learning）等技术从原始数据的领域知识（domain knowledge）建立特征，然后再部署相关的机器学习算法。虽然手动特征工程对于应用机器学习很有效，但它同时也是很困难、很昂贵、很耗时、并依赖于强大专业知识。特征学习弥补了这一点，它使得机器不仅能学习到数据的特征，并能利用这些特征来完成一个具体的任务。

来源：Wikipedia

计算机视觉技术

计算机视觉（CV）是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

来源：机器之心

知识图谱技术

知识图谱本质上是语义网络，是一种基于图的数据结构，由节点(Point)和边(Edge)组成。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲，知识图谱就是把所有不同种类的信息（Heterogeneous Information）连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱这个概念最早由Google提出，主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎，知识图谱可用来更好地查询复杂的关联信息，从语义层面理解用户意图，改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候，搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月，家庭情况等等。

来源：机器之心

数据库技术

数据库，简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据运行新增、截取、更新、删除等操作。所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

来源：维基百科

数据挖掘技术

数据挖掘（英语：data mining）是一个跨学科的计算机科学分支它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。数据挖掘过程的总体目标是从一个数据集中提取信息，并将其转换成可理解的结构，以进一步使用。

来源：维基百科

深度生成模型技术

深度生成模型基本都是以某种方式寻找并表达（多变量）数据的概率分布。有基于无向图模型（马尔可夫模型）的联合概率分布模型，另外就是基于有向图模型（贝叶斯模型）的条件概率分布。前者的模型是构建隐含层(latent)和显示层（visible)的联合概率，然后去采样。基于有向图的则是寻找latent和visible之间的条件概率分布，也就是给定一个随机采样的隐含层，模型可以生成数据。生成模型的训练是一个非监督过程，输入只需要无标签的数据。除了可以生成数据，还可以用于半监督的学习。比如，先利用大量无标签数据训练好模型，然后利用模型去提取数据特征（即从数据层到隐含层的编码过程），之后用数据特征结合标签去训练最终的网络模型。另一种方法是利用生成模型网络中的参数去初始化监督训练中的网络模型，当然，两个模型需要结构一致。

来源：机器之心 UT

云计算技术

云计算（英语：cloud computing），是一种基于互联网的计算方式，通过这种方式，共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

来源：Cloud Computing

逻辑技术

人工智能领域用逻辑来理解智能推理问题；它可以提供用于分析编程语言的技术，也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑（Propositional Logic ）以及一阶逻辑（FOL）等谓词逻辑。

来源：机器之心

大数据技术技术

大数据，又称为巨量资料，指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

来源：维基百科

迁移学习技术

迁移学习是一种机器学习方法，就是把为任务 A 开发的模型作为初始点，重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都是为了解决单个任务而设计的，但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。迁移学习对人类来说很常见，例如，我们可能会发现学习识别苹果可能有助于识别梨，或者学习弹奏电子琴可能有助于学习钢琴。

来源：机器之心 Pan, S. J., & Yang, Q. (2010). A survey on transfer learning. IEEE Transactions on Knowledge and Data Engineering, 22(10), 1345–1359.

图像生成技术

图像生成（合成）是从现有数据集生成新图像的任务。

来源：paperswithcode

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构，它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图，并通过在整张图上传递、转换和聚合节点特征信息，从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入，并用于节点分类或预测节点之间的连接，完整的模型可以通过端到端的方式训练。

来源：机器之心

对抗样本技术

对抗样本是一类被设计来混淆机器学习器的样本，它们看上去与真实样本的几乎相同（无法用肉眼分辨），但其中噪声的加入却会导致机器学习模型做出错误的分类判断。

来源：Goodfellow, I. J., Shlens, J., & Szegedy, C. (2014). Explaining and harnessing adversarial examples. arXiv preprint arXiv:1412.6572.

自然语言处理技术

自然语言处理（英语：natural language processing，缩写作 NLP）是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言；自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

来源：维基百科

图像增强技术

图像增强技术用于增强图像中的有用信息，它可以是一个失真的过程，其目的是要改善图像的视觉效果，针对给定图像的应用场合。它通过有目的地强调图像的整体或局部特性，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果，满足某些特殊分析的需要。

来源：百度百科

多任务学习技术

强化学习技术

强化学习是一种试错方法，其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划（Dynamic Programming）。流行的强化学习方法包括自适应动态规划（ADP）、时间差分（TD）学习、状态-动作-回报-状态-动作（SARSA）算法、Q 学习、深度强化学习（DQN）；其应用包括下棋类游戏、机器人控制和工作调度等。

来源：机器之心

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用，如语音识别，机器翻译，词性标注，句法分析和资讯检索。由于字词与句子都是任意组合的长度，因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题)，也使得在语料库中估算字串的机率变得很困难，这也是要使用近似的平滑n元语法(N-gram)模型之原因。

来源：维基百科

美团机构

美团的使命是“帮大家吃得更好，生活更好”。作为中国领先的生活服务电子商务平台，公司拥有美团、大众点评、美团外卖、美团打车、摩拜单车等消费者熟知的App，服务涵盖餐饮、外卖、打车、共享单车、酒店旅游、电影、休闲娱乐等200多个品类，业务覆盖全国2800个县区市。

www.meituan.com

阿里巴巴机构

阿里巴巴网络技术有限公司（简称：阿里巴巴集团）是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/

蚂蚁集团机构

蚂蚁集团是移动支付平台支付宝的母公司，也是全球领先的金融科技开放平台，致力于以科技和创新推动包括金融服务业在内的全球现代服务业的数字化升级，携手合作伙伴为消费者和小微企业提供普惠、绿色、可持续的服务，为世界带来微小而美好的改变。

http://www.antgroup.com

腾讯机构

腾讯，1998年11月诞生于中国深圳，是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念，为亿万网民提供优质的互联网综合服务。腾讯的战略目标是“连接一切”，我们长期致力于社交平台与数字内容两大核心业务：一方面通过微信与QQ等社交平台，实现人与人、服务及设备的智慧连接；另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展，通过普及移动支付等技术能力，为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/