Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

4800个大模型团队竞逐「产业真题」,这场金融科技大赛火出圈了

今年 7 月,一份《全球数字经济白皮书 (2024)》统计显示,全球目前已有 1300 多个基础大模型,美国的数量最多,中国紧随其后排在第二。

这一数字对比说明,在大模型这张「牌桌」上,中美是最具实力的两个玩家。曾经,中国奋力追赶「OpenAI 们」,两年之后我们可以看到,国产大模型在技术层面已抵达全球第一梯队。

而在这个过程中,圈内玩家逐渐分化出两条路线:一派继续卷性能,一派专注搞应用。

国内的优势恰恰在于产业场景极其丰富,落地空间极其广阔。面向大模型的下半场战事,业界普遍认为,中国将在应用层展现出更强的后劲。

目前的核心问题是,如何让大模型技术尽快与更多真实的产业场景连接起来。

从何处入手?一是精准定位最需要大模型的产业场景,二是找到能解决这些真实场景问题的人才。

一场直面「产业真命题」的技术赛事

我们熟悉的大模型落地案例更多发生在对话、作画、视频等方向,但其价值远不止于此,大模型同样可以深刻改变城市发展、金融科技、生物医药、工业制造、科学研究等领域。

已连续举办两届的 AFAC 金融智能创新大赛,正在成为国内大模型人才竞逐金融产业真命题的赛场。

AFAC2024 金融智能创新大赛(以下简称 AFAC2024 大赛)以金融行业内真实案例及海量真实数据为牵引,鼓励参赛者直面金融产业真命题,探索最具挑战的创新模型和算法。在去年赛制的基础上,AFAC2024 大赛对比赛形式进一步升级,在「挑战组」之外新增了「初创组」和「企业组」,形成了涵盖算法赛、应用赛和创业赛的综合赛制架构。

蚂蚁集团副总裁、蚂蚁金融技术委员会主席王晓航表示,举办 AFAC2024 大赛的出发点之一就是集聚、培养优秀科技人才、开展高水平合作交流。

同时,大赛设立了丰厚的奖金池,并为选手提供了配套的技术支持,吸引了数千个极具潜力的大模型团队参与。值得注意的是,选手们可以基于蚂蚁开源的 agentUniverse 多智能体框架,对多智能体协作模型进行开发定制,轻松构建智能体应用,节省更多精力以专注于破解产业命题。

3 个月,4882 支队伍的技术探索,让这场比赛「卷」出了新的高度。中国最顶尖的一批大模型人才围绕金融场景下的众多产业真题,贡献了众多前沿解决方案。

「我们始终相信通过科技的力量可以带来更多微小而美好的变化,我们期待 AI 能让高质量的金融服务惠及每一个人,让更好的金融产品进入千家万户,成为人们生活中的一部分。」王晓航表示,「人工智能技术的作用和价值不应仅限于研究和模型能力,更应产生更大的应用价值,就像扫码支付一样能够进入千家万户,进入每一个行业。」

接下来,让我们来看看三个代表团队的技术创新故事。

什么样的金融研报生成应用
能从六百多支队伍脱颖而出?

「拥抱 AIGC」团队的三位成员有很多共同点:都就读于浙江大学软件工程专业,都是硕士二年级的研究生,甚至住在同一个寝室。除了研究方向不太相同:三人分别选择了计算机视觉、数据治理与大语言模型、时空数据作为主攻方向。

队长高天弘曾参加过首届 AFAC 大赛,关注到 AFAC2024 大赛启动之后,他决定拉上室友再挑战,尽管「金融智能」对于三人来说是有些陌生的领域。

一番深思熟虑之后,他们选择了「AIGC 金融多模态研究报告智能生成」这个赛题。团队需要将大模型技术和金融数据深度融合,提出有创新价值的金融研报生成智能体解决方案,并应用于实际场景。

大模型的通用能力在不断进化,但要想解决高水平问题,还要靠行业知识的进一步积累。纵观当前的各类对话式 AI 应用,生成真实、有用、高水平的研究报告仍然是一项极具挑战性的任务。特别是对于金融这种专业门槛极高的领域,数据时效性、长文本总结、图表生成等都是其中存在的挑战。

如何有效攻克?特别是在赛题发布后,留给团队完成方案设计的时间并不算多。

针对上述问题,他们设计了一个面向金融研报生成的多智能体协同框架。具体来说,这个框架包含三层:多元数据来源、金融研报生成智能体 Agent、多源大语言模型

与传统的对话系统不同,协同的智能体具备任务规划和执行能力,能够在无需人类干预的情况下自动处理复杂问题,包括生成研报:

图片

其中,团队以 FinGPT-Forecaster 为基础,结合 LoRA 微调,训练了一个用于投资评级分析的股价预测大模型,克服了 ChatGPT 预测含糊和数据隐私问题,提供了可解释的预测结果。

图片

为了更高效地筛选金融数据,同时保证实时性和专业性,团队设计了一套多源检索增强方案。在检索获得行情、研报、股价等信息之后,首先针对走势图、PDF 研报等多模态数据进行预处理,突破单模态分析的局限性,使市场波动更直观呈现。然后从相关性、市场敏感性、可靠性、时效性多个维度出发,使用基于 LLM 的重排器进行排序优化。在这个过程中,作为赛事主办方之一,蚂蚁集团提供了新闻信息助手 API ,保证了数据收集的实时性,也大大减少了数据处理的工作量。

图片

最终,这一方案在同赛道的六百多支队伍中脱颖而出,夺得冠军。获奖之外,三位成员通过这次比赛也学会了如何理解现实中的产业需求,又如何面向真实产业场景制定具备可行性的方案。

图片

他们更加深刻地体会到大模型与传统 AI 研究的巨大差异。此前的 AI 模型基本面向具体任务而设计,仅用少量数据训练就可达到目标性能。相比之下,从底层训练的角度说,大模型对数据、算力的要求已经实现了指数级增长,对训练大模型的人的创新能力要求显然也更上一层楼。

用大模型打造「一对一」旅行智能助理

在「初创组」的赛场上,「智游幻境 Odyssey Agent」团队的成果让评委们印象十分深刻。

这个团队由五位热爱旅行的年轻人组成。众所周知,旅行的回忆是美好的,但旅行前的规划是千头万绪的。出行的人常常花费大量时间辗转于各个平台之间,获取信息、制定行程、预定服务,如果涉及出境游难度更甚。

以 Gemini、ChatGPT 为代表的对话式 AI 应用,也具备提供旅行信息推荐的能力,但往往只有「第一次可用」。很多时候,如果我们继续追问,后续对话可能很难与前面所谈行程保持一致。而且这些基本只能集成单个平台的信息,无法做到有效整合旅行过程中全部所需信息。

能不能做一款提供一站式定制旅行服务的大模型应用呢?五个人一拍即合,决定打造一个「旅行规划智能助理」。尽管团队中有几位成员在大厂的工作非常忙碌,但他们还是利用业余时间快速打造出了这个项目的雏形。

图片

具体来说,他们参考 agentUniverse 多智能体框架的交互模型设计思路,针对旅行场景搭建了一套多 Agent 协作体系:「CHaTS」(Consult,Hotel and Transportation,Spots)。

生成一个七日行程平均要调用大语言模型 50 余次,能在 3 到 5 分钟内返回一个城市的旅行规划和游记 Vlog。对于用户来说,最大的体验提升就是推荐的攻略细节真的更丰富了。

图片

由于涉及到多个大语言模型生成机制,为了避免前后行程矛盾、关键信息的遗忘以及 token 长度和整体成本问题,团队引入了共享记忆和 tool memory 机制。具体来说,他们将相关工具的执行结果(比如机票 / 酒店查询结果、每日景点推荐),在简单地预处理后进行本地存储,或者通过 Qwen 模型的 File 编码的形式存储在云端,降低了频繁调用工具造成的时间和经济成本,也避免了模型在重新推荐时产生幻觉或者矛盾冲突。

尽管目前的「智游幻境」还处于早期版本,却恰好展示了大模型在旅行类应用赛道的想象空间。团队表示,未来的「智游幻境」可以引入更强的大模型、更多的模态、更丰富的场景。比如通过 VR/AR 设备、无线耳机、摄像头等设备的联动,这款应用可以变为一个能看、能听、能说的「导游」,带来更沉浸的旅行体验。

从观光推荐到实时翻译服务,这样一款应用真的有可能彻底改变旅行者与世界互动的方式。

让大模型融入科技金融业务的「系统工程」

相比于挑战组和初创组,大赛的「企业组」赛道主要着眼于科技金融行业的新兴方向,鼓励科技金融行业的中小型企业提报有亮点、有新意的新技术、新产品落地项目。

深擎科技是一家成立六年的公司,多年来利用 AI 与大数据分析技术,为券商银行提供智能投顾助手和个性化内容生成相关产品,也见证了大模型技术的兴起和爆发。

在数十家参赛企业中,深擎科技提交的方案受到了较多的关注。简单来说,他们围绕 AI Agent 的基座,打造了一整套行业「刚需」的应用产品体系。

对于那些想用大模型变革自身业务的金融机构来说,在实践中往往会遇到一些挑战:如何快速响应业务需求,让业务参与到大模型应用场景的打磨中来?投入的大量配套研发,如何沉淀,算子化、可复用的最佳实践?如何量化评价场景效果,上线后如何持续优化迭代?

核心的问题就是,技术的快速迭代与金融业务所需的确定性之间,如何平衡?

深擎科技给出的解决方案是 AI Agent 平台「乾坤圈」,将大模型能力融入到金融业务的「系统工程」之中。

图片

在不同基础模型各有所长的今天,「乾坤圈」的一大亮点是支持多个基座大模型协作完成业务交付,且支持本地化、SaaS 大模型服务接入,兼容主流的开源和闭源模型。

此外,「乾坤圈」还提供了敏捷的 AI 场景构建模板和工具,让机构以低代码甚至无代码的方式迅速构建业务场景应用,解决了大模型落地中容易产生的「重复造轮子」问题。

基于「乾坤圈」,以往业界存在的金融领域大模型幻觉控制、业务数据和知识接入、生成结果合规安全性、产研运营端到端效率和生成结果质量评测问题,都得到了有效解决。

实际上,「乾坤圈」平台的技术探索也代表了当前大模型落地的整体趋势,对于很多专业门槛较高的领域来说,只有面向真实的产业场景设计垂直解决方案,才能实现以技术解决真问题的初衷。

目前,深擎科技的产品已经实现 PMF(Product Market Fit),覆盖了 80% 的大中型券商和 50% 的大型银行,近几年的主营收入年复合增长率超过 80%。

图片

接下来的阶段,大模型技术与金融业务场景的结合也会越来越紧密,深擎团队希望持续完善「乾坤圈」,在大模型和金融行业的交叉领域做更多从 0 到 1 的创新,为金融机构实现「数字化、集约化、精细化」客户经营提供动力。

期待大赛能诞生出中国的「OpenAI」

在有关大模型的讨论中,「人才」始终被认为是非常关键的竞争要素。

以 AFAC2024 大赛为代表的技术赛事之所以备受瞩目和火爆出圈,因为它既能提供一方培养 AI 人才的土壤,也切实给到了这些高潜力 AI 人才需要的扶持资源。

比如,对于「拥抱 AIGC」团队来说,这是一次走出校园、直面产业真题的宝贵机会;对于「智游幻境」团队,这是一次走上广阔舞台、验证自身设想的契机;对于「深擎科技」团队,这是一次与业内最顶级同行比拼、促进自我提升的精彩旅程。

纵览 AFAC2024 大赛的 4800 多支队伍,「年轻化」和「多元化」也是本次参赛群体的一大特质。但这些年轻的队伍却做到了对前沿技术的极致追求,以长远的眼光去看,未来中国的「山姆奥特曼」和「OpenAI」,很可能就诞生在这些充满技术热情的队伍中。

AFAC 组委会相关人士表示,希望大赛里涌现的出来各种优秀人才,能成为国内大模型领域的中坚力量,最终造福于整个行业的发展和创新。
产业AFAC2024
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

蚂蚁集团机构

蚂蚁集团是移动支付平台支付宝的母公司,也是全球领先的金融科技开放平台,致力于以科技和创新推动包括金融服务业在内的全球现代服务业的数字化升级,携手合作伙伴为消费者和小微企业提供普惠、绿色、可持续的服务,为世界带来微小而美好的改变。

http://www.antgroup.com
语言模型技术

统计式的语言模型是借由一个几率分布,而指派几率给字词所组成的字串。语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。

对话系统技术

对话系统大致可以分为两类:(1)面向任务的系统和(2)非面向任务的系统。面向任务的系统旨在帮助用户完成某些任务(例如查找产品,预订住宿和餐馆);非面向任务的系统在与人类交互过程中提供合理的反应和娱乐。通常,非面向任务的系统致力于在开放域与人交谈。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~