金融大模型，在黎明破晓前丨豆绘AI

发布时间：2023-09-01 10:00:13 浏览量：281

导语：8月31日，首批大模型产品将陆续通过《生成式人工智能服务管理暂行办法》（以下简称《暂行办法》）备案，可正式上线面向公众提供服务。包括百度文心一言、抖音云雀大模型、智谱AI的GLM大模型、中科院的紫东太初大模型、百川智能的百川大模型、商汤的日日新大模型、MiniMax的ABAB大模型、上海人工智能实验室的书生通用大模型、科大讯飞星火大模型，以及华为、腾讯的大模型产品，共计11家。悬而未决的政策准入已

8月31日，首批大模型产品将陆续通过《生成式人工智能服务管理暂行办法》（以下简称《暂行办法》）备案，可正式上线面向公众提供服务。

包括百度文心一言、抖音云雀大模型、智谱AI的GLM大模型、中科院的紫东太初大模型、百川智能的百川大模型、商汤的日日新大模型、MiniMax的ABAB大模型、上海人工智能实验室的书生通用大模型、科大讯飞星火大模型，以及华为、腾讯的大模型产品，共计11家。

悬而未决的政策准入已然落地。而通过备案的主体包含了互联网大厂、AI独角兽、科研国家队三方，也基本明确了国家对不同主体路径的肯定。

据上海申浩律师事务所对《暂行办法》进行了解读，《暂行办法》的规制重点在于服务应用层的信息内容安全，限制境外AIGC提供服务。更重要的是，《暂行办法》对境外AIGC的限制不包括垂直领域如工业、科研等场景，只要其不向公众提供服务。

换言之，目前《暂行办法》备案的关键在于“向公众提供服务”。这对于大模型企业而言，显然可以优先在面向C端的模型应用中积累用户、数据，更利于产品打磨。而未通过备案的企业组织也不会因此在研发上遭遇阻碍，反而在能获取海外AIGC调用能力的情况下，技术演进的进程有可能相对更快。

这或许会引发大模型玩家们形成落地偏向与技术偏向两条路径。

更值得注意的是，通过备案、面向公众提供服务的资质显然加快了金融、教育、法律等严肃场景的模型落地的进程。

以金融大模型为例，金融领域合规先行的特点一度限制了模型能力在实际业务中的应用，导致行业整体处于场景探索的阶段。而今首批模型产品获批开放，金融大模型赛道的转折点也已到来。

明面务虚，私下务实

今年3月，头部财经资讯公司彭博社发布了专门为金融领域打造的大模型BloombergGPT，试图将其积累40年的财经资讯数据价值得到释放。

彼时的彭博社可能没有想到，金融在大洋彼岸已经成为垂直领域大模型的抢跑者。

尽管早在彭博社开始着手搭建训练BloombergGPT前，已有不少研究表明使用特定领域数据训练的垂直大模型能在特定领域效果拔群，但当行业大模型的风吹到我们这时，有吸引力让垂直领域公司投身大模型，而非等待整体解决方案的似乎只有金融一家。

早在今年5月，度小满便发布了自研千亿参数金融大模型“轩辕1.0”，目前“轩辕2.0”已开源。奇富科技、马上金融、蚂蚁集团等金融科技企业紧随其后，先后组建了自研大模型团队并投身其中。

当然，金融领域外的互联网大厂与科技公司也希望就金融大模型分一杯羹，去年10月于科创主板上市的大数据企业星环科技同在5月推出面向金融量化的大模型“无涯”，腾讯云、科大讯飞、恒生电子等玩家也就金融领域的风控、客服等细分赛道推出自己的大模型解决方案。

金融一直是前沿科技希望结合与落地的垂直领域，甚至可以说金融史中暗藏着科技史的发展脉络。早在2016年为国际金融稳定理事会（FSB）定义的金融科技迎来大模型这一轮风口，当下局面其实并不出人意料。

无论是面向消费者市场与小微企业的金融普惠、面向金融机构的智能投研还是面向投资者的大数据洞见，大模型在金融领域的应用都有充足空间嵌入并释放价值。

大模型作为继互联网、移动互联网后的第三波浪潮，再次将金融机构拉回同一起跑线。

有BloombergGPT这个基础案例珠玉在前，为金融大模型的落地指明方向。总体看来，目前金融大模型的落地方向有以下几大类，几乎囊括了金融领域的方方面面:1、大数据风控的进一步迭代

2、金融相关文本生成，如财报、新闻、评论等

3、辅助决策的智能投顾、智能投研与辅助运营的智能客服

4、金融行业的“copilot”，包含债券发行、IPO、审计、评级等金融业务

当方向明朗之时，落地成果便成为检验产品的唯一标准。只是我们可以在公开信息中听到不小的声量，但却没法寻到落在实处的案例。这并非玩家们“藏拙”，而是金融大模型在落地途中不断遭遇两方面的掣肘:技术不成熟与场景不适配。

某公募基金经理告诉光子星球，金融大模型真正能落地应用的功能较少，且落地场景集中在中后台的客服、新闻播报等较为简单的to C生成式内容上。

“面向C端投资者的券商会应用多些，我们基金机构的监管更加严格，所以对创新会保持关注，这种新技术应用落地一般会滞后很多”，该基金经理称。

或许机构视角更为审慎，可是在互联网大厂视角下，金融大模型的八字依然没一撇。

一位腾讯高级架构师直言，金融大模型的应用还需要探索场景，明确的赛道仅智能客服、辅助编程等寥寥几项。在“模型在具体场景的打磨还有许多工程性问题未决”的前提下，应用与商业化还无从谈起。

上述人士表示，“技术成熟度、场景适配性两个问题解决后，行业需求和产业共计之间还需要找到一个投资回报的平衡点。应用推广除了是技术问题外也是商业问题。”

或因如此，尽管金融大模型的风吹了一阵又一阵，我们也未能在各大对应用与理论侃侃而谈的发布会、论坛中看到真正应用在金融场景的大模型案例，基本上是技术较为成熟的风控场景与封闭性较强的智能客服。

这并不奇怪，金融领域本身存在大量时效数据，结合当下大模型普遍存在生成内容不可解释性，面对以严谨著称的金融行业，碰壁是可想而知的事。

正如国家金融与发展实验室副主任杨涛撰文指出那般，当人工智能大模型在金融领域应用时，更需关注大模型的可审计性、可解释性等难题以及参与金融活动引发的风险特征变化、数据保护、责任分担、合规边界等问题，并强化数据伦理、算法伦理、主体伦理、行为伦理等方面的治理。

合规先行者已经出现，但合规也无法完全解决金融大模型的既有问题。唯有褪去光环，我们才能更好地梳理金融大模型的前世今生和未来，找到大模型在金融领域抢跑的答案。

回归提效本质

我们简单回顾此前的金融科技创新，不难发现畅想中的大模型应用早已存在，不过一直处于“雏鸟”的状态。

例如金融科技业务中占核心地位的智能投研便诞生于2016年前后，而迄今为止称得上成熟且步入商业化的应用还是处于较初级的阶段——金融数据与资讯终端，例如Wind、ifind等SaaS金融资讯软件，定位是为业内外人士提供垂直信息平台。

更进一步的应用也早已没了声音，就像曾被标普500以5.5亿美金收购，如今泯然众人的智能投研企业Kensho。

“金融数据信噪比太低了，和工业界的数据相比是数量级的差距。再考虑到金融数据的时序性与时效性，无论是机器还是人都难以找到可持续的模式。AI可以根据风险逻辑去拿Beta（与市场相关的可预测收益），但一直很难拿到Alpha(与市场不相关的超额收益)”，一位业内人士直言。

据多位业内人士介绍，金融数据经NLP（自然语言处理）提取后交由机器学习，将成果以预输入的投资规则在智能化交互界面输出是几年前的智能投研范式。大模型的引入不过是加强了机器学习的记忆、决策等能力，而且输出的结果，按从业者的话说是“跟蒙眼投资差不多”。

实际上，大模型为金融行业带来的并不止是单独业务能力的跃升，而是大模型的“large”所提供的泛化能力。

金融机构在过去智能化进程中，早已在风控、投研、投顾、评级等业务线构建模型与中台，辅助从业者推进业务的同时也在不断积累文本数据。而大模型的出现提供了一个将打乱的中台整合为一体的契机，既不需要多次建模也能打破各中台之间的数据孤岛。

最终呈现是以金融大模型为底座从而整合并不断延展机构的能力，好比阿里曾经在组织变革中提出的“大中台，小前台”。

于金融机构而言，这不仅是效率的提升，更是效益的跃升。当然，如今距离这项堪称“圣杯”的目标还有不小的距离，而大模型相对早先NLP、CV时期的能力演进已经在部分业务中得以体现。

以ESG资管企业秩鼎为例，其创始人刘相峰称，秩鼎的金融大模型能力应用正逐渐铺开，目前已在初级的数据收集整理与研究工作上做到了人效跃升。虽然ESG与传统金融存在一定距离，尤其是在数据信噪比方面，但作为为数不多的落地案例，有一定参考价值。

据了解，秩鼎的内部模型训练采用的同样是“预训练——精调（STF）——对齐(RLHF)”的范式，不同之处在于其实体识别系统可以将初步提取后的ESG相关事件匹配到唯一主体上。这对于模型知识图谱的构建，尤其是中文领域是一次不小的进步。

结合BloombergGPT仅以500亿参数规模做出一定效果，我们或许可以下一个判断:即金融大模型乃至行业大模型的落地收效如何，看的不一定是大力炼丹，而且训练精调以及应用工作流后的一些细小动作。

例如轩辕2.0在常规垂直模型训练混合大量通用数据，避免灾难性遗忘导致模型“变笨”，还在此基础上将预训练的数据以及指令微调数据进一步混合，其论文中将这种把预训练和精调融为一体的范式称为Hybrid-Tuning。

未来的范式演进我们犹未可知，但这细小的每一步都在为模型与金融行业提效，推动行业向实处走去。

金融大模型破晓前

金融大模型已经来到了价值释放的前夕。

政策准入一定程度上打消了场景方面的顾虑，更多能力可以在实际业务中得到应用，而技术成熟度亦在细小创新中缓慢提升。在破晓前的微妙阶段，金融大模型的商业模式与格局的前瞻性思考是有必要的。

结合《暂行办法》中对公众开放服务的审慎态度，接下来一段时间的金融大模型大概率不会过早向C端释放其能力，而是在内部业务的应用试错中迭代。

这意味着当下各个机构的研究部门更多会“刀刃向内”，试图于工作流中提升研究工作的效率和效益，围绕研究业务本身展开。而且出于数据隐私等方面的考量，在模型部署上会更看重私有化部署甚至是端侧部署。

即使存在自主可控的强需求，让每一家金融机构都从零开始储备算力、招募人才并训练机构的大模型，也显然是不现实的。更大的可能是由资源更多的主体或是基于某一底座或是完全自主构建出金融大模型，再以服务的方式就模型做私有化部署。

所以我们也不难发现度小满、奇富、马上金融、蚂蚁等金融科技头部纷纷投身自研模型的原因:并非只是自身已有充分的技术与数据储备，而是前方有大量存在确定性需求的中小金融机构客户。

B端应用方面，接入模型能力后的工作流势必也将发生改变，就像Kensho曾扬言“用AI干掉证券分析师”，届时金融机构的组织制度也将生变。

当机构内技术团队不断壮大，技术演进让内部效率达到一定高度后，届时金融大模型才可以强调业务的外部性。将价值释放面向的群体由B端转为C端，例如幻觉问题可控后，具备可解释、可溯源的AI投资能力。不过这一阶段的到来显然还需要很长的时间。

无论如何，合规进程在《暂行办法》的实施与备案中已前行一大步。冰山之下，各家金融大模型已蓄势待发，我们很可能在接下来的9月感受到国内大模型行业，继4月密集发布、6月垂直转向后的一个新节点。大模型的下一战——金融，市场等待玩家们的答案。

上一篇：图灵测试已死！ChatGPT通过人类考试也不算，超强AI评估新秀「逻辑谜题」

下一篇：美法院判AI无版权，但争议远没结束

声明： 本站所有文章，如无特殊说明或标注，均为网友发布。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。