开元体育爱分析参编《北京市人工智能大模型行业应用分析报告》发布,展现北京市大模型相关技术产品在各领域各行业的应用发展态势,并提出有关建议,为未来决策提供参考。
注:长按扫描下图二维码或点击文末左下角“阅读原文”,可下载完整版《北京市人工智能大模型行业应用分析报告》。
2023年,大模型落地集中于边缘场景。大模型兴起于2023年初,经过近一年的高速发展,其在政务、金融、产业升级等各个领域均有落地应用。大模型在政务领域,以政务问答、文件生成等场景为主;在金融领域,以智能客服、售前助理等场景为主;在产业升级领域,以知识问答、代码补全等场景为主;在医疗领域,以医疗文书生成、智能医药问答等场景为主;在文化教育领域,以内容润色、内容纠错等场景为主;在智慧城市领域,以公共安全监测、城市运行报告生成等场景为主。但上述场景大多为所属领域的边缘场景,不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。
2024年,大模型逐步向核心场景挺进。得益于大模型在边缘场景价值的成功验证及其技术演进,大模型在深耕边缘场景的同时开始向核心区挺进。在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。例如某运营商在2023年研发客服大模型并试点上线,由数万名员工内测试用,该运营商计划2024年开始在集团范围内加快规模化商用推广。大模型技术演进主要指检索增强生成(RAG)、智能体(AI Agent)和多模态,他们对扩大大模型应用范围有明显作用。检索增强生成技术是指大模型在回答问题时,会先从大量的文档中检索出相关信息,然后将这些检索出的信息作为提问的上下文构建提示词,大模型再基于提示词进行归纳总结,生成答案,检索增强生成技术主要用于解决大模型幻觉问题开元体育官网登录入口。智能体技术则可以实现大模型应用的能力升级,例如,类似ChatGPT的大模型应用仅能起辅助作用开元体育,而智能体技术可以赋予大模型感知、规划、记忆和使用工具的能力,实现独当一面。多模态技术使得交互模态不局限于单一的文本模态,而是扩展至文本、图片、音频、视频等多种模态,可显著提升大模型应用的产品功能和交互体验,推动大模型应用从可用向好用转变开元体育。
大模型在各个领域均有落地应用,其中在产业升级和金融领域的落地步伐最快。2023年公开招投标统计数据显示,产业升级相关大模型项目招标金额最多,占比高达32.5%,金融占比紧随其后,占比为28.2%。
央国企需求旺盛,引领大模型在两大领域快速落地。央国企守正创新,有较强意愿自上而下推进大模型应用。同时,央国企通常具有较强的数据基础设施、算力投入和AI应用基础,为大模型成功落地提供先决条件。在央国企引领下,大模型在产业升级和金融领域快速落地。
大模型基础能力提升、开发工具逐渐完善,为培育大模型应用提供肥沃土壤。大模型持续迭代,语义理解、上下文长度、多模态等能力愈发完善,有利于开发上层应用。同时,随着行业发展,大模型生态也在逐渐成熟,各类便捷的AI开发工具陆续推出,应用开发难度显著下降。例如百度于2024年推出的智能体开发工具AgentBuilder开元体育官网登录入口、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder开元体育官网入口登录,可以帮助不具备代码编程能力的人员完成大模型应用开发。
动态行业数据成为大模型落地新关键开元体育。基础大模型一般是基于广泛的公开文献与网络信息来训练的,属于“泛行业”,没有特定行业属性,导致基于其搭建的上层应用在专业和细分领域难以提供高价值服务。因此,打造行业大模型成为需求方和技术企业的共同关注点。具体而言,“动态行业大数据”是打造行业大模型的核心,其是指为保证行业大模型的持久生命力,技术企业应具备动态更新行业大数据的能力,而非只掌握一批“静态数据”。拥有“动态行业大数据”的技术企业更容易获得需求方青睐。
需求方IT能力越强,越倾向采购基础大模型,反之则倾向采购大模型应用。需求方IT能力差异显著,这会直接影响他们的采购行为。强IT能力的需求方倾向能力建设,较弱IT能力需求方倾向应用建设。聚焦大模型,强IT能力的需求方通常倾向采购基础大模型,通过自行微调来开发各类上层应用。IT能力稍弱的需求方通常倾向采购“企业大模型”,即由技术企业基于需求方数据对基础大模型进行微调。IT能力更弱的需求方通常倾向采购大模型应用,实现“开箱即用”,由技术企业对基础大模型进行调整和封装,需求方无需关心。
需求方IT能力越强,越具备在智算中心私有化部署大模型的条件,反之则更依赖大模型一体机和公有云部署。强IT能力需求方通常已自建智算中心,其具备高端GPU资源,支持大模型的训练和推理工作。IT能力稍弱的需求方通常采用大模型一体机,其仍为私有化部署模式,由技术企业对大模型、应用、算力资源进行整合,形成端到端解决方案,便于大模型在需求方快速落地。IT能力更弱的需求方通常倾向公有云部署,此种方式更省心且初始投入较低,有利于需求方低成本快速试错。
大模型训练及应用通常涉及四类参与主体,均存在安全需求。大模型开发及应用全流程通常涉及数据提供方、大模型应用使用方、基础大模型提供方、大模型应用提供方四类参与主体。它们在合作过程中需要解决信任及隐私安全保护问题。数据提供方面临数据使用过程中的各种不安全因素;大模型应用使用方担心在使用过程中泄露核心业务数据,该担心并非空穴来风,例如2023年三星设备解决方案部门因使用ChatGPT导致半导体设备测量、良品率/缺陷、内部会议内容等相关信息被上传到ChatGPT服务器中,造成广泛负面;基础大模型提供方面临模型产权被窃取风险,特别是对于初创企业而言,基础模型是公司的核心资产;大模型应用提供方面临微调参数成果泄露风险。
大模型安全逐渐受到重视,为可持续发展提供保障。在大模型行业发展初期,各参与方聚焦大模型、算力等方面,对安全性重视程度不足。随着行业发展逐渐深入,各参与方的安全呼声越来越高。反映到技术企业端,已有一批企业推出大模型安全类产品,为可持续发展提供保障。
大模型被认为是建立在充沛算力之上的“暴力美学”,随着大模型兴起,市场上算力需求剧增。不论是公共算力还是企业自建算力,尚无法完全满足大模型企业对于智能算力的需求。随着
大模型应用地更深更广,算力紧张情况预计仍将延续开元体育网站入口。特别是大模型在训练环节需要大型算力集群,但市场上存在较多分散算力,难以用于大模型训练,加剧了算力紧张情况。
知识产权保护与大模型应用之间的法律平衡点仍在探索中。大模型训练涉及的数据可能包括一些版权保护的作品,从知识产权保护的角度而言,可能需要禁止使用,避免生成侵权回答。但是,这些作品数量众多、来源各异、权属不同,若采用事先授权许可的方式,这一过程漫长、复杂且几乎无法落地操作开元体育。一是技术企业需要精准地将受保护的作品从海量数据中进行分离开元体育官网登录入口、提取;二是技术企业需要找到每一部版权作品对应的权利人与之协商授权,并支付价格不一的授权费用。
数据隐私保护与大模型应用之间的技术平衡点仍在探索中。对于数据隐私保护和大模型效率之间存在着一个两难的矛盾——既要最大限度地保护数据隐私,又要最大限度地发挥模型的效果。在政务、医疗和金融领域,该矛盾尤为突出。通过开发可信的框架,从而在数据隐私保护、模型效果和训练效率之间取得一种平衡,是业内的重点讨论方向,但仍在探索中。
大模型幻觉问题是影响行业大模型在部分领域落地应用的关键开元体育官网入口。政务、金融、医疗等领域对大模型输出内容的专业性、准确性有较高要求,对不准确回答的容忍度较低开元体育官网入口。例如在政务领域,面向公众的政务问答一旦生成错误的答案,将给工作人员带来额外的解释成本。
当前缺乏“根治”幻觉的方法,大模型规模化落地受阻。尽管当前较多大模型技术企业采取引入提示词工程或外挂知识库等方式进行内容校准,在一定程度上可以缓解大模型幻觉问题。但是,这种方式一定程度上限制了大模型的通用泛化能力,难以从根本上解决幻觉问题。
需求方在输出内容的专业性、准确性等方面要求较高,特别是在政务、教育、医疗等领域,尤为明显。当前大模型落地的各类应用大多处于可用阶段。这也导致需求方主要让内部员工使用大模型应用,而不对外服务。虽然现阶段大模型应用不能完全符合需求方实际业务要求,但需求方已经从早期试点过程中看到了大模型价值和可持续优化的潜力。因此,多数需求方有意愿携手技术企业继续深耕大模型应用,推动其从可用迈向好用,让大模型的价值在员工群体和客户群体中得到“全量释放”。
金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应,在凝练场景、开放数据、模型训练等过程中考虑监管因素,在项目交付时考虑所属领域可能存在的特殊要求。例如部分需求方为了保证数据不出域,可能要求技术企业采用驻场微调的方式。
金融领域应用大模型的市场驱动力较强,且结合点较多。金融属于高工作效率可以带来高回报的行业,金融机构为了追求更高的工作效率,更及时的决策分析,往往愿意为能显著提高效能的大模型产品买单。从实际落地角度来看,大模型可以和金融机构现有的软件系统、模型较好融合,相辅相成。目前,金融领域应用主要集中在保险售前助理、智能投研助理、招股书生成编写、智能研报合规审查、智能客服等方向。除此以外,部分企业深挖需求,带来了新颖的应用场景方向,如大模型保险理赔受理、大模型智能数据治理、个人/企业信用偿贷能力审查监控等,大模型在金融领域的商业价值将会逐步释放。除商业价值之外,大模型在金融领域的社会价值也开始显露开元体育开元体育官网入口登录,某银行将大模型与消费者权益保护审查平台结合,利用大模型对理财产品宣传材料实现自动生成审查意见开元体育,推荐优秀相似案例作为参考,辅助审查人员开展审查,能有效解决基层审查能力不足的问题,银行方审查速度和审查准确性得到大幅提升。
大模型在金融领域落地尚面临行业监管和算力资源等诸多挑战。金融行业监管严格,对大模型的输出结果准确性、安全性、合规性都具有较高要求开元体育,且金融机构数据隐私性较强,难以在机构间共享,大模型产品往往需要进行私有化训练及部署,这对于金融机构的算力资源提出新的挑战开元体育官网入口登录。同时,金融机构对私有化部署的依赖会引发大模型知识持续学习等问题。
一是建立完善的政策和监管环境。制定明确的政策框架和监管指导原则,确保大模型技术在金融领域的应用,既促进创新,又保障金融系统的稳定性和安全性。设立监管沙箱,允许金融机构在一定条件下测试大模型技术的应用,通过实践探索合理的监管框架,为未来的监管政策提供依据。
二是鼓励金融机构完善大模型基础配置。当前,金融机构已经逐步开展数字化,具备独立的信息数据平台,应持续提升金融机构在大模型应用方向的数字化基础,依托自身数据平台,构建安全高质量金融数据集开元体育网站入口,保证数据准确有效,数据来源可追溯,生成内容专业、权威。同时开元体育,鼓励金融机构加大在人工智能算力上的投入,引入平台级安全算力底座,为技术企业快速安全部署大模型应用提供渠道。
三是可以尝试在对公业务中探索大模型应用。当前大模型在金融领域的应用主要集中在对私业务,可以尝试向对公业务探索。例如将大模型与企业信贷业务进行结合,利用AI Agent技术将大模型、OCR、RPA等技术及组件进行调用,打造信贷助手,协助信贷经理完成资料收集、风险分析等工作。
医疗领域核心场景重视准确性及可解释性。诊断场景作为医疗领域的核心场景,需要大模型结果准确,同时给出判断依据,还应支持生成结果可回溯、可验证,这对技术企业的医疗业务积累以及技术方案的设计都提出了更高的要求,不少技术企业将大模型尝试应用于科研及教学环节,推动医疗领域更快实现大模型应用落地开元体育。
医疗数据治理面临隐私及标准化的挑战。当前医疗人工智能产品训练所需的基础数据,均来源于医疗机构在不同时期逐步部署的异构信息系统,不同的医疗机构之间医疗数据仍难以互联互通、共享共用,这阻碍了医疗数据在大模型甚至多模态大模型上的进一步分析利用。同时医院内部对数据管理严格,对数据安全与用户隐私保护要求很高,只支持大模型在医院内部私有化部署训练,无法出域训练,这种方式一定程度上限制了大模型在医疗领域的商业化落地。
医疗机构私有化落地成本较高。大模型在资金、时间、算力、硬件设施和环境等方面具有高昂的开发和运营成本开元体育。大模型训练与推理对算力要求大,科研单位及医疗机构自建算力所需的前期购买与后期维护的人员与资金成本极高,在当前算力短缺的情况下,医疗机构私有化部署医疗大模型难度加大。
一是从医疗全流程入手,开放有价值业务场景。从加快场景落地考虑,在持续推进医疗诊断等核心业务的同时,拓展医疗行业全领域业务场景,从互联网诊疗、诊前诊后全流程管理、科研场景、民营医院入手,鼓励本市大模型团队找准行业或场景数据优势错位发展,探索大模型在医疗领域的商业化模式和产业化发展路径。
二是推动构建北京市医疗大模型公共数据集。协同各类主体加快构建高质量的医疗领域公共训练数据集,推动医疗数据泛知情同意,按照尽职免责原则实现数据出院。研究制定数据集规范格式和使用标准,组织医疗数据治理能力强的企业进行医疗数据标准化治理,利用医学知识图谱技术,识别医疗实体并建立关联,形成结构化知识网络,针对病历文本进行语义分析,抽取症状、疾病等概念,有效提升医疗数据的质量,为训练更准确、可解释的医疗辅助模型奠定基础。
三是大模型技术企业与医院IT解决方案供应商加强合作。医院通常有固定合作的IT解决方案供应商,其他技术企业全新建立与医院的合作关系较为困难。大模型技术企业需要结合自身的技术特征、目标场景等要素,选择合适的医院IT解决方案供应商进行合作。
文娱领域是大模型应用最容易落地的场景。需求方面,影视、短视频、电竞直播等文娱方向在国内具有快速发育的土壤,而大模型在为文娱产品提供多样化、创造性的素材内容的同时,极大降低制作的成本和门槛。技术方面,文娱领域对大模型生成素材的准确度要求不高,而且当前文娱领域的监管相对宽松,大模型落地的试错空间较大。并且,随着以Sora为代表的多模态大模型的发展,将会明显加速大模型在文娱领域的落地步伐。
文化领域创作过程独特,对大模型创作的使用道德边界提出挑战。部分业内专家认为,内容创作需要基于人的情感需求,与阅读者达成共鸣。使用大模型进行创作的作品能否在质量上与人为创作的作品媲美、能否为阅读者提供正向情绪价值、是否能够区分是“创作”或“效仿”、是否能有效规避伦理等问题,仍需对创作的边界进行界定。
教育行业大模型落地面临伦理安全、部署条件、教学方式转变等多样挑战。教育领域在实际推广大模型应用中面临诸多挑战,一是教育领域对于伦理等问题容忍度较低,大模型可能会复制其训练数据中存在的偏见,这可能导致不公平的教育结果,目前对于大模型应用缺乏统一的标准指引,学校准入标准尚未形成。二是教育资源的数字化、标准化程度不足,算力资源的投入和成本控制或将制约大模型在教育领域广泛应用。三是教师和学生对人工智能大模型技术的接受程度和适应能力不同,如何有效增强教师与学生的数字素养和对未来技术的适应能力,是推广大模型应用的关键。
一是充分挖掘文化教育领域数据资源。鼓励文化机构开放数据资源,挖掘文化数据价值,通过政策激励、资金支持等方式,推动相关版权数据、音视频数据汇聚共享,为大模型提供丰富的训练和测试数据。
二是完善大模型伦理监管手段。将伦理监管制度与大模型应用情景相结合,健全大模型伦理审查清单,完善伦理审查复核机制,开展常态化科技伦理审查,同时做好大模型伦理监管制度宣贯,提醒企业将科技伦理的审查流程纳入产品规划。
三是选取部分学校优先试用大模型开展教学活动。推动在部分学校中开展先行先试,开展大模型辅助教学模范教师评选,激发教师使用大模型的积极性。在示范试点的建设过程中针对教师及学生在教学关键环节中面临的问题,在教案设计、命题助手、作业批改、智能助教等方面优先推广应用。
产业升级领域大模型应用推广具有强辐射效应。一方面,产业领域内上下游企业在结构属性和价值属性上关系密切,一旦领军企业打通了大模型在行业内的应用路径,将会直接驱动行业上下游企业利用大模型进行数字化转型和生产效率优化。另一方面,大模型赋能产品大规模进入市场,将会更新社会群体对大模型应用的直观认知,从而带动其他领域对大模型的尝试。
集团化的大模型解决方案可最大程度激发大模型应用效能。某个单点应用往往难以驱动企业在大模型上进行投入,构建集团内的通用大模型,并将大模型能力渗透到集团各个业务线,将有助于加速大模型的产业化落地。以汽车产业为例,部分汽车制造商预计在大模型应用研发上投入几千万元到上亿元的资金,从产品端的智能语音座舱、自动驾驶数据标注,到产线端的设备智能运维、产线效率优化,再到营销端的智能客服、产品推广等各个环节,全面推进大模型应用。
产业升级领域需求较为分散。传统产业界缺乏对大模型能力边界的具体认知,不同企业在探索大模型应用上会采用不同的路径。部分企业优先在边缘场景打下试点应用,以降低试错成本,另一部分企业则优先在核心场景上引入大模型,以获取最大的价值收益,大模型在整体产业链上的应用呈现多点开花的局面。传统产业界对大模型的需求也各不相同。部分企业认识到大模型价值,进而主动拥抱大模型,另一部分企业由于内部未建立大模型价值共识,仅为避免被竞争对手拉开差距,而应用大模型。
一是充分发挥央国企行业带头作用。央国企多为各行各业的龙头企业,拥有丰富的场景及资金资源,应鼓励央国企主动开放大模型应用场景,帮助其理清产业痛点,评估落地风险,凝练各环节应用需求,对接优质大模型技术企业,打造全产业链、全流程解决方案,推动大模型应用在央国企率先落地,形成良好的示范效应。
二是将智能客服应用作为行业渗透的敲门砖。在大模型技术应用薄弱的行业内可优先推广智能客服场景,从需求侧讲,行业内企业可以直观的体验到大模型带来的便捷服务,增强企业内的群体认同,为后续推动大模型在全产业链的应用落地减小内部阻力;从技术侧讲,智能客服应用场景属于大模型的通用场景之一,相对技术难度较小,且可充分发挥大模型技术优势,有助于大模型快速落地。
三是加强对中大型企业管理层培训力度。中大型企业是产业升级领域拥抱大模型的潜在客户,是大模型进行市场下沉的“必经之路”。当前,中大型企业管理层对大模型的认知较为薄弱,缺乏推动落地的意愿。因此,有必要面向管理层加强培训力度,助力大模型更快更好地发展开元体育官网入口。
政务领域大模型应用场景丰富,但公共属性偏多,商业化落地动力不足。政务领域作为社会服务的核心,业务背景包含大量政府数据及社会信息,主要工作包括公文撰写、政策研究、服务民众,因此政务领域从数据积累和业务需求上都适合大模型落地。当前政务领域已经在核心业务上初步形成产品,以政务助手的形式对不同来源的文件(如政府报告、政策法规等)进行分析、总结,并形成公文素材。然而,归因于政务领域落地周期长、准确度要求高、经济效益较低等原因,对企业的成本和技术挑战较大,令不少大模型企业望而却步开元体育官网入口。目前从事政务大模型的企业主要有以下两类:一是希望在政务领域打造大模型标杆应用的头部大模型企业;二是前期政务领域系统的技术服务商,在原有系统中扩展大模型功能。
政务领域大模型短期内难以具备直接面向公众提供精准政务问答的能力。政务问答对准确度要求极高,一旦生成错误的答案,将给工作人员带来额外的解释成本,这种风险尤其存在于审批和执法过程中。对问题理解有误、生成内容不准确、关联政策信息过时等问题普遍存在,大模型的幻觉问题短期内难以得到显著改善,在部分业务中尚不满足面向公众提供精准政务问答的条件。
一是鼓励在政务内部优先应用大模型,逐步面向公众开放。短期内在政务领域落地应用方向主要是面向政务工作人员内部使用开元体育官网入口。在该场景下,应明确大模型作为政务助手的定位,引导技术企业重点提升大模型的溯源能力及汇总能力,为用户提供多角度建议以及参考出处,辅助政务工作人员得出结论,通过优先落地内部业务的试点应用为后续实现更高智能化水平的政务大模型打下基础。随着不断测试验证,当模型能力满足一定条件后,逐步探索面向公众上线服务开元体育网站入口。
二是加快打造政务标杆案例,形成全行业示范效应。政务大模型应用重点提升的数据分析及总结功能具有行业普适性的特点,能够横向迁移至各行各业的办公场景中,应把握政务领域数据成熟度高、质量好的优势,从政务领域选取公文撰写、办公助手等落地效果好、可推广性强的案例进行推广开元体育,向社会各界释放政府主动拥抱大模型技术的信号,对齐各行业对大模型效能的认知,带动政务细分领域以及其他行业领域逐步接纳大模型应用。
三是大模型技术企业和政务IT解决方案供应商优势互补,协同推进大模型落地。政务领域对于技术供应商的行业经验、技术实力、综合实力等方面有较高要求。大模型技术企业在与政府部门合作方面的经验可能比较欠缺,而专注政务领域的传统解决方案供应商在大模型技术方面的能力较为薄弱。双方优势互补,有利于满足政务领域客户的需求。
智慧城市对大模型能力需求呈多元化特征。智慧城市涵盖智慧交通、智慧社区、智慧安防等细分领域,均对大模型有明确需求。通过结合物联网开元体育、云计算、大数据等先进技术,大模型能够实现对城市运行状态的全面感知、智能分析和精准决策。例如,在交通管理方面,大模型可以通过分析交通流量数据,优化交通信号灯的控制策略,提高道路通行效率;在环境监测方面,大模型可以实时监测空气质量、噪声污染等环境指标,为城市环保提供数据支持。
智慧城市落地大模型展现出数据治理集中化趋势。为提高市民生活质量、增强城市管理效能,智慧城市需实现城镇化、信息化、工业化的深度融合,解决城市运行中面临的复杂问题。数据作为城市的“新石油”,其重要性不言而喻。当下智慧城市涉及的数据种类繁多、来源复杂,如何有效管理和利用这些数据成为了一个亟待解决的问题。
行业标准和安全保障问题日益凸显。为了确保大模型技术的规范应用和数据安全,需要制定一系列的行业标准和规范,明确大模型技术的设计要求、应用流程和评价标准。同时,还需要加强数据安全保障措施,防止数据泄露和滥用。通过标准化和安全保障措施的实施,大模型在智慧城市领域的应用才能更加规范、安全、可靠。
一是推动智慧城市领域大模型应用协同发展、整体落地。关注交通、社区、安防、能源、环境、公共服务等业务场景间的交互关系,促进大模型应用在不同场景下的数据互通及结果共享,以提升全市运行效率为应用目标,打造“市-区-街-楼”立体化大模型解决方案。同时在实际业务中应加强对大模型深层次能力的拓展和应用,通过提升大模型的应用效果及泛化能力,促进大模型应用在全市范围内横向迁移及纵向拓展,推动大模型应用在智慧城市领域整体落地,尽快形成市场化商业闭环。
二是构建智慧城市大模型数据共享与治理体系。通过构建大数据平台,高效汇聚城市运行中产生的城市管理、交通流量、环境监测等度数据,为大模型提供全面而丰富的数据源。在此过程中开元体育官网入口,数据集经过数据清洗、标注和整合等步骤,形成高质量、标准化的数据集,确保大模型训练和应用的准确性和可靠性。同时,数据治理是保障数据质量的重要环节,只有确保数据的准确性、完整性,才能为大模型的训练和应用提供坚实可靠的基础,进而推动智慧城市的高效、智能化发展。
三是加强大模型应用的安全与隐私保护。智慧城市场景涉及到城市运行和市民生活,发展过程中应面向城市关键数据及用户隐私数据,建立健全大模型应用的安全管理制度,加强对数据的安全防护和隐私保护。同时,对大模型技术的安全风险进行定期评估,确保大模型应用的安全可靠。
13988888888