2023年,人工智能发展风起云涌,步入快车道,通用人工智能强势突围,在全球掀起大模型飓风。2023年,有哪些AI关键词值得铭记?不久前,中国信通院人工智能创新中心发布的“2023人工智能十大关键词”给出了答案。
AI基础设施
大模型的飞速发展正在推动AI基础设施的加速升级。在需求层面,AI基础设施需要支撑万亿级参数的模型训练、TB/PB级别的数据处理与计算,提供万卡级别的算力支撑。在供给层面,AI基础设施要更快、更稳、更易用。
目前针对AI基础设施,百度、阿里、腾讯等企业已开展实践。
而作为亚太地区知名的人工智能公司,同时也是人工智能国家队的科大讯飞,早在2009年就开始布局算力基础设施建设,在总部自建有业界一流的数据中心,截至目前,已建成4城7中心深度学习计算平台。同时还与华为、曙光等国产平台合作,在算力和操作系统方面都有系统性地对接。
2023年10月24日,科大讯飞星火认知大模型V3.0发布,董事长刘庆峰在发布会上表示,为确保数据安全及相关研究不被外国卡脖子,星火大模型V3.0所有训练都是在国产平台完成的,所有应用底层代码都是国产的。
同时他还透露,2024年上半年,科大讯飞将发布星火4.0版,性能方面全面对标GPT-4,而星火大模型4.0的训练工作,也将由科大讯飞与华为携手打造的“飞星一号”平台完成。
高质量数据集
以数据为中心的人工智能时代,呼唤高质量数据集。尤其是伴随着大模型在技术创新和工程落地的齐头并进,高质量数据集供给成为大模型发展的主要矛盾。
从发展需求看,大模型需要高质量的数据,以提高模型精度和可解释性,减少训练时间;需要大规模的数据,以提升模型训练效果;需要全维度的数据,以提高模型的泛化能力。
从供给困境看,目前中文数据集依然存在四个方面的问题,包括在数量方面,中文语料供给不足、开源生态不完善;在质量方面,缺少代码和文献类等高质量开放数据、已公开数据集与模型训练需求不匹配;在供需对接方面,数据资源流通规则不健全、对接生态链缺位;在生态建设方面,缺乏共性关键技术、工具和保障机制等。
从破局思路看,一方面要从加强内部数据治理、用好合成数据等角度,提升企业自身数据供给能力;另一方面,要从搭建数据联盟、绘制数据资源地图、推动共性关键技术联合攻关和推动数据流通模式创新等角度,完善数据供给的行业生态。
大模型能力增强
随着思维链(CoT)、向量数据库(Vector Database)、基于人类反馈的强化学习(RLHF)、提示工程(Prompt Engineering)等前沿技术的应用,大模型的能力愈发强大,智能技术已初步呈现涌现现象。
4.AI基准测试
随着大模型等人工智能技术的快速发展,传统的“图灵”测试和针对深度学习的测试很难覆盖所有的智能应用场景和边界样例,因此很难全面衡量新型人工智能系统的能力。
同时,大模型在知识涌现、思维链、提示工程、多模态信息处理等方面展现出强大的能力,也给AI基准测试带来新的挑战,例如如何测试大模型生成的可靠等。AI基准测试已逐渐成为影响AI技术发展的关键问题。
2023年6月份,中科院人工智能产学研创新联盟和长三角人工智能产业联盟为大模型制定了7大方向481个维度的科学评测体系,截至目前,国内已井喷式出现近百种大模型基准测试,但基准测试仍缺乏统一的体系和方法论,缺乏针对行业和场景实际应用效果进行测试的数据集。
5.生成式AI应用
自去年以来,生成式AI呈现出高效能工具持续出现、应用生态繁荣的新格局。在技术方面,大模型、生成算法与多模态等底层技术的突破成为生成式AI质变的关键。生成式AI更易调用、部署更轻量、成本更低。
今年国内科技公司发布的大模型,如讯飞星火、百度文心一言、华为云盘古等,性能表现持续向好。
特别是讯飞星火,据国务院发展研究中心国研经济研究院发布的测试结果表明,综合能力已达到国际一流水平,所有7个测评行业中表现均大幅超越ChatGPT,并在医疗、法律、教育等行业超过GPT-4。
从9月5日开放注册截至10月末,科大讯飞星火大模型已拥有1200万用户,为千万用户持续创造刚需场景价值。
目前,生成式AI应用已广泛展开。截至2023年末,讯飞星火的应用范围已覆盖办公、汽车,金融、医疗、工业、法律、科研等各领域。
6.AI安全
大模型在快速发展的同时,也将安全可信性问题抛到了每个人面前。大模型技术突破可能放大AI安全风险。
针对安全问题,7月13日,国家网信办联合多部门发布了《生成式人工智能服务管理暂行办法》。《办法》中反复强调,中国的大模型,无论是芯片、软件、工具、算力和数据资源,都应该做到安全可信。
7.MaaS
在大模型火热发展的进程中,产业界衍生出多种智能应用需求,但是模型的使用门槛较高,海量的算力、高质量的数据集、复杂的技术栈等问题使得很多企业望而却步,大模型的高门槛阻碍了企业应用落地。
MaaS通过将模型生产过程分层打造智算基础设施、大小模型库、一站式开发平台以及上层应用服务全套体系,为各类用户提供多层次一站式服务。
近年来产业界对MaaS的探索在逐步深入,头部云厂商相继发布自家MaaS产品,实现和加速MaaS生态赋能各行各业。
比如在教育场景,科大讯飞推出“教育数字基座”协助教育工作者完成学校个性化应用搭建,缩短开发周期,降低投资成本。
在医疗场景,发布星火医疗大模型应对民生健康的各项需求。
在汽车和办公场景,“星火大模型+智能座舱”,可让智能座舱实现车内跨业务、跨场景人车自由交流;“星火大模型+数字员工”,基于自然语言生成业务流程和 RPA,可帮助企业员工完成诸如数据分析、产品推荐等大量重复性工作。
科大讯飞在“数字员工”行业,实现了基于自然语言的生成业务流程和 RPA(机器人流程自动化),可帮助员工快速完成大量重复性工作。
8.AI4SE
大模型对代码生成和理解性能的突出表现,使整个软件工程开启了一个全新阶段。
大模型推动软件工程向智能化演进。以讯飞星火等为代表的大模型在代码方面表现出来的巨大能力,很好地解决了传统的AI技术存在的对代码的理解能力不足、无法学习不同的编码规范和编码习惯、重复性劳动多的问题。
借助基于讯飞星火大模型的“智能编程助手iFlyCode”,只需输入简单的指令,便能完成复杂代码的编写,较高的理解和生成能力为软件工程向全栈智能化方向演进提供了基础支撑。
9.AI Agent
大模型推动了AI Agent的快速出现和发展。从基本概念来看,AI Agent是以大语言模型为大脑,可以实现自主理解、长期记忆、规划决策、执行复杂任务的智能体。
从产生必要性来看,AI Agent充分结合大模型“脑”与数字员工“手”二者的优势,一方面破除了大模型“有脑无手”的困局,另一方面赋予数字员工多重能力,带来更高级的自动化解决方案。
从目前产品来看,有自主代理和生成代理两大类,自主代理根据需求自动规划并执行任务,成为高效的服务工具,如上面提到的基于讯飞星火大模型的“数字员工”和国外的BabyGPT等,而生成代理拥有自己的记忆目标和社交关系,是独立的机器个体,如斯坦福西部世界小镇等。
未来,AI Agent作为大模型的核心应用模式之一,可能会掀起新一轮应用创新的热潮。
10.AI原生
大模型技术的发展加速了AI原生时代的到来,其应用生态有望引来智能化革命。从基本要素来看,AI原生概念日益明确,它以AI为核心,对软件构建、用户交互方式、智能应用生成等环节进行重构,相关应用完全由AI打造,并具备“原生”的AI能力。
其次AI原生应用的核心特点也随之凸显,高效、精准、便捷、自动化的特性使其能实现更智能的服务。
从目前产品来看,国内外AI原生应用已涉及法律、教育、文学创作等众多领域,覆盖服务营销、办公提效、生产优化等不同场景。
其中较知名的例子,有国外的营销文案助手Jasper和国内的包括讯飞星火,百度文一言等在内的一众大模型,借助它们,诸如营销方案、PPT,甚至诗歌、散文、小说等的撰写工作可以事半功倍,高效完成。