“不敢转、不能转、不会转”一直是压在中小企业数字化转型头上的三座大山。
(资料图)
从本质上看,大模型将从根本上降低中小企业进行数字化转型的成本和复杂度。
算法、算力和数据可以说已经成为推动人工智能发展的三大要素,其中数据尤为重要。
在训练人工智能模型的过程中,如果想让其变得更加聪明,大量的、多样性的数据必不可少。
在小数据、优质数据应用有其前提,即需要在大的基础模型(预训练模型)之上,通过小数据进行模型的微调,使模型更加精准地服务具体应用场景。
从这个角度来讲,数据将在未来基础模型完成下游任务时,起到关键的作用,模型也是必用品。
大模型的优势在于能够学习更多的特征和模式,从而提高对输入数据的理解和处理能力,同时可以更准确地进行预测和分类,产生更自然的语言生成结果,或者在复杂的决策问题上做出更明智的选择。
目前产业正面临智能化转型,对于企业、机构而言,与人工智能深度融合,加入行业特色数据与知识、精准匹配真实应用场景的行业大模型能够极大提升业务流程效率和水平,成为驱动产业转型升级的重要力量。
大模型未来是多元化的,发展趋势是做小做专,真正的机会在企业市场。自ChatGPT发布以来,人工智能领军企业纷纷跟进。
百度、阿里、智谱华章等在全国范围内率先推出自研大模型产品并开放内测,具备了一定的行业迁移赋能能力,大模型赛道创业投资热情高涨。
目前市场上的很多大模型都已经具备了很大数据量,甚至一些开源的模型已经诞生,因此数据的积累就已经花费了大量的资金和时间。
而在这一背景下,对很多应用型的企业来讲,更要思考怎么把模型在面向的领域进行数据标注以后,进行后续行业模型的开发。
现在企业在应用大模型时往往面临算力资源不足、数据质量不高、场景开放不够等问题,这里面对企业蕴含着两大挑战。
第一是如何形成在行业数据方面的优势,这考验着企业对落地行业的理解,例如怎样将非常专业的处理数据标注出来。
第二个挑战则是在算力投资之上,模型训练需要投入巨大的算力资源。
对如何充分用好现有大模型基础,发挥场景优势,形成通用人工智能的产业生态,各行业都还在探索之中。
由政府支持创造更好的平台和环境,汇聚产业链上下游合作伙伴,促进技术、资源、场景等多方主体的合作,将有利于促进大模型研发和应用。
根据科技部的《中国人工智能大模型地图研究报告》,中国已发布79个10亿参数规模以上的大模型。
短时间冒出这么多大模型,但大企业们他们更需要专业、定制、能直接上手的产品,现在转型仍具有挑战性。
基础大模型的开发,这显然不是所有企业都能参与其中的,其训练成本极其高昂,更多地是从使用者的角度与大模型打交道。
尽管对于采用大模型的企业来说,API的价格已经大幅降低,比如2023年3月份ChatGPT API的价格比2022年底下滑了90%,而在2023年6月份,输入端的价格再次降低了25%。
即使如此,这种新型的计算方式相较于传统的运算方式依然更加昂贵。
据路透社报道,谷歌的母公司Alphabet的董事长John Hennessy表示,与大型语言模型进行交互的成本可能是进行标准关键词搜索的10倍。所以,虽然大模型的使用成本已经在不断下降,但其价格依然不菲。
另外,仅仅将大模型接入到特定的领域,可能并不能达到最佳的效果。
因此,在接入API并将其投入商用之前,企业还需要在诸多方面付出额外的成本。这包括数据准备和预处理的成本、模型训练和调优的成本、部署和运维的成本、模型更新和迭代的成本,以及法规合规的成本。
所有这些因素都使得应用大模型的总体成本依然很高。进入到AI的时代,这些卡点仍然存在的。
但是AI大模型所展现出来的多领域泛化能力具备解决问题的优势,也不得不让中小企业加速拥抱数字化转型。
国外大模型,往往先在实验室里打磨成熟,但硅谷之外的现实是复杂的。
而国内的大模型,往往是从互联网公司、各大产业端,真刀真枪干出来的。
目前,我国大模型在金融、传媒、文旅、政务四个重点领域的应用相对成熟。
金融领域属于信息密集型行业,是大模型技术的最佳应用场景之一。
例如百度与浦发银行联合研制的金融行业大模型“浦发·百度-文心大模型”,结合了浦发场景积累的行业数据与知识。
双方技术和业务专家一起设计了针对性的财报领域判别、金融客服问答匹配等预训练任务,让文心大模型学习到金融行业的知识,并在浦发典型任务应用上提升效能。
但新应用开发的高成本投入以及数据合规性、安全性带来的挑战仍横亘在金融行业面前,有待进一步优化处理。
需要注意的是,这种资金技术密集型的产业,通常很难与资金链薄弱、缺少人才和技术的中小企业相结合。
但是可以让大模型厂商、数字化解决方案商,还是中小企业,都将从这次技术革命中受益,原有的市场关系、格局也随之变化。
内容参考来源于:AI掘金志:大模型带来的「技术平权」,能否普惠到中小企业数字化转型?;第一财经:全面推动大模型应用,开创产业发展新格局——大力推动国产大模型在工业领域落地与应用;多知网:大模型应用的商业化进展慢,为什么慢?;经济日报:大模型行业应用加速落地