腾讯发布业界首份行业大模型调研报告:向 AI 而行,共筑新质生产力 | 附下载
衡量行业大模型应用成功与否,是业界越来越关心的核心问题、也是普遍挑战。许多行业机构几乎不知道从何入手,更不用说有充分的应用经验来衡量成功,然而如果缺乏衡量的标准和办法,又很难充分投入技术创新和应用,容易陷入决策困境。
基于本次研究对多方的实践调研,结合国际前沿的相关探索,我们尝试总结构建出当前衡量行业大模型应用成功的2-3-1原则:避免片面追求技术性能或短期收益的2个误区,应评估降本提效、业务创新和体验增强上的3类价值,并重点构建1个高质量数据飞轮的模式。
其中误区最容易陷入,导致大模型应用难成功。一是误将技术指标当作证明大模型成功的标准。在大模型技术快速迭代的形势下,大家容易将注意力集中在技术性能上,通过呈现指标数值的增长来反映大模型的成功,包括精度、召回率和提升率等,但这些指标远远不够。最大的问题是,技术指标的高低无法直接反映出大模型价值的大小,例如召回率从50%提升到60%,算不算成功其实很难评判。更重要的应该是关注业务指标,例如用户数、使用量、收入等,这些指标能直观反映价值,作为评判成功的标准更具说服力。可将技术指标和业务指标建立联系,用业务发展来牵引技术开发和优化,也更容易论证技术性能提升所带来的价值。二是过度看重投资收益中的短期产出部分而忽视长期投入。传统行业容易将大模型与成熟业务类似,要求明确的投入产出,甚至短期内实现正向盈利,这并不利于大模型应用的发展。大模型还在快速迭代,有大量的不确定性,比如技术突变、泡沫等,短期财务上很难有较好的表现,长期也很难评估准确。更合理的方式是将大模型作为研发或孵化项目,不强求短期的财务指标绝对值达成,转而关注业务、技术等指标的相对提升,采取广泛的组合投资策略长期持续投入才可能真正见效。
发表评论