
回顾两年前,我撰写了一篇关于保险行业智能客服的研究报告。当时AI技术尚未达到现今LLM的理解水平(文本+图片),因此智能对话机器人的实现不仅过程繁琐,效果亦不尽人意。例如,晚上10:50测试淘宝商家时,发现小型商家仍依赖人工客服,而规模较大的店铺则采用机器人与人工结合的方式。这可能是因为智能对话机器人在降低人力成本方面的效果,只有在人力成本较高或需要较长时间的适应期时才显现,而小企业往往等不及。
然而,近期我注意到,LLM为各行业的咨询和智能客服带来了翻天覆地的变化,具体变化将在后文详细阐述。
一、为何需用LLM重塑各行业?
自LLM问世以来,其对现代社会的影响被比作互联网对产业的革命性变革。利用LLM的过程,可视为对各行业的一次重塑。
这种重塑并非孤立发生,而是与技术发展的成熟度紧密相连。
技术进步可能在关键时刻引发行业格局的根本性变化。例如,原本在技术上具有优势的企业,可能因某项技术创新而失去优势。若这些企业未能及时适应变革,便可能被竞争对手超越,为小型和创业公司提供迎头赶上的机会。
以TTS技术的变革为例,说明技术大框架的跃升如何为市场带来变化:
首先,Tacotron 2是谷歌于2017年12月20日发布的端到端语音合成模型,它能够直接从文本生成类人语音。该系统的发布标志着TTS领域的重大进步,显著提升了语音合成的质量和自然度。

从该发展流程可见,2017年学界的变革直接影响了工业界的实现方案,新的企业层出不穷,老牌企业也纷纷加大投入,技术路线趋于统一。
21年各大厂商TTS技术的工业部署pipeline显示,当时各TTS生产商采用类似的模型和实现方式,差异化主要通过在各模块进行微调实现,主要集中在五个方向:fast、Low-Resource、Robust、Expressive、Adaptive。
最后,Tacotron的出现之所以成为TTS技术跃升的节点,是因为当时的模型变得可用,行业实现成本大幅降低。尽管目前TTS行业主流程的模型有所变化,如21年出现的端到端VITS系列和扩散模型的应用,但依然是基于深度学习的全量模型,原有的数据基础和部署经验仍可继续发挥作用。
二、RAG重塑智能对话机器人
为何选择在当前时刻使用RAG重塑智能对话机器人?
RAG技术的适用范围广泛,只要数据量充足,各行各业均可应用。技术方案明确,如RAG技术及其支持的平台和框架(例如langchain),网络上的信息丰富,对某些特殊行业,如金融、保险、税务咨询等知识壁垒较高的行业,以及需要项目1-N的TO B行业,可取得显著收益。
应用领域:
智能对话机器人可应用于人生的各个阶段:
出生
医疗健康:在医疗领域,智能对话机器人辅助
本文网址: