销讲流程2
最后更新于 2024/08/23   阅读数 10

呼叫行业从早期的人工呼叫到使用硬件的技术能力和AI外呼的。我们接下来会通过一个PPT的形式给大家的介绍客户为什么会使用AI外呼,以及AI外呼的技术路径,以及我们看到AI和上下游的技术能力和AI外呼的核心技术等等。我们逐层来进行拆解。

 

首先客户为什么会使用AI呼叫?我们认为呼叫行业是一个极其古老的行业。呼叫行业从90年代就出现了,从马化腾创办腾讯的时候,最早就是做寻呼机的。包括我们看到像华为等很多的行业,大家都是以SP通信增值服务来进行起家的。所以呼叫很古老,人们一直也在使用呼叫的形式,因为呼叫最大的特点就在于它可以绕过用户的许可,或者是用户可以跳过甲方的这种相关的要求下,直接和甲方进行互动。所以它具备一个主动式的一个联系的方式。

 

 

呼叫它也包括了主动式的呼出以及被动式的呼入两种形式。它分别被称之为AI的外呼以及AI的接听。所以这是它的一个两种使用方式。

 

用户其实使用它最简单的原因还是在于效率的变化。从90年代到今天30年的时间里,呼叫行业从早期的人工呼叫,到使用硬件的人工呼叫,到采用网页版的人工呼叫,到大概六年前采用机器人呼叫,到今天我们使用智能体大模型进行呼叫。整个变化是非常的直观的。

 

人们其实在六七年前就会去采用机器人的一种呼叫形式。虽然当时的电话机器人的智商偏低,识别也不准,但是用户依然会去选择。因为这种方式下相比于人工,他的人力成本极低。由于它极低的人力成本以及它的高效耗性,导致了用户哪怕在早期智能呼叫类的产品并不是很好用的情况下,依然会去使用智能呼叫产品。

 

其实智能呼叫这种产品是一个典型的适合于早期的AI大模型能力商业化的点。它符合于三个要素。首先第一点是AI外呼的ROI是可以大于一的,就是用户使用它的ROI可以大于一。第二点是大模型的,就是AI的一个智能度。这块稍等,这块我要跳一个PPT来讲。

 

我们认为AI呼叫的效率的高核心来自于三大块。首先是它的ROI是可以大于一的,就是AI的使用效率,特别是AI呼叫的效率,它要比人工的产出高。人们在使用AI呼叫时,最典型的一个点是他会去关注使用AIY户后的综合的一个北极星指标。比如说加微信好友,那加微信好友如果他的成本综合成本是在50元,通过AI呼叫,那人工工的成本可能是在100元,那这就很容易去核定他的ROI。

 

第二点是容错率高。由于音频端的智能客服相比于文本其实更加的单一化。因为文本端其实是一个多模态的场景,文本端既可能出现文本,也可能出现音频和附件。但是在呼叫领域里,由于通信条件的限制,所以整个呼叫只能够使用音频来进行互动。所以其实它的容错率相对是较高的。就是人们是可以接受AI说错话的,包括我们在看这些书本的时候,其实作者有一定的逻辑错误和读者是很难发现的,所以它容错率高。

 

第三点是他能力够,所以我们认为这样的一个业务场景是可以被AI化的。换句话讲,我们认为AAI呼叫是一个低精度的业务场景。那低精度的业务场景在早些时间是更容易被商业化的。

 

举个简单的案例,比如说自动驾驶技术。自动驾驶技术其实在汽车行业的应用已经很久了,但是其实咱们依然不太敢去使用自动驾驶的方式开100到200公里。但其实自动驾驶的技术在扫地机器人的场景里已经进行了大量的应用。所以我们可以类推,像我们的大模型技术也是应该是在客服、语音、数字人等相关的领域里先进行应用。所以他们是典型的低精度场景。但是像法律、医疗等场景是一个高精度场景,它的应用的速度就会偏慢一点。所以这是整个行业的一个变化。

 

另外一点,AI呼叫还符合一个技术的演进路径,就是SAAS和AI都是一种复利游戏。SAAS和AI本身的特点就在于它每一个月或者每一周都会基于代码量和数据量进行不断的升级。而这样的升级就会带动的产品进入到一个快速的业务增长期。

 

好,那我们回到刚才的那份材料里,我们继续拿出来。好,所以这个是我们认为AI呼叫的最早的一个使用的原因。就是它的ROI对于用户来讲是大于一的,它可以被AI化,并且它的容错率也相对较高。结合这几点,哪怕在六年前智能呼叫的技术相对偏弱,哪怕在当时与识别技术也非常的不智能,甚至很多的最基础的语音都会识别不准。

 

 

这里也普及一个小的知识点,在通信环境下,由于大量的人们的网络都在使用5G其实我们在打电话时是在使用用的是3G和上一代的4G网络。那也进一步的导致了其实通话的音质是偏低的。从音频的角度看,人们在正常的时候开腾讯会议是使用的是16K的音频。但是在打电话的时候使用的是8000赫兹的音频,所以它的音质是偏差的那这样的一个叫低音质的场景下的智能客服,其实就有很多的特别的工作要进行逐步的应用。

 

同时智能客服行业也在进行了一系列的演变,从最初的叫大规模无差别化的偏骚扰性质的沟通,走向今天更多叫一V一个性化的沟通。特别是在大模型的时代的来临,智能呼叫就更具备了这种个性化能力。我们可以和客户管理系统进行联动,通过对客户管理系统里的用户的相关信息,如用户的姓名,用户的背景进行大模型的阅读。后来有效的输出出客户的个性化的内容。所以大模型的智能呼叫相比于上一代机器人的智能呼叫,具备完全跨时代的变化。

 

 

同时渠道上开始变化,最早的智能呼叫仅仅是智能呼叫。但是今天的智能呼叫,需要跟上下游大量的产品进行协同。举个典型的案例,呼叫和挂机短信以及微信推送,甚至企业微信的机器人通知,还有企业微信自动加好友,以及API与客户的大量的产品进行协同。那他就具备了要与上下游的一系列的渠道进行整合的能力。同时他也从单一的节点式爆发走向了持续的关系化维护。一个用户的全生命周期里,其实有大量的点是需要进行智能化的客户联络的。举一个典型案例,比如电商行业,一个用户在购买产品、产品收获、产品到达、产品评价、后期复购、用户的会员营销以及节日回访,以及用户流失积分兑现等一系列的场景下都有大量的点需要进行这样的维护。

 

最后就是通过这种个性化的联络,甲方从直觉化的驱动进入到了一种数据化的驱动。典型的案例是在数据化驱动下,大量的如用户的接通率,用户的意向客户里意向标签率以及通话时长,客户所处地域,用户的标签化判断等等,所有的东西都被文本以及结构化。通过这些结构化的数据就可以有效的调整业务的策略。这是技术的演变以及需求的演变。同时甲方由于人力成本的不断的上升,以及当前对于私域运营的需求越来越大,以及甲方对营收的提高的一系列的一个要求。就是会进一步的带动我们认为新一代的智能客服场景的一个有效落地。

 

 

所以他为什么AI呼叫的效率比人高这么多呢?其实非常好恒定。首先人工呼叫每天最多工作八个多小时,人每天可以产生一个有效通话数量,一般是在100到200通电话。但是在基于AI的情况下,它的有效的通话量可以达到800到1000通电话。同时AI是可以严格的不会产生脱离主线业务需求的情况,不会产生对客户的很大的一个客诉。并且它可以进行有效的数据分类。同时AI的成本又是人力成本的报价的10分之1左右。所以进一步的我们可以类推,AI的综合成本是人的40分之1,也就是效率的四倍乘以成本的10分之1。

 

但是由于AI的不智能性,所以其实在上一代的机器人呼叫时代并没有让它产生大量的普及。但我们认为随着大模型技术的一个演进,特别是搜索增强技术结合大模型下,这样的可以超越人工的智能客服就具备了极大的市场价值。因为它具备真正取代人工的可能性。

 

所以按照刚才讲到的数据,我们可以进一步的类推。在AI的时代里,成本就不再是人力成本,而可能更多是经营性成本。如话费,如果我在不计入话费的情况下,AI的综合的成本可能是人的成本的40分之1。但是如果接入话费的情况下,AI的成本可能是人的成本的10分之1左右。所以可能在未来的情况,在未来AI的综合成本由于摊销下来后,它的边际成本不断下降,会逐步进入到一种固定成本的状态。所以以上是我们认为甲方为什么会使用AI呼叫。

 

AI呼叫的业务场景也包括了几个大的类型,主要包括包括了以会员营销以及非会员营销,会员回访、用户回访以及市场调研,以及客户通知等几个业务场景。接下来我们来讲一下AI呼叫的技术路径。AI呼叫的技术路径其实非常直观,它包括了三个维度,从底层的支撑能力层,它以AI的基础能力和智能引擎以及通信能力组成了底层能力。

 

 

AI的能力上,它包括了语音识别技术、NLP语义理解技术以及语音合成技术。在新一代的变化下,NLP的能力也可以被升级为大模型能力。这些进一步的包括了像实时打断变量呼叫以及多轮对话。智能引擎端由于大模型技术的出现,上一代的意图理解能力整个就可以进行淘汰。而完全基于加载在REG搜索增强和大模型下进行智能引擎的一个能力。

 

再往下走就是它的通信能力,这个就是呼叫行业比较有独特的。首先是SIP协议软交换技术以及通空号识别跟智能路由的调度。基于底下的基层支撑能力下,我们进一步的衍生出了基础服务层。基础服务层就包括了AI的对话能力以及意向标签能力、外呼管理能力、用户管理能力和API接口能力。话术管理能力下包括了如大模型对话以及知识库对话,外呼的任务配置、呼叫配置、黑名单配置和运营相关数据的管理,以及用户端的号码的导入。客户公海的导入其实仅仅是会员管理,就是一个如CRM一样的客户管理系统。要完成完整的工单以及用户的数据流转,同时我们在API的开放平台端也要支撑到数据的导入以及回调的相关支撑。还有像短信等相关服务。

 

最后到了业务侧,其实就是一个单一的AI呼叫坐席和消费者或者是用户之间的互动。这样的互动包括了主动呼叫以及被动呼入,还有人机协同等相关方式。最后产生的数据以人工呼叫挂机短信以及数据报表的形式进行流转。这是一个AI呼叫类的产品的一个基本的框架。

 

我们进一步的演进,其实它的历史变化也是非常直观的。智能呼叫的最早1.0版本是完全基于关键词的,甚至还有一个0.0版本。0.0版本就是我们叫ivr播报。

 

Ivr播报就是用户说零请用户请按0,用户请按一这样的通过按键的形式完成智能对话。从按键的形式是过去十年里比较主流的方式。到过去的2017到2018年,整个智能呼叫行业开始采用语音识别加语音合成技术,再结合关键词的ES搜索引擎的方式来完成搭建。到了2019年,图形化以及上下文的能力开始出现,意图理解的上下文的关系依然是采用关键词的方式作为主流。

 

2020年左右正则表达式的出现,让整个对话可以有效的拆解一些复杂的意图。比如说用户说房价,大户型的房子多少钱,那其中既会命中大户型也会命中多少钱的情况下,通过正则表达式就可以有效的拆解出用户的组合性的意图。但是这样的方式包括ivr关键词图形化和表达式都有一个严重的问题,就是需要AI训练师进行反复的结构化搭建一个普通的业务场景,如果在厂家没有接收过当前业务的情况下,需要至少10到15天的时间完成相关的搭建。所以在2022年左右,NLP自然语言理解技术出现,也就是问法对问法的相似度算法出现,让整个技术得到了新的突破。

 

我们通过对内容的向量化处理,让整个词条进行这种向量化的索引排序。通过这种方式我们就可以有效的命中相关的字段和问法。举个最典型的案例,我们在问题段里可以编写一个词条叫做江苏在哪里。接下来我们提问的时候,我们问出的是南京在什么地方。那整个的答案库依然可以通过向量化的方式找到南京在哪里,跟江苏是哪里之间的关联关系,并且有效的命中。同时这种方式下也可以有效的处理不可以和可以之间的互斥关系。所以基于NLP意图理解能力是在ChatGPT等大模型技术出现之前的最终极方案。这种方式下其实可以有效的解决问法之间的一个互斥的问题。

 

在大模型时代就进入了一个全新的技术周期。我们采用纯粹的大模型智能体在辅助以一定的NLP的语义理解,解决一定的成本和延迟下来进行这样的一个联动式的一个产品。也就是我们讲的最新一代的技术大模型呼叫再结合RAG知识中心的形式来进行输出。AI呼叫中心基于以上的技术演进,其实进入到了一个全新的历史机遇下。

 

我们认为智能呼叫行业具备着被大模型直接颠覆的一个特性。首先是每天中国有将近500万人在进行的呼叫中心的职场呼叫。而在国际市场上,很多的东南亚国家更是以英语作为母语,借助人力成本偏低的特点,以呼叫中心作为国家的支柱产业来进行使用。如柬埔寨等、菲律宾等相关国家。那么大模型的低成本、高智商以及它的能力,就可以有效的替代掉这数千万人的呼叫工作。

 

我们认为新一代的智能客服应该是什么样子呢?简单来讲就是由上图所示,我们通过企业提供大量的行业知识,来搭建企业的知识大脑。这个知识大脑我认为包括了三个类型。

 

 

第一个类型行业的知识。比如说以家装或房地产行业为主的一系列的这个行业的相关知识。这个知识不一定是由企业提供,而是可以由SaaS厂商结合各个行业的能力构建出的行业知识。第二个是职业的知识,比如一个销售冠军该怎么说话,一个客服优秀的客服人员该怎么说话?一个前台该怎么说话的好职业知识。以及第三点,企业自己的私有的知识库。私有的知识库也可以通过表格、文档、API网页等一系列的形式来呈现。

 

我们认为这也是一个正常的员工该具备的特性。包括了他的个人履历背景,他的行业背景以及他的职业背景,还有他入职培训的企业私有知识等等。这些构成了一个入职前的相关的一系列的知识。

 

进一步的是选择一个最适合业务场景的大模型。由于通话的特性在于流程较短,他通常来讲不会超过十分钟,一个人一分钟说话的次数量大概在300字左右。也就是说大模型呼叫的token数的消耗通常不会超过3000个token。所以他可以选择成本更低的,以turbo或者是这种4K的SIZE尺寸下的相关模型来进行演进。

 

进一步的输出出来就是以像文本客服在公域和私域,以及向智能呼叫的音频客服,如AI外呼,AII接听和数字客服为主的一系列的业务场景。所以我们认为未来的智能呼叫会是以这样的形式来进行。模型的选择可以变得更自定义化。我们可以选择如通义千问是否清颜豆包,如果是在国际市场上可以选择Llama 3或者是ChatGPT4等相关的技术能力。我们认为未来还会存在第五代的技术能力,我们后面会详细展开。

 

 

智能体呼叫不仅仅是包括了以上的特性,它还包括了一些更有意思的事情。比如说像声音克隆技术,在智能体呼叫下可以用某一个人的特定声音进行呼叫。同时我们还可以通过智能体广场的形式,迅速的构建出一系列的呼叫智能体。同时我们也可以通过多语种的形式来搭建这种中英文的互动的内容等等。我们进一步的去拆解了它。

 

 

其实大模型呼叫存在着很多的细节问题,最典型的问题在于以下的几点,1、成本高,由于token的出现,其实会让整个的呼叫成本偏高。2、延迟高。3、拟人化程度低。

 

这是大模型呼叫的三大问题。但是随着技术的演进,我们认为这三个问题会逐步的被消灭掉。首先成本问题,我们可以通过对一定的最常见90%会出现的内容进行预合成来解决。举个例子,所有的通话里,80%的通话在开场白结束后就会被挂断。所以我们完全可以对开场白、结束语无回应以及一些最常见的内容进行预先合成,来解决掉这样的成本偏高的以及延迟高的问题。我们通过这些预合成的方式,再结合NLP互动的形式来解决掉高并发处理的问题。

 

对于拟人化程度低的问题,我们相信随着技术的演进,TTS语音合成技术会越来越拟人,进一步的去让拟人化程度越来越的高。所以我们进一步的对于当期前的情况进行了拆解,我们把它统称为agents模式。A模式下大并发交互较弱,如AI外呼中的营销或通知类的业务场景,我们要采用NLP问法匹配,再结合大模型的方式。以上一代外呼为主,这一代外大模型呼叫为辅的形式来完成。

 

但是我还有一类业务,比方说并发较小。我们通常讲的并发较小是指单个对话模型有效通话量低于5万通电话。因为低于5万通电话的情况下会产生一个特点,就是上一代对话模型是需要AI训练师来搭建对话模型的。但是AI训练师搭建模型是有成本的,这个成本通常是在600到1000元之间。如果是在小并发的情况下,这个成本均摊到每一通电话里成本就偏高了。但是纯大模型呼叫下并不需要AI训练师的存在。所以对于伍万通以下的呼叫,其实大模型呼叫的成本更低。

 

我们认为以小并发交互强目标是取代人工的业务场景,可以采用纯粹的大模型智能体呼叫的形式来完成。他的业务场景我认为包括了几以下几个类型。第一个类型AI外呼的回访和调研性质的业务。如运营商满意度回访,以及大量的APP端对用户的回访和调研言,还有企业的AI的智能呼入接听。其实大多数企业的官网的呼入电话的客服人员的工作是非常的单一化的。他的主要目标是获取到用户的相关需求,并记录用户的联系方式。这样单一化的业务需求完全可以采用大模型来进行完成。第三点是多语种,基于这样的业务场景下,大模型呼叫完全可以替代掉像英文、法语、西班牙语等主流业务语种的智能呼叫,并且并不需要AI训练师进行这样的搭建。

 

最后就是目标就是以取代人工为主的,相对会有一定的技术复杂度的业务场景,如车险的核定等相关业务场景。所以我们认为agent是是主流。还有一种方式是copy的,就是辅助人工,辅助人工。上一代的人工呼叫其实也有很多点需要进行辅助,如人工呼叫员的训练培养以及语音质检,还有人工的无感接入和AI转人工等等。

 

我们认为人工呼叫其实是必然会被取代的行业。但是当前又有很多的同行或者竞争对手会去选择对人工呼叫进行一系列的产品升级。所以我自己会更倾向于对agent的开发。因为我认为呼叫这个行业并不应该存在真正存在。但是当前我们也会做一定的工作去辅助,让它变得更加智能。

 

还有一个就是模态的升级。AI呼叫不仅仅是音频端,音频端刚才有跟大家分享到,如AI外呼、AI接听、人工呼叫和人机协同。还有一个是视频端,视频端其实就是以数字文为主的形式,如未来5G通话技术普及之后,其实是可以通过电话进行这样的视频对话的。在这样的情况下,其实数字人的互动技术也可以在其中进行应用。我们认为AI音频和AI视频是相辅相成的,音频磁端其实本质是让大模型结合WAV文件进行互动,而视频端是大模型结合MP4文件进行互动。所以以上是我们认为的单纯的AI外呼的技术能力。

 

 

我们进一步的总结,AI呼叫其实经历了非常多的技术周期。当前其实进入到的是第六代的技术能力,以大模型加RAG搜索增强的能力。我们认为随着技术的演进,它还会进入到第七代版本,就是以当前GPT4-o的特性为主的技术能力。什么是GPT4-o呢?就是以端到端的形式,音频对音频的形式完成互动。音频对音频的形式下,大模型的延迟问题就会被彻底解决。当前的大模型呼叫其实综合的延迟会在1.2到1.5秒之间。以端到端的7.0版本的出现,就会让整个智能呼叫的速度压缩到300到500毫秒之间完成互动。

 

AI呼叫的上下游能力还包括了哪些呢?其实智能呼叫的业务场景,我们更多把它定义为叫用户触达。所以我们的愿景也是让联络更智能高效。

 

 

用户触达端其实除了呼叫以外还有哪些事情呢?典型的是以呼叫完毕会发送的挂机短信人工呼叫、微信推送AI转人工等等,完成这样的人机互动以及文本客服。所以呼叫和客服短信,人工呼叫台会有一系列的关联。

 

同时还涉及到两个上下游,第一个游是智能化的数据客户商机挖掘。那用户的数据从哪里来?其实主流的方式就是来自于三个点。第一个点是B2B的线索宝,第二个点是以广告为载体的广告平台线索接入,第三个点是企业自己的数据。所以其实通过这三种方式下找到用户的潜在联系方式后,我们再通过AI的智能呼叫、短信外呼转、人工无感染接入等一系列的方式进行有效的用户触达。最后再进行以CRM客户管理,语音质检以及意向标签等客户管理的方式下进行客户管理。而整个这个过程中,其实有着大量的人工的协同点。这些协同点我们也认为未来可以通过大模型agence的方式来进行替代。

 

那么AI呼叫的核心技术都包括了哪些呢?其实比较简单的来讲,它包括了三个维度。第一个维度就是大模型的自然与意义处理的能力。由于大模型技术的演进,其实这块的能力的价值被逐渐的淡化。但是它依然存在着以向NLP问法的处理方式以及一定的意图理解的处理方式的研发价值。但更多是在于和RAG搜索增强以及结合大模型之间的一个能力。

 

第二点可能更有价值一些,就是SaaS端的架构能力。SAAS端的架构能力主要包括了第一点对超高并发的高并发处理能力,其实是需要一系列的架构师的技术设计。第二点是智能呼叫的整个业务流程的管理。如客户管理系统,客户工单管理系统,以及智能呼叫的短信、人工呼叫等一系列配套的功能类的实现。第三点是web RTC的技术。

 

通过在通信层面的使用,如何将数字人在电话端进行应用,以及如何在高度有噪音的环境下进行智能化的降噪和声音的VAD打断处理等相关方式,其实都是通信端长时间需要开发的能力。毕竟在当前GPT4-O技术还没有有效的应用下,非端到端的技术所有的内容都会以识别成文本再进行处理来进行合成。这样的一个方式下,如果对噪音的处理不够有效的话,其实会产生很多的脏数据,进而影响大模型在实际生产环境中的一个应用。

 

那如何去构建我们的技术壁垒呢?其实核心就在于跟刚才内容一致的。首先是大量的数据,我们需要产生大量的文本数据、音频数据,甚至是一定的数字人视频数据,来搭建出我们足够好的降噪模型以及NLP意图理解模型。第二点是构建出大量的私有知识库。那这些私有的知识库就可以在RAG搜索增强下搭建出对用户来讲体验感更好的数据。因为单一客户的私有知识是有限的,但是我们作为云厂家,可以提供更多的公共的知识去辅助他,让他的对话变得更智能。换句话讲,企业内部培训以外,还需要一个类似大学一样的公共知识库,去帮助他进行大量的这样的培训。

 

最后就是我们的大量的代码,长长达六年以上的代码升级,实现了大量的对web RTC以及SAAS端的技术架构,产生了大量的应用的工程化的代码。如果今天有一个竞争对手照着云蝠智能的产品操,他依然也要调度出将近两千多万的研发费用,以及超过一年的时间来完成这个事情。所以我们进一步的拆解这些核心技术,其实就包括了首先是我们说的核心技术能力。第一点是对话的大脑能力。什么是大脑?就是大模型本身。那大模型本身也包括了一系列的AI能力,如语音识别、语音合成等等等。这些技术在识别率有限的情况下,平台端还要采用如智能纠错、智能匹配以及热词专属知识库等方式。让现有的这些公开服务更加的垂直化的符合呼叫行业的特性。

 

 

第二点是自定义的智能外呼策略。很多时候其实一线会通过调控的形式让接通率变得更高。但这些调控其实都是有一定的规则化的那这些规则系统可以通过自动化的调整,让实际的呼叫接通率提高到55%到60%之间。同时我们还可以通过禁止呼叫策略、重呼策略以及线路分配的方式,进一步的去降低投诉率以及提高接通率。

 

最后就是如何让语音识别变得更加的效果好。我们通过声音克隆技术可以对录音师进行有效的克隆。通过预先的一些常见录音来完成90%的真实感,以及对一定的特定业务场景的大模型的实时语音合成。通过声音克隆技术就可以让二者变得相辅相成,让声音更加的真实和饱满。

以上是关于AI的对话能力。但除了对话以外,数据分析以及一系列的后续的业务平台,还有隐私保障,也是技术演进相关需要的技术能力。首先在实时的数据分析端,我们需要提供以下跨时间的多任务的交叉分析,呼叫状态、性别、呼叫时段,多结构化的意向标签以及层次化的分析等等的方式来进行。在智能平台端,我们也要去提供如后续的短信、邮件、API以及与关联的CRM打通和全量化的数据存储。甚至我们要和呼叫中心的转接人工等相关能力进行相辅相成的互动。

 

在隐私与安全端,我们更要去帮助企业搭建出用户的隐私体系。支持对不同的部门、不同的业务板块,不同的号码联系人字段的组合化的加密,来完成号码的隐私保护。同时也要支持如AES256和本地化部署等更多样化的隐安全方式来保证用户的隐私。特别值得一提的是,其实呼吸道系统是一个高度隐私化的系统。因为系统上存在存储着大量的用户数据,所以其实对整个站点的攻防以及安全化处理上,我们投入了大量的研发资源。

 

 

对于后续处理,以上其实还涉及到几个有特色的功能,如AI实时转人工。AI实时转人工的一个技术壁垒在于我们需要通过完整的自主研发人工呼叫平台和AI呼叫平台,才可以实现无缝化的AI转人沟通。因为它本质在一个平台完成,就不涉及到公网转发。这样的一个转接就可以带来99%以上的转接成功率,并且可以看到之前AI的互动内容。

 

我们认为其实未来除了AI转人工以外,还可能存在的场景是如机器人转大模型,大模型之间互相转接。不同的大模型就像是不同的代理人一样,他们互相之间可以进行协同工作。如一个企业的AI呼入前台大模型可以和后道的AI呼叫销售大模型进行相辅相成的协同作业。同时我们还要跟整个CRM管理系统进行打通,通过这样的一个业务作业和客户管理进行协同化的一个业务流转。

 

 

还有就是如人机协同,举一个有技巧性的玩法,它就像是踢足球的帽子戏法一样。我们可以在前置的沟通中采用声音克隆的人工呼叫AI呼吸道来进行客户互动。在这个过程中,我们在发现了客户真的有意向之后,我们调取真正的人工来来跟客户互动。所以这样子就帮助人工团队节约了前置的90%的无效的沟通内容。但是用户的感知是全程都是同一个人在和他互动。所以我觉得它就像是一个帽子戏法一样,可以让人机协同实现一个无感化的介入。所以这是一个我们比较有特色的功能。

 

以上的功能的核心技术之外,更多就是在于服务端的一个使用了。我们会很关注到用户的使用价值。整个产品一直保持在每周更新一次的节奏上去,符合贴合用户的一个使用。除此以外其实更多是在服务端。我们认为一个to b的好的产品是需要有完整的客户运营和和供应链运营能力的。在我们的行业里,智能呼叫包括了整个对话体系的构建,以及呼叫线路的运营。如何让用户以更好的接通率以及更好的运营效果来完成整个的能力搭建,就包括了以下几个步骤。

 

 

以用户的目标建模,对话模型制作,智能化的录音线路准备,小规模测试、批量呼叫以及全面质检等等。各个业务部门板块如对话能力端,其实整个从云识别、语音理解,对话能力调优,以及我们的所有的工作时段,以及周末时段段的一个高效响应,甚至驻场服务来搭建出这样的有价值的策划运营数据统计的一个服务。在运营的线路端,我们还要和国内的上百个线路商进行沟通,保证线路的有效供应,保证整个的接通率,实时的互动能力以及行业的业务储备,以及自动化重复等等方式的一个应用。

 

我们认为整个产品的技术演进路线,除了刚才这些以外,还有一定的空间。如在大模型端的大模型之间的协同,未来的技术发展,我们认为主要包括了1、大模型之间的数据协同的沟通,或者我们叫智能体之间的沟通。智能体之间的沟通。2、高并发,超拟人的AI沟通,3、端到端的识别效率。所以这些其实都是未来的一个技术演进路线。第四点、5G高清数字视频通话。这些技术我相信会觉得时间的演进逐步的得到突破和应用。

 

最后我们来讲一下一定的客户案例。其实智能呼叫的客户主要包括了几个类型,一政府,二事业单位,三企业。它的应用方式也各有不同。比如说在政府端它就包括了以通知为主的方式。那这个事业单位是以通知、调研、呼入为主,那政府也是包括了补助,企业端可能是以营销为方。通知调研目录为主。所以每一个场景会各有不同,而且它的应用价值也各有差异,我们的部署形式也各有差异。比方说一跟二之间可能本地化多一些,对于三企业端可能SAAS端多一些。

 

我们进一步的来看,如在客户案例的第一代向我们服务过的万科集团,我们从18年到今天服务了已经有长达六年的时间。客户的复购率是持续化的那我们主要为他以像最早的售楼处的房地产销售为主。到今天我们不仅是服务它的售楼处,我们也对像物业等一系列的业务场景,如物业费的催缴等进行了这样的服务。同时在在政务端,我们也服务过如市场监督管理局等很多的政务部门。市场监督管理局每年都有一个业务场景是崔企业报年报。这个其实完全可以交给AI来完成。包括像是在疫情期间的疫情通知回访能力,我们也可以交给AI来完成。

 

 

包括我们也服务过像是一些公安局,最典型的案例就是电信反诈。电信反诈其实公安局有一定的能力迅速的得到受害人的相关联系方式。我们可以通过AI的方式,在秒级的单位上迅速的对用户进行反诈劝阻。而这样的反诈劝阻可以极大的减少用户的损失。

 

同时我们也服务过像是一些酒店,酒店的服务前台大多数的工作是非常单一化的。大多数用户都在问,比方说wifi密码是多少等相关的常见问题,也完全可以基于大模型来完成这样的解答。特别是值得一提的是,其实对于很多的工作场景下,他是很难做到24小时有人在线的那智能呼叫客服,你的场景的解决就是解决掉这些24小时的问题。

 

我们除了这些方案以之外,还有一个有特色的服务就是产品集成。我其实很多的业务场景都需要的智能的呼叫。举个典型的案例,其实很多的物联网硬件也是需要的这样的物流通知,呼叫通知服务的。比如说像是一些传感器在监听到水塘里的鱼这个水氧量不足的情况下,是需要发送出一些通知的那呼叫的特点相比于短信的其他的就是可以得到有效的录音和用户的回复的事件,如确认或不确认。

 

这样的一个业务场景,在一些物联网的AIoT智能硬件上,如刚才讲到的水产或者是农业,甚至是一些人体的传感器上都可以结合呼叫产品来进行一个应用。所以我们在产品集成端也和大量的需要这样呼叫能力的。如客户管理系统CRM,以及以社会化客户管理系统SCRM和一些AIoT平台进行协同,来完成这样高效化的智能通知和服务。那这就需要一系列的开放化的平台,如AI呼叫集成、AI质检集成、AI接听集成、人工呼叫以及线路供应和一系列的底层技术供应链。这样的一个服务能力是需要一个完整的并且高可用的智能化的开发平台才能完成。

 

同时其实对于很多的电商和新媒体行业也有一定的价值。有很多的网红可以对自己的会员数据进行这样的一个会员通知。网红可以通过自己的声音克隆技术,再结合这样的会员通知,实现很高并发的。

 

对于618或双十一大促的用户通知。这样的用户通知除了在大促以外,我们还可以在如会员的积分到期会员的积分到期,会员的生日提醒以及大促用户流失,客户的物流以及投诉等相关场景下进行一个应用。所以这是这种我们刚才讲到的一个用户的一个到店的一个提醒。包括我们也为很多的像运营商的用户满意度调研提供服务。

 

 

我们经常讲如何用好智能呼叫,其实核心在于你的场景的使用。如移动的运营商回访,其实不仅仅是在进行运营商回访,他也是对客群进行一个划分。如果你在运营商回访时的打分偏低,其实运营商是可以知道你对我不满意,有流失的风险。这时候他可以通过赠送一些套餐的形式,给到你一些相关的服务,来解决掉你潜在的流失风险。

再讲一个如何用好AI呼叫的,其实核心就包括了这么几件事儿。

 

通过高质量的线路可以实现更高的接通。如果说都没有接通的话,其实整个呼叫就没有实际的打到用户端,那系统再智能都没有意义,更高的接通。这是线路二对话逻辑。对话逻辑包括了最核心的钩子,你要有一个点去吸引到用户,和用户进行有效的沟通。如果说我们在和客户进行一次是营销的话,你至少要有一些赠送项或者是有价值的点。让用户至少愿意在开场白之后还愿意和你沟通。我们认为一个正常的互动,5秒内的挂断率不应该高于3%。

 

所以通过对话逻辑的反复打磨,可以让整个的对话变得更加的智能。这块也可以对大模型的提示词进行有效的编辑。三意向标签准确度。通过对意向标签体系的搭建,可以进一步步的从前面的沟通的文本兑换记录里找到有价值的用户群体。

 

四后续的跟进方式,发短信转人工微信通知是比较典型的方案。有效的跟进代表着当天的呼叫应该在下午或者是在实时都应该有得到一个跟进。这样子的话才能保证一个有效的获客成本。

 

最后关注一个北极星指标,什么是北极星指标呢?就是我们这次的沟通核心的目标是什么,如果是以营销业务为主,其实核心就是加微信。如果是一些通知类的话,就是看通知的到达率。

 

如果是加微信,那我们就是要看的是一个微信好友的添加成本大概在多少钱。比方说50元,那这样的一个成本是否相比于像广告投放等相关方式下,它成本更低。如果它更低,那就有持续做的价值。如果它更高,那就要去对之前讲到的1234点进行一个调优。

 

最核心的当然还有一个了,就是如果从选品的角度,我觉得就是这些。那最后再讲一下就是如何去选择一个好的AI外呼,如何选择AI外呼产品。我的认为一看产品怎么看看升级,看对话逻辑。对话逻辑的核心是NLP和大模型。如果说不是这两种方式,我可以给到大家一些明确的值。

 

关键词匹配它的正确率,正确率最多到85%,它更多的情况下就会产生互斥。就是关键词匹配更多他靠努力是解决不了的。第二个正则表达式正确率最多到90也是一样的问题。就是正则表达式更消耗时间,需要人员去学习,而且他也会产生互斥的问题。那么问法NLP这种的话,成本又低,速度又快,这种的话它的准确率可以达到95%,就是相对来讲是很正确的。如果是大模型准确率概念消失,因为它它永远都是对的。

 

接下来就是看你的理解能力和识别能力了。所以我觉得核心看产品,二看价格。价格其实无外乎三部分,坐席费、服务费和话费。这个其实就是要根据实际的业务来进行选择的了,要根据你的呼叫量去看,选择最适合你的方案。

 

三看服务,服务我觉得最典型的一个点,周末等非工作时段,非工作时段是否。可以有效支持。还有就是项第四项目线路的外线也会直接影响结论,所以这些是核心。最后五配套如果咱们没有数据,那就会涉及到一些相关的如商机获取的平台和CRM客户管理,这些配套能力是否可以支撑到后期的业务也演进。所以这些是我认为在选择一个好的AI外呼产品时必然会涉及到的一些点,大家可以关注。

 

最后再给大家分享一些当前的问题。第一点是大模型呼叫当前遇到的问题,其实很直观,刚才已经反复提到了,一成本太高,二延迟太重。成本太高,延迟太重。三、拟人度、真实性差。这些我认为随着GPT4-o类的端到端技术的演进,会有效的解决。

 

行业的两面性在于其实AI外呼类的产品经常会被用于AI外呼类的产品,经常AI呼叫类的产品经常被用于。稍等。这个其实我们觉得是有一定的两面性的。就是应该如何的让AI外呼更加的精准和更加的个性化。通过这种精准和个性化来解决掉它的烧有问题。因为我们认为这种产品核心它是一种工具,但是工具的使用方式是有很多的点的。平台端应该有一定的监管责任,让用户往着更好用户的联络,更加精准的方向去发展。

 

四是监管,由于行业的监管的不确定性,所以整个行业会处在有话费的价格波动。价格的波动可能更多是来自于监管的变化。所以这个的话其实当前很难进行有效的一个处理。

 

最后就是出海,其实AI外呼的产品的出海难度很大。AI呼叫最核心的出海难点在于:一、监管对话能力。现在是要求是不允许对外进行出海的,参考火山引擎当时遇到的一些问题,抖音遇到的一些问题。二、外文的处理,外文处理问题通过NLP,通过大模型技术是可以进行有效的处理的。三 、使用习惯,其实国内的产品还是太复杂,需要针对出海进行系统化的调整。

 

以上是我关于AI呼叫的整个的分享。这些分享包括了用户为什么要去使用智能呼叫化的产品。我们总结到了用户使用它更多是基于高效化的获客,以及个性化的联络,以及有价值的数据分析。我们也分享到了AI呼叫的技术演进,从底层技术到支撑层再到业务层,以及我们看到了AF要从早期的是ivr播报关键词、图形化表达式、NLP问法,到今天的大模型RAG。我们认为甚至还有下一代版本,以GPT 4-O为代表的端到端技术,会进一步的在AI呼叫行业进行应用。技术演进到今天,大模型呼叫会更多依赖于RAG搜索增强。

 

结合大模型的方式搭建出企业的知识大脑。通过企业知识大脑进一步的输出出AI智能的销售和AI智能的前台,进一步的对用户进行服务。它的服务模式也包括了以代理人模式的这种纯粹的智能呼叫,以及辅助的可拍立的模式的人工呼叫模式。进一步的再拆解成以音频和视频端的自媒体模式。

 

同时我们也分享到了AI呼叫的上下游业务能力,从单纯的客户触达到前置的数据筛选,到后置的CRM够管理,以及它的一系列应用到的核心技术。如自然语言理解能力,SAAS端的架构能力和外部RTC的技术能力。进一步的我们分析了一系列的它的技术的核心指标。最后我们除了技术以外,运营服务和线路服务能力也是其中的核心。

 

我们认为AI呼效应未来的技术发展,包括了刚才讲到的智能体之间的互动,超高并发,超拟人的AI沟通,端到端的识别效率和5G高清通话。接下来我们又分享了一系列的各类的客户案例,最后给到大家如何去用好AI呼叫,以及如何选择一个好的AI呼叫产品,以及当前的一些行业思考。

未能解决您的问题?请联系