- 发布
- 杭州微耘网络科技有限公司销售部
- 发货
- 3天内
- 电话
- 13386531520
- 手机
- 13386531520
- 发布时间
- 2023-12-25 09:32:59
因为中文是一个同音不同字的语言,还有音调的变化,比如我发一个音“laoshi”,这在不同的语境下,可能代表这是一个教书育人的职业,在另外的语境下,可能代表这个人的性格很老实。来自于技术方面的第二个挑战是多轮对话,人的自然语言从来都是含糊不清的,特别依赖上下文关系。比如说“我想订一个房间”,“什么位置?”,“中关村附近”,“什么时间?”,“周六”……这个例子里面,关于订房间的信息是散落在多轮对话之间的。如何综合***考虑上下文信息一直是学术界的一项挑战。第三,人类的对话行为模型非常复杂。因为在外呼机器人场景下,人们期待的是和另一个人之间的交流而不是一台机器。研究显示,人们在和机器人对话的时候,会自然的放慢语速,发音会更清晰,也会用更加配合机器人的句式来交互。但是在和人沟通的场景中,人们的发音或更含糊,会在句子中省略很多字词,也会在句子中突然修改前面的对话信息,这些都给语音识别,语义理解造成了极大的困难。醉后,我们目前的外呼机器人大部分都还是播放提前录音,为了实现真正的人机语音对话系统,我们需要让机器能发出人的声音,这就是语音合成技术。但是要合成出人自然对话中的抑扬顿挫,并且骗过人是一件非常困难的事情,人的耳朵对于音频的敏感程度远超过人眼对图像的敏感程度,这也让语音合成这件事情的难度更高。以上这些有关外呼机器人所具有的挑战和风险总结介绍,不知大家在看完之后都学到了多少知识呢。