在语音识别服务中,如果在您的业务领域存在一些特有词汇,默认识别不准确的情况下,可以使用热词功能。
概述
热词可以是姓名、公司名称或某领域的专有名词。如人名“王晓铭”(通常会识别为“王小明”),司法领域的“被上诉人”,电商领域的“包邮”。
热词不建议过长,不支持标点符号。设置后可测试识别效果,不满意再进行调整。
热词的时效性:设置后,新建的语音识别请求立即生效;已经运行的识别请求无法使用该热词。
热词分为名称类和业务类:
名称类:支持人名和地名。一个词表中只能包含人名或只能包含地名。
业务类:业务领域内特有词汇。一个词表中不限制热词的类别,如“苹果”、“哈士奇”、“小明”可以放在同一热词文件中。
使用限制
通过管理控制台添加热词时,有如下限制:
目前仅支持中文热词识别。
文件为TXT格式,100 KB以内,
UTF-8(无BOM)
编码。每行一个热词,最多128行,每个热词不超过10个字。
两类热词可各创建10组。
语料中请不要出现除空格、制表符、换行、换页之外的其他特殊字符。
创建热词
关于创建热词的操作,请参见创建热词。
热词管理
在智能语音管控台左侧导航栏的自学习平台 > 热词中管理已创建的热词表。
如下图所示,关联项目表示哪些项目正在使用该热词表,一个热词表可以被多个项目使用。您可以预览、更新、下载或删除已创建的热词。