当前位置: 首页 > news >正文

景德镇网站建设哪家口碑好网站建设的规划和设计

景德镇网站建设哪家口碑好,网站建设的规划和设计,设计师网站大全,wordpress 文章分页 插件WER (Word Error Rate) 定义#xff1a;预测的识别语音序列于groundtruth抄本之间的编辑距离 除以 ground truth抄本的单词数量 编辑距离 #xff08;预测的识别语音序列#xff0c;groundtruth 抄本#xff09;/ ground truth抄本的单词数量 英文定义#xff1a;It is g… WER (Word Error Rate) 定义预测的识别语音序列于groundtruth抄本之间的编辑距离 除以 ground truth抄本的单词数量 编辑距离 预测的识别语音序列groundtruth 抄本/ ground truth抄本的单词数量 英文定义It is given by the Levenshtein distance between the recognized word sequence         and the ground truth transcription divided by the number of words in the ground truth         transcription. 编辑距离的定义 从一个字符串到另外一个字符串的最小的替代插入和删除的操作次数 The Levenshtein distance is defined as the minimal number of substitution, insertion and deletion operations required to turn one word string into another. 多说话人的ASR系统的一些概念 单个说话人的输入和单个抄本输入 single speaker at the input and output a single transcription 叫SISO 多个说话人的合并音频有可能存在overlap的输入和多个输出序列的系统称为 MIMO     containing multiple speakers at their input and that produce multiple output word sequences (MIMO) MIMO抄本转录系统的目标是回答问题谁什么时候说了什么既转录的内容包括时间戳信息说话人label和抄本单词 不同的WER衡量指标 Concatenated Minimum Permutation WER 串联最小排列词错误率 cpWER 将每个说话者的所有语音连接起来作为reference(groundtruth)和hypothesis 文件预测序列 计算参考值与假设的所有可能的说话人排列之间的 WER。有 24 种这样的排列。 从中挑选出 WER 最低的这被认为是最佳排列。 cpWER 直接受说话人切分结果的影响。除了显示整个录音的错误率的 cpWER 之外我们还通过从参考中恢复话语信息来报告每个话语的详细错误。 Optimal Reference Combination WER ORC WER 多个参考转录 可能有多个参考转录用于同一个语音片段来自不同的来源或经过不同的处理。ORC WER 旨在处理这种多参考的情境选择最能代表语音内容的参考转录。 最优参考组合 对于每个语音单元utteranceORC WER 通过计算并比较每个参考与系统输出的词错误率选择一个具有最低错误率的参考转录。这使得 ORC WER 能够反映出在多参考情况下系统表现的最优情况。 提高准确性 通过选择多个参考转录中的最佳组合ORC WER 在评估时能够更精确地反映系统的性能避免由于参考转录的不完全或不一致性带来的偏差 ORC WER 引入多个参考转录并采用一种最优组合策略来减少对单一参考转录的依赖。这意味着对于每个输入的语音片段ORC 会选择多个参考转录中的“最佳”一个进行比较而不是仅依赖于一个固定的参考。 Multiple Input Multiple Output (MIMO) WER MIMO WER 1. 定义参考和假设序列 参考序列有 III 个参考语音序列每个序列对应一个真实的转录。 假设通道有 JJJ 个假设通道每个通道对应一个 ASR 系统的转录输出。 2. 语音段落的分配Utterance Assignment 对于每个参考语音序列 RiR_iRi找到与之匹配的假设通道 HjH_jHj以确保每个说话人的语音段落连续保留在一个通道中。这一过程涉及 避免通道切换保证同一说话人的语音在同一个假设通道中处理。 遵循顺序约束保证同一说话人说话的顺序不被打乱。 3. 计算每个通道的 SISO WER 对于每个假设通道 HjH_jHj计算其与参考序列 RiR_iRi 之间的单一输入单一输出SISO词错误率WER。这个步骤按如下公式计算 WERSISOSDIN\text{WER}_{\text{SISO}} \frac{S D I}{N}WERSISONSDI 其中 SSS 是替换错误数substitutions DDD 是删除错误数deletions III 是插入错误数insertions NNN 是参考文本中的总词数number of reference words 4. 最优参考通道匹配 对于所有可能的参考与假设通道的匹配组合选择一个最优匹配即选择那个能够最小化总的 MIMO WER 的参考-假设通道配对。由于参考序列和假设通道的数量很大这一过程是一个计算密集型的任务通常通过动态规划或其他优化算法来实现。 5. 计算最终的 MIMO WER 最终的 MIMO WER 是所有参考与假设通道匹配的 SISO WER 的加权平均值。它仅计算转录错误不考虑说话人归属错误即不考虑是否有正确的说话人识别信息。 MIMO WER 是一种评估多通道自动语音识别ASR系统的指标通过最优匹配参考和假设通道计算多说话人环境中词错误率同时避免通道切换确保同一说话人的连续语音保持在一个通道中。 greedy_orcwer greedy_orcwer 使用贪心算法计算最优参考组合词错误率ORC WER 使用一种贪心算法计算 最优参考组合词错误率ORC WER这种算法比最优算法更快速但不保证产生相同的结果。 tcpwer tcpwer 计算时间约束最优参考组合词错误率tcORC WER 计算时间约束最优参考组合词错误率tcORC WER类似于 ORC WER但考虑了时间约束条件即在评估时需要遵守语音的时间顺序。 greedy_dicpwer greedy_dicpwer 计算时间约束去识别说话人连接最小置换词错误率greedy DI-tcpWER 使用贪心算法计算时间约束去识别说话人连接最小置换词错误率greedy DI-tcpWER在多说话人环境下结合了去识别说话人技术和时间约束条件。 greedy_tcorcwer greedy_tcorcwer 计算时间约束最优参考组合词错误率tcORC WER 使用贪心算法计算时间约束最优参考组合词错误率tcORC WER类似于 tcORC WER但使用了更快速的贪心算法。 开源计算工具meeteval (也是chime竞赛指标代码依赖库) 参考文献ON WORD ERROR RATE DEFINITIONS AND THEIR EFFICIENT COMPUTATION FOR MULTI-SPEAKER SPEECH RECOGNITION SYSTEMS 代码库地址https://github.com/popcornell/meeteval/tree/2b06cead668a26d153ee9618950a6ac80445307c 安装步骤和注意事项 1) pip install meeteval 2) 如果出现x86_64-linux-gnu-g编译不过的情况先更新g (a) sudo apt update sudo; apt install g (b) sudo apt install build-essential (c) g --version 更新完g之后再安装步骤 1pip install meeteval 3 安装成功后 4配置~/.bashrc 首先是找到安装位置 find ~/.local -name meeteval-wer 假设搜索到的位置是/home/xxx/.local/bin/meeteval-wer 在~/.bashrc 写入export PATH$PATH:/home/xxx/.local/bin source ~/.bashrc 5) 在shell环境测试meeteval-wer meeteval-wer cpwer -h example_files/hyp.stm -r example_files/ref.stm 测试过程中有可能需要其他的包直接pip install 就可以
http://www.laogonggong.com/news/114015.html

相关文章:

  • 谁知道免费网站任何人任意做网站销售产品违法吗
  • 洛可可设计公司老板网站内容seo
  • 高端网站建设kgwl2022年自媒体平台倒闭
  • 单位网站建设费用什么会计科目网站基础优化
  • 网站如何做入支付接口wordpress 电影天堂 主题
  • golang做网站如何制作微信打卡小程序
  • 做蛋糕网站有哪些wordpress建的大型网站吗
  • 绵阳市建设银行网站微信小程序开发工具软件
  • 昆山网站建设苦瓜网络产品设计师网站
  • 青岛建设教育网站wordpress找不到xml
  • 知页转wordpress江阴网站优化公司
  • 江宁建设局网站网站框架都有什么用
  • 单位网站建设内容ps教程
  • 济南正规企业站seo广州代理记账
  • 中文手机网站设计案例网站渗透入侵全部教程
  • 有哪些免费建站的网站电子商务网站中最基本的系统是
  • 太仓市住房和城乡建设局网站wordpress单击图片
  • 网站建设宗旨是指百度明星搜索量排行榜
  • 免费推广自己的网站扬州门户网站开发公司
  • 做装修的推广网站有那种专业建设规划及实施方案
  • 建设移动端网站门户网站价格
  • 如何用phpstudy做网站网站建设是广告吗
  • 公司网页网站建设 ppt模板下载西湖南昌网站建设公司
  • 旅游公司网站建设策划书做网站 sql 用哪种
  • 江苏手机响应式网站建设网站标题怎么隔开
  • 论坛网站模个人如何注册网站
  • 企业网站报价表抖音小程序广告怎么跳过
  • mg电子游戏网站开发直播开放平台入口
  • 物流企业网站建设特色网站落地页是什么意思
  • 中国大连网站普象工业设计网官网