适用于Windows的最佳(免费)语音转文本软件

正在寻找最好的 free Windows软件来语音转文字?最重复的付费建议是Dragon Naturally Speaking(DNS)。但是有些人可能会嘲笑为软件付费。幸运的是,那里有一些很棒的免费程序,例如Google Docs语音键入(GDVT)和Windows语音识别(WSR)。

您可能想知道这两种产品与DNS相比如何?以及DNS是否符合您的需求。在本文中,我确定了三种用户:需要语音进行文本转录以写小说的用户,需要学术转录的用户和写的用户>业务文档,例如备忘录。为此,我测试了三个语音转录程序(DNS,GDVT和WSR)。

语音转录设置

在开始测试之前,我们首先来看一下推荐的硬件和软件设置。

Google文档语音输入需要Chrome浏览器和麦克风。而且它还需要持久的Internet连接(要求中未提及)。否则,这可能是开始语音转录的最简单方法。

DNS需要使用2001年或之后生产的处理器,Windows 7或更高版本以及大约4GB的免费存储空间。它最严格的要求是2GB RAM。这是DNS硬件要求的完整列表。

Windows语音识别,也称为语音平台运行时(下载WSR),不花钱,只需要Windows 7或更高版本的操作系统。

我使用动态麦克风(用于播客的最佳麦克风)和相对较快的Intel Core i7处理器。虽然需要高质量的麦克风,但不是必需的。即使这样,您也可以通过更好的声音质量和降低的背景噪音来改善结果。

我建议为进行高质量录音而使用的价格最低的麦克风是Audio-Technica ATR-2100。但是,售价为$ 5的麦克风和售价为$ 200的设备之间的准确性差异非常小。

另一方面,Microsoft Speech的最低要求几乎是任何远程现代计算机(过去十年中制造的大多数计算机) )和麦克风。如果您拥有最近五年制造的笔记本电脑或平板电脑,则默认情况下应该具有所需的功能。

此处介绍了如何使用Google语音输入:

此处介绍了入门Windows语音识别:

最后,这是Dragon Naturally Speaking的入门方法:

测试方法

我想找到最好的免费基于Windows的语音转文本应用程序。由于不同的消费者可能需要不同的产品,因此我设计了一个简单的测试。我从无版权的文本中阅读了三段不同的文章:一篇是查尔斯·达尔文(Charles Darwin)的《从物种到形式多样性的趋势》(em)。一位来自H.P. Lovecraft的克苏鲁之歌。最后一封来自杰里·布朗(Jerry Brown)2017年国情咨文演讲。我的方法论绝不是完美的,但它确实给人以每个语音识别套件的准确性的印象。

“我认为,世界上最仁慈的事情是人的思维无法将所有事物关联起来它的内容。我们生活在无边无际的黑海中一个宁静的无知岛上,这并不意味着我们应该远航。迄今为止,每门科学都朝着自己的方向努力,对我们的伤害很小。但是有一天,各种知识的拼凑在一起,将打开如此可怕的现实视野,以及我们在其中的可怕处境,以至于我们要么从启示中发疯,要么从致命的光芒中逃离,进入一个新黑暗时代的和平与安全

“在这样的场合通常会为来年制定具体的议程。在这个讲台上,我做了六次,而且做得很详细。而且,当我重新阅读以前的州政府演讲中提出的建议时,我很惊讶地看到我们在一起取得了很大的成就。"

“现在,当各种各样的这种动物出现时,在任何器官或任何意义上的力量或能力,这种增加是完全无用的,从未被采取行动,甚至可能在动物没有意识到的情况下存在。相反,在野生动物中,其所有能力和力量都根据生存需要而充分发挥作用,任何增加都可以立即获得,通过运动得到加强,甚至必须对食物,习性和整体稍作改动

3个语音转录套件经过测试

令人惊讶的是,如何针对付费软件进行了免费的语音识别测试。但归根结底,最准确的应用是《 Dragon Naturally Speaking》。但是,无论是Google语音输入还是Windows语音识别,它都一无所获,并且准确性超过90%。但是每个人都有自己的长处和短处,所以您可能会宁愿选择一个。

Lovecraft喜欢用冗长,不间断的括号内密集的散文来写作。尽管这三个套件都可以很好地准确转录Lovecraft的发声文本,但 DNS领先于竞争对手。它包括大写字母和标点符号(这完全是疯狂的)。

DNS: DNS仅从文本中删除了一个单词。总体而言,它在108个单词中得分为107。

WSR: Windows在转录Lovecraft方面做得很好,但并不令人惊奇。在大约108个单词中,它的97个正确。尽管这虽然不足以支持GDVT和DNS,但对于不需要在线访问的文本程序进行免费演讲还是有好处的。

GDVT:我不确定发生了什么事情,因为Google为其他节选钉上了抄录。 GDVT仅在108个单词中取得了103个单词,丢掉了两个单词,并错误地转录了三个单词。它甚至曾经拼出“分号",而不是插入正确的标点符号。它还将某些单词大写,将它们变成专有名词(但我不会对它们加以惩罚,因为它是准确的,而不是大写)。

我很确定,如果我第二次重读文档, ,不会有任何错误。

达尔文像Lovecraft一样写了很多带有括号信息的长句子。但是,他对语言的使用非常清楚,几乎不使用行话,这与当今几乎难以理解的科学写作有所不同。

DNS:达尔文的文字在《 Dragon Naturally》中几乎完美请讲。 DNS仅将一个单词拼写错误(“ into"),否则以88个单词中的87个单词完全钉住了测试。

WSR: Microsoft做得很好,匹配了82个单词共88个字。不过,它产生了一些相对奇怪的错误,例如将“ sense"拼写为“ cents"。

GDVT: Google在达尔文摘录中的表现非常出色。 GDVT仅对88个单词中的两个单词构成了错误。总的来说,对于免费的应用程序,您找不到更准确的替代方案。

Brown的讲话并不需要使用很多复杂的句子或词汇(除了“ rostrum"一词)。总体而言,大多数转录服务的表现都令人赞叹。或多或少,如果您需要一种能够处理简单句子和有限词汇量的服务,那么其中任何一种都可以很好地发挥作用。

DNS: DNS钉住了布朗的《国家状况》地址。虽然下降了一段时间,否则,它的每个单词都完美无缺。但是请注意,政治演说通常缺乏您在小说或学术界可能会看到的那种复杂的语言。备忘录或演讲是直接而直接的。语音识别客户端在处理该问题时应该没有任何问题。

WSR: Windows语音识别在转录方面做得很好-尽管不如DNS或Google出色布朗的讲话。 58个单词中满分55分。它甚至可以识别“ rostrum"一词,我什至不知道这是一个词,也不知道该如何发音。显然,我理解正确,或者语音识别技术甚至可以捕获错误发音。

GDVT: Google的转录软件绝对准确地记录了转录,准确率为100%。它甚至设法正确地将“国家状态"大写,而无需用户输入。它确实奇怪地使用了数字“ six"而不是拼写。

是否值得使用免费的转录服务?

Dragon Naturally Speaking,Google语音输入和Microsoft的Windows语音识别之间存在区别。龙比竞争对手更准确。但是,就准确性而言,最好的免费程序是Google的语音输入-范围很小。尽管Microsoft和Google的转录服务与DNS相比价格都逊色,但它们的价格都不到30美元。

将这两种免费服务相互对比,Google可以提供更好的语音识别准确性,标点符号和大小写,它需要互联网连接。 Google还捕获了许多您不想要的内容,例如标点符号和大写字母。

但是,如果您想要一个不需要互联网连接的免费转录程序,则Windows语音识别非常适合法案。它绝不差劲,而且提供的内容是《 Dragon Naturally Speaking》提供的90%。

更多信息,请看一下让计算机向您读取文档的方法。

您最喜欢的转录服务是什么?请在评论中告知我们!

标签: 语音识别 语音转文本