语音输入如何成为Google文档的最佳新功能

语音识别过去非常不准确。它仅在少数几个时代对少数人有用。但是现在,由于Nuance,Microsoft,Apple和Google的共同努力,它们实际上已经相当不错了,他们投入了无数资源来进行实际改进。

在所有这些公司中,很少有公司能兑现承诺。 Google的语音识别已使其成为其移动和服务战略的根本关键。

Google最早的尝试之一是短暂的GOOG-411(或Google Voice Local Search)。它于2008年推出,允许人们使用自己的声音搜索商务电话号码。语音识别技术也一直是Android的核心,随着JellyBean的发布,它终于可以离线使用。

本周早些时候,Google终于将语音识别引入了Google文档。

用户可以字面意思规定他们的文档(就像我对本文所做的那样),而无需安装任何其他软件或插件。对于在线办公套件而言,这是一个重大的飞跃,但这有什么好处吗?

入门

在我们开始深入研究其功能之前,我想谈谈如何获取Google语音输入。如果您拥有Google帐户,那么您已经拥有了。只需打开Goog​​le文档,然后打开一个新的或现有的文档即可。然后,将弹出一个窗口,询问您是否要尝试语音命令。点击尝试

下一步,您必须授予Google文档使用麦克风的权限。只需单击允许到弹出窗口。

然后,您必须选择要用于Google语音输入的语言。提供的语言和方言范围从英语和西班牙语到南非荷兰语和阿拉伯语。

语音识别成为主流的最大障碍之一就是不够准确。以前的假设是,如果您看到使用语音识别,则必须花费大量时间来编辑和更正文本。那么Google在这方面的价格如何呢?

实际上非常好。在大多数情况下,即使我有区域英语口音(我们稍后再讨论口音),Google Voice Typing也会理解我的意思。

我当时是Google的语音识别处理背景噪音的方式尤其令人印象深刻。当我写这篇文章时,约克夏犬在我的客厅里吠叫,我的窗户被部分打开。我住在繁忙的道路上,汽车不断驶过。但是尽管如此,Google还是能够过滤掉这些内容,并专注于我所说的话。

最大的问题是Google语音输入法经常在标点符号方面遇到困难。我会说“逗号",“句号"和“句号",这将解释为我想写“逗号",“句号"和“句号"。这令人沮丧,有两个原因。

首先,因为它会首先通过使用正确的标点符号来嘲笑我,然后立即恢复为该单词的拼写版本。无法阻止这种情况,我将不得不手动编辑该文档以进行修复。

但是,更糟糕的是,我无法阻止它的发生。没有字典可以覆盖拼写。它只是发生了,您必须处理它。

我不想低估这是多么令人沮丧。 这很烦人。但是随着越来越多的人使用此功能,并且随着Google投入更多资源来改善其语音识别能力,我相信这一点也会得到改善。

除了让我特别烦恼之外,我非常满意Google语音识别的准确性。

如何处理口音

我为Google语音输入支持的多种语言和方言感到惊讶。仅用英语,它就支持新西兰,澳大利亚,印度,南非,美国和英国方言,仅举几例。问题在于,实际上没有美国的口音,就像没有英国的口音一样。相反,各地的口音和方言范围各不相同。

不言而喻,英国在每个邮政编码中都带有重音。 PCPC.me团队在英国员工中拥有多种不同的口音。克里斯蒂安·考利(Christian Cawley)讲着广泛的米德尔斯堡口音。来自绍斯波特的罗布·南丁格尔(Rob Nightingale)更具北方吸引力。马克·奥尼尔(Mark O'Neil)带着苏格兰的丁字裤。

可以说,语音识别程序经常很难理解当地的英语方言。例如,当Siri出现时,它无法理解苏格兰用户就成了开玩笑。

但是Google的产品非常出色。当我说您不必练习说其他口音时,请相信我。我与少数几个朋友交流,他们也有当地的英语口音,他们也有类似的积极经历。虽然我承认这是一个很小且完全不科学的示例,但它肯定是有希望的。

语音听写速度

传统上,语音识别程序因无法跟上语音识别程序的速度而受到阻碍用户指示。诚然,我有点担心Google的产品不会有什么不同,特别是考虑到它是一种在线服务,而不是运行在功能强大的MacBook Pro上的程序。

但我印象深刻。 Google能够跟上我咖啡因率很高的速度,并且没有成为我工作效率的瓶颈。这与我使用其他语音命令工具的体验完全相反。

我不知道那是因为我拥有快速的FTTC(光纤到机柜)家庭互联网连接,还是事实Google可以无限供应快速服务器。无论哪种方式,我都可以完成。

麦克风注意事项

内置麦克风容易碰碰运气。以我的经验,它们要么像苹果笔记本电脑一样出色,要么就不是。很少有中间立场。

通常,最便宜的笔记本电脑的内置麦克风最差。这只是设备制造商往往会忽略的功能之一。

我开始使用MacBook Pro上的内置麦克风决定这篇文章。尽管Google文档经常说很难听到我的声音,但这并不能解释为较慢或不准确的命令。一切正常。

我还尝试了使用昂贵的Blue Yeti外置麦克风进行Google语音输入。这些是播客级质量的麦克风,在亚马逊上的零售价超过100美元。

诚然,我听不懂命令的准确性或速度。但是,使用此麦克风的最大好处是我能够插入一对AKG耳机并将其用作监听器。这样一来,我就可以更清楚地了解背景噪音,并且可以在自己声音太大或太安静的情况下进行自我调整。

最终想法

Google语音识别并不完美。但这并不奇怪,因为可靠的语音识别是一项很难实现的壮举。我觉得有很多可以改进的地方。

这主要集中在该软件如何处理标点和句子结构上。在理想的情况下,Google会根据您的声音的节奏和节奏自动插入标点符号,但是我们离它很远。

该软件尚未将其引入Google的其他产品中,例如Gmail。理想情况下,我希望有机会下载Google语音输入作为应用程序,并与iWork的Pages等其他软件一起使用。

但这是两个小麻烦,Google语音输入同样好随着它。相比之下,我使用OS X的内置语音识别功能撰写了本文的这一部分,它远没有那么精确,也没有那么快。

如果这不能说服人们切换到Google云端硬盘,我不知道会怎么做。

现在交给您!您是否被Google云端硬盘的语音识别所吸引?你尝试过了吗?在下面的评论中告诉我所有相关信息。

标签: Google文档 语音识别 语音转文本