启用语音识别及其转换为文本功能,并将该文本插入页面的文本元素中
"Voice Master"是一款免费的Chrome浏览器扩展程序,提供语音识别功能,可将口语转换为文本。该文本可自动插入网页上的任何文本字段或特殊的dictation窗口中,让您可以使用语音直接与Claude和ChatGPT等人工智能平台进行交互。此外,该扩展程序还提供由ChatGPT人工智能驱动的文本校正功能(用于校正标点符号、格式和词汇),但需要付费密钥才能启用此服务。此工具是任何希望提高工作效率、减少打字时间、优化工作流程的人的理想之选。
➤ 安装和设置
像安装任何其他Chrome扩展程序一样安装"Voice Master"扩展。安装后,您将看到一个麦克风图标,我们建议您将其拖放到工具栏上以便快速访问。
➤ 使用方法
- 启用语音输入:在弹出窗口中,将切换按钮切换至"开启"状态,然后点击麦克风图标。
- 语言选择:选择所需的输入语言,无论是英语还是其他可用语言。
- 字段选择:选择网页上要输入文本的字段——可以是购物网站的搜索栏、YouTube评论区、Facebook帖子文本区域、WordPress的TinyMCE文本编辑器或任何其他文本字段。
- 听写文本区域:点击"听写窗口"特殊按钮,开始说话,"Voice Master"会将您的语音转录为文本。可用于言辞表达您的想法。
- 关闭语音输入:说完后,再次点击麦克风图标即可停止该过程,或使用快捷键CTRL+SHIFT+Y。
➤ 使用ChatGPT编辑(校正标点符号)
如果您的文本需要校正,可利用集成的ChatGPT 3.5 Turbo人工智能(需付费的API):
- 高亮显示文本,然后点击工具栏上的按钮以改善文体风格"使用ChatGPT修复拼写和样式"。
- 首次使用时,系统会要求您输入GPT API密钥,该密钥将保存以备后续使用。
- 人工智能会编辑并返回文本,您只需确认即可替换原文。
!!只需5美元的预算,使用GPT-3.5-Turbo模型(每1000个token收费0.002美元),您就可以处理约250万个token。考虑到英语单词平均每个词有1.3个token,这相当于可处理约192.3万个英语单词。因此,有了这个预算,您就可以对大量英语文本进行校正。无中间环节,无额外服务费,您只需为直接使用OpenAI的服务付费!
➤功能免责声明
1)语音识别API的局限性:尽管语音识别技术有了很大改进,但准确识别标点符号仍然是一大挑战。这是因为标点符号不是用词语表达的,必须从语调、停顿和语音节奏中推导出来,这对算法而言仍是一大挑战。
2)语音模型的复杂性:人类语音是不可预测和多变的。人们可能说话很快、合并单词、使用地方口音或发音不清晰。所有这些因素都给语音识别系统准确识别和应用标点符号带来了挑战。
3)需要语境理解:标点符号的使用通常取决于句子或甚至整个段落的语境。像ChatGPT这样的人工智能经过训练,能够理解大量文本,因此能够根据上下文更好地判断是否需要使用逗号、句号、问号和感叹号。
文本中的简要说明:"为提高语音转文本技术识别的文本标点符号的准确性,我们应用ChatGPT人工智能进行了额外校正。这样可以考虑人类语音的语境和细微差别,从而确保文本格式的高度精准性。"
注意:
- ChatGPT无法用于YouTube评论区
- ChatGPT校正的最大文本长度为4000个字符
➤ 在独立窗口中听写
为了更方便地管理文本,请使用独立窗口听写功能:
- 按下"听写窗口"按钮
- 开始听写,文本将出现在一个独立的字段中,您可以从中复制到任何地方或将其用作个人笔记。
- 您也可以直接在此窗口中使用ChatGPT编辑文本。
- 使用示例:给任何人听写一封电子邮件,然后使用人工智能校正文本。
➤ 其他功能
该插件的所有窗口和面板都可以拖动。
- 快捷键:使用快捷键CTRL+SHIFT+U可切换面板的显示/隐藏。
- 在使用任何文本区域或文本输入字段时,您可以使用快捷键CTRL+SHIFT+Y启用或禁用语音识别。
- 如果选中某些文本然后说话,所选文本将被您所说的内容替换。
- 此外,您还可以随时关闭窗口或更改语言设置。
➤ 反馈和建议
如有任何想法或建议,请通过https://pluginus.net/contact-us上的联系表格与我们联系。我们非常重视您的反馈,并将不断努力改进"Voice Master"以更好地满足您的需求。
➤ 总结
"Voice Master"是一款实用的工具,可以帮助您将语音转换为文本。使用它,您可以轻松通过语音控制互联网、将语音转换为文本命令,并在必要时使用人工智能校正文本。此工具可以简化互联网使用,无需过多精力即可管理。将"Voice Master"添加到日常工作流程中,通过先进的语音识别技术来提高文字工作效率。