免费、开源、本地离线语音转文本神器！--粉丝服务平台-粉丝头条-fensifuwu.com

免费、开源、本地离线语音转文本神器！

日期： 2023-03-13 11:51:25 来源：治廷君收集编辑：治廷君

“设为星标”第一时间接收推送，精彩内容不容错过！

Buzz

一款GitHub开源免费的，可以本地离线运行的语音识别软件。它有两个功能，一个是语音转文字，一个是实时语音识别。

特点

从麦克风实时转录和翻译成文本
导入音频和视频文件并导出文本到 TXT、SRT 和 VTT 字幕文件
支持Whisper、 Whisper.cpp、与Whisper 兼容的 Hugging Face 模型和 OpenAI Whisper API
适用于 Mac、Windows 和 Linux

安装

以Windows系统为例简单说明，软件下载完成后，双击运行，进行安装：

根据个人情况选择是为所有用户安装，还是仅为当前用户安装

选择安装位置（老朋友都知道，小编习惯将软件安装在非系统盘，养成良好的软件安装习惯)。

后面基本一路 Next 即可进入安装阶段，等待安装完成即可。

使用

运行 Buzz ,进入软件主界面

如上图，工具栏麦克风按钮为实时语音识别，旁边的 + 号为音视频文件转文本，下面以音视频文件转文本为例进行说明，首先点击 + 号导入需要转文本的音频或视频文件，如下：

支持文件类型：
*.mp3,*.wav,*.m4a,*.ogg,*.mp4,*.webm,*.ogm,*.mov

打开音频后，会进入设置窗口，Model选项为语音识别的模型，第一次使用时，会根据Model下方选择的不同的质量需求，下载指定的模型，具体如下：

Task任务只有两个选项，分别为Translate（翻译）、Transcribe（转录），可根据需要进行选择

Language选项为语言设置选项，默认为detect language（自动检测语言），注意，这里的自动检测只是检测前几秒音频中的语言，稳妥起见，还是推荐自己指定语言。

设置完成，点击 Run

如上所述，第一次运行，本地没有任何模型，所以会自动开始下载模型文件，下载完成后会自动执行语音转文本任务。

状态栏显示 Completed （完成）后，使用鼠标双击这一行，就会弹出识别的字幕内容，如下:

可以看到，内容中有不少地方声音识别出来，但文字是不对的，还需要手动调整，不过小编只是为了演示，只选择了较小体量的Base模型，大家可以下载质量更高的模型进行尝试。

点击字幕列表右下角 Export （导出），可以选择导出为txt文本文件或者srt、vtt字幕文件。

服务粉丝

免费、开源、本地离线语音转文本神器！

Buzz

特点

安装

使用

相关下载

文章推荐

相关阅读

航天院入两万，是一种什么体验！

中国企业如何应对AI产业竞争

事关南部新城！一批公建配套项目计划出炉！

六险二金！中国中车2023春季校园招聘公告

济南地铁未来五年这样干！

有瓜吃！港媒“爆料”何鸿燊女儿何超莲4月举行婚礼,邓紫棋当伴娘...

电路老化不均匀成为IC设计师面对的大问题

萌漫 | 植树节创意漫画，独具匠心！

植树节，官兵在行动！

为家乡代言！贵州“文旅推荐官”正式招募，赶紧报名→

聚合标签

热门文章

百元茅台没人买，千元茅台有人追。十年前，有人花百元买了一万股茅台，后出手追中石油，如今，茅台一飞冲天，中石油深套十年。炒股，不要见异思迁，价值投资是首选。#股票#

谁说定期存款提前支取不划算？存中原银行“惠农宝”放心随便取

张小龙:交了8千万税无北京户籍孩子连私立也不让上

万字详解：ROE连续十年超过20的明星公司全面分析（附：详细名单）

“复活”半年后　京东拍拍二手杀入公益事业

离职时没有做满一个月，公司还需要帮纳当月社保吗？

最新文章

工资3K，我靠抖音tiktok全款买了房：你看不起的行业，往往很赚钱！

这款 Linux 才是 Windows 用户完美的发行版

免费、开源、本地离线语音转文本神器！

宝鸡南山中学：打造“沉浸式”课堂让历史教学“活”起来

航天院入两万，是一种什么体验！

Java并发面试，幸亏有点道行，不然又被忽悠了～