訊飛語記是一款支持語音和文字互轉(zhuǎn)的軟件,由科大訊飛信息科技股份有限公司制作發(fā)行,科大訊飛是一家專門從事智能語音及語音技術(shù)研究、軟件及芯片產(chǎn)品研發(fā)的國家骨干=級軟件企業(yè),在這么多年的發(fā)展之下,科大訊飛也是發(fā)行了非常之多的與語音相關(guān)的軟件及技術(shù),例如語音輸入、人機交互、語音合成等技術(shù),在語音編碼、意思呢轉(zhuǎn)換、語音降噪等技術(shù)上很有建樹,同時這些技術(shù)領(lǐng)域都是能方便我們的生活,有著廣闊的應(yīng)用空間,今天小編帶來的這款軟件就是這些技術(shù)的應(yīng)用體現(xiàn),使用該軟件的語音輸入功能,能十分高效的進行寫作,在以前很多碼字的大佬的速度的確是十分的快的,但是還有著非常之多的人的碼字速度其實并不快,有些時候在碼字的時候,卡克、慢、等等都會影響到寫作的靈感,而使用這款軟件就沒有這方面的煩惱,同時應(yīng)用場景十分的廣泛,實時錄音轉(zhuǎn)寫,可以用到記者采訪、會議記錄、課堂筆記之中,都是非常的方便。而且這款訊飛語記軟件除了支持文字轉(zhuǎn)寫,還支持文字轉(zhuǎn)語音,提供多種音色的發(fā)音給用戶,選擇一款喜歡的音色,解放自己的雙眼,享受聽書的樂趣。
軟件特色
一、語音輸入,高效協(xié)作。
1、全球尖端語音技術(shù),識別率高達98%。
2、說話就能變文字,轉(zhuǎn)寫中英文、各地方言無障礙。
3、120分鐘語音持續(xù)輸入,思如泉涌不中斷。
二、語音轉(zhuǎn)寫,智能校對。
1、錄音實時轉(zhuǎn)文字,邊聽邊改,一字不落。
2、記者采訪、會議記錄、課堂筆記必備神器。
三、收藏助手,語音朗讀
1、一鍵收藏文章、圖片、鏈接等內(nèi)容。
2、語音朗讀各類讀物,解放雙眼、更有各種音色的發(fā)音任意挑選。。
四、多端登錄,云端同步
1、支持iOS、Android、PC端多端登錄。
2、所有資料云端同步,永久保存,隨時隨地輕松查詢。
訊飛語記安裝步驟
1、從本站下載解壓后,找到“voicenote-2.0.2.exe”安裝向?qū)?,雙擊運行。
2、進入向?qū)Ш螅x擇文件的安裝位置,默認C盤,推薦安裝在除C盤之外的其他盤,點擊瀏覽可以選擇安裝位置。
3、安裝中,請等待1-3分鐘。
4、安裝成功,點擊完成退出暗轉(zhuǎn)向?qū)А?br />
訊飛語記使用教程
一、啟用與切換
1、Ctrl+ Shift鍵可切換
將鼠標移到要輸入的程序,點一下,使系統(tǒng)進入到輸入狀態(tài),就可以使用"Ctrl+ Shift鍵”換
輸入法,待切換出來即可使用。
2、Ctrl 鍵+引號鍵,快速切換到訊飛輸入法
您也可以使用Ctrl+引號鍵,快速切。
3、CtrI 鍵+空格鍵切換到默認輸入
如您喜歡,可以將訊飛輸入設(shè)為默認,通過"Ctrl 鍵+空格鍵”即可切換。
二、語音輸入
1、開啟與關(guān)閉
如上圖所述,點擊語音麥克風(fēng)開啟語音欄(快捷鍵: F6 )。
2、音量校準
首次啟用語音功能時,需要您根據(jù)向?qū)崾具M行音量,可以將您的錄音設(shè)備調(diào)整至最佳狀態(tài)。
建議您使用外接麥克風(fēng)進行語音輸入,能夠達到最佳的錄音效果。
3、語音輸入模式
訊飛輸入默認為您開啟了安靜模式,您每說完-句話后,待成功返回您剛說完的文字后,可以繼續(xù)說下一句,流程如下:
一般情況下 ,當(dāng)您使用電腦進行語音輸入時,噪聲會對識別效果造成影響,此時可以通過設(shè)置-語音設(shè)置面板,將語音識別的場景更改為嘈雜。
在嘈雜模式下,您每說完一句話后 ,訊飛會暫時停止錄音(以屏蔽環(huán)境噪聲的干擾)。
此時需要點擊一下麥克風(fēng)。 ,才能繼續(xù)進行語音輸入,流程如下:
常見問題
1、次數(shù)限制的疑問
開發(fā)集成階段的服務(wù)量為500次/日,開發(fā)者需要提交應(yīng)用上線審核,通過后可以獲得更多的每日服務(wù)量。
2、應(yīng)用上線審核的時間范圍
應(yīng)用上線審核流程需要4個工作日(工作日不包括周六周日以及國家法定節(jié)假日)。
3、上傳音頻的采樣率與采樣精度
采樣率16KHZ或者8KHZ,單聲道,采樣精度16bit的PCM或者WAV格式的音頻。
4、中英文混合識別
目前還不支持。
5、聽寫VS識別
聽寫:將語音直接轉(zhuǎn)換成相應(yīng)的文字。
識別:先上傳命令詞或者abnf語法文件。如果上傳的是命令詞,則只會識別命令詞,并返回識別結(jié)果,若命令詞中沒有匹配,則會返回沒有匹配結(jié)果的錯誤碼;如果上傳的是語法文件,會按照語法文件的格式返回相應(yīng)的匹配信息,若無匹配的結(jié)果,則會返回沒有匹配結(jié)果的錯誤碼。
6、使用語音聽寫,一次會話的最長時間
一次會話的最長時間為60秒。
7、聯(lián)系人、用戶詞表、命令詞、abnf語法文件、bnf語法文件的區(qū)別
聯(lián)系人與用戶詞表是聽寫的時候使用,命令詞和abnf語法文件是在識別的時候使用。
使用聯(lián)系人時,程序會讀取用戶的聯(lián)系人信息,在聽寫時,優(yōu)先識別聯(lián)系人;使用用戶詞表,詞表由開發(fā)者自定義,可以涉及各種偏門或?qū)I(yè)術(shù)語,上傳詞表后,會優(yōu)先識別詞表中的詞匯,提高個性化識別體驗。
命令詞識別時需要上傳命令詞,在識別時,識別結(jié)果只在命令詞中匹配,并且會有識別結(jié)果的置信度;使用abnf語法文件時,需要進行語法文件的上傳,語法文件可自行編寫,識別時,只有結(jié)果與語法文件相匹配時,才返回結(jié)果,否則返回沒有匹配結(jié)果的錯誤;使用語音+的離線命令詞識別時,需要使用bnf語法在本地編寫語法文件,之后就可以本地構(gòu)建、本地語法文件識別了。
8、日志文件的生成配置
在msc.cfg文件中配置“output=1”時,會輸出運行日志到msc.log,lvl=-1,log=文件路徑/msc.log(例如./home/../msc.log);“output=0”不生成日志,Level值越小日志越詳細,Level=-1為最詳細。
9、數(shù)據(jù)是否要加wav頭?是否可以直接mic數(shù)據(jù)至服務(wù)器?
wav文件由一個pcm文件頭及pcm數(shù)據(jù)組成,pcm文件頭是用于標識該wav文件的pcm數(shù)據(jù)采樣率、量化比特數(shù)、文件長度等信息。
mic錄音得到的就是pcm數(shù)據(jù),可以直接上傳語音云進行識別,不需要添加pcm文件頭。
需要注意,mic錄音的pcm數(shù)據(jù)采樣率與量化比特數(shù)需要與SessionBegin中設(shè)置的參數(shù)一致。
更新日志
訊飛語記 v3.1.1254.1
1、優(yōu)化加載筆記速度。
0條評論