快轉到主要內容

SillyTavern設定語音辨識服務,麥克風聲控

· 民國113年甲辰年
·
切換繁體/簡體 ·
分類 Linux系統 Self-hosting自架
標籤 Stable Diffusion
目錄
SillyTavern使用教學 - 點選展開系列文
8: 現在位置

語音辨識(Speech Recognition)讓你對麥克風講話來輸入文字,與AI對話。

SillyTavern可以利用瀏覽器內建的語音辨識系統來輸入文字,也能夠使用OpenAI的Whisper AI進行更精確的偵測。

1. 安裝語音辨識擴充套件
#

這個功能需要手動安裝。

  1. 點選擴充套件選單,點一下右上角「安裝擴充套件」按鈕,輸入網址https://github.com/SillyTavern/Extension-Speech-Recognition下載

  2. 在電腦安裝ffmpeg

2. 設定語音辨識
#

請注意~本機Whsiper運算的時候會耗用GPU資源計算,因此速度可能比瀏覽器的語音辨識要慢些。

1.點選擴充功能的Speech Recognition選單,Speech-to-text-Provider選取Whipser (Local)

  1. Speech Language建議手動指定語言比較精準。Message Mode選取Append就是在聊天欄輸入文字,Auto send即講完話自動送出訊息。

  2. Message Mapping為將聲控對應到SillyTavern的特定指令。

  3. 下面Whisper Model選取whisper-base,使其支援多語言。

  4. 然後就在聊天欄按麥克風圖示發話即可。

參考
#

SillyTavern使用教學 - 點選展開系列文
8: 現在位置

相關文章


感謝您的閱讀。我寫作是為了誠實表達想法,而不是追逐社群互動與流量。我很樂意傾聽你在仔細閱讀我文章之後的心得。若有內容勘誤 or 技術問題 or 回饋想法,歡迎透過本站「關於」頁面的Email與我聯絡。