找了一下 speech to text 可以用的 SDK for iOS 以下幾種方案:

  • NDEV Mobile (有免費方案,不過似乎不支援離線,客戶清單中有 wallmart,支援不少語言
  • iSpeech (看起來有很完整的開發整方案,支援各種平台)
  • OpenEars (stackoverflow 上比較多人推,似乎是最成熟穩定)
  • 用 Google 非公開的 API 偷偷幹,他會吐回 JSON speech2text 的資料,不過 Google 只能讀得懂 FLAC 格式檔案,所以必須在自己 server 端轉換,或是在 iPhone 裡直接轉換 (libFLAC for iOS),再丟到 Google server.

另外,Mac 的 SDK 似乎有可以用的方法 NSSpeechRecognizer,也可以看看這個偵測聲音的範例

 

底下為網友推薦聲音處理的一些 library 及教學資源: