[AI] Azure AI Speech的批次 Speech to Text (STT)功能

  • 60
  • 0
  • AI
  • 2025-05-12

教學文件: https://learn.microsoft.com/zh-tw/azure/ai-services/speech-service/batch-transcription

其實官網教學文件已經寫得很好了~ 還有附上圖片, 照著作就能進行批次STT,

我花比較多時間在上傳100個mp3到blob及用程式抓轉譯結果,

我用微軟lab環境測試, 上限是100個檔, 所以每100個檔上傳blob, 再打postman呼叫STT的API, 
(官網寫S0能放1萬個檔)

回傳的json裡, 會有如下url, 就是取得回傳報告

  "links": {
    "files": "https://XXXX.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/....../files"
  }

回傳報告就有這100個檔案的轉譯結果json, 如下:

"links": {
        "contentUrl": "https://XXXX.blob.core.windows.net/....."
      }

所以打完STT, 稍等一下(我一個檔才1~2秒, 上傳下一批100個檔案的時間就完成了…或依官網教學查狀態), 

再跑程式先抓files內json取得所有的contentUrl, loop抓轉譯的json內容, 解析其中的檔名和結果, 這用AI寫就能輕鬆作到

我傳的是英文日常句子, 結果幾乎都對, 只差在有時會漏逗號, 還有金額如$14.25會被轉譯成1425

 

Taiwan is a country. 臺灣是我的國家