其實官網教學文件已經寫得很好了~ 還有附上圖片, 照著作就能進行批次STT,
我花比較多時間在上傳100個mp3到blob及用程式抓轉譯結果,
我用微軟lab環境測試, 上限是100個檔, 所以每100個檔上傳blob, 再打postman呼叫STT的API,
(官網寫S0能放1萬個檔)
回傳的json裡, 會有如下url, 就是取得回傳報告
"links": {
"files": "https://XXXX.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/....../files"
}
回傳報告就有這100個檔案的轉譯結果json, 如下:
"links": {
"contentUrl": "https://XXXX.blob.core.windows.net/....."
}
所以打完STT, 稍等一下(我一個檔才1~2秒, 上傳下一批100個檔案的時間就完成了…或依官網教學查狀態),
再跑程式先抓files
內json取得所有的contentUrl
, loop抓轉譯的json內容, 解析其中的檔名和結果, 這用AI寫就能輕鬆作到
我傳的是英文日常句子, 結果幾乎都對, 只差在有時會漏逗號, 還有金額如$14.25會被轉譯成1425
Taiwan is a country. 臺灣是我的國家