語音之我的鋼鐵人後台計畫

語音應用

前言

想要嘗試用語音做一些相關的應用在生活中

因為Azure有許多的服務可以解決語音相關的處理

也在一些會議中聽到一些資訊
 

實踐方式

1.入口初期可以透過電腦+麥克風對語音應用整合

2.利用Azure的服務處理相關語音及語意的服務

3.最後希望可以觸發到意圖相關的應用

未實踐前的小思考

1.這算AI嗎?

我在想這些背後處理的服務應該都是大數據下分析出的結果,都是人為設計或編排,我個人覺得....所以AI到底是啥?什麼是真正的AI?(腦補)

2.如果叫一次服務收一塊錢你願意買單嗎?客戶會買單嗎?

一整個流程就使用了Azure 3個服務,在想這些服務收費下來應該也不是很便宜

可想而知為什麼普及或更深度的應用等等,Google做不到?siri做不到?
因為只要可以客製語意分析內容後應該理論上,可以直接讓使用者設定一些對應的服務了!(腦補)

3.有可能自己做掉語音或語意等相關的服務嗎?

難吧!這背後應該都是很多數據庫訓練出來的模型(猜)

4.有沒有人做好類似的東西?

也許有吧!沒去找我是工程師當然自己刻自己幹出來自己想做什麼怎麼串自己玩!(嘴)

以上!

有很多的不確定性及更深入的思考,若實踐後有機會再陸續補充!

參考

Azure

說話者辨識

語音轉文字服務

語言理解