2018/3/6 · Google 靠 AI 也能讓你一秒去背、錄影時同步換即時背景。(圖/翻攝自 Google blog,下同) 【我們為什麼挑選這篇文章】以前我們在 Youtube 上進行直播影片錄影的時候,如果想要做到即時的背景合成,大多要靠一種綠幕放在背景後才能辦到,不過不久的未來或許我們就可以省下這個找綠布的煩惱。
直播如何即時產生字卡特效?最近 YouTuber 特效大神「六指淵」又推出新作品,此次「六指淵」團隊透過 Google 的 AI 訓練模型,開發出能夠在直播中即時產生字卡的工具,只要訓練好 AI 模型之後,將網址貼到 KOLpower 中,就能夠實現在直播時辨識聲音,並吐出相對應的綜藝素材,如此一來直播也能有專業的影片字卡特效啦。KOLpower 不斷開發能夠讓創作者省時的工具,像是之前的「自動剪輯神器」就能夠粗剪影片,將空白的地方移除,快速完成影片初期的剪輯。
首先進入 Google Teachable Machine 聲音訓練模型網站,點擊 Mic 來錄製聲音訓練 AI 模型,首先需要加入一個「背景聲音」來讓 AI 學習背景音的環境,只需要錄製一段空白的聲音即可。接下來就是錄製各式字卡的聲音,比如說想要「哈哈」字卡,就錄製數段「哈哈」的聲音讓 AI 去學習辨識。 錄製背景聲音的部分,錄製完畢後點擊 Extract Sample,就可以看到右側的聲音樣本啦。 接下來就是大家要錄製各式的聲音,讓 AI 去學會辨識你的聲音,全部的樣本都錄製完畢後,點擊「Train Model」來讓 AI 進行學習。 學習完畢後在最右側的 Preview 就可以看到結果啦,此時可以測試看看 AI 的辨識效果如何,試著說出剛剛錄音的詞,看看 Output 下方辨識的分數是否都能夠在 90 分以上。若沒問題的話點擊 Export Model 就可以輸出囉。 輸出後點擊 Upload 上傳後,將下方的連結複製起來。 回到 KOLpower 中貼上剛剛的連結後,按下「讀取」。 讀取後就可以開始匯入「字卡素材」啦,字卡若是影片的話,必須是 .wemb 格式,字卡若是圖片可以用 PNG、JPG 檔,也支援 GIF 動態圖檔。六指淵團隊之前就有推出過「綜藝字卡」、「綜藝素材」,沒時間自製字卡的朋友,可以直接購買匯入,有時間的話自己做也沒有不行,素材匯入後選擇「綠背景」,最後點選「彈出素材視窗」就完成囉。最後就會在網頁上跳出綠幕背景的頁面,根據聲音辨識結果,跳出對應的字卡,只需要將此頁面分享至直播軟體播出就可以啦!以下看看示範:
傳送門:KOLpower 直播聲音辨識