kolpower

直播如何即時產生字卡特效?最近 YouTuber 特效大神「六指淵」又推出新作品,此次「六指淵」團隊透過 Google 的 AI 訓練模型,開發出能夠在直播中即時產生字卡的工具,只要訓練好 AI 模型之後,將網址貼到 KOLpower 中,就能夠實現在直播時辨識聲音,並吐出相對應的綜藝素材,如此一來直播也能有專業的影片字卡特效啦。KOLpower 不斷開發能夠讓創作者省時的工具,像是之前的「自動剪輯神器」就能夠粗剪影片,將空白的地方移除,快速完成影片初期的剪輯。

直播聲音辨識字卡

首先進入 Google Teachable Machine 聲音訓練模型網站,點擊 Mic 來錄製聲音訓練 AI 模型,首先需要加入一個「背景聲音」來讓 AI 學習背景音的環境,只需要錄製一段空白的聲音即可。接下來就是錄製各式字卡的聲音,比如說想要「哈哈」字卡,就錄製數段「哈哈」的聲音讓 AI 去學習辨識。

直播聲音辨識

錄製背景聲音的部分,錄製完畢後點擊 Extract Sample,就可以看到右側的聲音樣本啦。

直播即時字卡

接下來就是大家要錄製各式的聲音,讓 AI 去學會辨識你的聲音,全部的樣本都錄製完畢後,點擊「Train Model」來讓 AI 進行學習。

直播即時特效

學習完畢後在最右側的 Preview 就可以看到結果啦,此時可以測試看看 AI 的辨識效果如何,試著說出剛剛錄音的詞,看看 Output 下方辨識的分數是否都能夠在 90 分以上。若沒問題的話點擊 Export Model 就可以輸出囉。

直播聲音辨識字卡

輸出後點擊 Upload 上傳後,將下方的連結複製起來。

直播聲音辨識字卡

回到 KOLpower 中貼上剛剛的連結後,按下「讀取」。

直播聲音辨識字卡

讀取後就可以開始匯入「字卡素材」啦,字卡若是影片的話,必須是 .wemb 格式,字卡若是圖片可以用 PNG、JPG 檔,也支援 GIF 動態圖檔。六指淵團隊之前就有推出過「綜藝字卡」、「綜藝素材」,沒時間自製字卡的朋友,可以直接購買匯入,有時間的話自己做也沒有不行,素材匯入後選擇「綠背景」,最後點選「彈出素材視窗」就完成囉。

最後就會在網頁上跳出綠幕背景的頁面,根據聲音辨識結果,跳出對應的字卡,只需要將此頁面分享至直播軟體播出就可以啦!以下看看示範:

傳送門:KOLpower 直播聲音辨識

直播聲音辨識神器,AI 學習自動上特效及字卡 相關文章