banner
KiWi

KiWi的博客

这里是一个搞技术的音频er的网站
wechat
email

WwiseAgent:AI驅動的Wwise工作流助手

前言#

在遊戲音頻設計領域,Wwise 作為主流音頻中介軟體提供了 WAAPI(Wwise Authoring API)來支持工具開發。然而,長期以來,WAAPI 的使用一直局限於少數技術音頻工程師,形成了明顯的技術門檻。傳統開發模式下,每個專案特定需求都需要專人開發專門工具,不僅效率低下,還難以在不同專案間復用。

而在 AI 大模型技術爆發的今天,WwiseAgent 專案應運而生,徹底改變了這一現狀。
image

技術突破#

WwiseAgent 的核心優勢在於打破了傳統 WAAPI 工具開發的技術壁壘。

傳統 WAAPI 開發面臨三大痛點:首先,開發者必須同時精通編程和 Wwise 音頻系統;其次,每個工具往往只解決單一特定問題,泛化能力極差;最後,工具維護和更新需要持續投入技術資源。

下面是開發模式對比:

功能傳統 WAAPI 方式WwiseAgent突破點
需求響應時間數天到數週即時無需專門開發
開發門檻需專業程式員自然語言互動
功能泛化性低(專項定制)一套系統解決多種需求
維護成本持續需要幾乎為零模型自我更新

實戰演示#

以下是一些在工作中比較常見的 waapi 需求,通過 Wwise Agent 解決的表現

  1. 簡單的創建對象,並進行進一步操作
(如果看不到視頻的話是博客暫時遇到一些問題)
  1. 通過 excel 直接批量創建對象
    (待錄製視頻)
  2. 按照特定要求整理工程,規範資產管理
    (待錄製視頻)

以上是三個比較簡單,但是在平時工作中比較繁瑣的任務。這種任務交給技術音頻的話排期又會很靠後,設計師自己來的話又很麻煩。當然,Wwise Agent 能夠實現的功能不止如此,所有通過 Waapi 能夠做到的操作,它都可以做到,具體就需要設計師在實際生產中自己嘗試了。

後續方向#

對於 Wwise Agent 的下一步發展方向,無非也只有優化響應速度和進一步的多模態輸入來考慮了。畢竟在當今 AI 浪潮下,誰也不知道 Wwise 會在何時推出官方的 AI 服務,同時其自身也受限於 Waapi 的操作權限。

對於優化響應速度的話,無非也就是推動端到端的本地模型部署,通過蒸餾,剪枝等技術進一步壓縮模型大小。

對於多模態輸入來說的話,則需要根據實際工作場景,增加對於可能的圖片,視頻,音頻等的輸入支持。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。