裁判、球員、觀眾,全是我?!一個人怎麼遠距執行語音「綠野仙蹤測試」?

一個人寂寞寂寞就好 😢 ⋯⋯

Tempo Chang
7 min readJun 23, 2021

我們常常可能需要在訪談或測試時,同時兼任實驗主持人和研究員,像是發想個人的 side project,或當公司資源不足時。希望這篇文章能提供你一點執行方式的靈感(影分身之術的部分)!

什麼是綠野仙蹤法?

綠野仙蹤測試法(Wizard of OZ Testing,WOZ),顧名思義取自童話故事「綠野仙蹤」。在其故事的結尾,桃樂絲一行人最終發現一直相信著的強大魔法師奧茲根本不是什麼神秘的化身,而只是一個躲在布簾後面故弄玄虛的平凡人!

這樣的測試方法常用於人機互動的相關研究中,透過研究者假扮「巫師」(OZ)躲在另一頭針對受測者對電腦的輸入進行回覆,模擬真實產品的運作。讓受測者彷彿真實地與機器進行互動,而背後其實是「工人智慧」😂。

Gould, J. D., Conti, J., & Hovanyecz, T. (1983). Composing letters with a simulated listening typewriter. Communications of the ACM, 26(4), 295–308.

在設計語音對話式產品內容的初期,綠野仙蹤測試法也常用於:測試使用者對於示例對話詞彙(sample dialog)、語句流暢、語音對話代理人(語音系統角色,Voice conversational agent)的評估,差不多就是測試 GUI 介面的低保真原型的那種感覺。

一般測試將需要一位研究者擔任主持人、另一位熟悉研究的他人擔任「巫師」。由主持人作為明面的指引人,與受測者介紹測試流程,並且於測試過程中觀察、記錄測試過程。而扮演「巫師」者在暗處負責播放語音錄音檔(或著你也可以直接口語對話),如果提前錄音的示例對話中無法涵蓋受測者的輸入內容,也需要「巫師」以語音對話代理人的個性直接回覆,以便在正式進入語音對話的開發前確認使用者的互動體驗 ✊

那⋯⋯以上述為前提我們該怎麼獨自的做語音的綠野仙蹤測試呢 😰😰

如何「一個人」執行語音的綠野仙蹤測試?

我的研究著重於測試語音助理應用程式(voice assistant app)的互動,因此,在疫情仍未進入三級警戒前,原本為了營造更真實的語音情境,將透過紙模板製作「假手機」和語音助手的「假畫面」搭配語音錄音檔改變假手機上的畫面。

胎死腹中的紙原型(用電腦畫紙原型也是滿 COOOOL 的想法呢)

當時準備的測試道具有:

  1. 最重要的,語音對話錄音檔(我是用 Google Dialogflow 編寫後下載檔案)
  2. 紙模型們,手機與切換的畫面
  3. 語音示例對話清單(可以用 Exel 整理,或是我是用自己整理的 Component 模板)
  4. 語音對話流程圖(Hight-level flow diagram)
  5. 小時鐘搭配提示早中晚的紙版(每隔十分鐘為一個段落的轉換,為了讓使用者在期間可以更自由的與產品互動,而不進行打斷,不過需要在時間轉換時完成該階段的任務)
  6. 隔在與受測者之間的大紙板

其實這樣的測試方式若沒有旁人協助,需要超熟練,不然也是很難獨自進行(播放檔案的同時還需要變換紙模型 😨)。不過剛好在正要進入測試時,全台北進入了外出警戒狀態 😟 ⋯⋯

那也是終於進入了本文正題⋯⋯(整個打掉重練了)

示例對話清單模板,資料來源:自己(2021)。

如何一個人執行「遠距」的語音綠野仙蹤測試?

隨著疫情升級,測試又又又 Level Up 了… 這時,我遇到了三個的問題,

  1. 如何一邊聆聽受測者的講話內容,觀察受測者表情,並將內容記錄下來,同時還要對照對話流程播出錄音檔?
  2. 如何讓受測者能不受測試執行影響,能夠順利互動、對話?(測試需要很順暢!)
  3. 如何讓受測者彷彿真的是直接與一個語音產品/語音助手互動?

思考了許多方法,像是直接用 Dialogflow 開發成品,讓受測者分享手機畫面並且可以看到受測者直接操作的樣子,不過失敗了 😭

由於語音助手本身需要麥克風的權限,如果要在透過會議軟體分享畫面給研究者,將會是靜音的 🥺。 Dialogflow 開發的 Voice app 也只能在 Google 助理上執行語音互動。同時,最關鍵的是,直接執行到產品開發也與最初在「進入開發前」先以使用者經驗測試確認語音脈絡、對話體驗、對話範疇(intent)的目的相悖。

最後,我是這樣做的:

  1. 將語音對話改為利用 Voiceflow 進行串聯,能夠大幅的解決研究者需要對照語音流程表播放語音的難處。研究者就可以擁有更多時間關注於受試者的測試狀況。
  2. 開設一個會議工具(如 Zoom、Google Meet)新帳號,將其頭貼改為語音對話代理人的形象,姓名同理,並且分別用兩台裝置開啟。在測試時明確切換兩者的麥克風,身為主持人角色時使用個人帳號,身為語音「巫師」時打開麥克風,並播放錄音回覆。
  3. 回歸於語音助手體驗本身,但在測試前先以簡報與受測者介紹產品的實際應用,並且鼓勵受測者多多嘗試以個人口語與語音對話代理人對話。

(不過以 Voiceflow 開發中文語系的 voice app 可能會匯出、測試失敗,所以還是要一句一句點播放,還有回到 Google 爸爸的 Dialogflow 開發也比較保險 😭)

很像打地鼠般的測試設備的設定⋯
測試的模擬⋯

💡 在這邊提供,如果只是純測試詞彙與對話脈絡,也可以使用 Say Wizard 這個小工具(安裝教學)

最後

幾乎多數受測者都沒有發現研究者身兼二職 😂 (許多人結束後才問:所以那個人是誰?或是我們會議裡怎麼有第三個人?😨)

這個測試方法參考於一隻 Youtube 影片!不過他們有三個人:主持人、技術員、巫師,一起互相配合(羨慕)。感謝這位 Ian Arawjo 大大上傳影片讓我整個茅塞頓開順利的完成這次研究!(發現自己太白癡了,都沒想到,一直被綠野仙蹤既有的執行方式限制想像)

「當命運交給你一棵酸檸檬,你要想辦法把他做成一杯可口的檸檬汁。」 ── Dale Carnegie

你以為我們只有四個人嗎?其實有八個。

而最後完成開發後的語音遠端易用性測試又是下一階段的後話了(透過 Zoom 螢幕分享+畫面操控分享 Google Action 平台,讓使用者直接遠端用麥克風從後台對話) 😭

Next ㄈ Level ㄈ

🚩 想要了解更多關於語音對話產品的測試或設計可以看 Google 的介紹唷:

--

--

Tempo Chang
Tempo Chang

Written by Tempo Chang

_體現有價值的設計/ UX Designer / Product designer / / // / / / linkedin.com/in/tempo-chang/

No responses yet