隨著人工智能的越發(fā)火熱,越來越多公司開始研發(fā)人工智能產(chǎn)品,其中對話AI產(chǎn)品尤其被大家所關(guān)注。當(dāng)前十分火爆的智能音箱就屬于人工智能對話AI產(chǎn)品,其主要交互方式是語音對話,所以語音交互開始被廣泛關(guān)注。本文嘗試探討的課題,即是圖形用戶界面設(shè)計與語音用戶界面設(shè)計的關(guān)系。
本文中GUI (Graph User Interface) 指的是圖形用戶界面,包括我們現(xiàn)在所熟知的界面交互設(shè)計和視覺設(shè)計。本文中VUI (Voice User Interface) 指的是語音用戶界面。
GUI是道格·恩格爾巴特(鼠標(biāo)發(fā)明者)提出的概念,自從 80 年代蘋果推出第一款搭載GUI的電腦后,至今為止GUI一直是人機交互的代表。VUI前身是IVR —— 交互式語音應(yīng)答系統(tǒng),比如: 10086 的語音應(yīng)答系統(tǒng)。
21 世紀(jì)初,IVR系統(tǒng)已逐漸普及。起初,“按鍵+語音”的混合形式(“請按‘1’號鍵,或說‘1’),成為了人們和很多公司溝通的常見方式。
簡而言之,VUI主要指的是人通過自然語言與計算機進行交互。由此可見,GUI和VUI指的都是用戶與計算機進行交互,區(qū)別在于交互方式不同,前者通過圖形界面進行交互,后者通過自然語言進行交互。
GUI——用戶與系統(tǒng)在肢體上、感知上、概念上聯(lián)系的所有部分的總和。所謂肢體上指的是用戶點擊按鈕、操作鍵盤和鼠標(biāo);感知上指的是視覺、聽覺和觸覺;概念上指的是認(rèn)知。
用戶與計算機進行交互,主要通過手指操作硬件進行輸入,主要通過視覺感知獲取輸出。整個交互模式是人為創(chuàng)造的,對人類是陌生的,是非自然的,學(xué)習(xí)成本較高。
對于VUI來說,用戶與計算機的交互方式是自然語音,就像人與人進行溝通。用戶通過聲帶發(fā)聲進行輸入,通過聽覺進行感知,交互模式是自然的,學(xué)習(xí)成本較低,老人和小孩都能快速學(xué)會。
GUI所能表達的信息量往往較大,更加豐富,維度更廣(包括時間和空間)。因為人類的視覺可感知到的信息更加豐富,也更加立體。在圖形界面上不止可以展示文字,還可以展示圖片和動畫,信息輸出更加豐富、生動和高效。當(dāng)然,如果輸出的信息越豐富,認(rèn)知成本也會越大,也更難快速抓住關(guān)鍵信息。
VUI信息輸出的載體是自然語言,靠聽覺進行感知。因此,VUI在單位時間內(nèi)所能輸出的信息量較小,較單一,且只涉及時間維度。正因為如此,VUI的語音一定要簡潔高效,切記廢話,要讓用戶在短時間內(nèi)快速獲知核心信息。由于語音信息密度小,用戶在獲取語音信息的時候也會更加專注和輕松,不會被附加信息所干擾。
VUI同樣屬于用戶體驗設(shè)計范疇,只不過交互形式發(fā)生了變化,而人本化的設(shè)計目標(biāo)和基于認(rèn)知的設(shè)計原則不變。
1. 易于理解和使用
VUI同樣需要易于理解和使用,同樣需要遵循可見性、一致性、熟悉性和啟示性??梢娦浴獓L試保證事物可見,讓用戶感知到哪些功能是可用的,知道系統(tǒng)的當(dāng)前狀態(tài)。
可見性不單單指視覺可見,對于VUI來說,可見性主要指聽覺“可見”,目的是讓用戶察覺到它。
一致性——在使用設(shè)計特征時保持一致,在相同系統(tǒng)和標(biāo)準(zhǔn)工作流程下保持一致。對于VUI來說,一致性包括人格一致、說法一致、音效一致等。
熟悉性——使用用戶熟悉的事物,目的是讓用戶在使用產(chǎn)品時有熟悉感,而不是陌生感。熟悉感會讓用戶感到親切和自信,否則會感到不安和焦慮。對于VUI來說,熟悉性指的是系統(tǒng)反饋的語音是讓用戶感到熟悉的、親切的,就像朋友在與自己聊天。
啟示性——一個優(yōu)秀的設(shè)計是能夠清楚地看出它是用來做什么的。比如:把按鈕設(shè)計成可按壓的樣子,那么人們在使用時就會按下它。對于VUI來說,啟示性指的是系統(tǒng)要巧妙地給用戶提示,啟發(fā)用戶更熟練地與系統(tǒng)進行交互。
比如:如果用戶說:“我想聽Barenaked Ladies的歌曲《Call and Answer》?!?然后VUI回應(yīng):“播放Barenaked Ladies的《Call and Answer》?!边@樣下次用戶可能就會直接說:“播放Barenaked Ladies的《Call and Answer》?!?/p>
2. 安全、信任的
VUI同樣需要讓用戶感到安全并信任系統(tǒng),讓用戶感到控制感,知道他們在做什么和怎么去做。
控制——清楚何人或何物處于控制之中,并允許用戶進行控制。對于VUI來說,就是要給用戶充分的控制權(quán)。比如:在播放音樂時,需要支持語音控制音量、上一首、下一首、收藏、取消收藏、切換播放模式等操作,讓用戶可以完全解放雙手。
反饋——快速地從系統(tǒng)向人反饋信息,從而用戶可以了解他們的操作所帶來的影響,恒定而一致的反饋會促進控制的感覺。對于VUI來說,需要給用戶充分且恰當(dāng)?shù)恼Z音、音效等反饋,讓用戶及時感知到系統(tǒng)狀態(tài)。就像人與人交流時,如果A說了句話,B沒有回應(yīng),那么A就會感到?jīng)]有被尊重,這是很糟糕的體驗。
恢復(fù)——支持快速和有效的恢復(fù)操作,尤其是從失誤和錯誤的操作中。對于VUI來說,同樣要避免單行線式的操作路徑,需要給用戶返回、恢復(fù)的機會,比如:有語音收藏歌曲功能,就一定也要有語音取消收藏功能。
約束——提供一些約束從而用戶不會進行不合適的操作,尤其是,可以通過限制性允許的操作和對危險操作的確認(rèn)來防止用戶產(chǎn)生嚴(yán)重的錯誤。對于VUI來說,對于某些有風(fēng)險的操作,也需要給用戶一定的約束。比如:當(dāng)用戶說:“把音量調(diào)大最大”時,系統(tǒng)最好讓用戶進行二次確認(rèn):“音量最大會非常響,確定要調(diào)到最大嗎?”
3. 靈活、愉悅的
用戶體驗設(shè)計的目標(biāo)之一就是要讓用戶感到愉悅,因此情感化設(shè)計被不斷提起。人工智能對話AI產(chǎn)品的設(shè)計目標(biāo)當(dāng)然也是要讓用戶感到愉悅。
靈活性——允許多種方式,適應(yīng)具有不同經(jīng)驗和興趣的用戶。為用戶提供可以改變事物外觀和行為的機會,從而實現(xiàn)系統(tǒng)的個性化。比如:如果可以讓用戶選擇或切換系統(tǒng)的人格(端莊穩(wěn)重還是俏皮可愛),用戶的滿意度肯定會因此加分。
風(fēng)格——設(shè)計需要是時髦且吸引人的。對于VUI來說,需要系統(tǒng)的音色和語氣是吸引人的,不管是端莊穩(wěn)重、俏皮可愛,還是溫柔舒緩,總之需要有魅力。有魅力才能讓用戶動感情,喜歡上這個系統(tǒng)。
趣味性——一個吸引人的系統(tǒng)必須是文雅的、友好的、有趣的、令人愉悅的。對于VUI來說,需要在對話中嘗試添加一些趣味性。我們都喜歡幽默的人,自然也會喜歡幽默的系統(tǒng)。這主要取決于系統(tǒng)語料的質(zhì)量,需要語料是豐富且有趣的。當(dāng)然什么事都需要把握好尺度,過分了就會顯得不真誠。
關(guān)于作者
人工智能交互設(shè)計師,來網(wǎng)易前做B端通信軟件和C端網(wǎng)盤軟件。在網(wǎng)易做過游戲交互設(shè)計,現(xiàn)在在網(wǎng)易三音云音箱研發(fā)團隊,負(fù)責(zé)音箱APP的交互設(shè)計。喜歡游戲、運動和電影。
------------
來源:站長之家
掃一掃在手機上閱讀本文章