突破性“眼神打字”技術(shù):未來溝通的性進(jìn)展
幫助嚴(yán)重障礙患者更準(zhǔn)確、更高效地交流。
原標(biāo)題:AI又一突破!“眼神打字”更快更省力,研究登上Nature子刊
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):7431字
引言
漸凍癥(ALS)等障礙患者在溝通交流中面臨巨大挑戰(zhàn),急需有效的技術(shù)手段來改善溝通效率。谷歌研究團(tuán)隊(duì)開發(fā)的SpeakFaster界面,利用大語言模型(LLM)來加速眼動(dòng)打字,為這一人群帶來了新的希望。
1. SpeakFaster的工作原理
SpeakFaster是一個(gè)基于人工智能的用戶界面,能夠?qū)⒏叨瓤s略的英文文本(如首字母縮寫)擴(kuò)展為完整的短語。經(jīng)過微調(diào)的LLM在對(duì)話上下文的支持下,幫助ALS患者減少了57%的按鍵次數(shù),文本輸入速度提升了29-60%。
2. 用戶界面的設(shè)計(jì)與功能
SpeakFaster的UI設(shè)計(jì)簡潔,允許用戶輸入縮寫并自動(dòng)生成完整句子建議。該界面采用了三種輸入路徑:Initials-only AE、KeywordAE和FillMask,確保用戶即使在初始預(yù)測(cè)失敗時(shí)也能順利繼續(xù)輸入。通過這種設(shè)計(jì),用戶可以根據(jù)上下文和縮寫逐步找到所需短語。
3. 模擬實(shí)驗(yàn)與效果評(píng)估
研究團(tuán)隊(duì)通過模擬實(shí)驗(yàn)評(píng)估了SpeakFaster的有效性,發(fā)現(xiàn)其在按鍵節(jié)省和文本輸入速度方面均優(yōu)于傳統(tǒng)輸入法。具體而言,使用KeywordAE模型時(shí),SpeakFaster的按鍵節(jié)省率達(dá)到0.657,高于Gboard的0.482。
4. 用戶研究結(jié)果
用戶研究顯示,SpeakFaster在為ALS眼動(dòng)用戶提供按鍵節(jié)省的同時(shí),提升了打字速度。對(duì)于非AAC用戶,腳本場景下可實(shí)現(xiàn)56%的按鍵節(jié)省,而ALS眼動(dòng)用戶在實(shí)驗(yàn)中顯示出61.3%的速度提升。
5. 未來展望
盡管SpeakFaster在改善障礙患者的溝通效率方面表現(xiàn)出色,但仍存在模型語言單一、短語長度受限等局限。未來,隨著AI技術(shù)的不斷發(fā)展,有望為殘障人士提供更多改善生活質(zhì)量的解決方案。
結(jié)語
SpeakFaster為ALS患者提供了一個(gè)高效的溝通工具,展示了AI在改善殘障人士生活中的潛力。隨著技術(shù)的進(jìn)步,未來將會(huì)有更多創(chuàng)新方案問世,幫助更多人克服溝通障礙。
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化