Apple Intelligence預計在2025年推出,但報導指Siri的最新功能將可允許用戶直接輸入文字並變得更具對話性,不怕使用者在講話時出現口誤。而最近OpenAI推出的新一代旗艦AI模型「GPT-4o」,已能處理多種形式的輸入和輸出,無論是文字輸入、語音問題,甚至使用鏡頭進行對話,都能即時回應。「GPT-4o」中的「o」代表「omni」,它被譽為是目前與人類交流的「最佳AI助理」,不但能幫助上班族更有效地完成案頭工作,又能擔任「家庭教師」,甚至能進行即時口述翻譯,因此迅速吸引了大量用家青睞。
目前,各類人工智能應用的科技公司都爭相開發這類模組,正如筆者團隊開發中的「AI中央數據資訊庫」,雖然針對商用市場,唯其結構思維與「GPT-4o」如出一轍,可以說是「商用Siri」。
商用軟件導入這些AI模組後,將會變得更易操作。以往企業內部的後台軟件界面複雜,預設選項多多,如使用者不熟悉各樣選項,要整合生成一張銷售報表報表也難若登天。有了這種AI模組後,後台軟件將不再需要特定界面及預設按鈕,用戶只需在對話框中輸入或口述指令:「請提供今月份某分店的總銷售報表」,後台即可自動生成相應報表。
AI模組具有強大的理解能力,功能可以無限擴充。例如加入「訂閱」功能,用戶可以在對話框中輸入或口述「請於每月1日,提交過去30日某分店的總銷售報表」或「請每小時更新某分店的總銷售額」,後台亦能到時到候自動生成報表及回應。此外,又可加入預測功能,在對話框中要求AI:「請預測下月某店的總銷售額」,它就會根據過往數據進行分析,預估下月的銷售總額,並製作圖表供用戶參考。
筆者相信這類AI模組,很快就會被更廣泛應用,通過更自然的對話和超強的理解能力,大大改變人們對科技軟件的使用習慣。OpenAI CEO Sam Altman指出,他在使用GPT-4o這類AI模組後,工作時不用再停手或切換視窗,只需開口詢問即可得到AI即時回應,實在是一件十分酷的事情。