
介紹
隨著人工智能技術的迅速發展,許多公司開始使用大型語言模型(如ChatGPT)來打造品牌專屬的A.I.銷售和客戶服務系統。然而,在實際應用中,這些A.I.系統常常會出現所謂的「幻覺率」問題,例如 A.I.誤導用戶介紹了其他公司的產品或服務,這對企業的品牌形象和業務KPI造成了不利影響。我們將探討幻覺率問題及其應對方法,旨在幫助企業更有效地利用語言模型進行商業應用。
幻覺率問題
在使用大型語言模型時,企業希望A.I.能夠準確地介紹自己的產品和服務。然而,現實中,這些模型可能會出現介紹錯誤的情況,這就是所謂的幻覺率。根據研究,普通大型語言模型的幻覺率大約在15%至20%之間【1】。這樣的高幻覺率使得語言模型在商業應用中難以發揮其最大潛力。
目標:將幻覺率降至0.1%
為了實現真正有效的商業應用,Set Sail A.I. 認為需要將幻覺率減低一百倍,達到0.1%以下。要達到這一目標,我們提出了三個主要方法:大型語言模型建構 (LLM Grounding)、大型語言模型的資料集微調 (Fine Tuning) 和 複合代理設計 (Multiple Agent Design)。
解決方案
1. 大型語言模型建構 (LLM Grounding)
大型語言模型建構 (LLM Grounding) 指的是在創建大型語言模型代理 (LLM agent) 時,提供非常詳盡和準確的資料。這樣,A.I. 能夠清晰地知道所推薦的產品是什麼,其任務只是總結現有資料而不是進行創意回答。通過這種方法,可以顯著減少A.I. 的錯誤介紹【2】。
2. 資料集微調 (Data Set Fine Tuning)
資料集微調 (Data Set Fine Tuning) 涉及在開放的大型語言模型上進行微調。企業可以準備自己的數據,並在模型上加上一個微調層 (Fine Tuning Layer)。這樣,當大型語言模型生成回答時,能夠更準確地基於公司的資料進行回應【3】。
3. 複合代理設計 (Multiple Agent Design)
複合代理設計 (Multiple Agent Design) 是一種設計多個專門 A.I. agent 的策略,例如人工智能銷售代理(A.I. Sales agent)、人工智能預訂代理( A.I. Booking agent) 或人工智能客戶服務代理( A.I. Customer Service agent)。這些代理由一個主代理 (Master agent) 控制,決定使用哪個代理來回答特定問題。通過這種方式,可以顯著提高回答的準確度【4】。
結論
在商業應用中,降低大型語言模型的幻覺率至 0.1%以下是實現真正有效應用的關鍵。通過採用大型語言模型建構、資料集微調和複合代理設計這三個方法,企業可以顯著提升A.I.系統的準確性,從而達成更好的商業目標。
如果您想了解更多有關大型語言模型在商業應用中的其他場景,歡迎與我們聯絡。
參考資料
- Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., ... & Amodei, D. (2020). Language Models are Few-Shot Learners. arXiv preprint arXiv:2005.14165.
- Kalyan, K. S., Rajasekharan, A., & Sangeetha, S. (2021). AMMUS: A Survey of Transformer-based Pretrained Models in Natural Language Processing. arXiv preprint arXiv:2108.05542.
- Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., ... & Liu, P. J. (2019). Exploring the limits of transfer learning with a unified text-to-text transformer. arXiv preprint arXiv:1910.10683.
- Vinyals, O., Blundell, C., Lillicrap, T., Kavukcuoglu, K., & Wierstra, D. (2016). Matching networks for one shot learning. Advances in neural information processing systems, 29.
+852 6688 0053
info@setsailsoftware.com
www.chatbot.com.hk
www.chatalog.ai