如何提高AI在瀏覽網頁和完成任務的能力
Feb 19, 2025
卡內基梅隆大學的研究人員提出了一種樹搜索方法,用於語言模型代理,提升了它們利用網絡完成任務的能力。通過將互動視為分支搜索,代理可以評估多條行動路徑,避免重複錯誤,並在必要時回溯。在代理導航模擬的在線購物、論壇和分類廣告的測試中,使用樹搜索的代理成功完成了26.4%的任務,超過了缺乏搜索能力的基準。
對於基於大型語言模型的代理,甚至對於可以處理瀏覽器螢幕影像的視覺語言模型來說,瀏覽網頁以實現特定目標可能都是一項挑戰。雖然有些方法解決了訓練底層模型的這一困難,但代理架構也會有所不同。
請閱讀我們在《The Batch》中對該論文的摘要。https://hubs.la/Q036R7qG0