上下文管理是對話(huà)式 AI 的記憶中樞,需通過(guò)技術(shù)方案(RAG、結構化記憶)與優(yōu)化策略 (意圖過(guò)濾、動(dòng)態(tài)裁剪)解決連貫性、資源消耗與準確性的三角平衡問(wèn)題。
聲網(wǎng)對話(huà)式 AI 引擎采用的方案是通過(guò)結構化短期記憶+動(dòng)態(tài)長(cháng)期記憶注入,在保障兼容性的同時(shí),針對實(shí)時(shí)語(yǔ)音交互場(chǎng)景(尤其中斷處理)進(jìn)行深度優(yōu)化,并賦予開(kāi)發(fā)者高度靈 活的上下文控制權限。
短期記憶(Short-term Memory)是智能體在當前會(huì )話(huà)中臨時(shí)保存和處理的信息空間。 用戶(hù)和對話(huà)式智能體互動(dòng)期間,智能體會(huì )在短期記憶中緩存當前對話(huà)的上下文,確保智能體 能夠連貫地理解和回應用戶(hù)的連續輸入。
對話(huà)式 AI 引擎整體短期記憶會(huì )以 JSON 的形式存儲,遵循 OpenAI Chat Completions 的規則,同時(shí)進(jìn)行了部分的擴展。
◇ 智能體運行期間,調用 GET 獲取智能體短期記憶接口獲取短期記憶 JSON。該接 口會(huì )得到智能體生命周期內儲存的完整的短期記憶。
◇ 智能體停止后,聲網(wǎng)會(huì )通過(guò)消息通知服務(wù)將短期記憶回調至你的業(yè)務(wù)服務(wù)器,詳見(jiàn) 消息通知事件類(lèi)型。
智能體的短期記憶會(huì )隨智能體停止而消失,你可以在智能體停止后,將短期記憶儲存到 你的服務(wù)器以固化為長(cháng)期記憶,之后在創(chuàng )建智能體時(shí)通過(guò) llm.system_messages 直接注入 原始記憶內容或經(jīng)過(guò)總結的記憶內容,從而實(shí)現在智能體退出或重啟后仍然能夠訪(fǎng)問(wèn)和使用 這些數據。
以下示例展示了通過(guò) system_messages 注入經(jīng)過(guò)總結的記憶內容:

![]() |
| 商用機器人 Disinfection Robot 展廳機器人 智能垃圾站 輪式機器人底盤(pán) 迎賓機器人 移動(dòng)機器人底盤(pán) 講解機器人 紫外線(xiàn)消毒機器人 大屏機器人 霧化消毒機器人 服務(wù)機器人底盤(pán) 智能送餐機器人 霧化消毒機 機器人OEM代工廠(chǎng) 消毒機器人排名 智能配送機器人 圖書(shū)館機器人 導引機器人 移動(dòng)消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 導覽機器人 酒店送物機器人 云跡科技潤機器人 云跡酒店機器人 智能導診機器人 |