搜尋

一個確定性中介軟體,可將LLM提示壓縮50-80%

嗨HN,我正在開發Skillware,這是一個開源框架,將AI能力視為可安裝、自包含的模組。我剛剛新增了「提示詞改寫器」技能。這是一個離線啟發式中介軟體,能在長代理循環觸及LLM之前,去除對話填充詞和多餘上下文。它能顯著節省token成本和推理時間,且100%確定性(無需額外模型調用)。我們正在建立「代理專業知識」(邏輯+認知+治理)的註冊庫。如果您有專門的LLM工具,或想了解「標準」技能的樣子,我很期待您的回饋或PR:https://github.com/ARPAHLS/skillware

  • AI 助理
  • 大型語言模型
  • 工作流程自動化
Mar 21, 2026造訪官網

AI 摘要

Skillware是一個開源框架,提供「Prompt Token Rewriter」技能。此中介軟體透過移除對話填充詞和多餘上下文,確定性地壓縮LLM提示,從而降低代幣成本與推論時間。

適合誰

開發者建構LLM應用程式, AI工程師優化推論成本, 使用代理式AI循環的用戶

為何值得關注

Skillware的Prompt Token Rewriter能確定性地將LLM提示大小減少50-80%,無需額外模型調用即可節省成本並加速推論。

核心功能

  • 將LLM提示壓縮50-80%
  • 去除對話中的填充詞與重複內容
  • 作為離線啟發式中間件運作
  • 降低代幣成本與推理時間

使用場景

  • 開發者在建構複雜的客戶支援AI代理時,可整合Skillware的提示詞令牌重寫器,減少長對話中每輪互動的令牌數量,從而降低API成本並加快客戶回應速度。
  • 資料科學家實驗基於LLM的文字摘要時,可使用提示詞令牌重寫器預處理冗長文件,在輸入摘要模型前移除多餘對話元素,實現更聚焦且高效的分析。
  • AI研究員開發需要多重內部推理步驟的自動代理時,可運用確定性提示壓縮技術,確保代理模組間傳遞的中途思考與上下文不會膨脹最終傳送給LLM的提示詞,維持對運算資源的控制。