擷取增強生成 (RAG) 是一種結合了訊息檢索(Retrieval)和文本生成(Generation)的自然語言處理技術⁴。這種結合可以提高模型在處理複雜任務時的性能和效率⁴。它旨在通過從外部知識源檢索相關訊息,輔助大型語言模型(如 GPT 系列)生成更準確、更豐富的文本內容¹²。
RAG 的運作方式是,在向大型語言模型提供用戶的提示詞(prompt)之前,會先從外部的資料庫「檢索」相關資料,再將這些相關資料連同原本的提示詞提供給大型語言模型參考並「生成」回覆²。這種方法可以降低大型語言模型憑空杜撰答案、產生幻覺(Hallucination)的機率⁵。
RAG 的優點包括經濟實惠的實作、提供目前資訊、增強使用者信任、以及給予開發人員更多控制權¹。例如,RAG 可以讓開發人員為生成式模型提供最新的研究、統計資料或新聞¹。此外,RAG 的輸出可以包括來源的引用或參考,如果使用者需要進一步釐清或詳細資訊,也可以自行查詢來源文件¹。
RAG 技術為組織的生成式 AI 工作帶來了多種優點,並且已經被許多科技公司如 Amazon、Microsoft、Google、Oracle、IBM、NVIDIA、OpenAI 等採用²⁵⁶。這項技術的發展趨勢顯示,未來大型語言模型將更多地使用 RAG 來提供更準確、更聰明的回應⁵。
來源: 與 Bing 的交談, 2024/3/6
(1) 檢索增強生成 - MBA智库百科. https://wiki.mbalib.com/zh-tw/%E6%A3%80%E7%B4%A2%E5%A2%9E%E5%BC%BA%E7%94%9F%E6%88%90.
(2) 什麼是 RAG?- 擷取擴增產生說明 - AWS. https://aws.amazon.com/tw/what-is/retrieval-augmented-generation/.
(3) RAG 是什麼?不用微調模型就能低成本讓 LLM 理解專業知識的 AI 技術 - ALPHA Camp. https://tw.alphacamp.co/blog/what-is-rag-ai-technology-and-how-does-retrieval-augmented-generation-work.
(4) AI 狂潮最火紅的新玩意:RAG,未來 GPT 不再吐出幻覺就靠它? - 報橘. https://buzzorange.com/techorange/2023/11/08/rag-hot-ai-trend-llm-models-fine-tuning/.
(5) 使用 Azure AI 檔智慧擷取增強世代 (RAG) (先前為 表格辨識器) - Azure AI services. https://learn.microsoft.com/zh-tw/azure/ai-services/document-intelligence/concept-retrieval-augumented-generation?view=doc-intel-4.0.0.
(6) 使用 Azure AI 檔智慧擷取增強世代 (RAG) (先前為 表格辨識器) - Azure AI services. https://bing.com/search?q=%e6%93%b7%e5%8f%96%e5%a2%9e%e5%bc%b7%e7%94%9f%e6%88%90%28RAG%29%e6%98%af%e4%bb%80%e9%ba%bc.
(7) undefined. https://bing.com/search?q=.