愛伊米

OpenAI新模型可對任何長度的書籍產生摘要

OpenAI新模型可對任何長度的書籍產生摘要

OpenAI訓練了一個可以摘要整本書籍的模型,該模型藉由先總結書本的一小部分,再總結這些總結,以獲得更高層次的摘要,如此便可對任何長度的書籍進行摘要。研究人員提到,這個研究在書籍摘要的進展,是第一個對於縮放對應問題的實證工作。

研究人員藉由微調GPT-3語言模型,以生成整本書合理的摘要,其品質甚至能夠與人工編寫的摘要品質相比擬。該模型在BookSum資料集的書本摘要中,也獲得最佳的成果,而新的模型還能夠與其他模型搭配使用,像是與零樣本問答模型一起,就能夠提供良好的書本問答結果。

之所以OpenAI要進行這項研究,為得是要研究機器學習的對應問題(Alignment Problem)。研究人員提到,為了安全地部署通用人工智慧,研究人員必需要確保機器學習模型,完全按照人類的意圖動作,而這個問題被稱作對應問題。

而研究對應問題的困難之處,在於人類難以評估模型的輸出,特別是在大規模的任務中,因此OpenAI研究人員,想要藉由總結書本內容的任務,來測試可擴充套件的對應技術。

這項新的模型研究,結合了人類的反饋以及遞迴任務分階,研究人員提到,大型預訓練模型並不擅長摘要任務,在過去,雖然藉助人類的反饋,可以有助於模型根據人類的偏好,對貼文或短文進行摘要,但是要直接判斷整本書的摘要,並不是簡單的事,因為人類閱讀整本書,需要數個小時。

為了解決這個問題,研究人員使用遞迴任務分解決方案法,在程式上將複雜困難的問題,分解成簡單的任務,藉由將長文字的總結分解成較短的文字總結,使用書中較小部分的摘要,而不需要閱讀所有來源文字,也就允許人類更快的評估模型的摘要,研究人員提到,這個方法可以用來總結無限長度的書籍,不受轉換器模型對上下文長度的限制。

這項研究結果有助於推進人類評估模型的能力,研究人員提到,隨著模型可以完成更復雜的任務,人類對模型輸出的評估也就越困難,這使得在部署這些模型的時候,由於難以檢測模型輸出,因而可能產生負面的後果,因此人類必需要隨著模型能力提升,獲得更佳的評估能力。

研究人員目前解決這個問題的方法,是讓人類獲得模型的協助,來評估機器模型的輸出,而透過讓新模型產生書本個別章節的摘要,能夠節省人類閱讀文字評估摘要的時間。