分類: AI (人工智慧), Vibe Coding, 生成式AI, 生成式藝術, 生成式設計, 網路文化

從荒原到史詩劇場:生成式 AI 的辯證介面與提示工程

生成式 AI 的互動實踐,正從工具操作轉向可被閱讀的認識裝置。提示語不再只是指令,而成為塑造理解結構的書寫行為。語言在此同時構成介面與世界觀,使人與計算之間的關係進入必須被觀看與反思的層次。

Vibe Coding 建立在高度直覺化的生成經驗之上。語義片段在潛在空間(Latent Space)中被迅速縫合,結果往往先於理解出現。T.S. Eliot(1888–1965)在《荒原》(The Waste Land, 1922)中所確立的現代主義書寫,正是以碎片作為意義運作的基本單位。斷裂不指向整體的失效,而成為連續得以維持的條件。意義不再由作者封閉,而在閱讀過程中被持續補寫。大型語言模型(Large Language Model, LLM))依據機率逐詞展開的運算方式,同樣以斷裂維持語言的推進。

沉浸在此成為主要的互動姿態。語言的流暢性吸納推理過程,計算條件退居背景。此一設計哲學延續亞里斯多德式戲劇傳統 1,觀看被導向完成的結果,而非生成的條件。當模型能力持續提升,幻覺與偏見更容易被包覆在語言的完成度之中。

與此相對的,是 Bertolt Brecht(1898–1956)在《小戲劇論集》(Schriften zum Theater, 1957)中提出的史詩劇場(Episches Theater)。Brecht 透過「間離效果」(Verfremdungseffekt2中斷幻覺,迫使觀看停頓。舞台不再隱藏其製作條件,敘事被拆解為可被判斷的段落。理解不來自情感投入,而來自對結構的察覺。

布萊希特式(Brechtian)的觀看姿態進入提示書寫後,生成不再追求語言表面的連續,而在關鍵位置設置停頓。提示語轉為中斷裝置,要求說明前提、標示不確定性、揭露推論限制。回應因此顯露為條件化的結果,而非自然流出的敘述。

延遲、噪聲與隨機性不再被視為需要消除的缺陷,而被保留為可感知的生成痕跡。介面呈現為佈滿計算痕跡的空間,觀看停留在生成邊緣進行觀察。

生成不再只是內容的產出,而是一場被攤開的表演。語言、計算與介面共同構成可被閱讀的舞台。史詩劇場在數位環境中持續發生,存在於每一次提示停頓與生成分岔之間。

Eliot 的《荒原》:碎片化語言與生成本體論

Eliot 的《荒原》常被視為現代主義文學的關鍵文本,其書寫結構建立在高度的碎片化之上。詩作由但丁、莎士比亞、印度教經典與倫敦街頭語言的殘片構成,敘事不再沿著線性時間展開,而是在斷裂中推進。閱讀行為本身成為意義生成的場所,讀者必須在所謂的「破碎的意象堆」(A heap of broken images)之中自行建立關聯。

此一文本結構,與當代 Transformer 架構(Transformer Architecture3所呈現的生成方式展現出高度的結構相似性。LLM 所依賴的訓練資料,來自數位環境中大量未經整理的網路文本。這些語料本身並不構成統一敘事,而是由彼此異質的語言片段組成。模型透過注意力機制(Attention Mechanism4學習片段之間的統計關係,並將其壓縮於高維度的潛在空間之中。

當提示詞出現,模型的運作並非展開內在思考,而是在潛在空間內進行機率導向的移動。語言片段依據分佈被抽取並重新排列,生成暫時穩定的語句序列。此過程不以真值為核心,而以延續語言流動為首要條件。

在此意義上,生成行為呈現出明確的艾略特式(Eliotic)特徵。意義並未預先存在,而在碎片的交會中短暫浮現。《荒原》仰賴讀者的文化記憶填補斷裂之處,語言模型則透過溫度參數與採樣策略維持語句的連續表面。連貫性因此顯得不穩定。聲音在文本中頻繁切換,視角缺乏固定錨點,生成輸出亦可能在語言順暢的掩護下偏離事實,滑入幻覺狀態。

這類幻覺並非例外,而是碎片化生成邏輯的內在結果。語言持續前進,真實性則在機率選擇中被延後處理。

Vibe Coding:對碎片的直覺式投降

Vibe Coding」(氛圍編碼)一詞由 Andrej Karpathy 於 2025 年初提出,用以描述生成式人工智慧介入軟體開發後所浮現的互動姿態。Karpathy 將其界定為不再依循逐行書寫與明確規劃,而透過自然語言提示引導模型自行完成實作層面的判斷與組合。他形容此狀態為完全沉入氛圍之中,任由生成節奏推進,甚至暫時忽略程式碼本身的存在。

此一描述點出了當代生成互動中所顯現的 Eliot 式傾向。在 Vibe Coding 的過程裡,使用者的角色更接近於《荒原》的讀者,而非傳統意義上的工程師。提示語不必精確,方向亦未完全封閉,模型則在龐大的程式碼殘片之中展開組合與延展。應用程式並非經由完整設計後再被實現,而是在生成過程中逐步浮現,宛如從語言與結構的廢墟中被拼湊而出。

LLM 對程式語言世界的高度內化,是此模式得以運作的前提。模型在訓練過程中接觸過 GitHub 等平台上數以十億計的程式碼片段,常見的架構、演算法與設計慣例已被壓縮為可即時調用的統計關係。生成行為因此呈現出高度熟練的模仿能力,如同 Eliot 在詩中調度古典文獻與日常語言,片段的再現本身便足以構成表面的連續。

Vibe Coding 所隱含的問題,並非效率層面的取捨,而是認識層次的轉移。當使用者選擇忽略程式碼本身,生成條件也隨之退至不可見的位置。注意力集中於可運行結果,結構假設、依賴關係與限制條件逐步淡出視野。沉浸感在此不再只是互動風格,而轉為遮蔽結構的機制。

系統建構若完全交付生成流程,初期確實能迅速累積可運行成果,隨著規模與複雜度提升,內部結構的脆弱性便逐漸浮現。程式碼之間的關聯缺乏清晰脈絡,安全性與可維護性難以被系統性檢視,修補與擴充反而變得更加困難。生成的流暢表面在此掩蓋了結構上的空洞。

此一狀態揭示了 Eliot 式生成的陰影面向。當閱讀行為停留於感受層次,碎片便無法被重新組織為穩定的意義網絡。詮釋與批判缺席之際,拼貼失去支撐結構的能力。Vibe Coding 在此不再只是開發姿態,而成為理解生成式人工智慧時無法迴避的認識問題。

順滑介面的幻覺與沉浸政治

Vibe Coding 所追求的「順滑」(Seamlessness)與「自然」(Naturalness),在人機互動領域長期被奉為理想狀態。介面愈趨透明,操作痕跡愈加隱沒,使用者彷彿不再面對系統,而是直接與語言本身對話。互動在感受層次上被簡化為流暢與直覺,技術中介逐步退出可感知範圍。

從批判理論立場觀察,順滑並非中性的設計成果,而帶有遮蔽效果。介面刻意消除摩擦時,系統的邊界條件同時被抹平。錯誤率、失敗模式、運算成本與資源消耗不再被察覺,生成過程被包覆於自然語言的連續表面之下。使用者經驗到的並非受限的計算結果,而是彷彿自發湧現的回應。

於此狀態中,情感同一化逐漸形成。語言的流暢節奏、回應的即時性與語氣的擬人化,將 AI 理解為具有意圖與理解能力的對話者,而非依賴統計關聯運作的概率模型。互動關係由操作轉向投射,理性距離被感受性的親近取代。介面不再只是工具,而成為承載情感與信任的表面。

沉浸邏輯深植於亞里斯多德式(Aristotelian)的戲劇觀。觀看以投入為目的,舞台的技術條件不應干擾情感流動,幻覺的完整性被視為成功前提。人機互動在此延續了相同期待,系統愈不被察覺,體驗便被認為愈為成熟。

與此形成反向操作的,是 Brecht 的史詩劇場。在《小戲劇論集》中,Brecht 拒絕將沉浸視為目標,透過間離效果破壞舞台的自然性,讓觀眾意識到表演正在被製作。燈光、佈景與敘事轉折不再隱藏其人工性,而被保留為可被察覺的構成要素。

將此觀點引入人機互動討論,順滑不再只是品質指標,而成為需要被檢視的設計策略。過度自然的介面降低理解門檻,同時也削弱批判距離。使用者在沉浸中失去對系統條件的感知,生成結果因此被誤認為可靠、完整,甚至具有主體性。

順滑顯現為觀看政治。它規定可被看見的範圍,並將其餘條件排除於經驗之外。Brecht 所反對的並非情感本身,而是情感壟斷理解的位置。轉化至生成式人工智慧的互動設計,意味著重新引入中斷、遲滯與不自然的時刻,讓系統的有限性重新進入視野。

打破沉浸不再被視為體驗失敗,而成為理解生成條件的前提。順滑不再是終點,而是需要被抵抗的表面。

史詩劇場的介入:Brecht 與反幻覺機制

Brecht 的史詩劇場理論,核心聚焦於「間離效果」。其關注點不在於強化情節的自然流動,而在於解除事件被視為理所當然的狀態,讓行動、語句與因果關係顯露為需要被說明的對象。事件一旦失去必然性,理解便不再依賴情感投入,而轉向對條件與結構的辨識。Brecht 反對觀眾在劇場中放棄判斷,觀看必須保持清醒與距離,舞台因此成為思考發生的場所。

史詩劇場透過多項打斷幻覺的手法維持此一觀看要求。燈光設備不被遮蔽,演員在關鍵時刻離開角色位置直接面向觀眾,標語與字幕提前揭露情節走向。敘事的驚奇效果被削弱,因果關係被攤開呈現。舞台不再承諾沉浸,而是不斷提示表演正在被製作。注意力因此由故事結局移向生成過程。

在 Brecht 的《四川好女人》(Der gute Mensch von Sezuan, 1943)(圖 1)中,史詩劇場的間離策略以敘事結構本身被明確化。主角沈黛(Shen Te)為了在不公的社會條件下生存,不得不反覆在「善良的自我」與「冷酷的表親」之間切換。角色分裂並非心理戲劇的結果,而被呈現為制度壓力下的必然產物。舞台不試圖為此提供道德和解,反而在結尾直接將問題拋回觀眾,要求其思考善如何可能在既有條件中成立。

圖 1:Bertolt Brecht(1898–1956),《四川好女人》(Der gute Mensch von Sezuan),1943 年。於杜塞道夫戲劇院(Düsseldorfer Schauspielhaus)之演出場景。畫面中角色的身體姿態與刻意誇張的表演動作,拒絕心理寫實的情感連續性,轉而凸顯行動的被製作性與社會條件的壓迫結構。演員並未引導觀眾進入角色內在,而以可辨識的姿態與節奏,將角色分裂與道德困境呈現為制度問題。此種舞台處理方式體現史詩劇場的間離原則,將觀看從同情轉向判斷,使事件得以被分析而非被自然化。圖片來源:ddorf-aktuell.de;攝影:Sandra Then;著作權歸原權利人所有,僅供學術研究與評論用途。

劇中多次使用旁白、歌曲與直接對話的方式中斷敘事連續性。情節尚未完成,評述已經介入。觀眾無法依賴角色命運獲得情感釋放,而被迫正視行動背後的經濟與社會結構。觀看因此不再指向同情,而轉向判斷。舞台在此成為分析的場所,事件被展示為可被拆解的構成,而非自然發生的故事。

此一案例清楚顯示,史詩劇場並不以提供答案為目的,而透過中斷維持問題的開放性。意義不被封閉於敘事完成之中,而持續懸置於觀看與思考之間。這種結構性的未完成狀態,正是布萊希特所要求的觀看倫理。

將此觀點延伸至提示書寫,互動的重心不再放在擬人化語氣或語言連續性,而落在中斷的安排。提示語在生成節點引導模型停下來,說明假設前提、推論依據與不確定範圍。語言的任務不再只是完成敘述,而是在關鍵位置揭露其生成條件。

當生成過程被拆解為可被觀察的片段,使用者得以在輸出之外辨認其限制。認知不再完全依附於語言的完成度,而在停頓與斷裂之處獲得更細緻的辨識能力。史詩劇場的反沉浸原則在此轉化為提示書寫的設計倫理,使人與 AI 的對話持續保留批判距離,並反覆指向生成本身。

亞里斯多德式介面 vs. 布萊希特式介面

生成式人工智慧的介面設計,呈現出方向迥異的思想路徑。其差異不僅體現在操作風格,更涉及對語言、主體與媒介角色的根本理解。

以 Aristotle(384–322 BCE)為思想源頭的介面哲學,對應於 Vibe Coding 所體現的互動取向。其核心目標圍繞沉浸、情感共鳴與媒介的退場。介面被設計為透明而連續的通道,互動流程沿著線性時間展開,回應彼此銜接,幾乎不留下斷裂痕跡。AI 在此被理解為可靠而貼近需求的助手,回應傾向於修補不一致之處,以維持語言表面的平滑。錯誤、遲疑與計算痕跡多半被吸收進生成節奏之中。使用者進入此結構後,主要以接受與消費的姿態參與互動。技術層面上,零樣本提示(Zero-shot Prompting5或角色提示(Role Prompting)等做法正符合此一哲學取向,生成彷彿自然湧現,過程本身不被要求顯影。

此類介面邏輯,與 Eliot 在《荒原》中所呈現的閱讀狀態形成呼應。碎片化語言在連續閱讀中被暫時縫合,意義於流動之中浮現。讀者若選擇順著節奏前行,斷裂便退居背景,整體感受得以維持。Vibe Coding 的沉浸經驗,正是在程式語言領域重現了此種閱讀姿態。

與此相對,布萊希特式的介面哲學轉向批判性的互動結構。其目標並不放在情感投入,而是批判、理性審視與媒介的顯影。互動流程刻意保留斷裂,結構呈現出蒙太奇特徵,接縫不被掩飾,反而成為理解的入口。AI 在此不再扮演擬人化助手,而以正在執行概率計算的模型姿態現身,回應同時標註不確定性,或並列多個可能結果。使用者的角色隨之轉變,從接受結果的對象,移向能夠介入節奏與方向的觀察者,甚至成為調度生成的導演。技術實作上,驗證鏈(Chain of Verification, CoVe6、元認知提示(Metacognitive Prompting7等手法正體現了此一思路,透過中斷與反思,讓生成條件進入可見範圍。

在 Brecht 於《小戲劇論集》所闡述的史詩劇場之中,觀看不再被引導至情感共鳴,而被要求停留在判斷的位置。舞台的人工性被刻意保留,敘事的連續性被拆解,觀眾因而得以察覺事件如何被構成。

兩種介面哲學之間的差異,最終回到對生成的態度。亞里斯多德式介面傾向於讓語言自行前行,讓媒介消失於體驗之中。布萊希特式介面則要求語言停下來,讓媒介重新浮現。前者延續 Eliot 式閱讀在流動中維持連貫的策略,後者則在斷裂處重新奪回理解的主動權。生成式人工智慧的介面設計,正是在這兩種哲學張力之間,持續暴露其文化與認識論立場。

布萊希特式提示:讓生成被看穿

「布萊希特式提示」(Brechtian Prompting)指向主動要求模型暴露自身生成條件的提示策略。重點不在於迅速取得答案,而在於要求模型呈現推論如何展開、不確定出現於哪些位置,以及結果依賴哪些前提。生成行為不再被視為單次輸出,而被理解為可被拆解與檢視的過程。

提示書寫在此不再只是取得回應的手段,而被理解為可安插於生成流程中的介入行為。其理論背景可回溯至 Brecht 於《小戲劇論集》中所闡述的史詩劇場原則。表演不再以維持幻覺的連續為任務,而透過中斷將觀看拉回判斷層次。生成過程因此脫離順暢節奏,在停頓中顯露其構成方式。

元認知提示於此脈絡下展開。模型被要求回顧自身的推論歷程,將理解、初步判斷、風險評估與回應修訂區分為不同階段。生成不再沿著單一路徑完成,而在反覆檢視中逐步展開。模型的角色隨之轉移,從答案提供者轉為自身輸出的評論者。

生成在此呈現出表演性的轉折。演員暫停動作,指出先前演出存在問題,隨後重新嘗試。回應離開原有敘述位置,轉向對語言選擇與推論依據的審視。語言不再被視為自然流動,而顯露為可修正的行為。

相近的中斷邏輯亦出現在驗證鏈技術之中。模型先給出初步回應,接著自行提出一組驗證問題,逐一檢查其中的事實主張,最後依據檢查結果調整輸出。生成在此失去即時完成的地位,事實性轉而成為必須再次被確認的對象。

此處可對照 Brecht 在戲劇中運用標語與旁白的方式。敘事尚未推進,觀看已被迫停下來。觀眾被提醒眼前內容並非不可質疑的故事,而是由可被檢驗的構成元素所組成。當使用者沉浸於語言的順暢表面,驗證步驟插入其中,注意力隨之轉向知識的暫時性。

另一項相關操作要求模型在回應之前先重寫使用者的提示語。原始輸入經過重新整理,無關訊息與偏見被剝離,問題的核心意圖重新浮現。生成不再直接承接既有指令,而在重構之後才得以展開。

重寫提示的過程對應 Brecht 所提出的歷史化手法。事件不被視為自然發生,而被放回生成脈絡中理解。輸入本身所隱含的立場與限制因此浮現,提問如何形塑結果的關係進入可見範圍。

布萊希特式提示並不追求回應速度的提升,而重新安排理解的位置。推論過程被拆解,錯誤風險被標示,前提條件被攤開。生成不再只是輸出行為,而轉化為可被觀看與思考的演算實踐。提示書寫在此成為介面層級的倫理操作,為人與 AI 的對話保留批判距離,也為生成本身留下被理解的空間。

反幻覺的觀看政治

Brecht 指出,當觀眾忘記自己正身處劇場,舞台上呈現的社會關係便會被接受為不可變更的自然秩序。史詩劇場因此拒絕沉浸,要求觀看保持警覺。觀看若被幻覺包覆,判斷便讓位於認同,社會關係遂以必然性之名被內化。

相同的風險出現在生成式人工智慧的互動之中。當使用者忽略 AI 作為概率模型的前提,輸出便被理解為中立而可靠的陳述。語言的流暢與即時回應容易被誤認為理解與意圖,結果獲得近似真理的地位。判斷在此被轉移至系統之外,責任隨之消散。

布萊希特式提示的政治意義,正在於對此狀態的持續干預。透過驗證鏈與元認知提示,生成流程被反覆打開。回應不再直接封閉為結論,而被迫經歷核查、反思與修訂。互動因此保留停頓,讓不確定、偏差與前提浮現於語言表面。

提示書寫在此維持可被質問的狀態。每一次中斷都在提醒,眼前內容源自可被追溯的製作過程。錯誤並非例外,偏見並非偶發,判斷仍需介入。使用者不再只是接受者,而被召回至審視的位置。

提示書寫不僅關乎效率,也關乎公共理性。間離並未取消互動,而重建其倫理邊界。生成式系統被要求呈現自身條件,觀看得以恢復距離,判斷重新成為行動的前提。史詩劇場的政治要求,因而以技術形式延續於人與 AI 的對話之中。

Field UI:接縫設計與場域的視覺化

目前多數生成式人工智慧的互動,仍然圍繞在「Chat UI」(對話框)之上。此介面形式建立在嚴格的線性時間軸中,所有輸入與輸出被迫依序通過同一視窗,問題、回應與修正彼此覆蓋,過往推論逐步沉入捲動歷史之中。對話因此呈現為連續敘述,而非可被拆解的結構。複雜任務在此被壓縮為一連串語句,關聯關係難以被同時觀看。

Geoffrey Litt 曾指出,Chat UI 並不適合承載高度複雜、非線性或多目標的工作流程。當任務涉及多個假設、分支路徑或相互衝突的條件時,線性對話反而成為限制。使用者無法同時掌握推論的不同階段,也難以回看哪些判斷建立在哪些前提之上。控制權在此逐漸轉移至語言流動本身,而非任務結構。

在此介面條件下,生成過程容易被誤解為連續而完整的敘事。推論的斷裂、不確定與修正被埋入對話深處,觀看被引導至最新輸出。這種結構與布萊希特所反對的沉浸狀態形成共鳴。當介面只允許單一路徑前行,判斷便難以停留,批判距離隨之縮減。

為了支撐布萊希特式的觀看姿態,介面必須允許同時呈現多重狀態。生成條件、假設來源、驗證結果與修訂痕跡,需要在空間上並置,而非在時間中被覆蓋。這樣的需求,指向不同於對話框的介面想像。

Field UI」(場域介面)在此浮現為新的互動範式。介面不再被理解為單一入口,而被視可展開的場域。推論節點可以被標示、比較與回溯,不確定性得以保留在可見範圍。使用者不再沿著語言序列前行,而在結構之間移動,觀看生成如何被組織。

在此場域中,生成不再以完成敘事為目的,而以暴露條件為核心。介面成為判斷發生的空間,而非結果展示的容器。Field UI 因而不只是視覺或互動形式的調整,而是回應布萊希特式批判觀看的必要基礎,為人與 AI 的協作提供能夠停留、比較與介入的結構位置。

場的雙重語義與介面的空間化轉向

Field」(場)在此並非單一概念,而承載著兩個來源不同、卻在介面層面相互滲透的語義脈絡。

在物理學中,場指向遍佈空間的關係結構。速度場、位移場或力場,並不描述孤立物件,而描寫空間中每一位置所承載的狀態值。重點不在於單一點,而在於分佈、梯度與連續變化。場的意義來自整體關係,而非局部事件。

在介面設計語境中,場則指向輸入的區域。輸入場並非單純的文字容器,而是人與系統交換訊號的位置。輸入行為在此被理解為觸發計算的起點,使用者的操作透過場被轉譯為系統內部可處理的狀態。

Field UI 正是在這兩層意義之間展開。介面不再只是承接輸入與輸出的通道,而被構想為一個可被感知與操作的場域。模型內部的潛在空間不再完全隱沒於計算背後,而透過視覺、位置與關係的方式被外顯。生成不再被理解為單次跳躍的結果,而呈現為在場中持續變動的狀態分佈。

在此介面架構中,使用者不只是提交指令,而進入具有結構的空間。權重變化、推論分岔、不確定區域與穩定區域,都能在場域中被定位與比較。理解不再依賴時間序列中的最新回應,而來自對整體關係的觀看。

場的概念因此改寫了人與 AI 的互動方式。介面不再壓縮複雜性,而為其提供可被停留的空間。操作不再只是推進流程,而成為在分佈之中移動與調整的位置選擇。Field UI 所引入的,並非新的視覺風格,而是將生成從語句層次提升至空間層次,讓模型內部的動態條件成為可被閱讀的結構。

接縫設計作為可見性的倫理

Field UI 的理論基礎,奠立於「接縫設計」(Seamful Design8的概念之上。在普適計算(Ubiquitous Computing)的研究脈絡中,Matthew Chalmers 與 Phoebe Sengers 曾明確指出,介面設計若一味追求隱藏技術運作的無縫性,反而削弱使用者對系統條件的理解能力。在《設計互動系統的反思性》(Reflective Design, 2005)等相關論述中,他們主張,技術系統的限制、不穩定與異質性不應被完全抹除,而應以可感知的方式保留下來。接縫在此不再被視為缺陷,而成為理解系統如何運作的入口。

無縫設計所追求的,是看似自然且自動化的互動表面。網路延遲被隱藏,定位誤差被修正,演算法的不確定性被平滑處理。使用者所面對的是連續且穩定的回應,彷彿技術本身不存在。此類設計確實降低了初期使用門檻,但同時也遮蔽了系統的運作邊界。當錯誤出現,原因無從判斷,介面亦無法提供足夠線索,理解在此被中斷。

接縫設計則採取相反的策略。延遲、誤差與概率被保留在互動表面之中,並以視覺、節奏或空間配置呈現。系統不再假裝全然可靠,而顯示其不穩定狀態。使用者得以察覺回應的條件,理解哪些因素影響結果,並在此基礎上調整行為。互動不再只是接受,而轉向適應與調度。

於此脈絡,接縫設計所支持的並非控制感,而是挪用能力(Appropriation9。使用者能夠因應系統的限制,發展出新的使用方式。技術不再要求被完全理解,而被允許以部分可見的狀態存在。理解在此來自經驗與調整,而非對隱藏機制的信任。

Field UI 正是將此設計倫理延伸至生成式人工智慧的互動場域。模型的不確定、推論的分岔與計算的代價,不再被壓縮進順滑介面,而被保留為可被觀看的結構。接縫因此成為判斷的支點,也成為批判性互動得以成立的前提。

Field UI 的具體實踐:暴露舞台機械

在 Brecht 的舞台上,燈光設備與牽引繩索始終保持可見。舞台不試圖掩蓋自身的技術條件,而是將其保留為觀看的一部分。表演因此不再被誤認為自然發生的事件,而被理解為經過組織與製作的結果。Field UI 正是在此精神下,重新思考生成式人工智慧的介面呈現方式。若生成過程本身構成理解的條件,那麼演算法的狀態與參數同樣需要進入可見範圍。

當 LLM 生成文本時,運算並非沿著單一路徑前進,而是在大量候選 Token 之間進行概率選擇。每一次輸出,都是在分佈之中取值的結果。傳統介面往往將此過程完全隱藏,只保留最終語句,彷彿答案從無中浮現。Field UI 則嘗試將這一選擇狀態外顯,讓使用者感知語言生成時的穩定與猶疑。

在視覺層面上,文字可被理解為一個顏色場。置信度較高的 Token 以清晰、銳利的黑色呈現,字形穩定而邊界明確。置信度較低的部分,則轉為灰階、模糊或帶有輕微抖動。語句在此不再呈現為均質文本,而顯露內部差異。使用者能夠一眼辨識哪些段落建立在高度確定的統計關係之上,哪些位置則處於不穩定狀態。

這樣的呈現方式直接削弱了輸出的權威感。語言不再以完整性壓倒觀看,而保留猶豫與偏移的痕跡。理解在此被迫停下來,介入得以發生。判斷不再完全交付系統,而重新回到使用者手中。中斷與反思不再只是理論姿態,而成為介面經驗的一部分。

在另一個層次上,Field UI 亦可回應生成背後的運算消耗。Vibe Coding 往往將計算成本包覆在流暢體驗之中,推理過程被壓縮為等待指示。若引入流體力學中速度場的可視化概念,推理便能轉化為空間運動的圖像。模型的思考不再由旋轉圖示代表,而被描繪為穿越複雜地形的路徑。

在此視覺化中,拓撲結構持續變化。模型正在檢索的知識節點被標示出來,推理受阻的位置呈現為高延遲區域。路徑的分岔與回返顯示推論並非線性展開,而在多個可能方向之間調整。使用者不再只是等待結果,而能夠觀看計算如何在結構之中移動。

為了配合元認知提示,Field UI 亦可納入元認知儀表板。主畫面負責生成內容,側邊或浮動區域則持續顯示模型的自我監控狀態。語法檢查、潛在風險、修正行為以文字或圖示形式同步呈現。這個區域不提供答案,而提供過程的旁述。

其功能近似於史詩劇場中的旁白者。角色行動尚未完成,解說已在舞台一側展開。生成與評論並置,行為與反思同時發生。使用者得以在觀看中理解模型如何評估自身行為,哪些位置出現疑慮,又如何進行修正。

透過此類介面安排,Field UI 將 Brecht 的舞台原則轉化為計算環境中的觀看結構。生成不再被包裝為自然結果,而以可見的技術狀態呈現。介面因此成為判斷的場所,讓理解在中斷、猶豫與顯影之中持續生成。

綜合迴路:Eliot × Brecht 的雙重結構

前述理論與介面實作並置之後,高階提示(High-level Prompt)的溝通結構逐漸清晰。互動不再停留於指令發出與結果回收的線性關係,而展開為反覆回返與修正的過程。提示書寫、生成回應、驗證與重構相互牽動,理解在多次往返之中逐步成形。

於此溝通迴路中,提示並非固定起點,回應亦不構成終點。每一次輸出同時成為下一次判斷的材料。使用者透過觀察不確定、辨識偏移、調整前提,持續介入生成流程。模型則在回顧、驗證與修訂之間運作,將自身的限制與條件暴露於互動之中。語言不再只是傳遞意圖的媒介,而成為推理得以展開與被檢視的場域。

主張、反思與修正並未被安排為固定順序,而在互動中相互推動。中斷為理解打開新的位置,修訂改寫後續的提問方式。溝通由此呈現出螺旋式展開的特徵,重複不指向回到原點,而在回返之中產生位移。

高階提示在此不只是技巧層面的集合,而是參與生成的姿態。使用者不再被動接受結果,而持續站在判斷的位置。AI 亦不再被期待提供最終答案,而被要求展示生成如何成立。理解在反覆展開之中保持開放,並始終處於可被質疑的狀態。

第一階段:Eliot 式的生成(能量)

高階提示溝通迴路的起點,並非精確控制,而是釋放生成的動能。此階段承接 Eliot 在《荒原》中所展現的書寫邏輯。語言不再被整理為單一敘事,而以碎片、殘響與異質來源共存的狀態展開。意義尚未被固定,能量先於結構浮現。

於此階段,使用者提供的提示並不追求清晰規格,而帶有高度文化噪訊與模糊意向。例如要求某個賽博龐克風格的登入頁面,並附帶九〇年代駭客電影的氛圍描述。提示語在此更接近喚起,而非命令。它並未封閉結果,而為生成開啟一片語義空間。

模型的運作同樣處於開放狀態。龐大的訓練語料構成一片數位荒原,不同時代、語境與風格的片段在其中並置。注意力機制負責捕捉碎片之間的關聯,高溫度的隨機採樣讓生成偏離常規路徑。語言在此並非收斂,而是不斷擴散,生成結果帶有明顯的不穩定性與偶發性。

此階段的功能不在於正確,而在於豐富。創造力、意外性與語義紋理在此被大量釋放。結果往往帶有過量資訊、風格疊加與未經篩選的聯想。這正是 Vibe Coding 所依賴的動力來源,也是後續判斷得以展開的前提。生成在此被理解為能量狀態,尚未進入結構化與驗證的層次,卻為理解提供了必要的素材與張力。

第二階段:Brecht 式的中斷(剎車)

生成能量在前一階段被充分釋放後,溝通迴路隨即進入中斷的時刻。此處不再追求延續語言的動勢,而引入刻意的停頓。此一階段的理論根源,可回溯至 Brecht 在《小戲劇論集》中所提出的史詩劇場原則。表演必須在關鍵位置被打斷,觀看才能從沉浸轉向判斷。

在實作層面,中斷首先發生於呈現方式。生成結果不再立即以完成品姿態交付,而被暫時凍結,或僅以草稿狀態出現。語言的流暢性在此被抑制,生成的權威感被延後。使用者意識到輸出尚未定型,仍處於可被檢視的狀態。

隨之啟動的,是批判性的生成程序。驗證鏈要求模型回頭檢查自身輸出,逐項辨識事實主張與邏輯依據。憲法式人工智慧(Constitutional AI10則引入規範層面的審視,回應是否符合安全、無害與一致性的原則。模型在此不再維持創作姿態,而轉向審查角色,語言的任務由生成轉為評估。

角色的切換構成此階段的關鍵。模型離開先前的創作者位置,重新閱讀自己的產出,檢視潛在風險與結構缺陷。代碼的安全性、效率與可維護性進入檢查範圍,語句的合理性與前提條件被逐一攤開。生成過程因此被迫回看自身,而非持續向前推進。

此階段所引入的功能,在於恢復理性與結構性的介入。語言的偶發性不再被無限放大,幻覺在此被阻斷於成形之前。Vibe 所營造的自然感受到質疑,生成被重新放回可被判斷的軌道。中斷並未否定創造力,而為其設置邊界,讓理解得以從感受層次轉向批判層次。

第三階段:Field UI 的介入(觀看)

在生成經過釋放與中斷之後,互動進入觀看的階段。此處不再追求新的語言推進,而將重心放在呈現與理解之上。結果不只是被交付,而被安排在可被閱讀的介面之中。Field UI 在此承接前兩個階段的張力,將生成過程轉化為可被觀看、比較與判斷的結構。

最終輸出不以單一文本形式出現,而被置入 Field UI 的場域之中。介面明確標示經過 Brecht 式中斷後所發生的修正位置。原先存在問題的區段被指出,修正理由同步顯示。例如原始程式碼中出現硬編碼密碼,相關位置被標註並附上修訂說明。生成結果因此不再呈現為平滑整體,而顯露其被加工與調整的痕跡。

概率分佈亦在此被視覺化。置信度較低的片段伴隨視覺噪聲或模糊處理,與穩定區段形成明顯對比。延遲與運算路徑不被清除,而作為背景紋理保留下來。推理所經歷的繞行、停滯與回返,在介面中留下可感知的痕跡。生成不再只是結果,而成為一段可被追索的歷程。

於此結構中,使用者的角色發生轉變。互動不再以接收為主,而轉向觀看與介入。使用者同時看見完成的輸出,也看見生成與修正的過程,既不完全置身其中,也未被排除在外。此一位置接近 Brecht 所期待的觀眾狀態,觀看本身包含判斷的責任。

透過接縫的保留,使用者獲得對系統運作的深度感知。模型的限制、不穩定與計算代價不再隱沒於順滑表面,而成為可被操作的資訊。微調因此不再依賴猜測,而建立在對結構的理解之上。控制感來自於對生成條件的掌握,而非對結果的信任。

Field UI 在此完成溝通迴路的最後一個環節。生成的能量已被釋放,中斷已引入批判,觀看則將理解固定在可被反覆回返的位置。介面不再只是顯示結果的容器,而成為判斷得以持續發生的場域。生成式人工智慧的互動,也在此從體驗導向轉為理解導向,讓使用者能夠在觀看中參與生成的後續調整與決策。

搭建小型的史詩劇場

Eliot 在《荒原》中揭示了現代世界的語言處境。文化斷裂無法被修補為整體敘事,語言所能提供的,只是暫時成立的意義組合。碎片之間的連結並不穩定,理解依賴閱讀者在當下所做的補寫與承接。意義在此從未完成,而是在不斷變動之中維持其短暫有效性。

Brecht 在《小戲劇論集》中進一步指出,正因意義缺乏永恆基礎,觀看便不能沉溺其中。當敘事被自然化,社會關係便以必然性之名獲得遮蔽。中斷因此成為必要行動,讓理解停下來,讓意義重新接受檢視。史詩劇場並不拒絕意義,而拒絕意義的封閉。

當生成式人工智慧成為語言生產的主要場域,Eliot 與 Brecht 的結合指向新的技術美學方向。生成系統不再被期待提供穩固真理,而被理解為在龐大語言碎片中不斷組合與偏移的裝置。意義在生成中浮現,也在下一次生成中鬆動。若缺乏中斷機制,暫時性的結果便容易被誤認為客觀陳述。

因此,目標並非打造完美、擬人、無縫的語言代理。那樣的形象遮蔽了生成的條件,也掩蓋了不確定與偏見的存在。真正需要的,是能夠釋放語義能量,同時保留可被觀看的生成痕跡的語言裝置。創造力在其中被允許擴散,判斷也隨時得以介入。

Field UI 與布萊希特式提示所構成的互動結構,正是朝向此方向的嘗試。生成被呈現在可被閱讀的場域之中,中斷與修訂成為常態。使用者不再只是接受語言結果,而站在觀看與審視的位置。理解在此不依賴信任,而建立在對生成條件的察覺之上。

搭建小型史詩劇場,並非為了重現戲劇形式,而是為語言技術建立可被質疑的空間。生成得以展開,中斷得以發生,判斷得以持續。人與 AI 的對話因此不再追求終極答案,而在反覆生成與檢視之間,維持開放而清醒的狀態。

提示工程的未來

成熟的提示工程(Prompt Engineering)已不再等同於搜尋關鍵語句,期待模型自動吐出理想回應。核心轉向落在互動的編排。提示書寫成為對節奏、停頓與回看方式的設計,語言不再單向發聲,而在結構中被安排與調度。提示因而更接近劇本,而非咒語。

互動劇本需要啟動生成的碎片。提示語引入豐富語境、風格與文化參照,讓模型在龐雜語料之中展開聯想。生成的任務不以立即收斂為目的,而在語義層面製造張力與密度。碎片並置,能量積累,創造力在不穩定之中浮現。

批判機制隨即嵌入生成流程。自我反思、驗證與中斷不再是生成之後的補救,而成為過程中的常態操作。模型被要求回顧推論,指出不確定之處,檢視前提與後果。語言在推進之中學會停下來接受質詢,生成顯露為可被修正的行為。

感知的場域同時被構建。不確定性、概率分佈與運算過程不再隱沒於介面背後,而轉化為可見結構。使用者得以並置觀看結果與生成條件,理解回應的來處,也辨識其脆弱位置。互動由時間序列轉向空間關係,判斷獲得可停留的所在。

Vibe Coding 在此不再停留於直覺信任。氛圍被保留,卻不被放任。生成的能量受到引導,批判得以介入,理解隨之展開。提示書寫不只是操作技巧,而成為組織生成節奏的能力。

這樣的實踐超越提示語本身,轉而在數位空間中搭建小型史詩劇場。語言被允許生成,也被要求顯影。人類與機器同時站在舞台上,演出以清醒為前提。創造力在批判之中持續展開,理解在反覆觀看中逐步深化。

對開發者與設計師的建議

對於從事 AI 應用開發的專業人士,實踐層面的行動方向可從介面、流程與觀看方式三個層次展開。

過度封裝生成系統,往往削弱使用者對模型條件的理解。提示的結構、推論的侷限與不確定性不宜被完全抹平。透過接縫設計,介面保留對邊界的可感知性,使用者得以理解系統並非全能,而是在特定前提下運作。理解來自可見性,而非流暢所營造的信任。

批判性流程需要進入系統結構本身。後端整合驗證鏈或自我修訂(Self-Refine)類型的自我修訂機制,讓生成結果在完成前經歷檢查與回顧。關鍵不在於是否修正,而在於修正過程能否被看見。推論如何被調整、錯誤如何被識別、判斷如何重建,皆應以可讀形式呈現在前端,讓使用者理解生成並非一次完成的事件。

介面層級亦需超越線性對話框的限制。Field UI 提供替代方向,透過新的視覺語言呈現概率分佈、延遲狀態與推論分岔。互動不再只是語句的往返,而在空間中展開。場成為理解發生的位置,使用者在其中移動、比較與介入。

在此實踐脈絡下,AI 不再被視為不可理解的黑盒,而轉向可被觀看與討論的結構。生成條件被攤開,限制被標示,修訂留下痕跡。協作建立在理解之上,而非盲目的信任之上。人與機器的關係也由依賴轉為增強,智能不再是單向輸出的結果,而成為共同建構的過程。


  1. 「亞里斯多德式戲劇傳統」源自 Aristotle(384–322 BCE)在《詩學》(Poetics, ca. 335 BCE)中對悲劇的系統性論述。其核心在於以連貫敘事、因果結構與情感引導,促成觀眾對角色命運的情感同一化。戲劇被視為模仿行動的整體,透過情節推進,引發憐憫與恐懼,最終達成「淨化」(katharsis)。在此傳統中,舞台技術與敘事手段傾向於隱蔽自身的人工性,以維持幻覺的完整,使觀眾暫時忘卻觀看行為本身,沉浸於所呈現的世界。此一戲劇觀深刻影響後世寫實主義戲劇、電影敘事以及當代以沉浸為導向的互動設計思維,並成為 Bertolt Brecht(1898–1956)所明確反對與批判的理論對象。
  2. 「間離效果」(Verfremdungseffekt)為 Bertolt Brecht(1898–1956)所提出之戲劇理論核心概念,常譯為「間離效果」或「陌生化效果」。其目的並非營造沉浸,而在於打斷觀眾對舞台事件的自然化認同,使行動、角色與社會關係顯現為可被質疑與分析的對象。Brecht 主張,當觀眾意識到自己正在觀看一場被製作的表演,判斷便能取代情感同一化,觀看轉化為批判行為。相關論述可參見《小戲劇論集》(Schriften zum Theater, 1957)。
  3. Transformer」為深度學習模型家族之專有名稱,源自 Vaswani et al. 發表之〈Attention Is All You Need〉(2017)。該術語並非自然語言中的功能性名詞,而是特定架構的命名,用以指涉以自注意力機制(Self-Attention)為核心的神經網路模型。中文學術文獻中尚未形成穩定且通行的譯名,實務與研究社群多沿用英文原稱,以避免與日常語義如「轉換器」或「變壓器」產生混淆,並維持跨語言文獻的一致性。
  4. 「注意力機制」(Attention Mechanism)指大型語言模型在處理序列資料時,用以動態分配計算權重的核心運算方法。模型在生成或理解語言時,並非平均對待所有輸入,而是根據當前任務與上下文關係,為不同詞元分配不同的重要性權重。此機制讓模型能在長序列中捕捉關鍵關聯,建立遠距詞彙之間的結構關係。注意力機制為 Transformer 架構的基礎運算原理,相關概念最早由 Vaswani 等人在〈Attention Is All You Need〉(2017)中系統化提出,並成為當代大型語言模型得以處理複雜語境與長距依賴的關鍵條件。
  5. 「零樣本提示」(Zero-shot Prompting)指在未提供範例或示範輸出的情況下,直接以自然語言指令要求 LLM 完成任務的提示方式。此作法仰賴模型在訓練階段所學得的廣泛語言分佈與任務抽象能力,而非即時學習。零樣本提示常被視為生成式系統最具直覺性的互動形式,語言輸出呈現高度流暢,回應速度快,但推論過程與不確定性多半被隱沒於生成表面。於沉浸導向的介面設計中,零樣本提示容易強化對模型能力的信任,卻同時降低使用者對生成條件與錯誤風險的察覺。
  6. 「驗證鏈」(Chain of Verification, CoVe)指將自我核查嵌入生成流程的提示策略。模型先產生初步回應,接著抽取回應中的事實主張或關鍵判斷,為每一主張生成可檢驗的驗證問題,再依據核查結果修訂原回應。驗證鏈的目的不在於增加語言流暢性,而在於迫使生成停下來回看自身前提,降低幻覺與錯誤推論在未被察覺的情況下固化為結論。作為互動結構,驗證鏈在生成與修訂之間引入中斷,讓不確定與可疑之處浮現於回應表面,為使用者保留判斷與介入的位置。
  7. 「元認知提示」(Metacognitive Prompting)指引導 LLM 對自身推論歷程進行回顧、評估與修訂的提示方式。此作法要求模型在輸出答案之前或之中,明確區分理解問題、形成初步判斷、辨識潛在錯誤與修正推論等階段,將原本隱沒於生成表面的推理過程轉化為可被閱讀的結構。元認知提示的重點不在於模擬人類意識,而在於將生成視為可反覆檢視的行為,使不確定性、假設前提與推論跳躍得以浮現,為使用者保留判斷與介入的位置。此技術常與驗證鏈、自我修訂流程並用,用以降低幻覺固化並提升生成結果的可審視性。
  8. 「接縫設計」(Seamful Design)為普適計算(Ubiquitous Computing)領域中的重要設計概念,由 Matthew Chalmers 與 Phoebe Sengers 所提出,用以反思過度追求無縫互動的設計傾向。其核心主張在於,技術系統中的不穩定、限制與異質性不應被完全隱藏,而應以可感知的方式呈現於介面之中,作為使用者理解系統運作條件的線索。接縫在此不被視為缺陷,而成為使用者進行判斷、調整與挪用(appropriation)的契機。相關論述可參見《設計互動系統的反思性》(Reflective Design, 2005)與後續普適計算研究。
  9. 「挪用能力」(Appropriation)指使用者在理解技術系統限制與特性之後,主動調整、重組並發展出非預期用法的能力。此概念在普適計算與人機互動研究中,常用以描述使用者如何在不完整、帶有不確定性的系統條件下,將技術納入自身實踐,而非僅依照設計者預設的操作流程行動。挪用並非誤用或偏差,而是一種建立在理解基礎上的創造性使用行為。當系統的接縫、不穩定與限制被保留於介面中,使用者得以感知其運作邊界,進而調整互動策略,發展出更具彈性的使用方式。此一概念常與接縫設計(Seamful Design)並置,用以說明可見性如何轉化為行動自由度與理解深度。
  10. 「憲法式人工智慧」(Constitutional AI)指將規範原則內嵌於模型訓練與生成流程中的方法論,核心作法在於以明確列出的價值準則或行為原則,作為模型自我評估與修訂的依據。模型在生成回應後,會依循這些原則進行自我檢查與調整,而非完全依賴人工標註的即時回饋。此方法由 Anthropic 提出並系統化發展, 目的在降低有害輸出、偏見與不可預期行為,同時保留模型進行自我修正的能力。憲法式人工智慧並不將規範視為外在約束,而將其轉化為生成過程中的內部參照,使判斷、修訂與責任成為模型運作的一部分。