talk

向LLM發問——走得比文章更遠

你正在閱讀一篇文章。主題吸引了你。但在結尾之後,出現了一個文章沒有提出的問題——或者提出了,卻不是你感興趣的方向。

可以關閉分頁。可以尋找下一篇可能根本不存在的文章。或者,可以向語言模型發問——然後選擇自己的探索方向。

這不是一本AI指南。這是基於AI907兩篇文章,示範與LLM合作的一種具體技術。我以Claude(Anthropic)為例——因為這是我目前選用的模型——但所描述的技術同樣適用於ChatGPT、Gemini、Grok或你手邊的任何其他模型。

在展示任何內容之前,先說明一個重要前提:LLM會自信地犯錯。它以專家的語氣給出錯誤的數字。引用未經核實的來源。生成聽起來可信的回答,因為它就是這樣被建構的。我們稍後會回到這一點。

以下引用的回答以原始形式呈現——未經迭代或驗證。這些是示範性例子,而非完成的素材。兩者若要用於任何嚴肅的用途,都需要多輪精煉。


第一個主題:風化層防護罩

關於風化層防護罩的文章以這樣的觀察作結:建造月球基地的真正挑戰不是棲息艙的設計,而是移動數百噸材料。物理學已有描述。工程差距——知識與行動之間——也是如此。

但對我來說,讀完那篇文章後出現了另一個問題。不是「多少噸?」——那只是深化同一條線索。我的問題具有系統性:將四個棲息艙以共用牆壁的方式排列,是否會改變等式——無論是在風化層質量方面,還是在月夜期間的保暖方面?

模型向我提議了三個其他繼續方向。我對其中任何一個都不感興趣。我選擇了自己的方向。

提示詞:

「將棲息艙緊靠牆壁排列(例如2×2佈局中的4個)是否有意義,以便最小化所需的風化層數量並在夜間保持熱量?如何準備接觸面以在夜晚過後連接模組?」

Claude的回答(節錄):

「有,而且非常有意義——但有精確定義的注意事項。

每面共用牆都是一個不需要從外部覆蓋風化層的表面。在2×2佈局中有4個模組,你有4面共用牆,而不是16面獨立牆。這實際上可以將所需的風化層質量減少20–35%,具體取決於模組形狀和所需層厚。

熱效應甚至比輻射效應更大。兩個被加熱的模組之間的共用牆在兩側都被主動隔熱——而不是在黑暗側與-170°C的真空接觸。加熱系統必須對抗更小的熱損失表面。

接縫問題在操作上確實困難,在通俗文獻中幾乎缺席。鋁和鈦鋼在200–300°C的溫降下會改變其長度的約0.2–0.5%的線性尺寸。對於一個8米的模組,這是每個方向16–40毫米的運動。接縫的三種方式:補償接縫(expansion joint)、乾式可分離接縫,或具有統一防護罩並埋在一堆風化層下的整體系統——這樣整個系統就像一個熱惰性物體一樣運作。

最嚴重的問題是風化層塵埃在每次熱運動時被磨入密封件更深處。標準方法:軟金或銦金屬密封件、迷宮式接縫幾何形狀、持續壓緊接縫的彈簧。」

這個回答有幾件事值得注意。首先——LLM不僅回答了問題,還識別了一個「在通俗文獻中幾乎缺席」的方面。我可以驗證這一點。其次——它給出了具體的數字(質量減少20–35%,16–40毫米的運動)。這些是在任何嚴肅背景下使用之前需要驗證的要點。


第二個主題:人類的生活空間

關於人類生活空間的文章以一個哲學問題作結:如果地球上只有0.26%的星球體積是可及的,也許向宇宙擴張是合乎邏輯的結果?這是一個很好的出發點——但我對另一個方向感興趣。

提示詞:

「如果我們想在不離開地球的情況下將人類可用的空間翻倍——技術上最簡單的是什麼:向地下深挖、向上建造,還是為撒哈拉裝冷氣?」

Claude的回答(節錄):

「向地下深挖從技術上來說是三個方向中最困難的,這有違直覺。在-1公里以下,溫度每公里深度上升約25–30°C。在3公里處約有80°C,在5公里處超過100°C。在3公里深度,靜岩壓力約為80兆帕。每條隧道都需要主動支撐,或只在特定工業應用中使用的材料。

向上建造在技術上最便宜——這裡有一個微妙的陷阱。垂直建造並不會增加文章意義上的可用體積,它只是使其密集化。如果你有80億人住在2公里高的摩天大樓而不是獨立屋,你並沒有為生物圈的總體積增加任何東西。

為撒哈拉裝冷氣——如果問題是「什麼在技術上最簡單以增加空間」——那麼開發乾燥沙漠是唯一既能真正擴展生物可及層、又不與基本材料物理學抗爭的選擇。真正的「撒哈拉裝冷氣」不是字面意義上冷卻900萬平方公里——而是綠色基礎設施,關閉水循環。撒哈拉在約8,000年前的氣候最優期有湖泊、河流和熱帶草原。這不是地球改造,而是回歸在地質時間尺度上最近存在的條件。

還有第四個方向,問題沒有提及——文章直接作為結論所暗示的:軌道和月球在某種意義上比地球表面以下5公里更容易,因為至少你不必與星球內部的熱量抗爭,也不必在80兆帕壓力下的岩石中挖掘隧道。」

我要指出最後一段。模型自行將問題的線索與文章的主題聯繫起來——並提出了問題中沒有的第四個方向。那個方向有趣嗎?是的。我選擇了它嗎?沒有。我留在撒哈拉,想知道是否有人已經嘗試實現這樣的概念。下一個提示詞,下一次迭代。

值得注意技術背景:我將兩個提示詞都附上了來源文章的內容。這就是為什麼在回答關於深挖的問題時,模型使用1公里及以上的深度,而在向上建造方面——使用約2公里的高度,因為這些數值出現在文章中。如果我要進一步迭代這個線索,我會從幾十或幾百米的深度開始,而不是一公里。回答並不錯誤——提示詞不夠精確。這也是與模型合作的實際觀察:它回答你提出的問題,並不總是你心中想的那個問題。


如何驗證LLM的回答

兩種方法,都很快速。

第一種方法:關於確定性的後續問題。

當模型給出你想進一步使用的具體數字或聲明時——直接問:

「你說2×2佈局中風化層質量的減少是20–35%。你對這個數字有把握嗎?它從哪裡來?」

模型要麼會引用一個來源(你可以核實),要麼說這是沒有具體依據的近似值。兩種結果都有價值。第二個告訴你,你不能引用這個數字——只能把它視為進一步搜索的方向。

第二種方法:問定義而不是來源。

比「你從哪裡得到的?」更有力的測試是「你如何定義它?」模型經常依靠記憶中的近似值,這些定義在不同回答之間是不一致的。「你如何定義『生物可及空間』?」這個問題比問來源更快揭示不一致性。

我定期使用這兩種方法。當數字需要在私人探索以外具有意義時,兩者都不能代替查核原始來源。


從中得出什麼

一篇文章有一個方向——作者選擇描述的那個。與LLM的對話有多少個方向,取決於你有多少問題。

從實踐中得出的幾點觀察:

LLM總會提出一個方向。 它不一定是你的方向。在開始對話之前先有自己的問題是值得的——因為模型會樂於用自己的建議填補空白,那個建議可能很有趣,但很少能精準切中你真正感興趣的東西。

從簡單開始,然後收緊。 第一個提示詞不用術語。第二個帶有對數字或你感興趣的方面的請求。不需要寫長指示——如果背景清晰,模型能很好地處理簡單問題。

LLM不能取代來源。 它幫助你理解你自己會找到的來源。它也幫助你在開始搜索之前提出正確的問題。

一篇文章是出發點。與模型的對話是探索。你最終到達哪裡,取決於你帶來什麼問題。


本文是AI907 Human–AI Collaboration類別的一部分。來源文章:風化層防護罩:房間裡500噸的大象人類慣常生活空間

Similar Posts