向LLM發問——走得比文章更遠

你正在閱讀一篇文章。主題吸引了你。但在結尾之後，出現了一個文章沒有提出的問題——或者提出了，卻不是你感興趣的方向。

可以關閉分頁。可以尋找下一篇可能根本不存在的文章。或者，可以向語言模型發問——然後選擇自己的探索方向。

這不是一本AI指南。這是基於AI907兩篇文章，示範與LLM合作的一種具體技術。我以Claude（Anthropic）為例——因為這是我目前選用的模型——但所描述的技術同樣適用於ChatGPT、Gemini、Grok或你手邊的任何其他模型。

在展示任何內容之前，先說明一個重要前提：LLM會自信地犯錯。它以專家的語氣給出錯誤的數字。引用未經核實的來源。生成聽起來可信的回答，因為它就是這樣被建構的。我們稍後會回到這一點。

以下引用的回答以原始形式呈現——未經迭代或驗證。這些是示範性例子，而非完成的素材。兩者若要用於任何嚴肅的用途，都需要多輪精煉。

第一個主題：風化層防護罩

關於風化層防護罩的文章以這樣的觀察作結：建造月球基地的真正挑戰不是棲息艙的設計，而是移動數百噸材料。物理學已有描述。工程差距——知識與行動之間——也是如此。

但對我來說，讀完那篇文章後出現了另一個問題。不是「多少噸？」——那只是深化同一條線索。我的問題具有系統性：將四個棲息艙以共用牆壁的方式排列，是否會改變等式——無論是在風化層質量方面，還是在月夜期間的保暖方面？

模型向我提議了三個其他繼續方向。我對其中任何一個都不感興趣。我選擇了自己的方向。

提示詞：

「將棲息艙緊靠牆壁排列（例如2×2佈局中的4個）是否有意義，以便最小化所需的風化層數量並在夜間保持熱量？如何準備接觸面以在夜晚過後連接模組？」

Claude的回答（節錄）：

「有，而且非常有意義——但有精確定義的注意事項。

每面共用牆都是一個不需要從外部覆蓋風化層的表面。在2×2佈局中有4個模組，你有4面共用牆，而不是16面獨立牆。這實際上可以將所需的風化層質量減少20–35%，具體取決於模組形狀和所需層厚。

熱效應甚至比輻射效應更大。兩個被加熱的模組之間的共用牆在兩側都被主動隔熱——而不是在黑暗側與-170°C的真空接觸。加熱系統必須對抗更小的熱損失表面。

接縫問題在操作上確實困難，在通俗文獻中幾乎缺席。鋁和鈦鋼在200–300°C的溫降下會改變其長度的約0.2–0.5%的線性尺寸。對於一個8米的模組，這是每個方向16–40毫米的運動。接縫的三種方式：補償接縫（expansion joint）、乾式可分離接縫，或具有統一防護罩並埋在一堆風化層下的整體系統——這樣整個系統就像一個熱惰性物體一樣運作。

最嚴重的問題是風化層塵埃在每次熱運動時被磨入密封件更深處。標準方法：軟金或銦金屬密封件、迷宮式接縫幾何形狀、持續壓緊接縫的彈簧。」

這個回答有幾件事值得注意。首先——LLM不僅回答了問題，還識別了一個「在通俗文獻中幾乎缺席」的方面。我可以驗證這一點。其次——它給出了具體的數字（質量減少20–35%，16–40毫米的運動）。這些是在任何嚴肅背景下使用之前需要驗證的要點。

第二個主題：人類的生活空間

關於人類生活空間的文章以一個哲學問題作結：如果地球上只有0.26%的星球體積是可及的，也許向宇宙擴張是合乎邏輯的結果？這是一個很好的出發點——但我對另一個方向感興趣。

提示詞：

「如果我們想在不離開地球的情況下將人類可用的空間翻倍——技術上最簡單的是什麼：向地下深挖、向上建造，還是為撒哈拉裝冷氣？」

Claude的回答（節錄）：

「向地下深挖從技術上來說是三個方向中最困難的，這有違直覺。在-1公里以下，溫度每公里深度上升約25–30°C。在3公里處約有80°C，在5公里處超過100°C。在3公里深度，靜岩壓力約為80兆帕。每條隧道都需要主動支撐，或只在特定工業應用中使用的材料。

向上建造在技術上最便宜——這裡有一個微妙的陷阱。垂直建造並不會增加文章意義上的可用體積，它只是使其密集化。如果你有80億人住在2公里高的摩天大樓而不是獨立屋，你並沒有為生物圈的總體積增加任何東西。

為撒哈拉裝冷氣——如果問題是「什麼在技術上最簡單以增加空間」——那麼開發乾燥沙漠是唯一既能真正擴展生物可及層、又不與基本材料物理學抗爭的選擇。真正的「撒哈拉裝冷氣」不是字面意義上冷卻900萬平方公里——而是綠色基礎設施，關閉水循環。撒哈拉在約8,000年前的氣候最優期有湖泊、河流和熱帶草原。這不是地球改造，而是回歸在地質時間尺度上最近存在的條件。

還有第四個方向，問題沒有提及——文章直接作為結論所暗示的：軌道和月球在某種意義上比地球表面以下5公里更容易，因為至少你不必與星球內部的熱量抗爭，也不必在80兆帕壓力下的岩石中挖掘隧道。」

我要指出最後一段。模型自行將問題的線索與文章的主題聯繫起來——並提出了問題中沒有的第四個方向。那個方向有趣嗎？是的。我選擇了它嗎？沒有。我留在撒哈拉，想知道是否有人已經嘗試實現這樣的概念。下一個提示詞，下一次迭代。

值得注意技術背景：我將兩個提示詞都附上了來源文章的內容。這就是為什麼在回答關於深挖的問題時，模型使用1公里及以上的深度，而在向上建造方面——使用約2公里的高度，因為這些數值出現在文章中。如果我要進一步迭代這個線索，我會從幾十或幾百米的深度開始，而不是一公里。回答並不錯誤——提示詞不夠精確。這也是與模型合作的實際觀察：它回答你提出的問題，並不總是你心中想的那個問題。

如何驗證LLM的回答

兩種方法，都很快速。

第一種方法：關於確定性的後續問題。

當模型給出你想進一步使用的具體數字或聲明時——直接問：

「你說2×2佈局中風化層質量的減少是20–35%。你對這個數字有把握嗎？它從哪裡來？」

模型要麼會引用一個來源（你可以核實），要麼說這是沒有具體依據的近似值。兩種結果都有價值。第二個告訴你，你不能引用這個數字——只能把它視為進一步搜索的方向。

第二種方法：問定義而不是來源。

比「你從哪裡得到的？」更有力的測試是「你如何定義它？」模型經常依靠記憶中的近似值，這些定義在不同回答之間是不一致的。「你如何定義『生物可及空間』？」這個問題比問來源更快揭示不一致性。

我定期使用這兩種方法。當數字需要在私人探索以外具有意義時，兩者都不能代替查核原始來源。

從中得出什麼

一篇文章有一個方向——作者選擇描述的那個。與LLM的對話有多少個方向，取決於你有多少問題。

從實踐中得出的幾點觀察：

LLM總會提出一個方向。 它不一定是你的方向。在開始對話之前先有自己的問題是值得的——因為模型會樂於用自己的建議填補空白，那個建議可能很有趣，但很少能精準切中你真正感興趣的東西。

從簡單開始，然後收緊。 第一個提示詞不用術語。第二個帶有對數字或你感興趣的方面的請求。不需要寫長指示——如果背景清晰，模型能很好地處理簡單問題。

LLM不能取代來源。 它幫助你理解你自己會找到的來源。它也幫助你在開始搜索之前提出正確的問題。

一篇文章是出發點。與模型的對話是探索。你最終到達哪裡，取決於你帶來什麼問題。

本文是AI907 Human–AI Collaboration類別的一部分。來源文章：風化層防護罩：房間裡500噸的大象及人類慣常生活空間。

向LLM發問——走得比文章更遠

第一個主題：風化層防護罩

第二個主題：人類的生活空間

如何驗證LLM的回答

從中得出什麼

人類生命的約定空間

尚未存在的任務——以及已然存在的工具

能否與 Claude 一起設計創新的月球著陸場？

太小的利基。論罕至,卻深達

當技能不再是證明

風化層屏蔽：房間裡的500噸大象

第一個主題：風化層防護罩

第二個主題：人類的生活空間

如何驗證LLM的回答

從中得出什麼

Similar Posts