Britannica 告 OpenAI — 當 AI 把知識變免費,百科全書怎麼活
🎯 核心重點 (TL;DR)
- Britannica 的訴訟同時攻擊三個層次:訓練資料侵權、RAG 即時擷取、以及 AI 幻覺冒用品牌——其中 RAG 擷取因更接近「即時複製」而非「學習」,法律辯護空間最小。
- 知識的危機不在品質,而在分發:AI 壟斷知識分發管道後,即便內容品質更高,Britannica 的訂閱溢價也歸零,這是所有內容產業共同面臨的結構性問題。
- 台灣 Lawsnote 案與 Britannica 案高度相似,說明「資料整理方式有無版權」的爭議已是全球性議題,台灣法院選擇嚴格保護編輯著作,對 AI 訓練資料的影響值得持續關注。
- 最可能的結局是 OpenAI MDL 和解,但若 RAG 擷取被單獨裁定侵權,整個 AI 產業都需重新設計資訊擷取架構,影響範圍遠超單一訴訟。
你問 ChatGPT「量子運算是什麼」,它用三段話解釋得比大多數科普文章清楚。你滿意地關掉視窗。但你不會知道——也不會在意——那三段話背後有一篇 Britannica 編輯花了兩週撰寫、三位同儕審查的長文。你不會點進 Britannica.com,不會看到他們的訂閱方案,不會成為他們的付費用戶。
這就是 Encyclopedia Britannica 在三月十三日把 OpenAI 告上紐約南區聯邦法院的原因。不是因為 AI 太聰明,而是因為 AI 把別人的聰明變成了自己的免費服務。
Britannica vs. OpenAI 訴訟摘要
- 提告日期:二○二六年三月十三日,紐約南區聯邦法院
- 原告:Encyclopedia Britannica Inc. + Merriam-Webster(同集團)
- 被告:OpenAI
- 指控一:未經授權抓取近十萬篇文章訓練 GPT 模型
- 指控二:ChatGPT 透過 RAG 技術即時擷取 Britannica 內容生成回答
- 指控三:AI 幻覺時將虛構資訊歸因給 Britannica(違反蘭姆法)
- Britannica 估值:2024 年 IPO 計劃目標 $10 億美元
- 預計走向:併入 OpenAI MDL(16 件版權訴訟合併審理)
一本兩百五十八年的百科全書,為什麼現在才告
Britannica 不是第一次面對生存威脅。一九九○年代,微軟的 Encarta 用一張 $99 的光碟擊潰了一套要價超過 $1,500 的紙本百科全書,逼得 Britannica 在一九九六年破產、以 $1.36 億被瑞士投資人收購。新東家把它轉型成教育科技公司——砍掉兩千人的上門推銷部隊,把 90% 的營收轉向學校和機構訂閱。到了二○二二年,公司營收接近 $1 億美元,訂閱續約率高達 95%,甚至在二○二四年初向 SEC 提交了 IPO 申請,目標估值 $10 億。
這個復活故事的前提是:知識有價,而 Britannica 是「經過驗證的知識」的品牌代名詞。
然後 ChatGPT 出現了。
Britannica 的網站流量從二○二二年的每月約 6,950 萬次,跌到二○二五年的約 4,740 萬次——兩年蒸發了近三分之一。但流量下降只是表面症狀。真正的問題是,當使用者可以直接從 AI 得到「Britannica 等級」的答案,訂閱這個動作本身就失去了意義。
三重指控:訓練、擷取、冒名
訴狀一共丟出三張牌,每張打的是不同的法律邏輯。
第一層:訓練資料侵權。 Britannica 指控 OpenAI 透過 Common Crawl 和 WebText 等資料集,在未經授權的情況下抓取了近十萬篇 Britannica 文章來訓練 GPT 模型。這是目前大多數 AI 版權訴訟的標準戰場——紐約時報、Getty Images、一群小說家都是在這個層面打。
第二層:RAG 即時擷取。 這一層才是這場訴訟真正有意思的地方。RAG(Retrieval-Augmented Generation,檢索增強生成)是一種讓 AI 在回答問題時即時搜尋外部資料、擷取內容再生成回答的技術。Britannica 的主張是:就算你辯稱訓練是 fair use,但 ChatGPT 在回答問題的當下即時拉取我的文章內容、消化後直接餵給使用者,這不是「轉化性使用」,這是替代。
想像一個比喻:如果訓練資料侵權像是有人偷讀了你的食譜然後學會做菜,那 RAG 擷取就像是有人每次客人點菜時,即時翻開你的食譜照抄,然後端出去說是自己做的。
第三層:品牌傷害。 Britannica 還援引了蘭姆法(Lanham Act),指控 ChatGPT 在產生幻覺(hallucination)時,會把虛構的資訊歸因到 Britannica 或 Merriam-Webster 名下。換句話說,AI 不只抄你的內容,還在胡說八道的時候拉你背書。
| 指控層次 | 行為 | 法律依據 | 類比 |
|---|---|---|---|
| 訓練資料 | 抓取 ~10 萬篇文章訓練 GPT | 著作權法 | 偷讀食譜學做菜 |
| RAG 擷取 | 即時拉取內容生成回答 | 著作權法 | 每次點菜即時翻食譜照抄 |
| 品牌冒名 | 幻覺內容歸因給 Britannica | 蘭姆法(商標法) | 端錯菜還說是你做的 |
零點擊知識引擎:比 Google 更致命的取代
要搞懂 Britannica 為什麼非告不可,得先回頭看出版業和搜尋引擎那段糾纏了十年的恩怨。
Google 的 Featured Snippet 從二○一四年開始就在吃出版商的午餐——直接在搜尋結果頁面顯示答案,使用者不用點進原始網站。到了二○二五年,零點擊搜尋已經占 Google 搜尋的 58% 到 60%。出版商罵了十年,但至少 Google 還會附上來源連結,還有一些使用者會點進去。
ChatGPT 把這個問題推到了極端。它不附來源連結(或者附了你也不會點),不導流量,不分潤。更關鍵的是,Google 的 AI Overviews 已經把零點擊率推高到 83%,而新聞出版商從 Google 獲得的流量在二○二五年第四季從 51% 暴跌到 27%。
Britannica 面對的是一個結構性問題:它的產品是「經過驗證的知識」,但 AI 可以在零成本的情況下提供「看起來一樣好」的知識。這不是品質問題——Britannica 的內容確實更可靠。這是分發問題:當知識的分發管道被 AI 壟斷,品質的溢價就消失了。
台灣的鏡子:Lawsnote 案的啟示
如果你覺得這場爭議離台灣很遠,那你可能還不知道 Lawsnote 案。
二○二五年六月,新北地方法院對法學新創 Lawsnote(七法)做出一審判決:兩名創辦人分別被判四年和兩年有期徒刑,並須賠償法源資訊 NT$1.545 億(約 $3,950 萬美元)。罪名是在二○一八到二○一九年間,用爬蟲程式抓取競爭對手法源資訊的九萬八千筆法規沿革資料。
這個案子的核心爭議和 Britannica 驚人地相似:資料的「整理方式」有沒有版權?
法源主張,雖然法律條文本身不受著作權保護(台灣著作權法第九條明文規定),但它對九萬八千筆法規沿革的「選擇、編排」——每筆平均花七分鐘人工整理——構成受保護的編輯著作。法院同意了:編輯著作的創作門檻很低,法源的整理方式具備最低程度的創作性。
把場景拉回美國。Britannica 的邏輯幾乎一樣:維基百科上的知識是免費的,但 Britannica 對這些知識的「篩選、驗證、組織和表述」是有價值的智慧勞動。當 OpenAI 抓取這些文章時,它拿走的不是原始事實,而是 Britannica 對事實的「加工方式」。
但兩個案子有一個關鍵差異。Lawsnote 案是刑事+民事併行,創辦人直接面臨牢獄之災——這在資料爬蟲的案例中極為罕見,也讓台灣新創圈震驚。Britannica 案則是純民事訴訟,而且面對的是一家估值超過 $3,000 億的公司。誰的籌碼更大、誰的風險更高,答案並不直觀。
Lawsnote 的創辦人郭榮彥在判決後公開表示強烈不服,認為法規內容應為公共財,而將爬蟲技術入罪將嚴重打擊台灣的科技創新。這個案子目前正在上訴中。
三種可能的結局
這場官司最終會怎麼收場?我看到三條路,每條都指向不同的產業未來。
路線一:併入 MDL,拖到和解。 這是最可能的結果。目前 OpenAI 的版權 MDL 已經合併了十六件訴訟,Britannica 案幾乎確定會被併入。MDL 的發現程序接近尾聲,但 fair use 的裁定最早要到二○二六年夏天。在那之前,OpenAI 可能選擇和解——AI 產業已有先例,Anthropic 在二○二五年九月以 $15 億和作家群體達成版權和解,創下美國版權訴訟史上最大公開和解金額。和解金額通常不會完全公開,但 Britannica 大概能拿到一筆授權費和持續的分潤安排。
路線二:RAG 擷取被單獨裁定為侵權。 如果法院把「訓練」和「RAG 擷取」分開處理,後者更難用 fair use 辯護。訓練至少還有「轉化性使用」的論據,但 RAG 是在使用者提問的當下即時複製內容——這更接近傳統的複製貼上。如果 RAG 被判侵權,整個 AI 產業都要重新設計資訊擷取的方式。
路線三:fair use 全面勝訴,出版業自求多福。 如果法院認定訓練和 RAG 都屬於 fair use,那 Britannica 的商業模式就得自己找出路。可能的方向包括:成為 AI 公司的授權內容供應商(類似新聞媒體和 Google 的授權協議)、強化「人工驗證」的品牌溢價、或轉型成 AI 無法取代的互動式教育平台。
我的判斷偏向路線一,但我認為路線二的可能性被市場低估了。RAG 擷取在法律上確實和訓練資料是不同性質的行為,而且 Britannica 在訴狀中刻意把這兩者分開主張,顯然是有備而來。
關鍵洞察
訓練資料的 fair use 爭議已經打了兩年沒有結論,但 RAG 即時擷取是一個新的法律問題——它更像「即時複製」而非「學習」,辯護空間更小。
Britannica 的內容品質從未被質疑,但當 AI 壟斷了知識的分發管道,品質的溢價就歸零。這是所有內容產業面臨的結構性問題。
同樣是「資料整理方式有無版權」的爭議,台灣法院選擇了嚴格保護。這對全球的法律科技和 AI 訓練資料爭議都有參考意義。
OpenAI MDL 的 fair use 裁定最早在夏天出爐,加上二千萬筆 ChatGPT 日誌即將曝光,這半年內的發展將決定整個 AI 產業的版權邊界。
知識免費之後
二○一二年,Britannica 停印了最後一版紙本百科全書。當時的 CEO Jorge Cauz 說了一句話,大意是:紙本只是載體,知識本身不會消失。十四年後的今天,知識確實沒有消失——但它被 AI 消化、重組、免費分發之後,創造知識的人還能不能活下去?
Britannica 花了兩百五十八年建立「可信賴的知識」這個品牌。OpenAI 花了兩年讓使用者覺得 ChatGPT 的答案「夠好了」。這場官司的結果不只關乎兩家公司的命運,它回答的是一個更根本的問題:當 AI 可以消化一切,「整理知識」這件事本身,到底還值不值錢?
如果答案是不值錢,那下一個被消化的,會不會是你正在讀的這篇文章?
每週科技評析
喜歡這篇分析?
每週一篇深度科技洞察,直送你的信箱。不追流量,只寫有誠意的內容。
加入讀者行列
🔒 零垃圾信,隨時取消,完全免費