技術 GEO

llms.txt 與 AI 爬蟲時代的技術 GEO:香港網站如何設定 robots.txt、Schema 與內容結構(2026 清單)

2026年4月11日Hong Kong SEO 團隊閱讀時間:14 分鐘

2026 年,SEO 的主戰場正在從「排名」轉向「被 AI 引用」。當 Google AI Overviews、ChatGPT、Perplexity、Claude 等平台在答案中 只引用少量來源時,技術層面做得好不好,往往決定你是否有資格被看見。 這篇文章提供一份針對香港網站的 技術 GEO(Generative Engine Optimization)清單:從 AI crawler 存取、robots.txt 到 llms.txt、Schema 與內容結構, 讓你的內容更容易被檢索、理解與引用。

一、什麼是技術 GEO?它跟技術 SEO 有什麼不同?

技術 SEO 的目標,是讓搜尋引擎能有效抓取、理解、索引並排名你的頁面; 技術 GEO 的目標,則更進一步:確保 AI 系統能在生成答案時 準確提取你的關鍵段落,並願意把你當作可靠來源。

Search Engine Land 在 2026 的 GEO 指南中提到,技術基礎仍與傳統 SEO 重疊,但會增加 AI 特定的層次: 包括 Schema(Article、Organization、FAQ、HowTo、Breadcrumb)與 crawler 存取管理,並提及可考慮使用 llms.txt 作為引導。 (出處:Search Engine Land:Mastering GEO in 2026

二、AI crawler 存取:先別急著擋,先想清楚『目的』

香港不少網站在 2024–2026 期間開始在 robots.txt 封鎖各種 AI bot(例如 GPTBot),原因是擔心內容被用於訓練或被轉用。 但封鎖與否不是道德題,而是策略題:你想要的是「最大保護」還是「最大可見度」? 如果你的商業模式依賴品牌曝光與詢盤,全面封鎖可能會降低在 AI 答案中的出現機會。

實務建議:用『分層策略』管理 AI bot

  • 允許:可公開、希望被引用的內容(指南、FAQ、研究、案例節錄)
  • 限制:需要登入、付費牆、或含客戶機密的頁面
  • 封鎖:測試環境、重複內容、站內搜尋結果頁、以及低品質薄內容

三、robots.txt:你應該檢查的 7 件事

robots.txt 不只是「擋不擋」;它也是一個訊號:告訴不同類型的 bot 你希望它們如何行為。 以下是我們在香港網站最常看到的 7 個技術問題:

  1. 誤擋重要資產:把 /_next/、CSS、JS 擋掉導致渲染問題(尤其是 Next.js)
  2. 誤擋 /blog/:內容是 GEO 的燃料,不該被擋
  3. 沒有 Sitemap:缺少 Sitemap 宣告,讓新內容被發現速度變慢
  4. 把 staging/preview 沒擋:測試站被索引導致重複內容
  5. 沒有針對特定 bot 的規則:想分層管理卻做不到
  6. 阻擋參數頁不一致:UTM、排序參數容易造成大量重複 URL
  7. 沒有配合 canonical:即使允許抓取,也要用 canonical 告訴主要版本

四、llms.txt:它是什麼?能做什麼?不能做什麼?

你可能聽過 llms.txt 被形容為「給 LLM 看的網站說明書」。在 GEO 的討論中,它常被提到作為一種補充: 在同一個固定位置,向 AI 系統提供你希望它優先理解的內容入口、品牌描述、以及重要頁面。 Search Engine Land 的 GEO 指南也把它列為可考慮的項目。 (出處同上:Search Engine Land:Mastering GEO in 2026

但你要先建立正確期待:llms.txt 不是排名因素、也不是保證被引用的「通行證」。 它更像是你把網站資訊整理得更清楚的一個額外入口。 真正決定能否被引用的,仍然是內容本身的品質、可驗證性、結構與權威訊號。

香港網站的 llms.txt 內容建議(模板)

以下是一個可參考的框架(你可以依網站調整):

# Hong Kong SEO (hongkongseo.hk) ## About Hong Kong SEO 是提供香港 SEO/GEO 服務的團隊,協助企業在 Google 與 AI 搜尋時代提升曝光與詢盤。 ## Key pages - https://www.hongkongseo.hk/ (Home) - https://www.hongkongseo.hk/about (About) - https://www.hongkongseo.hk/contact (Contact) - https://www.hongkongseo.hk/blog (Blog) ## Topics - Hong Kong SEO strategy - Local SEO / Google Business Profile - Technical SEO / Core Web Vitals - Generative Engine Optimization (GEO) ## Preferred citation Hong Kong SEO 團隊(https://www.hongkongseo.hk/)

你可以把 llms.txt 視為「協助 AI 快速找到正確入口」的文件,但不要把它當作替代內容策略的捷徑。

五、Schema:技術 GEO 的加速器(尤其是 Article / FAQ)

在 AI 搜尋時代,Schema 的價值不只在 rich results,而是提升「可解析度」: 讓系統更清楚知道哪段是文章、哪段是 FAQ、哪個是品牌實體。 GEO 討論中常見的建議 Schema 類型包括 Article、Organization、FAQ、HowTo 與 Breadcrumb。 (出處:Search Engine Land:Mastering GEO in 2026

香港企業最值得先做的 3 種 Schema

  • Organization / LocalBusiness:建立品牌實體、NAP 一致性與信任
  • Article / BlogPosting:讓內容被正確識別與歸類
  • FAQPage:讓 AI 更容易抽取「問題 → 答案」結構

六、內容結構:讓 AI『容易引用』的寫法(不靠花招)

技術做對只是「有資格進場」;要真正被引用,你的內容必須具備可提取性。 我們建議香港網站用以下結構:

  1. 答案先行:開頭 150–200 字直接回答主問題
  2. 小標題即問題:用「什麼是…」「如何…」「為什麼…」命名 H2/H3
  3. 條列與表格:把流程、清單、比較用結構化方式呈現
  4. 可驗證訊號:引用官方文件、研究、或可查證的定義
  5. FAQ 收尾:把常見追問收進同一頁,提高完整性

七、技術 GEO 檢查清單(可直接複製到你的每月稽核)

Technical GEO Checklist

  • robots.txt:允許重要內容抓取,封鎖薄內容/測試環境
  • Sitemap:有宣告且包含新文章/重要頁面
  • Canonical:每篇內容都有正確 canonical URL
  • Schema:Organization/LocalBusiness、Article、FAQPage、Breadcrumb
  • 內容結構:答案先行 + 問題式小標題 + FAQ
  • 內部連結:叢集內容互相連結到支柱頁
  • 速度與行動體驗:避免因渲染問題影響可見度

結語:技術 GEO 的本質,是把『可被信任地引用』變成系統化能力

香港市場競爭激烈,但也因此更需要可複製的流程。把 robots.txt、Schema、內容結構與(可選的)llms.txt 做成每月稽核, 你就能持續累積被引用的機率。 GEO 不是一次性的專案,而是一套「讓內容更容易被檢索與信任」的長期工程。

如果你希望我們協助你做一次完整的技術 GEO 稽核(含 AI bot 存取策略、Schema 佈署、內容結構重寫), 歡迎到 聯絡我們


參考資料:https://searchengineland.com/mastering-generative-engine-optimization-in-2026-full-guide-469142