今日要聞
生成式 AI 進入「落地深化」的第二階段:一方面,產品更新愈來愈像雲端服務的例行升級,重點不只在更強的基準測試分數,而是使用者是否更易控、更可信、更易整合到工作流程;另一方面,監管與安全測試也開始跟上,形成更制度化的發布前評估與問責機制。對香港企業來說,這意味著 AI 採購與導入的關鍵不再是「有沒有用」,而是「可否持續、安全、合規、可度量」。
OpenAI 將 GPT-5.5 Instant 設為 ChatGPT 預設:更少幻覺、可追溯記憶來源
OpenAI 把 GPT-5.5 Instant 設為 ChatGPT 的預設模型,方向很清晰:把「日常對話」的體驗做得更穩定。官方重點放在減少法律、醫療、金融等敏感領域的幻覺,同時維持低延遲,讓它能繼續扮演即時工作助理,而非只有在高算力模式下才可靠。
更值得香港用戶留意的是「記憶來源(memory sources)」的可視化。當聊天助理開始依賴過往對話、文件或連接的企業工具來個人化回覆,若欠缺可追溯性,很容易令企業內部的風險審批卡住。把來源顯示出來,至少讓用戶能刪除、修正或釐清上下文從何而來,對建立信任很關鍵。
重點整理
- 預設模型升級會直接影響團隊的日常工作效率;建議企業把「模型版本變更」納入 IT 變更管理。
- 若團隊用到記憶/檔案/連接器功能,應先定義:哪些資料可被引用、保留多久、誰可清除。
在 API 層面,GPT-5.5 以 chat-latest 的形式提供,對開發團隊來說可更快跟上預設版本;但同時也提醒你要做版本回歸測試與提示詞穩定性檢查,避免某次例行升級就令客服或內部助理的行為出現漂移。
資料來源:https://techcrunch.com/2026/05/05/openai-releases-gpt-5-5-instant-a-new-default-model-for-chatgpt/
美國 CAISI 擴大前沿模型「發布前」安全測試合作:從自願走向制度化評估
美國商務部轄下、隸屬 NIST 的 CAISI 擴大與多家大型 AI 供應商的合作,允許政府在模型公開發布前進行測試與研究,重點放在國家安全與前沿能力的風險評估。這類安排反映一個趨勢:在大型模型愈來愈「像基礎設施」的今天,安全評估不再只靠企業自律聲明,而是逐步走向制度化與可比對的量測。
對香港企業來說,這不是遙遠的美國政策新聞。因為跨國雲端與 AI 供應商往往以同一套安全與合規文件服務全球市場;一旦「發布前測試」變成常態,企業採購時也更容易把要求寫進合約:例如要求供應商提供第三方測試摘要、風險緩解證據、以及在發現高風險能力時的應對流程。
落地建議(給香港 IT / 合規 / 風險團隊)
若你正評估把生成式 AI 接入客服、財務或法務流程,除了問「準確率」,也要問:供應商是否有發布前測試、紅隊演練、事件通報、以及可追溯的評估報告;把這些要求納入採購清單,往往比日後補救更省成本。
同時也要留意一個現實:更嚴格的測試與門檻可能令最先享受到新模型能力的,仍是大型企業與特定合作夥伴。中小企若想跟上,策略是建立可切換的模型抽象層(multi-model routing),把風險與供應商鎖定成本降到最低。
資料來源:https://www.politico.com/news/2026/05/05/microsoft-xai-google-caisi-safety-testing-00906529;https://www.cio.com/article/4168122/us-government-agency-to-safety-test-frontier-ai-models-before-release.html
Microsoft 365 Copilot「程式碼解譯器」可直接分析企業搜尋到的檔案:把資料分析入口前移
Microsoft 365 Copilot 的一個細節更新其實很「企業級」:Copilot Chat 的程式碼解譯器(code interpreter)現在不只可分析你手動上載的檔案,亦可直接分析透過企業搜尋找到的檔案。這等於把資料分析的入口前移到「搜尋」那一步,讓用戶更快把散落在 SharePoint、OneDrive 或其他企業內容庫的資料拉進同一個分析工作流。
這個改動看似小,卻很可能改變部門協作節奏:業務同事不需要等數據團隊整理;市場同事可即時把多份報表做彙總;法務也可以更快做初步條款比對。當然,前提是權限與資料治理要跟上,否則「能搜到」就等於「能被模型讀取並推理」,會令資料分類與最小權限原則面臨更大壓力。
注意事項
建議企業先盤點:哪些文件庫允許被 Copilot 分析、哪些需要額外標記或隔離;並為敏感資料制定「可分析但不可外傳」的使用守則,避免員工把分析結果再複製到外部渠道。
香港不少企業同時面對跨境協作與合規要求(例如客戶資料、合約與財務資料)。若你正推 Copilot 或類似助理,這類「更方便」的功能通常也是最容易觸發風險的地方:要把政策、權限與審計機制做在前面,才能享受效率提升而不放大事故成本。
資料來源:https://learn.microsoft.com/en-us/microsoft-365/copilot/release-notes
總結來看,今天三則消息都指向同一件事:AI 正在從「模型競賽」走向「治理與工作流競賽」。香港企業若想在 2026 年把生成式 AI 變成可持續的競爭力,下一步不是追最新模型名字,而是建立三件事:清晰的資料邊界、可回溯的風險證據、以及可快速切換供應商的技術架構。做到這三點,才能在產品更新加速與監管收緊之間,穩定地把 AI 變成生產力。
本文由 AI Course Hong Kong 導師 Ivan So 整理。如有查詢,歡迎電郵至 ivan@hdcourse.com。