Duolingo CEO 把「AI 使用率」列入績效考核，員工集體反彈，一年後撤回。同一時間 Meta 和 McKinsey 卻在加碼。這中間的差別，決定了企業 AI 導入會推得動、還是推到員工跳船。

這幾週，老闆又在主管會議上丟了那句話：「我們要怎麼追蹤員工有沒有在用 AI？」

你點頭，先把話接住——「我去研究一下 KPI 怎麼設計」。回到位子上，你看著那份空白的績效制度草案，心裡有一個聲音越來越大：這件事設計錯了，整個 HR 部門要背鍋。

你想得到會發生什麼：使用率被打分 → 員工為了分數做表演性的 AI 使用 → 工作產出沒變好 → 部門主管抱怨 HR 的指標「很假」→ 一年後你被要求「重新設計一次」。你甚至不用真的跑過，就能預見這個循環。

你也想過直接跟老闆說「別這樣推」，但沒有彈藥。一個來自 HR 的「別這樣」，在轉型壓力下聽起來就像抗拒——你需要的是一個別人走過一次、並且公開認錯的案例。

你桌上那份 KPI 草案，可能就是 Duolingo 一年前走過的那條路。你可以看它從頭到尾只花十分鐘，不用自己再走一次。

H2-1：一封 LinkedIn 貼文，一年後的公開回頭

2025 年 4 月 28 日，Duolingo 的執行長 Luis von Ahn 發了一封公司內部信，然後把這封信公開貼到 LinkedIn。

信上寫著五件事：從現在起，Duolingo 將是一家「AI-first」的公司；逐步停止使用約聘人力處理 AI 能做的工作；新員工錄用時會檢視 AI 運用能力；AI 將進入全員會議的常態議程；而且——員工的績效考核，將會納入「AI 使用情況」這一項。

這封信在 LinkedIn 上馬上爆開。有人拍手，說這是新時代的管理者。更多留言的語氣非常冷——Duolingo 自己的員工匿名跳出來說「你要我用 AI，還是要我把事做好？這兩件事不一定是同一件。」重度使用者在 TikTok 拍影片示範「刪掉 Duolingo App」。用戶的訊號很清楚：他們不接受一個用考績逼員工用 AI 的公司。

整整一年後，2026 年 4 月 10 日，Luis von Ahn 在一場媒體訪談裡做出公開更正（Fortune: “I’m not going to force you — Duolingo CEO backs off”，2026-04-13；TechRadar: “It did not fit”，2026-04-14）：

「我不會逼任何人用 AI。」

「我們之前推的那件事，在某些情況下，並不合適（it did not fit）。」

一年多的時間，從「AI-first」到「不會逼你」，這家公司把整個決策過程公開留在檯面上。值得看的地方不在它做錯了什麼——在它走完的那一整圈循環，所有正在設計相同 KPI 的公司，都會被同一個機制推到同一個終點。

H2-2：同一時間，Meta、McKinsey、NVIDIA 在走反方向

Duolingo 撤回的那週，科技媒體的頭條很有意思——好幾家大公司正在做看起來相反的事。

Meta 的工程團隊被要求使用內部 AI 輔助寫程式，使用率被追蹤，但追蹤結果只進團隊的工作流改善報告，不進個人績效檔案。McKinsey 內部員工的 AI 使用寫入顧問技能路徑培訓，而不是績效指標。NVIDIA 把 AI 工具的操作能力列為新進員工報到訓練的必修，用在入職能力驗證，不用在年度考核。

乍看之下這三家和 Duolingo 在對打。到底誰是對的？

答案是兩邊都有道理，但關鍵差別在他們「管」的是不同的東西。

Duolingo 原本的做法：把 AI 使用頻率納入考績。你今天用了幾次 AI？用了哪個模型？有沒有用？這些變成員工績效的評估維度。

Meta 和 McKinsey 的做法：把 AI 融入工作成果的評估。你的專案完成速度有沒有提升？你的產出品質有沒有進步？你有沒有學會這個職能的新標準工作流？AI 在這套邏輯裡只是背景工具，被盯的永遠是工作成果。

這兩種做法聽起來差一點點，結果天差地遠。前者會讓員工把「使用 AI」變成一種表演。後者會讓員工真的去問「我的工作還能用 AI 再變好多少？」

H2-3：為什麼「把 AI 綁進 KPI」會失敗，三個藏在數據裡的原因

Q：為什麼明明員工都知道要用 AI，績效綁 AI 使用率卻失敗？

三個結構性原因：(1) 員工還沒準備好——Gallup 2026 年調查 22,000 人顯示，僅 12% 員工每天在工作中用 AI；(2) 最膚淺的使用方式最容易被測量——員工為了 KPI 會做「交易式」使用（問一題得一答），這種使用產不出真正的生產力；(3) 把 AI 定位成考核工具，員工就會用防禦心態面對它——Forrester 研究指出，當員工感知 AI 為「威脅」而非「增強」時，會採用最低限度策略，甚至因誤用 AI 輸出造成負面生產力。

這三個原因每一個都有數據支撐。

地雷一：員工還沒準備好。

Gallup 在 2026 年對 22,000 名員工做的勞動力調查顯示，即便企業大規模部署 AI 工具，真正每天在工作中使用 AI 的員工只有大約 12%。Forrester 的 AIQ 指數（衡量員工 AI 素養的指標）顯示，懂「與 AI 對話的設計能力」的員工比例，一年內從 22% 進步到 26%——整整一年，只提升 4 個百分點（Forrester, “AIQ 2.0 Report”, 2026）。

這兩個數字疊在一起代表什麼？你把 AI 使用率納入 KPI，等於在懲罰那 88% 還沒學會的員工。他們會用最低限度的方式應付，只為了分數不難看。McKinsey 2025 年的《State of AI》報告也呼應這一點：全球 88% 企業已在某個職能導入 AI，但不到 5% 的企業認為 AI 已產生可量化的盈餘貢獻——「中間多數人的猶豫（the middle hesitates）」正在拖住整個轉型。

地雷二：最膚淺的使用方式，最容易被測量。

Chief Learning Officer 2026 年的分析〈From AI Access to Workforce Readiness〉講得很直接：大多數員工目前使用 AI 的方式是「交易式」的——問問題、得答案、結案。這種單步心理模型非常淺薄，產生不了真正的生產力提升。

當 AI 使用率變成 KPI，最容易被衡量、員工最容易做到的，就是這種交易式使用。你用 KPI 獎勵了最沒價值的使用方式。Josh Bersin 對此下了一個判斷：「只放大使用規模而不重新設計學習方式，是在放大噪音，不是放大能力。」

地雷三：當 AI 被定位成考核工具，員工會用防禦心態面對它。

Forrester 2026 年的報告點出一個關鍵心理現象：員工感知 AI 為「威脅」還是「增強工具」，會產生完全不同的行為。感知為威脅時，員工會放棄使用，或者照抄 AI 出錯的輸出，然後還得花時間回頭修——原本想省時間，最後變成做兩份工。Forrester 的建議很清楚——領導層若對 AI 的意圖模糊不清，會顯著減慢員工的採用速度、技能建立與應變能力。

Duolingo 撤回的那一刻，員工眼中的 AI 已經從「幫手」變成「打分的人」。所有把 AI 綁進考績的公司都會碰到這個相同的陷阱。

這件事還有一個 HR 常忽略的副作用：當員工被逼著用，他們不會先問「這個資料能不能丟進 ChatGPT」。你的 KPI 設計，同時也在設計一條資安風險——把 AI 綁進考績，等於鼓勵員工把客戶資料、薪資檔案、法務合約丟進公開模型，只為了讓使用紀錄好看。

重設 KPI 的時候，順手把資料使用界線一起講清楚，比事後補救便宜很多。最簡單的紅線三條：

1. 個資與薪資：任何含姓名、身分證、員工編號、薪酬的資料，只能用企業內部封閉模型，不能貼進公開 AI。

2. 客戶合約與未公開財務：同上。違反直接記警告。

3. 使用紀錄可稽核：哪個員工在哪天用哪個模型處理過哪類資料，公司必須看得到。員工要事先簽這一條才能用。

這三條貼在員工手冊裡，比任何 KPI 表都有效。因為它把「責任邊界」講清楚了——員工知道什麼可以做、什麼不能做，就不會為了分數亂貼資料。

H2-4：那正確的推法是什麼？，從「你有沒有用」到「你的工作有沒有變好」

Josh Bersin 的研究團隊記錄過一個值得看的案例。

一家擁有數千名員工的大型受規管企業，沒有把 AI 納入 KPI——他們打造了一個 60 天的 AI 模擬練習環境，讓員工在真實工作流裡練習用 AI 解決問題，有教練提供即時回饋，這 60 天的表現明確不計入考績。

60 天後的測量結果很有意思：自評「高自信使用 AI」的員工比例顯著上升，「低自信」員工的比例明顯下降（Chief Learning Officer, “From AI Access to Workforce Readiness” Learn-Practice-Perform Framework, 2026）。

這是員工信心分數的變化，不是營收或工時的硬數字——但它解釋了一件硬的事情為什麼會發生：Klarna 2024 年宣布他們的 AI 客服助手相當於 700 名全職客服的工作量，每年預期為公司帶來 4,000 萬美元的成本節省（Klarna IR Report, 2024）。他們做對的一件事是：從頭到尾沒把「用不用 AI」列進客服員工的績效 KPI——他們測的是客訴率、回覆時間、客戶滿意度。當員工信心建立起來，硬數字自然會從工作流裡長出來。

HBR 在 2026 年 4 月的文章〈When Creating an AI Strategy, Don’t Overlook Employee Perception〉總結得很到位：AI 策略成功的關鍵在員工對這件事的「感知」，不在技術部署的規模。員工感覺 AI 是來幫他們的，他們會主動用、深度用、持續用。員工感覺 AI 是來評量他們或取代他們的，推得越用力，反彈越大。

這是兩條路線的本質差異：「強制採用」vs.「結果導向」。 Duolingo 原本走的是前者，撤回後正在嘗試後者。Meta 和 McKinsey 一直走的就是後者——他們看的是工作成果的變化；員工按了幾次 Copilot（微軟的 AI 助手工具），從來沒進他們的儀表板。

H2-5：下週一可以做的一件事，把績效考核裡的「AI」兩個字拿掉

如果你公司這一季正在設計 AI 採用 KPI——停一下。

第一步：換一個問法

原本的問法：

「這個員工／部門，有沒有用 AI？用了幾次？用了哪些工具？」

換成：

「這個員工／部門，這季有哪個工作流程因為 AI 變快了／變準了／變好了？」

這兩個問題問起來差不多，答案會完全不同。前者，員工會打開 AI 用法紀錄、把數字做好看；後者，員工要真的講出一個具體的工作成果——客服的首次回覆時間從 3 小時縮短到 20 分鐘、市場分析報告的第一版從 5 天縮到 4 小時、新產品上線前的使用情境測試多跑 3 倍。

第二步：設計一個 30-60-90 天試點框架

如果你要認真試一次，從一個部門開始：

第 0–30 天｜量現況。 選一個工作流最明確的單位（客服／法務／市場分析都好），先測目前的基準線（首回覆時間、報告產出週期、錯誤率）。這一個月不導入新工具，單純拍下「沒 AI 之前」的樣子。
第 31–60 天｜導入＋陪跑。 加一位內部教練（不是 IT，是業務懂的人），每週一次案例回饋。這 60 天明確不計入考績——讓員工敢試、敢錯、敢問笨問題。
第 61–90 天｜測後測。 回到基準線，看指標變化。變好的做法，寫成內部 SOP 推到其他部門。

這個框架的核心是：不一次推全公司，是一個部門把一件事做深。90 天後你手上的不是一張漂亮的 KPI 儀表板，是一個可以複製的成功案例。複製比宣示有力一百倍。

什麼時候你該停下來？ 三個失敗訊號：(1) 教練每週帶的案例全是抱怨，沒人真的產出改善；(2) 60 天中段仍看不到基準線指標往好的方向移動 3% 以上；(3) 員工私下開始流傳「這又是另一個 KPI 騙局」。任何一條出現，先暫停試點、回頭檢視是「工具選錯」還是「流程選錯」。繼續硬推只會複製 Duolingo 的循環。

回頭看台灣，這件事特別容易踩是因為結構問題——多數公司的 KPI 文化繼承自製造業的 OEE（設備綜合效率）邏輯，預設「可測量 = 可管理」。但 AI 使用的價值不線性地和使用次數相關。把製造業的測量邏輯套在知識工作上，就會出現 Duolingo 那種 KPI。這不是 HR 的錯，是整個台灣企業的管理慣性還沒追上知識工作的本質。

第三步：用身份調整語氣

如果你是 HR—— 下次績效制度會議，帶 Duolingo 這個案例進去當反例。帶的時候語氣要收好：這個案例是為了說「我們要推 AI，但不能用 Duolingo 那種方式推」。避開「所以我們不能推 AI」的用語——這會被誤讀成你在抗拒轉型，老闆會以為你在擋路。

如果你是數位轉型推手—— 下次跟老闆討論「怎麼讓大家都用起來」時，把對話從「設一個使用率 KPI」拉到「我們每個部門每季交一個『因為 AI 變好的工作流程』報告，加上一個 90 天試點」。對老闆來說成本一樣（都是要員工動起來），對員工來說意義完全不同。

如果你是夾在中間的執行層，沒位子發言—— 會議前做一張 A4，左欄 Duolingo 一年的時間軸，右欄 Meta/McKinsey 的做法，中間一句問題：「我們的指標，比較像左邊，還是右邊？」這張紙的語氣是「來看個案例」，避開了「我有意見」的對立感。

最後一句話

Duolingo 這一年最有意思的地方，在 Luis von Ahn 公開撤回。他本可以悄悄改，但他選擇公開承認「it did not fit」。這對所有正在推 AI 的企業主管，算一個很少見的禮物：一個用自己公司當失敗案例的 CEO。

AI 這波浪潮裡最昂貴的錯誤，往往發生在最努力的那家公司身上——推得太用力，反而把員工推走。Duolingo 已經公開走完那條路一次，你可以直接從他那張地圖開始。

AI 採用率是虛榮指標，工作成果才是真 KPI。

這一直是智谷相信的事：企業 AI 導入是一個組織和技術共同找節奏的過程。節奏對了，員工會主動往前；節奏錯了，任何 KPI 都推不動。

如果你的公司正在設計 AI 採用的管理機制——還沒送出去之前，歡迎找我們聊聊這個設計。

關於作者

智谷網絡（Kvalley Network）自 1996 年創立，專注企業 AI 轉型與中高階主管培訓，累計服務 3,000+ 家企業、75,000+ 小時訓練執行時數、年度訓練 30,000+ 人次，合作講師夥伴超過 400 位。代表客戶包含錸德集團、智易科技、台光電子、亞洲水泥、陽明海運等上市企業。本文由智谷內容團隊整理，研究與新聞來源包含：Fortune〈I’m not going to force you: Duolingo CEO backs off〉（2026-04-13）；TechRadar〈It did not fit〉（2026-04-14）；Gallup《2026 Workforce Survey》（22,000 員工）；Forrester《AIQ 2.0 Report》（2026）；McKinsey《State of AI 2025》；Harvard Business Review〈When Creating an AI Strategy, Don’t Overlook Employee Perception〉（2026-04）；Chief Learning Officer〈From AI Access to Workforce Readiness〉（2026-03）；Klarna Investor Relations Report（2024）。

低壓力軟收——「如果你的公司正在設計 AI 採用的管理機制……歡迎找我們聊聊」

智谷網絡（Kvalley Network）自 1996 年創立，專注企業 AI 轉型與中高階主管培訓，累計服務 3,000+ 家企業、75,000+ 小時訓練執行時數、年度訓練 30,000+ 人次。

Duolingo 把「有沒有用 AI」寫進考績，員工集體反彈後撤回，你的公司正準備做一樣的事嗎？

H2-1：一封 LinkedIn 貼文，一年後的公開回頭

H2-2：同一時間，Meta、McKinsey、NVIDIA 在走反方向

H2-3：為什麼「把 AI 綁進 KPI」會失敗，三個藏在數據裡的原因

H2-4：那正確的推法是什麼？，從「你有沒有用」到「你的工作有沒有變好」

H2-5：下週一可以做的一件事，把績效考核裡的「AI」兩個字拿掉

第一步：換一個問法

第二步：設計一個 30-60-90 天試點框架

第三步：用身份調整語氣

最後一句話

推薦精選文章

發佈留言取消回覆

H2-1：一封 LinkedIn 貼文，一年後的公開回頭

H2-2：同一時間，Meta、McKinsey、NVIDIA 在走反方向

H2-3：為什麼「把 AI 綁進 KPI」會失敗，三個藏在數據裡的原因

H2-4：那正確的推法是什麼？，從「你有沒有用」到「你的工作有沒有變好」

H2-5：下週一可以做的一件事，把績效考核裡的「AI」兩個字拿掉

第一步：換一個問法

第二步：設計一個 30-60-90 天試點框架

第三步：用身份調整語氣

最後一句話

推薦精選文章

發佈留言 取消回覆

發佈留言取消回覆