Duolingo CEO 把「AI 使用率」列入績效考核,員工集體反彈,一年後撤回。同一時間 Meta 和 McKinsey 卻在加碼。這中間的差別,決定了企業 AI 導入會推得動、還是推到員工跳船。

這幾週,老闆又在主管會議上丟了那句話:「我們要怎麼追蹤員工有沒有在用 AI?

你點頭,先把話接住——「我去研究一下 KPI 怎麼設計」。回到位子上,你看著那份空白的績效制度草案,心裡有一個聲音越來越大:這件事設計錯了,整個 HR 部門要背鍋。

你想得到會發生什麼:使用率被打分 → 員工為了分數做表演性的 AI 使用 → 工作產出沒變好 → 部門主管抱怨 HR 的指標「很假」→ 一年後你被要求「重新設計一次」。你甚至不用真的跑過,就能預見這個循環。

你也想過直接跟老闆說「別這樣推」,但沒有彈藥。一個來自 HR 的「別這樣」,在轉型壓力下聽起來就像抗拒——你需要的是一個別人走過一次、並且公開認錯的案例。

你桌上那份 KPI 草案,可能就是 Duolingo 一年前走過的那條路。你可以看它從頭到尾只花十分鐘,不用自己再走一次。

H2-1:一封 LinkedIn 貼文,一年後的公開回頭

2025 年 4 月 28 日,Duolingo 的執行長 Luis von Ahn 發了一封公司內部信,然後把這封信公開貼到 LinkedIn。

信上寫著五件事:從現在起,Duolingo 將是一家「AI-first」的公司;逐步停止使用約聘人力處理 AI 能做的工作;新員工錄用時會檢視 AI 運用能力;AI 將進入全員會議的常態議程;而且——員工的績效考核,將會納入「AI 使用情況」這一項

這封信在 LinkedIn 上馬上爆開。有人拍手,說這是新時代的管理者。更多留言的語氣非常冷——Duolingo 自己的員工匿名跳出來說「你要我用 AI,還是要我把事做好?這兩件事不一定是同一件。」重度使用者在 TikTok 拍影片示範「刪掉 Duolingo App」。用戶的訊號很清楚:他們不接受一個用考績逼員工用 AI 的公司。

整整一年後,2026 年 4 月 10 日,Luis von Ahn 在一場媒體訪談裡做出公開更正(Fortune: “I’m not going to force you — Duolingo CEO backs off”,2026-04-13;TechRadar: “It did not fit”,2026-04-14):

「我不會逼任何人用 AI。」

「我們之前推的那件事,在某些情況下,並不合適(it did not fit)。」

一年多的時間,從「AI-first」到「不會逼你」,這家公司把整個決策過程公開留在檯面上。值得看的地方不在它做錯了什麼——在它走完的那一整圈循環,所有正在設計相同 KPI 的公司,都會被同一個機制推到同一個終點。

H2-2:同一時間,Meta、McKinsey、NVIDIA 在走反方向

Duolingo 撤回的那週,科技媒體的頭條很有意思——好幾家大公司正在做看起來相反的事。

Meta 的工程團隊被要求使用內部 AI 輔助寫程式,使用率被追蹤,但追蹤結果只進團隊的工作流改善報告,不進個人績效檔案。McKinsey 內部員工的 AI 使用寫入顧問技能路徑培訓,而不是績效指標。NVIDIA 把 AI 工具的操作能力列為新進員工報到訓練的必修,用在入職能力驗證,不用在年度考核。

乍看之下這三家和 Duolingo 在對打。到底誰是對的?

答案是兩邊都有道理,但關鍵差別在他們「管」的是不同的東西

Duolingo 原本的做法:把 AI 使用頻率納入考績。你今天用了幾次 AI?用了哪個模型?有沒有用?這些變成員工績效的評估維度。

Meta 和 McKinsey 的做法:把 AI 融入工作成果的評估。你的專案完成速度有沒有提升?你的產出品質有沒有進步?你有沒有學會這個職能的新標準工作流?AI 在這套邏輯裡只是背景工具,被盯的永遠是工作成果。

這兩種做法聽起來差一點點,結果天差地遠。前者會讓員工把「使用 AI」變成一種表演。後者會讓員工真的去問「我的工作還能用 AI 再變好多少?」

H2-3:為什麼「把 AI 綁進 KPI」會失敗,三個藏在數據裡的原因

Q:為什麼明明員工都知道要用 AI,績效綁 AI 使用率卻失敗?

三個結構性原因:(1) 員工還沒準備好——Gallup 2026 年調查 22,000 人顯示,僅 12% 員工每天在工作中用 AI;(2) 最膚淺的使用方式最容易被測量——員工為了 KPI 會做「交易式」使用(問一題得一答),這種使用產不出真正的生產力;(3) 把 AI 定位成考核工具,員工就會用防禦心態面對它——Forrester 研究指出,當員工感知 AI 為「威脅」而非「增強」時,會採用最低限度策略,甚至因誤用 AI 輸出造成負面生產力

這三個原因每一個都有數據支撐。

地雷一:員工還沒準備好。

Gallup 在 2026 年對 22,000 名員工做的勞動力調查顯示,即便企業大規模部署 AI 工具,真正每天在工作中使用 AI 的員工只有大約 12%。Forrester 的 AIQ 指數(衡量員工 AI 素養的指標)顯示,懂「與 AI 對話的設計能力」的員工比例,一年內從 22% 進步到 26%——整整一年,只提升 4 個百分點(Forrester, “AIQ 2.0 Report”, 2026)。

這兩個數字疊在一起代表什麼?你把 AI 使用率納入 KPI,等於在懲罰那 88% 還沒學會的員工。他們會用最低限度的方式應付,只為了分數不難看。McKinsey 2025 年的《State of AI》報告也呼應這一點:全球 88% 企業已在某個職能導入 AI,但不到 5% 的企業認為 AI 已產生可量化的盈餘貢獻——「中間多數人的猶豫(the middle hesitates)」正在拖住整個轉型。

地雷二:最膚淺的使用方式,最容易被測量。

Chief Learning Officer 2026 年的分析〈From AI Access to Workforce Readiness〉講得很直接:大多數員工目前使用 AI 的方式是「交易式」的——問問題、得答案、結案。這種單步心理模型非常淺薄,產生不了真正的生產力提升。

當 AI 使用率變成 KPI,最容易被衡量、員工最容易做到的,就是這種交易式使用。你用 KPI 獎勵了最沒價值的使用方式。Josh Bersin 對此下了一個判斷:「只放大使用規模而不重新設計學習方式,是在放大噪音,不是放大能力。」

地雷三:當 AI 被定位成考核工具,員工會用防禦心態面對它。

Forrester 2026 年的報告點出一個關鍵心理現象:員工感知 AI 為「威脅」還是「增強工具」,會產生完全不同的行為。感知為威脅時,員工會放棄使用,或者照抄 AI 出錯的輸出,然後還得花時間回頭修——原本想省時間,最後變成做兩份工。Forrester 的建議很清楚——領導層若對 AI 的意圖模糊不清,會顯著減慢員工的採用速度、技能建立與應變能力。

Duolingo 撤回的那一刻,員工眼中的 AI 已經從「幫手」變成「打分的人」。所有把 AI 綁進考績的公司都會碰到這個相同的陷阱。

這件事還有一個 HR 常忽略的副作用:當員工被逼著用,他們不會先問「這個資料能不能丟進 ChatGPT」。你的 KPI 設計,同時也在設計一條資安風險——把 AI 綁進考績,等於鼓勵員工把客戶資料、薪資檔案、法務合約丟進公開模型,只為了讓使用紀錄好看。

重設 KPI 的時候,順手把資料使用界線一起講清楚,比事後補救便宜很多。最簡單的紅線三條:

1. 個資與薪資:任何含姓名、身分證、員工編號、薪酬的資料,只能用企業內部封閉模型,不能貼進公開 AI。

2. 客戶合約與未公開財務:同上。違反直接記警告。

3. 使用紀錄可稽核:哪個員工在哪天用哪個模型處理過哪類資料,公司必須看得到。員工要事先簽這一條才能用。

這三條貼在員工手冊裡,比任何 KPI 表都有效。因為它把「責任邊界」講清楚了——員工知道什麼可以做、什麼不能做,就不會為了分數亂貼資料。

H2-4:那正確的推法是什麼?,從「你有沒有用」到「你的工作有沒有變好」

Josh Bersin 的研究團隊記錄過一個值得看的案例。

一家擁有數千名員工的大型受規管企業,沒有把 AI 納入 KPI——他們打造了一個 60 天的 AI 模擬練習環境,讓員工在真實工作流裡練習用 AI 解決問題,有教練提供即時回饋,這 60 天的表現明確不計入考績

60 天後的測量結果很有意思:自評「高自信使用 AI」的員工比例顯著上升,「低自信」員工的比例明顯下降Chief Learning Officer, “From AI Access to Workforce Readiness” Learn-Practice-Perform Framework, 2026)。

這是員工信心分數的變化,不是營收或工時的硬數字——但它解釋了一件硬的事情為什麼會發生:Klarna 2024 年宣布他們的 AI 客服助手相當於 700 名全職客服的工作量,每年預期為公司帶來 4,000 萬美元的成本節省(Klarna IR Report, 2024)。他們做對的一件事是:從頭到尾沒把「用不用 AI」列進客服員工的績效 KPI——他們測的是客訴率、回覆時間、客戶滿意度。當員工信心建立起來,硬數字自然會從工作流裡長出來。

HBR 在 2026 年 4 月的文章〈When Creating an AI Strategy, Don’t Overlook Employee Perception〉總結得很到位:AI 策略成功的關鍵在員工對這件事的「感知」,不在技術部署的規模。員工感覺 AI 是來幫他們的,他們會主動用、深度用、持續用。員工感覺 AI 是來評量他們或取代他們的,推得越用力,反彈越大。

這是兩條路線的本質差異:「強制採用」vs.「結果導向」。 Duolingo 原本走的是前者,撤回後正在嘗試後者。Meta 和 McKinsey 一直走的就是後者——他們看的是工作成果的變化;員工按了幾次 Copilot(微軟的 AI 助手工具),從來沒進他們的儀表板。

H2-5:下週一可以做的一件事,把績效考核裡的「AI」兩個字拿掉

如果你公司這一季正在設計 AI 採用 KPI——停一下。

第一步:換一個問法

原本的問法:

「這個員工/部門,有沒有用 AI?用了幾次?用了哪些工具?」

換成:

「這個員工/部門,這季有哪個工作流程因為 AI 變快了/變準了/變好了?」

這兩個問題問起來差不多,答案會完全不同。前者,員工會打開 AI 用法紀錄、把數字做好看;後者,員工要真的講出一個具體的工作成果——客服的首次回覆時間從 3 小時縮短到 20 分鐘、市場分析報告的第一版從 5 天縮到 4 小時、新產品上線前的使用情境測試多跑 3 倍。

第二步:設計一個 30-60-90 天試點框架

如果你要認真試一次,從一個部門開始:

  • 第 0–30 天|量現況。 選一個工作流最明確的單位(客服/法務/市場分析都好),先測目前的基準線(首回覆時間、報告產出週期、錯誤率)。這一個月不導入新工具,單純拍下「沒 AI 之前」的樣子。
  • 第 31–60 天|導入+陪跑。 加一位內部教練(不是 IT,是業務懂的人),每週一次案例回饋。這 60 天明確不計入考績——讓員工敢試、敢錯、敢問笨問題。
  • 第 61–90 天|測後測。 回到基準線,看指標變化。變好的做法,寫成內部 SOP 推到其他部門。

這個框架的核心是:不一次推全公司,是一個部門把一件事做深。90 天後你手上的不是一張漂亮的 KPI 儀表板,是一個可以複製的成功案例。複製比宣示有力一百倍。

什麼時候你該停下來? 三個失敗訊號:(1) 教練每週帶的案例全是抱怨,沒人真的產出改善;(2) 60 天中段仍看不到基準線指標往好的方向移動 3% 以上;(3) 員工私下開始流傳「這又是另一個 KPI 騙局」。任何一條出現,先暫停試點、回頭檢視是「工具選錯」還是「流程選錯」。繼續硬推只會複製 Duolingo 的循環。

回頭看台灣,這件事特別容易踩是因為結構問題——多數公司的 KPI 文化繼承自製造業的 OEE(設備綜合效率)邏輯,預設「可測量 = 可管理」。但 AI 使用的價值不線性地和使用次數相關。把製造業的測量邏輯套在知識工作上,就會出現 Duolingo 那種 KPI。這不是 HR 的錯,是整個台灣企業的管理慣性還沒追上知識工作的本質。

第三步:用身份調整語氣

如果你是 HR—— 下次績效制度會議,帶 Duolingo 這個案例進去當反例。帶的時候語氣要收好:這個案例是為了說「我們要推 AI,但不能用 Duolingo 那種方式推」。避開「所以我們不能推 AI」的用語——這會被誤讀成你在抗拒轉型,老闆會以為你在擋路。

如果你是數位轉型推手—— 下次跟老闆討論「怎麼讓大家都用起來」時,把對話從「設一個使用率 KPI」拉到「我們每個部門每季交一個『因為 AI 變好的工作流程』報告,加上一個 90 天試點」。對老闆來說成本一樣(都是要員工動起來),對員工來說意義完全不同。

如果你是夾在中間的執行層,沒位子發言—— 會議前做一張 A4,左欄 Duolingo 一年的時間軸,右欄 Meta/McKinsey 的做法,中間一句問題:「我們的指標,比較像左邊,還是右邊?」這張紙的語氣是「來看個案例」,避開了「我有意見」的對立感。

最後一句話

Duolingo 這一年最有意思的地方,在 Luis von Ahn 公開撤回。他本可以悄悄改,但他選擇公開承認「it did not fit」。這對所有正在推 AI 的企業主管,算一個很少見的禮物:一個用自己公司當失敗案例的 CEO。

AI 這波浪潮裡最昂貴的錯誤,往往發生在最努力的那家公司身上——推得太用力,反而把員工推走。Duolingo 已經公開走完那條路一次,你可以直接從他那張地圖開始。

AI 採用率是虛榮指標,工作成果才是真 KPI。

這一直是智谷相信的事:企業 AI 導入是一個組織和技術共同找節奏的過程。節奏對了,員工會主動往前;節奏錯了,任何 KPI 都推不動。

如果你的公司正在設計 AI 採用的管理機制——還沒送出去之前,歡迎找我們聊聊這個設計。

關於作者

智谷網絡(Kvalley Network)自 1996 年創立,專注企業 AI 轉型與中高階主管培訓,累計服務 3,000+ 家企業75,000+ 小時訓練執行時數、年度訓練 30,000+ 人次,合作講師夥伴超過 400 位。代表客戶包含錸德集團、智易科技、台光電子、亞洲水泥、陽明海運等上市企業。本文由智谷內容團隊整理,研究與新聞來源包含:Fortune〈I’m not going to force you: Duolingo CEO backs off〉(2026-04-13);TechRadar〈It did not fit〉(2026-04-14);Gallup《2026 Workforce Survey》(22,000 員工);Forrester《AIQ 2.0 Report》(2026);McKinsey《State of AI 2025》;Harvard Business Review〈When Creating an AI Strategy, Don’t Overlook Employee Perception〉(2026-04);Chief Learning Officer〈From AI Access to Workforce Readiness〉(2026-03);Klarna Investor Relations Report(2024)。

低壓力軟收——「如果你的公司正在設計 AI 採用的管理機制……歡迎找我們聊聊」

推薦精選文章

📚 升官即地獄:當 72% 的 Z 世代不想升,企業的接班計畫卡在哪一階?

📚 面對 AI 中階焦慮,Lyft CEO David Risher 給的是另一條路:重新發明這個位置

更多企業 AI 培訓服務:https://www.kvalley.biz/tcservice/digital/

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

This field is required.

This field is required.