Duolingo CEO 把「AI 使用率」列入績效考核,員工集體反彈,一年後撤回。同一時間 Meta 和 McKinsey 卻在加碼,這中間的差別,決定了企業 AI 導入會推得動、還是推到員工跳船。

這幾週,老闆又在主管會議上丟了那句話:「我們要怎麼追蹤員工有沒有在用 AI?」

身為 HR 的你,先把話接住:「我去研究一下 KPI 怎麼設計」。回到位子上,你看著那份空白的績效制度草案,心裡有一個聲音越來越大:這件事設計錯了,整個 HR 部門要背鍋。

你想得到會發生什麼:使用率被打分 → 員工為了分數做表演性的 AI 使用 → 工作產出沒變好 → 部門主管抱怨 HR 的指標「很假」→ 一年後你被要求「重新設計一次」。你甚至不用真的跑過,就能預見這個循環。」

你也想過直接跟老闆說「別這樣推」,但沒有彈藥。一個來自 HR 的「別這樣」,在轉型壓力下聽起來就像抗拒,你需要的是一個別人走過一次、並且公開認錯的案例。

你桌上那份 KPI 草案,可能就是 Duolingo 一年前走過的那條路。你可以看它從頭到尾只花十分鐘,不用自己再走一次。

一、一封 LinkedIn 貼文,一年後的公開回頭

2025 年 4 月 28 日,Duolingo 的執行長 Luis von Ahn 發了一封公司內部信,然後把這封信公開貼到 LinkedIn。

信上寫著五件事:從現在起,Duolingo 將是一家「AI-first」的公司;逐步停止使用約聘人力處理 AI 能做的工作;新員工錄用時會檢視 AI 運用能力;AI 將進入全員會議的常態議程;而且員工的績效考核,將會納入「AI 使用情況」這一項

這封信在 LinkedIn 上馬上爆開,有人拍手,說這是新時代的管理者,更多留言的語氣非常冷。Duolingo 自己的員工匿名跳出來說「你要我用 AI,還是要我把事做好?這兩件事不一定是同一件。」重度使用者在 TikTok 拍影片示範「刪掉 Duolingo App」。用戶的訊號很清楚:他們不接受一個用考績逼員工用 AI 的公司

整整一年後,2026 年 4 月 10 日,Luis von Ahn 在一場媒體訪談裡做出公開更正:「我不會逼任何人用 AI。」、「我們之前推的那件事,在某些情況下,並不合適(it did not fit)。」

一年多的時間,從「AI-first」到「不會逼你」,這家公司把整個決策過程公開留在檯面上。值得看的地方不在它做錯了什麼——在它走完的那一整圈循環,所有正在設計相同 KPI 的公司,都會被同一個機制推到同一個終點。

二、同一時間,Meta、McKinsey、NVIDIA 在走反方向


Duolingo 撤回的那週,科技媒體的頭條很有意思:好幾家大公司正在做看起來相反的事

Meta 的工程團隊被要求使用內部 AI 輔助寫程式,使用率被追蹤,但追蹤結果只進團隊的工作流改善報告,不進個人績效檔案。McKinsey 內部員工的 AI 使用寫入顧問技能路徑培訓,而不是績效指標。NVIDIA 把 AI 工具的操作能力列為新進員工報到訓練的必修,用在入職能力驗證,不用在年度考核。

乍看之下這三家和 Duolingo 在對打。到底誰是對的?答案是兩邊都有道理,但關鍵差別在他們「管」的是不同的東西

Duolingo 原本的做法:把 AI 使用頻率納入考績。你今天用了幾次 AI?用了哪個模型?有沒有用?這些變成員工績效的評估維度。

Meta 和 McKinsey 的做法:把 AI 融入工作成果的評估。你的專案完成速度有沒有提升?你的產出品質有沒有進步?你有沒有學會這個職能的新標準工作流?AI 在這套邏輯裡只是背景工具,被盯的永遠是工作成果。

這兩種做法聽起來差一點點,結果天差地遠。前者會讓員工把「使用 AI」變成一種表演;後者會讓員工真的去問「我的工作還能用 AI 再變好多少?」

三、為什麼「把 AI 綁進 KPI」會失敗?三個藏在數據裡的原因

Q:為什麼明明員工都知道要用 AI,績效綁 AI 使用率卻失敗?

三個結構性原因,每一個都有數據支撐:

地雷一:員工還沒準備好

Gallup 在 2026 年對 22,000 名員工做的勞動力調查顯示,即便企業大規模部署 AI 工具,真正每天在工作中使用 AI 的員工只有大約 12%。Forrester 的 AIQ 指數(衡量員工 AI 素養的指標)顯示,懂「與 AI 對話的設計能力」的員工比例,一年內從 22% 進步到 26%,整整一年,只提升 4 個百分點(Forrester, “AIQ 2.0 Report”, 2026)。

這兩個數字疊在一起代表什麼?你把 AI 使用率納入 KPI,等於在懲罰那 88% 還沒學會的員工,他們會用最低限度的方式應付,只為了分數不難看。McKinsey 2025 年的《State of AI》報告也呼應這一點:全球 88% 企業已在某個職能導入 AI,但不到 5% 的企業認為 AI 已產生可量化的盈餘貢獻——「中間多數人的猶豫(the middle hesitates)」正在拖住整個轉型。

    地雷二:最膚淺的使用方式,最容易被測量

    Chief Learning Officer 2026 年的分析〈From AI Access to Workforce Readiness〉講得很直接:大多數員工目前使用 AI 的方式是「交易式」的,問問題、得答案、結案。這種單步心理模型非常淺薄,產生不了真正的生產力提升

    當 AI 使用率變成 KPI,最容易被衡量、員工最容易做到的,就是這種交易式使用。你用 KPI 獎勵了最沒價值的使用方式。Josh Bersin 對此下了一個判斷:「只放大使用規模而不重新設計學習方式,是在放大噪音,不是放大能力。」

    地雷三:當 AI 被定位成考核工具,員工會用防禦心態面對它

    Forrester 2026 年的報告點出一個關鍵心理現象:員工感知 AI 為「威脅」還是「增強工具」,會產生完全不同的行為。感知為威脅時,員工會放棄使用,或者照抄 AI 出錯的輸出,然後還得花時間回頭修——原本想省時間,最後變成做兩份工

    Forrester 的建議很清楚:領導層若對 AI 的意圖模糊不清,會顯著減慢員工的採用速度、技能建立與應變能力。Duolingo 撤回的那一刻,員工眼中的 AI 已經從「幫手」變成「打分的人」。所有把 AI 綁進考績的公司都會碰到這個相同的陷阱。

    這件事還有一個 HR 常忽略的副作用:當員工被逼著用,他們不會先問「這個資料能不能丟進 ChatGPT」。你的 KPI 設計,同時也在設計一條資安風險——把 AI 綁進考績,等於鼓勵員工把客戶資料、薪資檔案、法務合約丟進公開模型,只為了讓使用紀錄好看。

    重設 KPI 的時候,順手把資料使用界線一起講清楚,比事後補救便宜很多,最簡單的紅線三條:

    1. 個資與薪資:任何含姓名、身分證、員工編號、薪酬的資料,只能用企業內部封閉模型,不能貼進公開 AI。
    2. 客戶合約與未公開財務:同上,違反直接記警告。
    3. 使用紀錄可稽核:哪個員工在哪天用哪個模型處理過哪類資料,公司必須看得到。員工要事先簽這一條才能用

    這三條貼在員工手冊裡,比任何 KPI 表都有效,因為它把「責任邊界」講清楚了。員工知道什麼可以做、什麼不能做,就不會為了分數亂貼資料。

    四、那正確的推法是什麼?從「你有沒有用」到「你的工作有沒有變好」

    Josh Bersin 的研究團隊記錄過一個值得看的案例。

    一家擁有數千名員工的大型受規管企業,沒有把 AI 納入 KPI。他們打造了一個 60 天的 AI 模擬練習環境,讓員工在真實工作流裡練習用 AI 解決問題,有教練提供即時回饋,這 60 天的表現明確不計入考績。

    60 天後的測量結果很有意思:自評「高自信使用 AI」的員工增加了 4 倍,「低自信」的員工減少了 2 倍(Josh Bersin Academy, “Practice-Perform-Learn Framework Case Study”, 2026)。

    這是員工信心分數的變化,不是營收或工時的硬數字,但它解釋了一件硬的事情為什麼會發生:Klarna 2024 年宣布他們的 AI 客服助手相當於 700 名全職客服的工作量,每年預期為公司帶來 4,000 萬美元的成本節省(Klarna IR Report, 2024)。他們做對的一件事是:從頭到尾沒把「用不用 AI」列進客服員工的績效 KPI——他們測的是客訴率、回覆時間、客戶滿意度。當員工信心建立起來,硬數字自然會從工作流裡長出來

    HBR 在 2026 年 4 月的文章〈When Creating an AI Strategy, Don’t Overlook Employee Perception〉總結得很到位:AI 策略成功的關鍵在員工對這件事的「感知」,不在技術部署的規模。員工感覺 AI 是來幫他們的,他們會主動用、深度用、持續用,員工感覺 AI 是來評量他們或取代他們的,推得越用力,反彈越大。

    這是兩條路線的本質差異:「強制採用」vs.「結果導向」 Duolingo 原本走的是前者,撤回後正在嘗試後者。Meta 和 McKinsey 一直走的就是後者——他們看的是工作成果的變化;員工按了幾次 Copilot(微軟的 AI 助手工具),從來沒進他們的儀表板。

    五、下週一可以做的一件事:把績效考核裡的「AI」兩個字拿掉

    如果你公司這一季正在設計 AI 採用 KPI,停一下。

    第一步:換一個問法

    原本的問法:「這個員工/部門,有沒有用 AI?用了幾次?用了哪些工具?」

    換成:「這個員工/部門,這季有哪個工作流程因為 AI 變快了/變準了/變好了?」

    這兩個問題問起來差不多,答案會完全不同。前者,員工會打開 AI 用法紀錄、把數字做好看;後者,員工要真的講出一個具體的工作成果:客服的首次回覆時間從 3 小時縮短到 20 分鐘、市場分析報告的第一版從 5 天縮到 4 小時、新產品上線前的使用情境測試多跑 3 倍。

    第二步:設計一個 30-60-90 天試點框架

    如果你要認真試一次,從一個部門開始:

    第 0–30 天:量現況

    選一個工作流最明確的單位(客服/法務/市場分析都好),先測目前的基準線(首回覆時間、報告產出週期、錯誤率)。這一個月不導入新工具,單純拍下「沒 AI 之前」的樣子。

    第 31–60 天:導入+陪跑

    加一位內部教練(不是 IT,是業務懂的人),每週一次案例回饋。這 60 天明確不計入考績,讓員工敢試、敢錯、敢問笨問題。

    第 61–90 天:測後測

    回到基準線,看指標變化,變好的做法,寫成內部 SOP 推到其他部門。

    這個框架的核心是:不一次推全公司,是一個部門把一件事做深。90 天後你手上的不是一張漂亮的 KPI 儀表板,是一個可以複製的成功案例,複製比宣示有力一百倍。

    什麼時候你該停下來?

    三個失敗訊號:

    1. 教練每週帶的案例全是抱怨,沒人真的產出改善
    2. 60 天中段仍看不到基準線指標往好的方向移動 3% 以上
    3. 員工私下開始流傳「這又是另一個 KPI 騙局」

    任何一條出現,先暫停試點、回頭檢視是「工具選錯」還是「流程選錯」,繼續硬推只會複製 Duolingo 的循環。

    回頭看台灣,這件事特別容易踩是因為結構問題:多數公司的 KPI 文化繼承自製造業的 OEE(設備綜合效率)邏輯,預設「可測量 = 可管理」。但是 AI 使用的價值不線性地和使用次數相關,把製造業的測量邏輯套在知識工作上,就會出現 Duolingo 那種 KPI,這不是 HR 的錯,是整個台灣企業的管理慣性還沒追上知識工作的本質。

    第三步:用身份調整語氣

    如果你是 HR下次績效制度會議,帶 Duolingo 這個案例進去當反例,帶的時候語氣要收好:這個案例是為了說「我們要推 AI,但不能用 Duolingo 那種方式推」。避開「所以我們不能推 AI」的用語——這會被誤讀成你在抗拒轉型,老闆會以為你在擋路。

    如果你是數位轉型推手: 下次跟老闆討論「怎麼讓大家都用起來」時,把對話從「設一個使用率 KPI」拉到「我們每個部門每季交一個『因為 AI 變好的工作流程』報告,加上一個 90 天試點」。對老闆來說成本一樣(都是要員工動起來),對員工來說意義完全不同。

    如果你是夾在中間的執行層,沒位子發言會議前做一張 A4,左欄 Duolingo 一年的時間軸,右欄 Meta/McKinsey 的做法,中間一句問題:「我們的指標,比較像左邊,還是右邊?」這張紙的語氣是「來看個案例」,避開了「我有意見」的對立感。

    六、最後一句話

    Duolingo 這一年最有意思的地方,在 Luis von Ahn 公開撤回,他本可以悄悄改,但他選擇公開承認「it did not fit」。這對所有正在推 AI 的企業主管,算一個很少見的禮物:一個用自己公司當失敗案例的 CEO。

    AI 這波浪潮裡最昂貴的錯誤,往往發生在最努力的那家公司身上——推得太用力,反而把員工推走。Duolingo 已經公開走完那條路一次,你可以直接從他那張地圖開始。

    AI 採用率是虛榮指標,工作成果才是真 KPI。

    這一直是智谷相信的事:企業 AI 導入是一個組織和技術共同找節奏的過程,節奏對了,員工會主動往前;節奏錯了,任何 KPI 都推不動。

    如果你的公司正在設計 AI 採用的管理機制,在還沒送出去之前,歡迎找我們聊聊

    推薦精選文章

    📚 72% 的 Z 世代說不想當主管,但你的接班計畫還在假設他們想升

    📚 司升錯人的機率高達 82%! HR 要負責收拾那些離職面談

    更多企業 AI 培訓服務:https://www.kvalley.biz/tcservice/digital/

    發佈留言

    發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

    This field is required.

    This field is required.